• 제목/요약/키워드: voice data

검색결과 1,260건 처리시간 0.028초

보안성을 갖는 음성 및 데이터 트랜시버의 물리 계층 구조 설계 (Design of the PHY Structure of a Voice and Data Transceiver with Security)

  • 은창수;임선민;이경민
    • 대한전자공학회논문지TC
    • /
    • 제43권10호
    • /
    • pp.46-54
    • /
    • 2006
  • 본 논문에서는 기존의 아날로그 트랜시버가 가지고 있는 단점을 극복하기 위한 디지털 트랜시버를 제안한다. 제안된 트랜시버는 불연속적인 협대역 채널들로 구성된 환경에서 사용된다고 가정하였다. 그리고 어느 정도의 보안성을 가지며 개인 대(對) 개인뿐만 아니라, 개인 대(對) 그룹, 그룹 대(對) 그룹의 음성 및 데이터 통신이 가능하여야 하며, 음성과 데이터를 동시에 전송할 경우 1 Mbps의 데이터 율을 가져야 한다고 가정하였다. 주파수 대역의 제한 때문에 FH-SS(Frequency Hopping-Spread Spectrum) 방식을, 구현의 복잡성 때문에 D8PSK(Differential 8 Phase Shift Keying) 방식을 채택하였다. 반송파와 심볼 타이밍 복원을 위해 IEEE 802.11 FHSS 프레임 구조를 바탕으로 새로운 프리앰블 구조를 제안하여 검출 확률을 높였다. 전산 모의 실험과 전력 계산을 통하여 제안된 시스템은 아날로그 워키토키와 같은 간단한 무선 통신에 사용될 수 있음을 보였다.

긴 지연시간을 갖는 ABR 트래픽에 대한 피드백제어 모델 (A Feedback Control Model for ABR Traffic with Long Delays)

  • 오창윤;배상현
    • 한국정보처리학회논문지
    • /
    • 제7권4호
    • /
    • pp.1211-1216
    • /
    • 2000
  • ATM은 패킷 데이터 서비스 통신에 적합한 통신방식으로 데이터, 음성, 영상 등의 서비스를 동시에 지원할 수 있다. 이러한 ATM의 QoS를 보증하기 위해서는 패킷 데이터를 전송하는 소스 비율에 대해 네트워크 초과적조 조건을 조절하는 것이 필요하는데 대부분의 제어알고리즘이 임계값을 기반으로 한 피드백 제어방식이다. 그러니 실시간 음성 트레픽과 같은 서비스는 네트워크 상에서 데이터 서비스 동안에 동적인 연결이 설정되고 종료될 수 있으므로 피드벡 제어정보가 지연된다면 고속으로 서비스된 음성 데이터에 대한 품질은 소스의 목적지 사이의 시간 지연으로 인해 손실될 수 있다. 본 논문에서는 제시된 최소평균제곱오차에 근거를 둔 제어 알고리즘은 예시적인 피드백 제어로 피드백 제어를 위해 미지함수의 기울기와 버퍼크기를 이용하여 미래의 버퍼크기를 예측하려 하였으며 시뮬레이션 질과 본 논문에서 제시한 제어 알고리즘은 효과적임이 증명되었다.

  • PDF

피드백 제어 정보 및 알고리즘을 이용한 ABR 서비스 트래픽제어 (An ABR Service Traffic Control of Using feedback Control Information and Algorithm)

  • 이광옥;최길환;오창윤;배상현
    • 인터넷정보학회논문지
    • /
    • 제3권3호
    • /
    • pp.67-74
    • /
    • 2002
  • ATM은 패킷 데이터 서비스 통신에 적합한 통신방식으로 데이터, 음성, 영상 등의 서비스를 동시에 지원할 수 있다. 이러한 ATM의 QoS를 보증하기 위해서는 패킷 데이터를 전송하는 소스 비율에 대해 네트워크 초과적조 조건을 조절하는 것이 필요한데 대부분의 제어알고리즘이 임계값을 기반으로 한 피드백 제어방식이다. 그러나 실시간 음성 트래픽과 같은 서비스는 네트워크 상에서 데이터 서비스 동안에 동적인 연결이 설정되고 종료될 수 있으므로 피드백 제어정보가 지연된다면 고속으로 서비스된 음성 데이터에 대한 품질은 소스와 목적지 사이의 시간 지연으로 인해 손실될 수 있다. 본 논문에서 제시한 최소평균제곱오차에 근거를 둔 제어 알고리즘은 예시적인 피드백 제어로 피드백 제어를 위해 미지함수의 기울기와 버퍼크기를 이용하여 미래의 버퍼크기를 예측하려 하였으며 시뮬레이션 결과 본 논문에서 제시한 제어 알고리즘은 효과적임이 증명되었다.

  • PDF

텍스트와 음성의 앙상블을 통한 다중 감정인식 모델 (Multi-Emotion Recognition Model with Text and Speech Ensemble)

  • 이명호;임명진;신주현
    • 스마트미디어저널
    • /
    • 제11권8호
    • /
    • pp.65-72
    • /
    • 2022
  • COVID-19로 인해 대면으로 이루어지던 상담 방식이 비대면으로 진행되면서 비대면 상담의 중요성이 높아지고 있다. 비대면 상담은 온라인으로 언제 어디서든 상담할 수 있고, COVID-19에 안전하다는 장점이 있다. 그러나 비언어적 표현의 소통이 어려워 내담자의 마음을 이해하기 어렵다. 이에 비대면 상담 시 내담자의 마음을 잘 알기 위해서는 텍스트와 음성을 정확하게 분석하여 감정을 인식하는 것이 중요하다. 따라서 본 논문에서는 텍스트 데이터는 자음을 분리한 후 FastText를 사용하여 벡터화하고, 음성 데이터는 Log Mel Spectrogram과 MFCC를 사용하여 각각 특징을 추출하여 벡터화한다. 벡터화된 데이터를 LSTM 모델을 활용하여 5가지 감정을 인식하는 다중 감정인식 모델을 제안한다. 다중 감정인식은 RMSE을 활용하여 계산한다. 실험 결과 텍스트와 음성 데이터를 각각 사용한 모델보다 제안한 모델의 RMSE가 0.2174로 가장 낮은 오차를 확인하였다.

기계학습에 의한 후두 장애음성 식별기의 성능 비교 (Performance comparison on vocal cords disordered voice discrimination via machine learning methods)

  • 조철우;왕수건;권익환
    • 말소리와 음성과학
    • /
    • 제14권4호
    • /
    • pp.35-43
    • /
    • 2022
  • 본 논문은 후두 장애음성 데이터의 식별률을 CNN과 기계학습 앙상블 학습 방법에 의해 개선하는 방법에 대한 연구이다. 일반적으로 후두 장애음성 데이터는 그 수가 적으므로 통계적 방법에 의해 식별기가 구성되더라도, 훈련 방식에 따라 과적합으로 인해 일어나는 현상으로 인해 외부 데이터에 노출될 시 식별률의 저하가 발생할 수 있다. 본 연구에서는 다양한 정확도를 갖도록 훈련된 CNN 모델과 기계학습 모델로부터 도출된 결과를 다중 투표 방식으로 결합하여 원래의 훈련된 모델에 비해 향상된 분류 효율을 갖도록 하는 방법과 함께, 기존의 기계학습 중 앙상블 방법을 적용해 보고 그 결과를 확인하였다. 알고리즘을 훈련하고 검증하기 위해 PNUH(Pusan National University Hospital) 데이터셋을 이용하였다. 데이터셋에는 정상음성과 양성종양 및 악성 종양의 음성 데이터가 포함되어 있다. 실험에서는 정상 및 양성 종양과 악성종양을 구분하는 시도를 하였다. 실험결과 random forest 방법이 가장 우수한 앙상블 방법으로 나타났으며 85%의 식별률을 보였다.

사용자의 혁신성 및 지식수준이 가상비서 기반 음성쇼핑의 이용에 미치는 영향 (Influence of User Innovativeness and Knowledge Base on Acceptance of Voice Shopping)

  • 조웅;안수호;정두희
    • 벤처창업연구
    • /
    • 제15권2호
    • /
    • pp.153-169
    • /
    • 2020
  • 가상비서에 기반해 구매활동을 하는 새로운 방식의 음성쇼핑(Voice shopping)이 주목받고 있다. 전 세계적으로 음성쇼핑 시장이 성장을 하고 있고, 우리나라도 음성쇼핑의 본격적 상용화를 눈앞에 두고 있다. 음성쇼핑 관련 서비스의 발전을 위해서는 서비스의 질, 새로운 방식에 맞는 효율적 프로세스, 고객관계 구축 방법 등 새로운 쇼핑방식과 관련한 세부적 이슈에 대해 구체적으로 고찰하는 작업이 필요하다. 그러한 시도의 일환으로서, 이 연구는 음성쇼핑에 대해 소비자들이 갖는 인식 및 태도에 영향을 미치는 요인을 판별하고자 한다. 이 연구에서는 171명의 온라인쇼핑 이용객의 설문조사 응답데이터를 기반으로 분석을 실시했다. 인지된 유용성, 사용 용이성 등 기술수용모델(Technology Acceptance Model)의 전형적 요인 외에 인지된 유희성이라는 요인을 추가하여 음성쇼핑에 대한 이용의도에 미치는 영향을 분석했다. 특별히 이 연구에서는 사용자의 속성이 미치는 영향에 집중하고자 한다. 음성쇼핑의 확산을 위해서는 유효한 타깃 고객을 설정하는 게 필요하며, 사용자에 대한 이해가 선행되어야 원활한 고객관계 구축이 가능해지기 때문이다. 따라서 이 연구에서는 사용자 혁신성 및 지식수준 등 사용자의 속성에 따라 음성쇼핑 이용의도와 관련한 요인이 어떻게 영향을 받는지 분석하고자 한다. 분석결과, 사용자 혁신성은 인지된 유용성과 사용 용이성, 인지된 유희성 모두에게 긍정적 영양을 줬다. 사용자 지식기반은 인지된 유용성과 사용 용이성, 인지된 유희성 모두에게 유의하지 않았으나, 이 변수들의 외생변수 역할을 하는 사용자 혁신성에 긍정적 영향을 주는 것으로 나타났다. 한편 확장된 기술수용모델 변수 중에서는 인지된 유용성과 인지된 유희성이 음성쇼핑의 이용의도에 긍정적 영향을 주고, 사용 용이성은 음성쇼핑 이용의도에는 유의한 영향이 없으나 인지된 유용성과 유희성을 모두 높이는 것으로 나타났다. 이 연구는 음성쇼핑 플랫폼 및 연관 서비스 개발시중점을 두어야 할 지향점 및 고객관계 설정 방향에 대한 시사점을 제시하는 데 의의가 있다.

멀티미디어 환경에서 효율적인 음성 전송을 위한 WATM MAC 프로토콜 (A WATM MAC Protocol for the Efficient Transmission of Voice Traffic in the Multimedia Environment)

  • 민구봉;최덕규;김종권
    • 한국통신학회논문지
    • /
    • 제25권1A호
    • /
    • pp.96-103
    • /
    • 2000
  • WATM(Wireless Asynchronous Transfer Mode) 네트워크에서 음성은 실시간 전송이 요구되는 주된 요소 중의 하나다. 본 논문에서는 멀티미디어 환경에서 음성 트래픽을 효율적으로 전송하기 위한 새로운 매체접근제어(MAC: Medium Access Control) 프로토콜을 설계하고 성능을 평가하여 기존의 MAC방식과 비교한다. 새로 제안한 프로토콜은 상향링크(uplink)의 예약 슬롯구간(request slot period)을 음성 예약 슬롯구간과 비실시간 데이터 예약 슬롯 구간으로 구분하고, 음성 트래픽에 대해서는 QoS(Quality of Service)를 보장할 수 있도록 프레임 크기에 따른 적절한 슬롯 할당함수를 제시하였다. 이때 MAC은 반복적으로 휴지(silent)상태가 된 음성 소스의 수에 비례하여 음성예약 슬롯을 동적으로 할당하고, 슬롯예약 시 데이터를 함께 보냄으로써 평균 접근지연시간을 줄일 수 있도록 한다. 시뮬레이션에 의한 성능분석결과는 제안한 MAC방법이 고정된 음성 예약슬롯을 가진 Slotted ALOHA 방법에 비하여 대역폭 사용효율이 높음을 보인다. 또한 음성 단말의 수가 변하는 동적 환경하에서도 일정한 QoS를 제공 할 수 있다. 이것은 모든 음성 단말에게 하나씩의 뭬\ulcorner슬롯을 할당하는 NC-PRMA(None Collision-Packet Reservation Multiple Access)프로토콜보다 향상된 성능을 가진다는 사실을 나타낸다.

  • PDF

CNN(Convolutional Neural Network) 알고리즘을 활용한 음성신호 중 비음성 구간 탐지 모델 연구 (A Study on a Non-Voice Section Detection Model among Speech Signals using CNN Algorithm)

  • 이후영
    • 융합정보논문지
    • /
    • 제11권6호
    • /
    • pp.33-39
    • /
    • 2021
  • 음성인식 기술은 딥러닝과 결합되며 빠른 속도로 발전하고 있다. 특히 음성인식 서비스가 인공지능 스피커, 차량용 음성인식, 스마트폰 등의 각종 기기와 연결되며 음성인식 기술이 산업의 특정 분야가 아닌 다양한 곳에 활용되고 있다. 이러한 상황에서 해당 기술에 대한 높은 기대 수준을 맞추기 위한 연구 역시 활발히 진행되고 있다. 그중에서 자연어처리(NLP, Natural Language Processing)분야에서 음성인식 인식률에 많은 영향을 주는 주변의 소음이나 불필요한 음성신호를 제거하는 분야에 연구가 필요한 상황이다. 이미 많은 국내외 기업에서 이러한 연구를 위해 최신의 인공지능 기술을 활용하고 있다. 그중에서 합성곱신경망 알고리즘(CNN)을 활용한 연구가 활발하게 진행되고 있다. 본 연구의 목적은 합성곱 신경망을 통해서 사용자의 발화구간에서 비음성 구간을 판별하는 것으로 5명의 발화자의 음성파일(wav)을 수집하여 학습용 데이터를 생성하고 이를 합성곱신경망을 활용하여 음성 구간과 비음성 구간을 판별하는 분류 모델을 생성하였다. 이후 생성된 모델을 통해 비음성 구간을 탐지하는 실험을 진행한 결과 94%의 정확도를 얻었다.

자동차 전면부와 음성 어시스턴트의 스타일 관계 분석 (Investigating the Relationship Between Vehicle Front Images and Voice Assistants)

  • 박민정;민소영;김태수;석현정
    • 감성과학
    • /
    • 제25권4호
    • /
    • pp.129-138
    • /
    • 2022
  • 음성 어시스턴트가 차량에 탑재되기 시작하면서, 차량의 조형적 특징과 음성 어시스턴트간의 연관성이 중요해지고 있다. 본 연구는 자동차에 적용된 음성 어시스턴트와 외관의 조화스러움에 대하여 공통된 감성적 특징을 기반으로 살펴보고자 하였다. 12가지 차량 이미지와 6가지의 음성 어시스턴트에 대해 15종의 형용사를 바탕으로 감성 평가를 실시하였다. 실험은 온라인 개별 인터뷰로 진행되었으며, 총 24명의 대학생이 참여하였다. 참여자들은 각 자극물을 대표하는 감성 형용사 3종을 1, 2, 3위로 평가하고, 선정 이유에 대한 간단한 인터뷰를 진행하였다. 설문 결과에 대해 주성분분석을 수행하여 2개의 주요 요인을 추출한 뒤, 각 요인을 축으로 하여 자극물을 분포시켰다. 분포도를 바탕으로 감성적 특징을 도출하고자 계층적 군집 분석을 수행하였다. 주성분 분석 결과 자동차 이미지와 음성 어시스턴트를 설명하는 감성적 차원으로 "편안한-급진적인"과 "가벼운-무거운"이 추출되었다. 두 차원을 바탕으로 자극물들을 분포시킨 결과, 자동차와 음성 어시스턴트가 동일한 축을 바탕으로 다양하게 분포해 두 요인이 자극물간 감성적 특징을 도출하기에 적합하다고 판단되었다. 자극물들의 분포도를 바탕으로 계층적 군집분석을 수행하여 17개의 자극물을 4가지 군집으로 추렸다. 각 군집은 도전적인, 우아한, 위엄있는, 활기찬 그룹으로 도출되었다. 본 연구에서는 차량의 조형적 특징과 음성 어시스턴트의 감성적 이미지를 동시에 설명할 수 있는 두 축을 도출하였다. 도출된 축을 바탕으로 그려진 분포도에 군집 분석을 수행해 감성적 특징을 분류하였으며, 총 4개의 감성적 특징이 도출되었다. 본 연구는 자동차의 조형적 특징에 맞춘 음성 어시스턴트 제안을 위한 디자인 품평 가이드로 활용되어, 추후 출시되는 차량에서 사용자들의 자동차 음성 어시스턴트 감성 경험이 증진될 것으로 기대한다.

VDL M2 데이터 링크 소프트웨어 설계 및 구현 (The Design and Implementation of VDL M2 Data Link Software)

  • 김현경;양광직;김태식;배중원
    • 항공우주기술
    • /
    • 제7권2호
    • /
    • pp.11-20
    • /
    • 2008
  • 현재 항공기 조종사와 지상관제사간의 공대지 통신은 주로 음성통신과 텍스트 기반의 데이터 통신으로 이루어지고 있다. 국제민간항공기구(ICAO)에서 현 공대지 통신의 정확도와 효율성을 높이기 위한 기술로 디지털 데이터 통신 기술이 제안하였다. 그 중 하나인 VDL M2 시스템은 VHF 대역을 사용하는 디지털 데이터 통신 링크로, 기존의 음성통신과 텍스트 기반의 ACARS 데이터 통신을 대체할 수 있을 것으로 기대된다. 본 논문에서는 한국항공우주연구원에서 개발한 VDL M2 시스템을 구성하는 소프트웨어의 설계 및 구현결과에 대해 기술하였다.

  • PDF