• 제목/요약/키워드: Voice signal

검색결과 431건 처리시간 0.023초

음성의 준주기적 현상 분석 및 구현에 관한 연구 (Analysis and synthesis of pseudo-periodicity on voice using source model approach)

  • 조철우
    • 말소리와 음성과학
    • /
    • 제8권4호
    • /
    • pp.89-95
    • /
    • 2016
  • The purpose of this work is to analyze and synthesize the pseudo-periodicity of voice using a source model. A speech signal has periodic characteristics; however, it is not completely periodic. While periodicity contributes significantly to the production of prosody, emotional status, etc., pseudo-periodicity contributes to the distinctions between normal and abnormal status, the naturalness of normal speech, etc. Measurement of pseudo-periodicity is typically performed through parameters such as jitter and shimmer. For studying the pseudo-periodic nature of voice in a controlled environment, through collected natural voice, we can only observe the distributions of the parameters, which are limited by the size of collected data. If we can generate voice samples in a controlled manner, experiments that are more diverse can be conducted. In this study, the probability distributions of vowel pitch variation are obtained from the speech signal. Based on the probability distribution of vocal folds, pulses with a designated jitter value are synthesized. Then, the target and re-analyzed jitter values are compared to check the validity of the method. It was found that the jitter synthesis method is useful for normal voice synthesis.

음성과 활동량을 이용한 에너지 소모량 측정기기 개발 (Development of energy expenditure measurement device based on voice and body activity)

  • 임재중
    • 한국인터넷방송통신학회논문지
    • /
    • 제12권6호
    • /
    • pp.303-309
    • /
    • 2012
  • 본 연구는 인체의 활동량과 음성 신호를 기반으로 에너지 소모량을 추정하고자 수행하였으며, 3축 가속도 센서와 PVDF(polyvinylidene fluoride) 필름을 이용하여 활동량과 음성 신호를 검출하였다. 인체의 움직임과 음성 신호, 그리고 실제 에너지 소모량 값은 MP-150 시스템과 호흡가스 분석기를 이용하여 수집하였다. 음성신호의 전력 값과 피험자의 체중을 독립 변수로 활용하였을 때 0.918의 R 제곱 값을 보였으며, 활동량 분석에 있어서는 SVM(signal vector magnitude), BMI(body mass index), 키, 그리고 나이를 독립 변수로 활용하였을 때 가장 높은 상관성을 나타냈다. 음성과 활동량을 토대로 하는 에너지 소모량 추정은 활동량만을 이용하여 추정하는 기존의 기기보다 정확한 결과값을 제공할 수 있음을 확인하였다.

하이브리드 자동 통역지원 시스템에 관한 연구 (A Study of Hybrid Automatic Interpret Support System)

  • 임총규;박병호;박주식;강봉균
    • 산업경영시스템학회지
    • /
    • 제28권3호
    • /
    • pp.133-141
    • /
    • 2005
  • The previous research has been mainly focused on individual technology of voice recognition, voice synthesis, translation, and bone transmission technical. Recently, commercial models have been produced using aforementioned technologies. In this research, a new automated translation support system concept has been proposed by combining established technology of bone transmission and wireless system. The proposed system has following three major components. First, the hybrid system consist of headset, bone transmission and other technologies will recognize user's voice. Second, computer recognized voice (using small server attached to the user) of the user will be converted into digital signal. Then it will be translated into other user's language by translation algorithm. Third, the translated language will be wirelessly transmitted to the other party. The transmitted signal will be converted into voice in the other party's computer using the hybrid system. This hybrid system will transmit the clear message regardless of the noise level in the environment or user's hearing ability. By using the network technology, communication between users can also be clearly transmitted despite the distance.

배경잡음 및 패킷손실에 강인한 voice-over-IP 수신단 기반 음질향상 기법 (Robust speech quality enhancement method against background noise and packet loss at voice-over-IP receiver)

  • 김지연;김형국
    • 한국음향학회지
    • /
    • 제37권6호
    • /
    • pp.512-517
    • /
    • 2018
  • 음성 품질의 향상은 통신 분야의 주요 관심사이다. 본 논문에서는 VoIP(Voice-over-IP) 수신부에서의 배경잡음 및 패킷손실에 강인한 음질향상 방식을 제안한다. 제안된 방식에서는 하이브리드 마르코프 체인 기반 네트워크 지터추정, 추정된 지터를 이용한 적응적 플레이아웃 스케줄링, 그리고 진폭 및 위상 복원 기반의 음성 향상 방식 등을 결합하여 IP 네트워크를 통해 VoIP 수신부에 도착하는 음성신호의 품질을 향상시킨다. 실험결과는 제안된 방식이 송신부의 인코딩 전에 음성신호에 추가된 잡음을 제거하고 불안정한 네트워크 환경에서 양질의 음성을 제공하는 것을 확인할 수 있다.

Modular Fuzzy Neural Controller Driven by Voice Commands

  • Izumi, Kiyotaka;Lim, Young-Cheol
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2001년도 ICCAS
    • /
    • pp.32.3-32
    • /
    • 2001
  • This paper proposes a layered protocol to interpret voice commands of the user´s own language to a machine, to control it in real time. The layers consist of speech signal capturing layer, lexical analysis layer, interpretation layer and finally activation layer, where each layer tries to mimic the human counterparts in command following. The contents of a continuous voice command are captured by using Hidden Markov Model based speech recognizer. Then the concepts of Artificial Neural Network are devised to classify the contents of the recognized voice command ...

  • PDF

VoiceXML을 이용한 홈 네트워크 음성 인터페이스 (Home Network Speech Interface Using VoiceXML)

  • 노용완;김동규;신정훈;정광우;홍광석
    • 융합신호처리학회논문지
    • /
    • 제6권3호
    • /
    • pp.127-133
    • /
    • 2005
  • 본 논문에서는 홈 네트워크 시스템 상에서의 VoiceXML을 이용한 음성 인터페이스를 제안한다. 기존의 홈 네트워크 인터페이스는 블루투스, IrDA, 무선 LAN, Home RF를 사용하지만 집 외부와 같은 원거리에서 사용 할 수 없거나 사용방법이 어려웠다. 본 논문에서 제안한 VoiceXML 음성 인터페이스는 다른 인터페이스 기술들 보다 원거리에서 사용자가 홈 네트워크 서비스를 지원 받을 수 있으며 또한 유무선 전화를 사용하여 흠 서버를 제어하며 VoiceXML server를 통하여 사용자에게 직접 전화를 걸어 문제점을 알려줄 수 있다. 본 논문에서는 이러한 음성 인터페이스를 홈 네트워크 측면에서 활용하였고 실질적인 원격검침, 원격제어 서비스를 구현한다. 그리고 이를 기초로 제안한 방식의 효율성을 평가한다.

  • PDF

Transformer 네트워크를 이용한 음성신호 변환 (Voice-to-voice conversion using transformer network)

  • 김준우;정호영
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.55-63
    • /
    • 2020
  • 음성 변환은 다양한 음성 처리 응용에 적용될 수 있으며, 음성 인식을 위한 학습 데이터 증강에도 중요한 역할을 할 수 있다. 기존의 방법은 음성 합성을 이용하여 음성 변환을 수행하는 구조를 사용하여 멜 필터뱅크가 중요한 파라미터로 활용된다. 멜 필터뱅크는 뉴럴 네트워크 학습의 편리성 및 빠른 연산 속도를 제공하지만, 자연스러운 음성파형을 생성하기 위해서는 보코더를 필요로 한다. 또한, 이 방법은 음성 인식을 위한 다양한 데이터를 얻는데 효과적이지 않다. 이 문제를 해결하기 위해 본 논문은 원형 스펙트럼을 사용하여 음성 신호 자체의 변환을 시도하였고, 어텐션 메커니즘으로 스펙트럼 성분 사이의 관계를 효율적으로 찾아내어 변환을 위한 자질을 학습할 수 있는 transformer 네트워크 기반 딥러닝 구조를 제안하였다. 영어 숫자로 구성된 TIDIGITS 데이터를 사용하여 개별 숫자 변환 모델을 학습하였고, 연속 숫자 음성 변환 디코더를 통한 결과를 평가하였다. 30명의 청취 평가자를 모집하여 변환된 음성의 자연성과 유사성에 대해 평가를 진행하였고, 자연성 3.52±0.22 및 유사성 3.89±0.19 품질의 성능을 얻었다.

패킷음성 프로토콜의 구현 (Implementation of Packet Voice Protocol)

  • 이상길;신병철;김윤관
    • 한국통신학회논문지
    • /
    • 제18권12호
    • /
    • pp.1841-1854
    • /
    • 1993
  • Ethernet에 음성신호의 전송을 위한 패킷음성 프로토콜을 PC 구현하였다. 구현한 패킷음성 프로토콜은 CCITT의 G.764 패킷음성 프로토콜을 수정하여 사용하였다. 이를 위하여 ethernet을 통한 음성통신을 하기 위한 하드웨어 시스템을 설계하였는데, 전화기 인터페이스부분, 음성처리부분, PC인터페이스부분 및 제어부분으로 나누어진다. 소프트웨어는 OSI 7 계층에 맞추어 설계하였으며 ethernet device driver, 전화기 인터페이스 하드웨어 driver 그리고 패킷음성 프로토콜 처리부분으로 구성되어 있다. 실제 실험결과 ethernet을 통하여 전화를 연결하고 만족한 음성통화를 할 수 있었다.

  • PDF

각종 음성분석 상용 프로그램의 모음 기본주기 분석 결과 비교 (Comparison of vowel pitch results among several commercial voice analysis programs)

  • 남기창;이승훈;최재남;최홍식;남도현;김덕원
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2005년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.54-56
    • /
    • 2005
  • Analysis of the voice and its corresponding studies are examined from the recording of the voice through microphone and various calculation processes of the signals by using computer. Voice analyser include data acquisition and analyzing program. Since oath program uses different voice signal processing algorithm, thorough understanding of the operation is essential. In this study, analysis result of patient voice were compared by using four different voice analysis programs such as MDVP, Praat, TF32, and the program developed in this study. Pitch, jitter and shimmer were selected as comparison analysis factors. As a result, pitch, jitter and shimmer showed different result since each program uses different pitch computation algorithm.

  • PDF

음성 신호 특징과 셉스트럽 특징 분포에서 묵음 특징 정규화를 융합한 음성 인식 성능 향상 (Voice Recognition Performance Improvement using the Convergence of Voice signal Feature and Silence Feature Normalization in Cepstrum Feature Distribution)

  • 황재천
    • 한국융합학회논문지
    • /
    • 제8권5호
    • /
    • pp.13-17
    • /
    • 2017
  • 음성 인식에서 기존의 음성 특징 추출 방법은 명확하지 않은 스레숄드 값으로 인해 부정확한 음성 인식률을 가진다. 본 연구에서는 음성과 비음성에 대한 특징 추출을 묵음 특징 정규화를 융합한 음성 인식 성능 향상을 위한 방법을 모델링 한다. 제안한 방법에서는 잡음의 영향을 최소화하여 모델을 구성하였고, 각 음성 프레임에 대해 음성 신호 특징을 추출하여 음성 인식 모델을 구성하였고, 이를 묵음 특징 정규화를 융합하여 에너지 스펙트럼을 엔트로피와 유사하게 표현하여 원래의 음성 신호를 생성하고 음성의 특징이 잡음을 적게 받도록 하였다. 셉스트럼에서 음성과 비음성 분류의 기준 값을 정하여 신호 대 잡음 비율이 낮은 신호에서 묵음 특징 정규화로 성능을 향상하였다. 논문에서 제시하는 방법의 성능 분석은 HMM과 CHMM을 비교하여 결과를 보였으며, 기존의 HMM과 CHMM을 비교한 결과 음성 종속 단계에서는 2.1%p의 인식률 향상이 있었으며, 음성 독립 단계에서는 0.7%p 만큼의 인식률 향상이 있었다.