• Title/Summary/Keyword: 비음성

Search Result 1,997, Processing Time 0.043 seconds

Endpoint Detection in the Car Noise Environment for Speech Recognition (음성인식을 위한 자동차 소음환경에서의 끝점 검출)

  • 서동권;신원호;양태영;김원구;윤대희
    • The Journal of the Acoustical Society of Korea
    • /
    • v.17 no.1
    • /
    • pp.76-79
    • /
    • 1998
  • 소음이 존재하지 않는 환경에서는 에너지 파라메터만으로도 정확한 끝점 검출을 수 행할 수 있으나 신호대 잡음비가 0dB에 가까운 자동차 환경에서는 끝점 검출이 거의 불가 능하다. 본 논문에서는 자동차 소음 환경에서 음성 구간 검출을 위하여 단구간 영교차율과 2∼4kHz의 주파수 영역 에너지를 사용한 끝점 검출 방법을 제안하였다. 제안된 방법과 기 존의 방법의 성능을 DTW를 이용한 단독음 인식 시스템에 적용하여 인식률로 비교하였으 며 제안된 음성 구간 검출 방법을 적용한 경우가 보다 좋은 인식률을 나타내었다.

  • PDF

Trends of Low Bit-Rate Speech Coding (낮은 전송률 음성 부호화 연구 동향)

  • 강홍구
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.27-30
    • /
    • 1995
  • 음성 신호를 압축한 후, 주관적 왜곡 없이 복원하기 위한 부호화 연구는 대역 제한된 채널에 적용하기 위해 전송률을 더욱 낮추기 위한 연구 분야와 전송률은 높더라도 복잡도 및 성능 면에서 효과적인 연구 분야로 나눌 수 있다. 본 논문에서는 기존 시스템의 절반에 해당하는 전송률에서도 비슷한 성능을 유지함으로써 디지털 셀룰라 표준화안으로의 가능성이 가장 높은 음성 부호화 방법들에 대해 비교 설명하고, 전송률을 좀 더 낮추기 위해 진행되고 있는 새로운 연구 경햐에 대해 고찰한다. 또한, 전송률은 높더라도 기존 방법에 비해 복잡도는 매우 낮은 부호화기에 대한 설명을 통해 향후 연구 방향에 대해 언급하고자 한다.

  • PDF

Design and Performance Analysis of Packetized Voice Transport Networks Using AAL2 (AAL2를 이용한 음성 패킷 전송망의 설계 및 성능 분석)

  • 추순호;조유제;김동호
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10c
    • /
    • pp.174-176
    • /
    • 2000
  • AAL2(ATM Adaptation Layer 2)는 짧고 가변 길이를 가지며 지연에 민감한 패킷들을 ATM 상에서 효과적으로 지원하는 프로토콜이다. AAL2 프로토콜은 이동통신망에서의 기지국(BS)과 이동 교환국(MSC) 사이의 중계선 상에서 음성 트래픽을 전송하는데 효과적으로 활용될 수 있다. 본 논문에서는 먼저 AAL2 프로토콜이 다른 AAL 방식에 비해 구별되는 특징을 살펴보고, AAL2의 성능을 시뮬레이션을 통해 분석한다. 그 결과를 토대로 AAL2 프로토콜을 이용한 음성 트래픽 전송망 설계 시에 고려할 요소들을 살펴보고 효과적인 설계 방안을 제시한다.

  • PDF

The Study for Noisy Speech Improvement with Noise Perception Pattern Suppression (잡음 신호의 지각 패턴 제어를 통한 음질 개선 알고리즘 개발에 관한 연구)

  • Kim Hunjoong;Cha Hyungtai
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.199-202
    • /
    • 2002
  • 본 논문에서는 사람의 청각 모델을 기반으로 잡음에 의해 손상된 음성 신호로부터 잡음 신호의 마스킹 특성과 신호에너지의 지각(知覺)을 나타내는 임계대역(critical band)에서의 잡음 에너지에 대한 지각 패턴인 noise excitation pattern을 이용한 잡음 에너지 차감과 잡음 추정 오차에 의한 변형된 음성신호 내의 순음(tonal) 성분과 비순음(non-tonal)성분의 보정을 통해 효과적인 음성 품질의 개선을 위한 연구를 하였다.

  • PDF

Improvement of the ASR Robustness using Combinations of Spectral Subtraction and KLT-based Adaptive Comb-filtering (스펙트럴 서브트렉션과 비동기 KLT 잡음 감소 기법의 조합에 의한 음성 인식 성능 개선)

  • Park Sung-Joon
    • Proceedings of the KSPS conference
    • /
    • 2003.05a
    • /
    • pp.207-210
    • /
    • 2003
  • In this paper, the combinations of speech enhancement techniques are experimented. Specifically, the spectral subtraction, KLT based comb-filtering, and their combinations are applied to the Aurora2 database. The results show that recognition accuracy is improved when KLT based comb-filtering is applied after spectral subtraction.

  • PDF

A Study on the JAVA Beans Component Architecture in Speech Recognition Flight Information System Using (VoiceXML을 사용한 음성 인식 항공 정보 시스템에서의 JAVA Beans Component 구조에 관한 연구)

  • 장준식;윤재석;김국보
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2002.05c
    • /
    • pp.105-111
    • /
    • 2002
  • 최근까지 웹은 컴퓨터 상에서의 디스플레이, 키보드, 포인팅 장치들과 같은 비주얼 인터페이스를 통해서 정보 전달 및 서비스를 해오고 있다. 또한 이들은 일부의 모바일용 서비스를 제외하고 대부분이 익스플로어나 네스케이프 등의 웹브라우져를 지원하는 서비스를 해오고 있다. 이와 같은 시스템은 시간과 공간에 제약이 있으며 지원하는 브라우저가 있어야 하는 단점이 있다. 전화의 보급률은 컴퓨터나 기타 장치들에 비해 높고, 음성은 사람에게 쉽게 다가갈 수 있고 편하게 사용할 수 있는 인터페이스이다. 본 논문에서는 지금까지의 보는 것 중심의 웹 서비스를 듣고 말하는 웹 서비스로 음성 인식 항공 정보 시스템으로 설계ㆍ구현하였다.

  • PDF

Research on Recognition Network Structures for Non-recognition Sentence Rejection (비인식 대상 문장 거부 기능을 위한 음소 기반 인식 네트워크의 구성에 관한 연구)

  • 이병혁;하진영
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2004.10b
    • /
    • pp.772-774
    • /
    • 2004
  • 음성인식 시스템에서 입력된 음성 데이터에 대해 비인식 대상에 대한 거부기능은 신뢰도 보장 측면에서 상당히 중요하다. 비인식 대상의 단어 거부는 지금까지 여러 연구가 이루어져 왔으나, 문장 거부에 대한 연구는 사실상 부족한 실정이다. 본 논문에서는 비인식 대상 문장 거부기능의 신뢰도를 한층 높일 수 있도록 음소 기반 네트워크에 유성자음(VC), 무성자음(C), 모음(V) 단위의 필러 음향 모델을 생성하여 다양한 음소기반 인식 네트워크의 구성방법을 적용하여 비인식 대상 문장에 대해 거부 기능을 구현하고, 그에 따라 인식률과 거부율이 달라질 수 있음을 보인다. 구현된 시스템에서 제안한 3가지 음소단위 인식 네트워크 중 문장의 각 단어별 필러 모델을 구성했을 때가 가장 좋은 구성임을 알 수 있었다.

  • PDF

A Study on Formant Variation with Drinking and Nondrinking Condition (음주와 비음주 상태의 포어먼트 변화에 관한 연구)

  • Lee, See-Woo
    • Journal of the Korea Academia-Industrial cooperation Society
    • /
    • v.10 no.4
    • /
    • pp.805-810
    • /
    • 2009
  • This paper present a characteristic of formant variation in order to discriminate between drinking and nondrinking condition. By simulation experiments based on monosyllable, it is shown that the higher formant in F1, F2 and F3 in drinking speech signals compared with nondrinking speech signals. And I knew that the formant is very effective at distinction of drinking condition and nondrinking condition.

Measurement of RF Protection Ratio required by NTSC TV Sound Signal against DAB Interferer (디지털오디오방송에 대한 NTSC TV 음성신호의 RF 혼신보호비 측정)

  • Kim, Geon;Yang, Kyu-Tae;Jeong, Young-Ho;Lee, Soo-In
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2002.11a
    • /
    • pp.215-218
    • /
    • 2002
  • RF 혼신보호비는 동종 혹은 상이한 전송시스템간의 주파수 공유가 요구되는 상황에서 각 전송시스템의 운용 및 채널 배치에 반드시 필요한 정보로써, 이미 PAL, SECAM 방식의 아날로그 TV와 Eureka 147을 포함한 디지털방송과의 혼신에 대해서는 미국과 유럽, 일본에서 측정결과를 발표한 상태지만, NTSC방식과 Eureka 147 방식과의 혼신보호비에 대해서는 아직까지 측정이 이루어지지 않은 상태이다. 따라서 NTSC TV방식을 사용하고 있는 국가에서 Eureka 147 방식을 DAB 방송표준으로 도입하고자 할 때 혼신보호비를 필요로 할 것이다. 이에 본 논문에서는 유럽의 디지털오디오방송(Digital Audio Broadcasting; DAB) 시스템인 Eureka 147방식에 대한 NTSC방식의 아날로그 TV 음성신호의 RF 혼신보호비 측정결과를 제시하고자 한다.

  • PDF

Trends of Codec Technology for 4G Mobile Enhanced Voice Service (4G 모바일 증감음성 서비스를 위한 코덱 기술 동향)

  • Lee, M.S.;Kim, D.Y.;Lee, B.S.
    • Electronics and Telecommunications Trends
    • /
    • v.25 no.6
    • /
    • pp.29-37
    • /
    • 2010
  • 본 논문에서는 무선망과 신호처리 기술의 발달과 1GHz급 이상의 고성능 모바일 장치의 등장에 따라 현재의 모바일 음성 서비스 품질과 확연히 차별화된 서비스를 제공하기 위해 3GPP에서 논의중인 EVS 코덱의 기술적 특성 및 최간 표준화 동향에 대해 기술한다. 3GPP에서는 지난 3월, 2년간의 논의를 거쳐 4G 모바일과 같은 EPS 시스템에서 차별화된 새로운 증감음성 품질의 서비스 제공이 필수적이라는 판단 하에 EVS 코덱 표준의 개발을 시작하였다. 현재 EVS 코덱 표준화를 위해 세부적인 가능과 성능 목표에 대해 협의를 진행중이며 표준의 완료 계획시점인 2012년 상반기경, 4G/LTE에서는 광대역 수준의 음성서비스에 비해 신호대역폭이 2배가 확장된 슈퍼와이드밴드급의 증감음성 서비스가 제공될 것으로 전망한다.