• 제목/요약/키워드: 비음성

검색결과 1,997건 처리시간 0.029초

이동통신 시스템을 위한 음성 부호화기와 결합된 적응 반향제거기에 관한 연구 (Adaptive echo canceller combined with speech coder for mobile communication systems)

  • 이인성;박영남
    • 한국통신학회논문지
    • /
    • 제23권7호
    • /
    • pp.1650-1658
    • /
    • 1998
  • 본 논문에서는 이동통신 시스템의 반향을 제거하기 위해 음성부호화기에서 얻은 음성 분석 정보를 이용하여 반향을 제거하는 방법을 제시하였다. 반향 제거기 적응 알고리즘의 입력 신호로서 기존의 방법인 음성부호화기의 출력 음성신호를 사용하지 않고 음성 부호화기 디코더 과정에서 제공되어지는 여기 신호, 선형 예측 오차 신호를 사용하였다. 모의 실험을 위해 Normalized Least Mean Square(NLMS) 알고리즘을 이용한 적응 반향 제거기를 구성하였고, 기존의 음성신호를 사용하는 반향제거기에 비해 음성 부호화기에서 제공되어지는 음성의 여기 신호 성분을 적응 알고리즘 입력신호로 사용함으로써 40 dB Echo Return Loss Enhancement(ERLE)를 얻는데 걸리는 시간에 있어서 약 4배 정도의 빠른 속도를 얻을 수 있다.

  • PDF

열악한 환경의 음성 언어 이해를 위한 정보 추출 접근 방식 (An Information Extraction Approach for Spoken Language Understanding in a Hostile Environment.)

  • 은지현;이창기;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2004년도 제16회 한글.언어.인지 한술대회
    • /
    • pp.20-24
    • /
    • 2004
  • 본 논문에서는 환경 잡음과 원거리 음성 입력 그리고 노인 발화 등의 열악한 음성 인식 환경에서의 음성 언어이해(spoken language understanding)를 위한 정보 추출 접근 방식에 대해 논하고 있다. 정보 추출의 목적은 미리 정의된 slot에 적절한 값을 찾는 것이다. 음성 언어 이해를 위한 정보 추출은 필수적인 요소만을 추출하는 것을 목적으로 하는 개념 집어내기(concept spotting) 접근 방식을 사용한다. 이러한 방식은 미리 정의된 개념 구조 slot에만 관심을 가지기 때문에. 음성 언어 이해에서 사용되는 정보 추출은 언어를 완전히 이해한다기보다는 부분적으로 이해하는 방식을 취하고 있다. 음성 입력 언어는 주로 열등한 인식 환경에서 이루어지기 때문에 많은 인식 오류를 가지고 이로 인해 텍스트 입력에 비해 이해하기 어렵다. 이러한 점을 고려하여, 특정 정보에 집중함으로써 음성 언어를 이해하고자 시도하였다. 도로 정보 안내 영역을 대상으로 한 실험에서 텍스트 입력(WER 0%)과 음성 입력(WER 39.0%)이 주어졌을 때, 개념 집어내기 방식의 F-measure 값은 각각 0.945, 0.823을 나타내었다.

  • PDF

선천성 심장병 환아에서 음향학적 요소의 변동 (Acoustic variations associated with congenital heart disease)

  • 오정은;최윤미;김선준;주찬웅
    • Clinical and Experimental Pediatrics
    • /
    • 제53권2호
    • /
    • pp.190-194
    • /
    • 2010
  • 목 적 : 애성 및 음성 변동은 심장병 환자에서 관찰될 수 있는데 이러한 음성 변동 정도를 음향학적 지표의 평가로 분석하여, 소아에서 선천성 심장병 종류에 따른 음성 변동을 음향학적 요소로 분석하고자 하였다. 방 법 : 수술 전 선천성 심장병 환아 94명을 연구 대상으로 하였고 심실 중격 결손, 동맥관 개존, 심방 중격 결손, 폐동맥 협착, 활로 사징이 포함되었으며, 음성 변동을 조사하기 위한 음향 지표 분석은 통증 자극을 통하여 얻어진 음성 자료를 multi-dimensional voice program system을 이용하여 평가하였다. 연구에 사용된 음향 지표로 average fundamental frequency, length of analyzed sample, jitter percent, shimmer, noise to harmonic ratio를 분석하였다. 결 과 : 음향 지표인 average fundamental frequency은 동맥관 개존, 심실 중격 결손, 활로 사징 경우에서 유의한 감소를 나타냈으며, length of analyzed sample은 연구 대상 선천성 심장병 환아에서 대조군에 비해 의미있는 차이를 나타내지 않았다. Jitter percent, shimmer, noise to harmonic ratio는 심실 중격 결손, 동맥관 개존, 심방 중격 결손에서 대조군에 비해 증가되었다. 이러한 음성 변동은 연구 대상 선천성 심장병 중 동맥관 개존에서 음도변이, 강도변이, 음성의 소음 정도가 가장 뚜렷하게 나타났으며, 동맥관 개존, 심실 중격 결손, 심방 중격 결손 순으로 그 음성 변동의 특징을 나타냈다. 결 론 : 수술 전 선천성 심장병 환아에서 음성을 음향학적 지표로 비교 분석한 결과 음향학적 지표들이 심장 질환의 유형별 차이를 보이는데 좌우 단락 심질환군에서 현저한 비정상적 음향학적 지표를 나타냈다.

심층 신경망을 활용한 손상된 음성파일 복원 자동화 (Restoration of damaged speech files using deep neural networks)

  • 허희수;소병민;양일호;윤성현;유하진
    • 한국음향학회지
    • /
    • 제36권2호
    • /
    • pp.136-143
    • /
    • 2017
  • 본 논문에서는 심층 신경망을 이용하여 손상된 음성파일을 복원하는 방법을 제안한다. 본 논문에서 다루는 음성파일 복원은 기존의 파일 카빙(file carving) 기반의 복원과는 다른 개념으로, 기존 기법으로는 복원할 수 없었던 손실된 정보를 복원하는 것이 목적이다. 새로운 복원 기법을 수행하는 과정에서 필요한 작업이지만 사람이 직접 수행할 수 없거나 너무 많은 시간이 소요되는 작업을 심층 신경망을 활용해 자동화할 수 있는 방안을 제안하였으며 관련한 실험을 진행하였다. 실험 결과, 심층 신경망을 활용해 음성, 비음성 분류나 음성파일 부호화 방식의 식별이 가능해 기존 파일 카빙 기반 방법이 복원하지 못하는 파일을 복원할 수 있었다.

남성과 여성의 음성 특징 비교 및 성별 음성인식에 의한 인식 성능의 향상 (Comparison of Male/Female Speech Features and Improvement of Recognition Performance by Gender-Specific Speech Recognition)

  • 이창영
    • 한국전자통신학회논문지
    • /
    • 제5권6호
    • /
    • pp.568-574
    • /
    • 2010
  • 음성인식에서의 인식률 향상을 위한 노력의 일환으로서, 본 논문에서는 성별을 구분하지 않는 일반적 화자독립 음성인식과 성별에 따른 음성인식의 성능을 비교하는 연구를 수행하였다. 실험을 위해 남녀 각 20명의 화자로 하여금 각각 300단어를 발성하게 하고, 그 음성 데이터를 여성/남성/혼성A/혼성B의 네 그룹으로 나누었다. 우선, 성별 음성인식에 대한 근거의 타당성을 파악하기 위하여 음성 신호의 주파수 분석 및 MFCC 특징벡터들의 성별 차이를 조사하였다. 그 결과, 성별 음성인식의 동기를 뒷받침할 정도의 두드러진 성별 차이가 확인되었다. 음성인식을 수행한 결과, 성을 구분하지 않는 일반적인 화자독립의 경우에 비해 성별 음성인식에서의 오류율이 절반 이하로 떨어지는 것으로 나타났다. 이로부터, 성 인식과 성별 음성인식을 계층적으로 수행함으로써 화자독립의 인식률을 높일 수 있을 것으로 사료된다.

ISDN에서의 신호방식

  • 이남희
    • ETRI Journal
    • /
    • 제9권4호
    • /
    • pp.58-71
    • /
    • 1987
  • No.7 신호방식은 종합정보통신망에서 음성 및 비음성의 회선교환 서비스를 제공하기 위한 국간 신호방식 기능을 수행할 뿐만 아니라, 망을 지능화하고 여러가지 보조서비스들을 제공하며 망을 보다 효율적으로 운용 관리하기 위하여 통신망내의 프로세서들 간에 사용되는 범용적 데이터 통신 프로토콜로서, 디지틀 가입자-망 액세스와 함께 종합정보통신망을 실현하기 위해 필수적으로 요구되는 새로운 신호방식이다. 본 고는 최근의 CCITT 연구결과를 바탕으로 종합 정보통신망과 비관련된 전화사용자부(Telephone User Part)와 데이터 사용자부(Data User Part) 를 제외한 전반적 No. 7 신호방식에 대하여 기술한다. 더불어 이러한 No. 7 신호방식이 운용되는 공통선 신호망에 대하여 간략히 설명한다.

  • PDF

무선 데이터 통신 기술 통신기술

  • 조균연;조동호
    • 전기의세계
    • /
    • 제43권12호
    • /
    • pp.24-31
    • /
    • 1994
  • 선진 외국에서 제공하는 각종 무선 데이타 서비스를 살펴보면 유럽에서는 이동 데이타 통신 및 서비스가 이미 상용화 단계에 있고, 이동 통신을 이용한 교통제어 시스템이 실용화되고 있으며 무선 데이타 통신망을 전국적으로 구축하여 행정, 사법, 공공사업등의 각종 서비스를 제공하고 있다. 또한, 이동통신 기술을 보유한 영국, 스웨덴, 미국, 일본 등에서는 음성 뿐만 아니라 비음성 통신 서비스에 필요한 기술등을 개발하여 이를 mobitex, mobifax, 문자표시행 pager등을 개발하는데 활용하고 있으며, 위성을 이용한 이동 데이타 서비스도 계획하고 있다. 따라서, 여기서는 이러한 무선 데이터 통신 기술의 주요 특징 및 동작원리에 대해 다루고자 한다.

  • PDF

2-선식가입자 선로를 통해 DPSK로 변조된 음성 및 비음성 신호의 시간압축다중화 전송에 관한 연구 (A Study on the TCM Transmission of Voice/Nonvoice Signals Modulated by DPSK through the 2-Wire Subscriber Loop)

  • 장청룡;강창언
    • 한국통신학회:학술대회논문집
    • /
    • 한국통신학회 1986년도 춘계학술발표회 논문집
    • /
    • pp.107-112
    • /
    • 1986
  • This paper presents one method to resolve the end-to-end digital connectivity through 2-wire subscriber loop. This system which consists of the subscriber`s device and the line termination device makes use of the advantages of time compressed multiplexing and modified DPSK. Experimental results show that the transmission range of the lab test covers 2km and that of the field test covers 1.5km.

  • PDF

연속 은닉 마코프 모델을 이용한 한국어 음성 인식을 위한 효율적 음절 모델링 (Effective Syllable Modeling for Korean Speech Recognition Using Continuous HMM)

  • 김봉완;이용주
    • 한국음향학회지
    • /
    • 제22권1호
    • /
    • pp.23-27
    • /
    • 2003
  • 최근 연속 음성 인식에서의 성능 향상을 위해 음절을 인식 단위로 사용하고자 하는 노력들이 보고되고 있다. 그러나 음절의 경우 음소에 비해 학습성이 음소에 비해 좋지 않고, 모델의 수가 음소에 비해 매우 많으므로 음절 경계에서의 문맥 종속 모델링이 어렵다는 단점을 갖고 있다. 본 논문에서는 한국어에서의 음절의 학습성을 향상시키기 위한 방법과 음절경계에서의 음소 문맥 종속 음절 모델링을 제안한다. 제안된 방법을 단어 인식 실험에 적용한 결과, 기존의 음절 모델과 비교하여 평균 46.23%의 에러 감소율을 보였다 우측 음소 종속 음절 모델 (right phone dependent syllable model)의 경우 트라이폰(triphone) 모델에 비해 16.7%의 에러 감소율을 볼 수 있었다.

음성신호 분석 요소의 적용으로 헬륨가스 흡입이 음성 기관의 특성 변화에 미치는 영향 (The Effect of Helium Gas Intake on the Characteristics Change of the Acoustic Organs for Voice Signal Analysis Parameter Application)

  • 김봉현;조동욱
    • 정보처리학회논문지B
    • /
    • 제18B권6호
    • /
    • pp.397-404
    • /
    • 2011
  • 본 논문에서는 헬륨가스 흡입에 따른 조음기관의 특성이 변화되는 것을 측정하기 위해 음성분석학적 요소의 적용을 통한 실험을 수행하였다. 헬륨가스는 기존에 잠수부가 사용하던 질소가스가 인체에 치명적인 공기 색전증을 유발하게 되면서 이를 극복하기 위한 대체 호흡용 가스로 사용되고 있다. 그러나, 헬륨가스는 명료도가 낮은 squeaky voice를 유발하기 때문에 잠수부들의 비정상적인 음성에 대한 해석에 어려움이 많다. 따라서, 헬륨가스가 음성기관에 미치는 영향을 음성분석학적 특성 변화로 측정하기 위해 헬륨가스 흡입 전과 후의 음성을 기반으로 피치 및 스펙트로그램 측정, 분석에 대한 실험을 수행하였다.