• 제목/요약/키워드: 음성 노력

검색결과 148건 처리시간 0.028초

음소단위 TDNN에 기반한 한국어 연속 음성 인식을 위한 데이타 자동분할 (Automatic segmentation for continuous spoken Korean language recognition based on phonemic TDNN)

  • 박규봉;이근배;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1995년도 제7회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.30-34
    • /
    • 1995
  • 신경망을 이용하는 연속 음성 인식에서 학습이라 함은 인위적으로 분할된 음성 데이타를 토대로 진행되는 것이 지배적이었다. 그러나 분할된 음성데이타를 마련하기 위해서는 많은 시간과 노력, 숙련 등을 요구할 뿐만아니라 그 자체가 인식도메인의 변화나 확장을 어렵게 하는 하나의 요인 되기도 한다. 그래서 분할된 음성데이타의 사용을 가급적 피하고 그러면서도 성능을 떨어뜨리지 않는 신경망 학습법들이 나타나고 있다. 본 논문에서는 학습된 인식기를 이용하여 자동으로 한국어 음성데이타를 분할한 후 그 분할된 데이타를 이용하여 다시 인식기를 재학습시켜나가는 반복 과정을 소개하고자 한다. 여기에는 TDNN이 인식기로 사용되며 인식단위는 음소이다. 학습은 cross-validation 기법을 이용하여 제어된다.

  • PDF

ATM기반 MPLS 기술을 이용한 음성서비스 제공 구조 연구 (A Study of Voice Service Architecture Using MPLS Technology Based on ATM)

  • 윤현식;양선희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (중)
    • /
    • pp.1301-1304
    • /
    • 2002
  • 통신 환경이 변하면서, 기존의 서비스에 따라 크게 음성망과 패킷망으로 구분되던 망 구조가 하나의 통합된 망에서 모든 서비스를 제공하는 구조로 진화하고 있다. 그리고, 이러한 서비스를 가능하게 하는 기술로서 VoIP(Voice over IP)가 최근까지도 계속 각광받고 있다. 그러나, 많은 노력에도 불구하고, 음성서비스와 같은 실시간 서비스의 엄격한 품질 요구조건을 보장하는 문제 때문에 VoIP 기술의 실제 적용이 지연되고 있다. 이에 본 논문에서는 통합망의 패킷 전달망을 ACE2000 MPLS 시스템 기반의 MPLS 망으로 구축함으로써 음성서비스의 품질을 보장하는 망 구조를 제시하고자 한다. 아울러 TE Server를 이용해서, 음성호를 전달하는 ER-LSP(Explicit Routed Label Switched Path)를 설정하는 호 설정 절차를 제시하였다.

  • PDF

VoiceXML을 이용한 음성 DB 수집 시스템 구현 (An Implementation of Speech DB Gathering System Using VoiceXML)

  • 김동현;노용완;홍광석
    • 인터넷정보학회논문지
    • /
    • 제6권1호
    • /
    • pp.39-50
    • /
    • 2005
  • 음성 DB는 음성학, 음성인식, 음성합성 등을 연구할 때 가장 기본적으로 필요한 요소이다. 음성 DB의 양과 질이 개발하고자하는 시스템의 성능을 좌우한다고 할 정도로 음성 DB의 중요성 및 역할은 막중하다. 최근 음성포탈을 비롯한 다양한 전화 서비스 기술의 발달로 인하여 전화 음성 DB 수집의 필요성이 시급한 상황이다. 기존 CTI 분야의 IVR 애플리케이션 전화음성 DB 수집 시스템은 C/C++언어나 전용 개발 도구를 사용하여 이루어져 왔으며, 이로 인하여 각 응용서비스간 자원의 재활용이 어려운 실정이며 많은 인력과 시간을 필요하다는 문제점을 가지고 있다. 그러나, VoiceXML의 전화 음성 DB 수집시스템은 XML에 내포된 태그형식을 갖는 언어로써 쉽고, 간단한 문법체계를 가지고 있어 조금만 노력을 기울이면 손쉽게 작성할 수 있어 인력과 시간을 절약할 수 있는 장점을 가지고 있다. 또한 단지 웹서버에 연결된 DB의 내용만을 변경함으로써 다양한 전화 음성 DB를 수집할 수 있는 장점을 가지고 있다. 본 논문에서는 음성인식이나 음성합성 등 음성정보처리기술의 개발에 가장 중요한 요소인 음성 DB를 Voiceful을 사용하여 전화 음성 DB를 수집하는 시스템을 소개한다.

  • PDF

한국어 음성 웹브라우저 설계 및 구현 (Design and Implementation of Korean Voice Web Browser)

  • 장영건;조경환
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권5호
    • /
    • pp.458-466
    • /
    • 2001
  • 본 논문은 HTML을 분석하여 추출된 내용을 음성으로 변환시키고, 웹 브라우저 제어 및 웹문서의 내용 지정을 위하여 음성인식을 사용하는 음성 웹 부라우저의 설계와 구현에 관한 것이다. 이 시스템의 특징은 보편적 설계기법을 사용하여 정상인과 시각장애인을 모두 고려하여 설계되었으며, 특히 시각장애인 인터페이스를 위하여 웹 문서의 구조를 쉽게 인식할 수 있는 트리 구조를 도입하였고, 웹 브라우저 상에 태그로 표현된 모든 요소를 추출하고, 각 요소에 따라 출력음성의 속성을 다르게 하여 별도의 요소 안내음성 출력이 없이 요소 특성을 인지할 수 있게 하였다. 이 방식은 음성 특징을 세부적으로 표현할 수 있는 청각 스타일 시트의 사용을 배제한 것으로써 웹 문서 작성자가 특별한 추가적 노력 없이, 사용자가 문서내의 구조와 요소들의 특징을 쉽게 인식할 수 있는 장점이 있다.

  • PDF

남성과 여성의 음성 특징 비교 및 성별 음성인식에 의한 인식 성능의 향상 (Comparison of Male/Female Speech Features and Improvement of Recognition Performance by Gender-Specific Speech Recognition)

  • 이창영
    • 한국전자통신학회논문지
    • /
    • 제5권6호
    • /
    • pp.568-574
    • /
    • 2010
  • 음성인식에서의 인식률 향상을 위한 노력의 일환으로서, 본 논문에서는 성별을 구분하지 않는 일반적 화자독립 음성인식과 성별에 따른 음성인식의 성능을 비교하는 연구를 수행하였다. 실험을 위해 남녀 각 20명의 화자로 하여금 각각 300단어를 발성하게 하고, 그 음성 데이터를 여성/남성/혼성A/혼성B의 네 그룹으로 나누었다. 우선, 성별 음성인식에 대한 근거의 타당성을 파악하기 위하여 음성 신호의 주파수 분석 및 MFCC 특징벡터들의 성별 차이를 조사하였다. 그 결과, 성별 음성인식의 동기를 뒷받침할 정도의 두드러진 성별 차이가 확인되었다. 음성인식을 수행한 결과, 성을 구분하지 않는 일반적인 화자독립의 경우에 비해 성별 음성인식에서의 오류율이 절반 이하로 떨어지는 것으로 나타났다. 이로부터, 성 인식과 성별 음성인식을 계층적으로 수행함으로써 화자독립의 인식률을 높일 수 있을 것으로 사료된다.

메디칼 영상처리 보드 및 응용 Software

  • 지영선
    • 대한음성언어의학회:학술대회논문집
    • /
    • 대한음성언어의학회 1995년도 제4회 학술대회 심포지움 및 워크샵
    • /
    • pp.181-184
    • /
    • 1995
  • 일반적으로 의료상에서 방사선 사진 상으로부터 병소 부위를 찾아내어 질병의 유무 및 진단을 해왔으나 명확하지 못한 방사선 사진 자체의 문제점들과 사진 현상시의 문제점들로 인하여 진단의 혼란을 초월할 수 있다. 또한 오래 전부터 컴퓨터의 발달로 인하여 방사선 사진을 입력, 진단하려는 움직임도 있었으나 많은 노력에도 불구하고 입력시키려는 사진이 잡음이 많고 대비가 상당히 안 좋은 상태이므로, 이로 인한 해상도의 문제점으로 이를 기피하고 현상되어 나온 사진자체로 진단을 하려고 하였다. (중략)

  • PDF

LETF IP 텔레포니 프로토콜 분석 (Analysis of IETF IP Telephony Protocols)

  • 최선완;하은용;전경재;최경수;김환철
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2000년도 춘계학술발표논문집
    • /
    • pp.397-400
    • /
    • 2000
  • 인터넷에서 음성 서비스를 제공하는 IP 텔레포니 또는 VOIP(Voice over IP)기술은 대부분 ITU-T H.323을 기반으로 제공되고 있다. 그러나 H.323은 그 구조가 복잡하기 때문에 이해하는데 상당한 노력과 오랜 개발 기간이 요구된다. 특히 표준을 따라 개발한 제품간에 상호연동을 위해서 상당한 노력이 필요하다. LFTF는 이러한 문제를 극복하고 인터넷 환경에서 잘 동작할 수 있는 IP 텔레포니용 프로토콜을 표준화하고 있으며 , 본 논문에서는 이들 프로토콜을 분석한다.

  • PDF

고령친화 AI음성 O2O 서비스의 서비스가치가 태도와 이용의도에 미치는 영향에 관한 연구

  • 이명숙;고인곤
    • 한국벤처창업학회:학술대회논문집
    • /
    • 한국벤처창업학회 2021년도 추계학술대회
    • /
    • pp.125-128
    • /
    • 2021
  • 한국은 2025년 전체 인구 중 65세 이상 인구가 20%을 상회하는 초고령 사회 진입이 전망되면서 노화수준에 맞는 고령친화적인 제품서비스 공급이 요구된다. 특히 시니어 소비자가 사용하기 편리한 인터페이스를 갖춘 서비스가 필요하다. 이에 시니어들은 노화(aging)에 대한 문제의식에 비용을 지불하며 젊은 소비자들과 유사한 소비행태를 보이고, 노화 수준별 건강 유지 및 건강 불안, 돌봄 공백, 사회적 고립 증가 등 사회문제가 복합적으로 심화되면서 고령친화적인 스마트한 Aging Service 공급이 요구된다. 이러한 시기와 맞물려 with코로나시대 시니어 소비자가 사용하기 편리한 인터페이스를 갖는 제품·서비스로 4차 산업혁명의 중심인 AI(Artificial Intelligence)와 정보통신 기술의 노력이 가시화되고 있다. 따라서 IT 기술에 덧입혀 시니어들의 욕구에 부합하는 AI 음성인식 기능을 탑재한 제품 및 서비스가 향후 고령친화산업 성장을 주도할 것으로 전망된다. 이에 본 연구는 '고령친화 AI 음성 O2O 서비스'의 서비스 가치가 태도와 이용의도에 영향을 미치는가를 분석하기 위해 선행이론을 토대로 전문가 델파이 방법을 통해 고령친화 AI 음성 O2O 서비스의 정의를 도출하고 실증분석으로 '고령친화 AI 음성 O2O 서비스'의 서비스가치(상황기반 제공성, 즉시연결성, 위치정확성)와 태도 및 이용의도간의 인과관계를 조사하기 위해 본 연구를 진행하였다.

  • PDF

한국어 발화음성에서 중점단어 탐색을 위한 기본주파수에 대한 연구 (A Study of Fundamental Frequency for Focused Word Spotting in Spoken Korean)

  • 권순일;박지형;박능수
    • 정보처리학회논문지B
    • /
    • 제15B권6호
    • /
    • pp.595-602
    • /
    • 2008
  • 각 문장 별 중점단어는 발화음성을 인식하고 그 의미를 이해하는데 도움을 준다. 발화된 음성신호로부터 중점단어를 탐색할 수 있는 방법을 찾기 위한 노력의 일환으로 실험을 통하여 문장 내에서 중점단어와 그 외의 단어들의 기본주파수의 평균과 분산, 그리고 평균 에너지를 분석해 보았다. 한국어로 된 100개의 발화문장의 음성데이터를 가지고 실험을 한 결과 중점단어는 그 외의 단어들에 비해 대부분 상대적으로 높은 기본주파수의 평균값을 나타내거나 상대적으로 높은 기본주파수의 분산 값을 나타냈다. 이 연구 결과를 이용하면 한국어의 구어문장에서 운율적 특성을 알 수 있을 뿐만 아니라, 자연어 처리를 이용한 핵심어를 추출하는 데에도 도움이 될 것이다.

VoIP망에서 Agent 기반 IP 녹취 시스템 (An Agent Based IP Transcript System in VoIP Network)

  • 임재진;김수희;정인상;정인환
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2006년도 춘계학술발표대회
    • /
    • pp.1243-1246
    • /
    • 2006
  • 초고속 통신망의 확대 적용으로 인터넷의 빠른 성장과 함께 음성과 비디오 그리고 데이터를 통합하고자 하는 노력이 시도되고 있다. VoIP(Voice over IP)는 IP를 이용하여 음성과 데이터를 패킷 형태로 통합하여 실시간으로 전송하는 기술이다[1]. 패킷 네트워크에서 VoIP 시그널링 기술을 이용하면 망 자원으 효율적 이용 및 PSTN에 가까운 음질 그리고 인터넷과 연계한 다양한 음성서비스 지원이 가능하다. 콜센터에서도 VoIP를 사용하게 됨에 따라 VoIP망에서의 녹취 시스템이 필요하다. VoIP 녹취 시스템은 상담원과 고객 간의 통화 내용을 자동으로 녹음하여 보관함으로써 고객의 요구사항을 명확하게 파악할 수 있으며 녹취 데이터의 통계 자료 제공으로 효율적인 관리가 가능하고, 선택 녹취, 스케쥴링 녹취, 상담원의 평가 자료를 제공하여 고객 관리의 질적인 향상을 지원한다. 본 논문에서는 성능에 큰 영향을 주지 않고 기존의 VoIP 녹취 시스템의 문제점을 해결한 에이전트를 포함한 VoIP 녹취 시스템을 제안한다.

  • PDF