통합 검색 | Korea Science

음성인식을 이용한 URL Navigator 개발 (A Development of an URL Navigator using Speech Recognition)

전한길;홍인숙;김윤중
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2009년도 춘계학술발표대회
- /
- pp.122-125
- /
- 2009
기존의 인터넷 익스플로러는 높은 보급률의 이점을 지니고 있지만 인터넷을 이용하기 위한 기본지식의 필요성과 키보드, 마우스와 같은 장치를 이용한 입력방식은 장애인 및 고령층의 사용자들이 이용하기에는 불편하다. 이와 같은 문제점을 해결하고자 본 논문에서는 웹 서비스 기술을 이용하여 기존의 음성인식 시스템을 웹 서비스로 재구성하고 클라이언트가 음성인식 웹 서비스를 요청하고 음성명령이 가능하도록 인터넷 익스플로러에 음성명령이 가능한 Navigaotr를 Toolbar 형태의 프로그램을 구현하였다. 본 시스템은 클라이언트가 사용하는 음성 Navigator Toolbar와 웹 서비스를 통해서 음성 서비스를 제공하는 음성 서비스 프로바이더로 구성된다. 음성 Navigator Toolbar는 인터넷 환경에서 음성데이터를 바이너리 포맷형식인 DIME을 이용하여 음성 서비스 프로바이더로 전송하고 반환 결과를 가지고 URL Navigator를 통해 인터넷 페이지를 이동시킨다. 음성 서비스 프로바이더는 사용자가 전송한 음성데이터를 인식기를 통해 인식하고 결과를 가지고 정보 Database를 검색하여 실제 인터넷 주소를 사용자에게 반환한다.
https://doi.org/10.3745/PKIPS.y2009m04a.122 인용 PDF

음성인식을 위한 웹페이지 변환 웹서비스와 음성라이브러리 구현 (An Implementation of the Speech-Library and Conversion Web-Services of the Web-Page for Speech-Recognition)

오지영;김윤중
- 한국콘텐츠학회:학술대회논문집
- /
- 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
- /
- pp.478-482
- /
- 2006
본 연구에서는 음성인식을 위한 웹페이지 변환 웹서비스와 음성을 녹음하고 전송하는 음성라이브러리를 구현하였다. 구현된 시스템은 웹서비스 소비자와 웹서비스 제공자들로 구성되어 있다. 웹서비스 소비자는 음성을 녹음하고 웹서비스를 호출하여 음성인식을 요청한 후 결과를 사용자에게 반환하는 기능을 한다. 웹서비스 소비자는 음성라이브러리(speech-Library)와 웹서비스와 통신하는 프록시라이브러리를 포함한다. 음성라이브러리는 사용자가 녹음한 음성에서 음성데이터만 추출하는 전처리 과정과 사용자의 음성과 매핑되는 링크를 검색하는 기능을 수행한다. 프록시라이브러리의 기능은 두개의 웹서비스를 호출하고 반환되는 결과 값을 수신 받는다. 웹서비스 제공자는 파싱 웹서비스와 음성인식 웹서비스로 구성되어있다. 파싱 웹서비스는 일반 웹페이지를 ActiveX 컨트롤을 삽입하여 음성인식이 가능한 웹페이지로 재구성한다. 음성인식 웹서비스는 기존의 연구에서 구현된 시스템을 사용하였다. 실험 결과, 일반 웹페이지를 재구성하고 링크 테이블을 생성한 것을 확인할 수 있었다. 또 한 사용자의 음성과 매핑되는 URL을 검색하는 것도 확인하였다. 또한 음성인식 웹서비스의 결과에 매핑되는 URL를 검색하여 사용자에게 웹페이지를 반환하는 것도 확인하였다.
PDF

모바일 환경에서 인증과 음성인식을 위한 웹 서비스 구현 (An Implementation of the Web Service for Authorization and Speech Recognition in the Mobile Environment)

오지영;김윤중;고유정
- 한국멀티미디어학회논문지
- /
- 제8권2호
- /
- pp.225-232
- /
- 2005
PDA는 저장 공간이 제약적이고 입력을 위해 펜 기반장치를 사용해야 하므로 불편함을 지닌다. 본 논문에서는 이러한 불편함을 보완하기 위하여 기존의 음성인식 시스템을 XML(extensible Markup Language) 웹 서비스로 제공하고, PDA에서 음성인식 웹 서비스를 요청함으로써 음성명령이 가능하도록 구현하였다. 본 시스템의 구성은 모바일 클라이언트와 음성인식 웹 서비스 프로바이더로 되어 있다. 모바일 클라이언트는 사용자정보와 음성 데이터를 DIME(Direct Internet Message Encapsulation)을 이용하여 음성 인식 웹 서비스 프로바이더를 요청한다. 음성 인식 웹 서비스 프로바이더는 인증된 클라이언트에 한하여 음성 인식 결과와 사용자명을 반환하는 서비스를 제공한다. 따라서 이 시스템은 PDA에서 대용량의 음성 DB나 음성인식 시스템을 직접 탑재하지 않고도 음성인식 서비스를 이용할 수 있다.
PDF

음성인식기술을 이용한 새로운 서비스 (New Services based on speech recognition technology)

구명완
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1995년도 제12회 음성통신 및 신호처리 워크샵 논문집 (SCAS 12권 1호)
- /
- pp.47-51
- /
- 1995
음성인식기술을 이용한 시스템이 상용화되기 위해서 필요한 기술의 최근 동향과 현재의 기술로 실용화가 이루어지고 있는 서비스등에 대해 알아본다. 최근의 음성인식기술은 실용화를 목표로 음성 인식을 위한 기본 유니트 선정, 화자의 음성을 거절하는 기능, 및 실시간 구현 기술에 대한 연구가 활발히 진행되고 있다. 한편 현재의 기술로 가능한 실용서비스로는 전화번호 안내, 음성 다이얼링 서비스 등과 같이 현재 제공되고 서비스의 비용을 절감시키는 것과 교통안내, 날씨안내, 영화관 예약에 음성인식기술을 적용하여 새로운 서비스를 제공하는 것이 있다.
PDF

음성 인식용 웹페이지를 위한 웹서비스 제공자의 구현 (Implementation of the Web Service Provider for the Speech Recognition Web Page)

오지영;김윤중
- 한국멀티미디어학회:학술대회논문집
- /
- 한국멀티미디어학회 2003년도 추계학술발표대회(상)
- /
- pp.257-260
- /
- 2003
본 논문은 일반 웹페이지를 음성인식이 가능한 웹페이지로 전환하고, 이 페이지가 사용 될 수 있는 웹서비스를 구현하였다. 본 연구에서 구현한 시스템은 웹서비스 소비자와 웹서비스 제공자로 구성되어 있다. 웹서비스 소비자는 다음에 설명하는 두개의 웹서비스 제공자를 호출하는 기능과 재구성된 웹페이지외 xml 문서를 저장하는 기능, xml 문서로부터 사용자의 음성과 매핑되는 URL을 검색하는 기능을 포함하고 있다. 웹서비스 제공자는 웹페이지를 변환하는 웹서비스 제공자와 음성인식 웹서비스 제공자이다. 웹페이지 변환 웹서비스 제공자는 일반 웹페이지를 분석하여 필요한 태그를 변환하는 기능과 하이퍼링크 값인 URL을 추출하는 기능으로 구성되어 있다. 사용자의 음성을 분석하고 인식하는 음성인식기는 기존의 연구에서 구현된 음성인식 웹서비스 제공자를 이용하였다.
PDF

Intelligent Peripheral의 특수 음성 자원을 이용한 Universal Personal Telecommunications 서비스 (Universal Personal Telecommunications using Specialized Resource Functions in the Intelligent Peripheral)

김기령;김태일;최고봉
- 한국정보처리학회논문지
- /
- 제3권6호
- /
- pp.1506-1514
- /
- 1996
본 논문은 지능형 정보 제공 시스템(IP:Intelligent Peripheral)의 특수 음성 자 원을 활용하여 음성 인증과 음성편집 기능을 추가한 새로운 종합 개인 통신(UPT: Universal Personal Telecommunication)을 제안한 것이다. 기존의 UPT 서비스가 인증 번호를 디지트로 입력하여 이용자의 인증 절차를 수행하던 것과는 달리, 본 연구에서 제안된 음성 인증 기능은 IP의 음성 검증 자원을 활용함으로써 서비스 절차를 간편하 게 하고, UPT 번호의 오용을 방지할 수 있게 한다. 또한, 미리 녹음된 음성 혹은 UPT 서비스 프로파일에 수록된 내용만을 서비스 이용자에게 음성 안내하던 기존의 UPT 서 비스와는 달리, 음성 편집 기능은 지능망 서비스 호 진행 중에 서비스 이용자로부터 음성을 수집하여 편집함으로써 UPT 이용자에게 발신자 통보, 메시지 전달 등의 다양 한 음성 정보 서비스의 제공을 가능하게 한다.
PDF

음성다이얼서비스 시스팀 개발

신동헌
- 정보처리학회지
- /
- 제3권1호
- /
- pp.102-108
- /
- 1996
통신 선진국들은 음성인식기술을 이용한 통신망에서의 여러 가지 부가서비스 개발을 추진함으로써 서비스를 자동화하여 인력절감 및 고부가치를 추구하는데 노력하여 왔으며 최근에는 가입자들을 대상으로 개발완료된 시스팀들의 시험서비스를 제공하면서 상용화에 박차를 가하고 있다 특히 미국의 NYNEX사는 '93년 3월부터 가입자들을 대상으로 "음성다이얼서비스"를 시험제공함으로써 음성인식기술을 활용한 교환서비스를 세계최초로 시작하였다 한국통신에서도 "자동통역전화요소기술 연구"를 통하여 그동안 음성인식기술에 대한 요소기술을 확보하였으며 현보유기술로도 자체적으로 국제 경쟁력이 있는 음성다이얼 서비스 구현이 가능하다고 판단되어 소프트웨어연구소에서는 '94년부터 시내사업본부 개발과제로 시스팀개발에 착수하였다. 본고에서는 음성다이얼서비스 개요와 서비스 구성, 그리고 장치의 구현에 대하여 단계별로 기술하였다. 구현에 대하여 단계별로 기술하였다.
PDF

VoiceXML기반 HUVOIS 음성처리 솔루션 (HUVOIS speech service solution based on VoiceXML)

김문식
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 2004년도 추계학술발표대회논문집 제23권 2호
- /
- pp.33-34
- /
- 2004
통화 위주의 기능이 주류를 이루고 있던 전화 서비스시장에 다양한 정보를 제공하기 위한 첨단 부가서비스를 제공하기 위해서는 인터넷과의 연동, 음성인식, 음성합성, 음성녹음 등의 요소들을 제공할 수 있어야 하며, 여러 고객의 다양한 요구사항을 수용하기 위한 서비스 시나리오의 개발 방법이 제공되어야 한다. HUVOIS solution 은 WWW 콘서시엄의 표준에 따른 VoiceXML 2.0 인터프리터 엔진과 음성인식엔진, 음성합성엔진을 수용하였으며 신규 부가서비스를 쉽고 빠르게 제공할 수 있는 환경을 제공하기 위하여 개발되었다. 본 논문에서는 KT가 개발한 HUVOIS 솔루션과 이를 이용한 각종 서비스 및 사업에 대하여 기술하였다.
PDF

자연어 음성인식 기술을 이용한 음성 대화 서비스 개발동향 (Spoken Dialogue Service Trends Using Natural Speech Recognition Technology)

정호영;송화전;강병옥;정의석;정훈;오유리;권오욱;이기영;이윤근
- 전자통신동향분석
- /
- 제26권5호
- /
- pp.14-28
- /
- 2011
모바일 혁명과 빅데이터(big data) 시대에 접어들면서 사용자 중심의 자연스러운 인터페이스와 정보검색에 대한 요구가 늘어가고 있다. 모바일 환경에서의 쉽고 자연스러운 검색을 위해 음성인식 기술을 이용한 음성검색 서비스가 대세를 이루고 있으며 대화형 검색 서비스로 발전하게 될 것이다. 음성 대화 서비스의 주요 응용 분야인 음성검색 및 외국어 교육 서비스에서의 자연어 음성인식 기술 역할 및 사용자 경험을 바탕으로 하는 선순환 구조의 인식 성능 개선에 대해 소개한다. 또한 두 응용분야에서의 국내외 개발동향을 소개하고 실제 개발 사례를 통해 무제한급 자연어 음성인식 기술에 기반한 음성 대화 서비스의 가능성을 살펴본다.
PDF

원헝 ad hoc 방식의 음성 컨퍼런스 시스템 (Voice Conference System Based On Circular ad hoc)

김철한
- 한국정보통신설비학회:학술대회논문집
- /
- 한국정보통신설비학회 2003년도 하계학술대회
- /
- pp.123-126
- /
- 2003
최근 컴퓨터 및 통신 기술의 발전으로 인터넷 전화 서비스가 증가하고 있다. 지금까지의 인터넷 전화 서비스는 1:1 방식의 서비스가 주류를 이루었으나, 점차 다자간 음성 채팅, 원격 강의 등과 같은 N:N 방식의 음성 컨퍼런스 서비스에 대한 수요가 급증하고 있다. 그러나 기존의 음성 컨퍼런스 시스템은 별도의 컨퍼런스 서버 구축, 부하 집중 사용자 수의 증가에 따른 음성 트래픽 증가 등의 문제로 일정한 통화 품질을 유지하기 어렵다는 단점이 있다. 따라서, 본 논문에서는 이와 같은 문제를 개선하기 위한 ad hoc 방식의 음성 컨퍼런스 시스템을 제안하였다. 그리고 이 시스템의 성능 분석을 통하여 최소 4명의 참여자까지 일정한 음성 품질이 보장됨을 확인함으로써 본 논문에서 제안하는 시스템의 타당성을 검증하였다.
PDF

검색결과 1,467건 처리시간 0.04초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)