Search | Korea Science

이영직
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.08a
- /
- pp.367-370
- /
- 1998
정보통신부 출연의 "HCI를 위한 음성 입출력 처리 기술 개발" 과제에 대하여 기술한다. 이 과제의 주 목적은 PC 윈도우 환경에서 사람과 기계 간의 음성 입출력 기술을 개발하는 것이다. 이를 위해 음성 인식 분야에서는 화자 적응, 잡음 적응, 및 인식 대상 어휘 적응 기술을 개발하며, 합성 분야에서는 시스템 메시지 합성 기술을 개발한다. 또, 음성이 기존의 입출력 수단인 키보드나 마우스를 모두 대치할 수 없으므로, 본 과제에서는 음성이 추가됨으로써 입출력이 편리해지는 다중 모드 입출력 기술의 갭라에 초점을 맞추어 기술을 개발하고 있다. 인식 분야의 주요 연구내용은 음성검출 및 비음성 제거, 인식 속도 향상, 인식 성능 향상이며, 합성 분야 주요 연구 항목은 학습형 합성기 알고리즘 및 이의 문제점 해결이다. 본 논문은 이러한 점을 정리하여 발표한다.정리하여 발표한다.
PDF

이용주;김경태;정현열;조철우
- Information and Communications Magazine
- /
- v.11 no.9
- /
- pp.79-92
- /
- 1994
음성인식 및 합성 시스템으로 대표되는 음성입출력장치의 개발 및 실용화에 따라 이들의 성능을 객관적으로 평가할 수 있는 방법이 중요하게 되었다. 그러나 국내에서의 이분야에 대한 체계적인 연구는 맞지 않다. 본고에서는 이와 관련한 지금까지의 국내외 연구예들을 검토하고 우리 실정에 맞는 평가법 작성을 위한 방법을 모색하고자 한다. 음성입출력장치의 객관적인 평가방법이 확립되면 연구 개발자는 여러방식의 우열을 객관적으로 파악할 수 있고 신뢰성있는 시스템을 효율적으로 개발할 수 있으며 관련제품의 사용자입장에서는 제품간의 성능비교가 가능하게 될 것이다.
PDF

이용주
- Proceedings of the Acoustical Society of Korea Conference
- /
- 1998.08a
- /
- pp.363-366
- /
- 1998
음성언어처리기술의 응용이 활발해져 감에 따라 각국에서는 이들 기술의 성능을 객관적으로 평가하기 위한 국제적인 협력활동이 활발하다. 본고에서는 이들 음성 DB 및 음성 입출력 평가법 관련 국제협력활동을 소개하고 국내에서도 이에 적극적으로 대응하기 위한 방안을 제안하고자 한다.
PDF

Park, Jihwan;Chang, Joon-Hyuk
- Proceedings of the Korea Information Processing Society Conference
- /
- 2018.05a
- /
- pp.460-461
- /
- 2018
본 논문에서는 기존의 단일입출력 환경에서의 칼만필터 기반 반향제거방법을 다중입출력 구조로 확장하는 방법을 제안한다. 다중입출력 구조의 반향제거방법은 단일입출력방식보다 우수한 반향제거 성능을 보이면서도 더욱 낮은 음성왜곡도를 보였다.
https://doi.org/10.3745/PKIPS.y2018m05a.460 인용 PDF

Lim, Mi-Jung;Park, Peom
- 한국HCI학회:학술대회논문집
- /
- 2006.02a
- /
- pp.1011-1018
- /
- 2006
멀티모달 인터페이스는 인간의 제스처, 시선, 손의 움직임, 행동의 패턴, 음성, 물리적인 위치 등 인간의 자연스러운 행동들에 대한 정보를 해석하고 부호화하는 인지기반 기술이다. 본 논문에서는 제스처와 음성, 터치를 이용한 3D 오브젝트 기반의 멀티모달 인터페이스를 설계, 구현한다. 서비스 도메인은 스마트 홈이며 사용자는 3D 오브젝트 직접조작을 통해 원격으로 가정의 오브젝트들을 모니터링하고 제어할 수 있다. 멀티모달 인터랙션 입출력 과정에서는 여러 개의 모달리티를 병렬적으로 인지하고 처리해야 하기 때문에 입출력 과정에서 각 모달리티의 조합과 부호화 방법, 입출력 형식 등이 문제시된다. 본 연구에서는 모달리티들의 특징과 인간의 인지구조 분석을 바탕으로 제스처, 음성, 터치 모달리티 간의 입력조합방식을 제시하고 멀티모달을 이용한 효율적인 3D Object 인터랙션 프로토타입을 설계한다.
PDF

Lee, Yong-Ju;Kim, Gyeong-Tae
- ETRI Journal
- /
- v.8 no.3
- /
- pp.24-28
- /
- 1986
음성인식 기술개발을 위해서는 음성 데이터베이스가 필요하다. 본고에서는 음성 입출력기술 표준화의 일환으로서의 공통음성 데이터 제정에 관한 각국의 현황을 소개하였고, 우리말을 대상으로 한 음운특성 연구용의 데이터베이스를 확보하기 위한 고려사항을 검토하였다.
PDF

석용호;김기철;한일송;이황수
- Information and Communications Magazine
- /
- v.11 no.9
- /
- pp.93-107
- /
- 1994
본 글에서는 음성인식에 적용된 신경망 구조를 알아본다. 또한 신경망 VLSI와 국내에서 개발된 신경망 VLSI인 URAN에 대해서 살펴보고 URAN을 이용한 음성인식 시스템의 설계에 관해 기술한다. 시뮬레이션을 통해 낮은 정밀도의 입출력 및 연결강도, 선형 출력함수를 가지는 뉴런을 사용하는 신경망 음성인식 시스템의 성능을 분석하고 잡음 환경에서 낮은 정밀도를 사용한 신경망의 성능저하 정도를 검토한다.
PDF

Cho, Byoung-Ho;Jang, Yu-Tak;Kim, Woo-Jin;Kim, Ki-Jong;Yoo, Ki-Young
- Journal of KIISE:Computing Practices and Letters
- /
- v.6 no.6
- /
- pp.580-587
- /
- 2000
In this paper, we present a design method of a digital filter converting humming voice melody into MIDI data and a method of adapting it to a distributed multimedia I/O server. MuX uses device-independent DLMs(Dynamic Linking Module) for the inteliace with various I/O devices, and has wave-form audio DLM and MIDI DLM for audio interfaces. In order to expand the audio device interfacing ability of MuX system, we have designed and implemented a filter transforming human voice into MIDI messages. As the methods to input MIDI data are expanded to human voice in addition to MIDI files and MIDI instrument, someone who is not good at playing instruments can also generate the MIDI data, which enables our media interfaces to be used in various applications.
PDF