• 제목/요약/키워드: 음성입출력

검색결과 53건 처리시간 0.025초

HCI를 위한 음성 입출력 처리 기술 개발 (Speech Input/Output Processing Technology for Human-Computer Interface)

  • 이영직
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.367-370
    • /
    • 1998
  • 정보통신부 출연의 "HCI를 위한 음성 입출력 처리 기술 개발" 과제에 대하여 기술한다. 이 과제의 주 목적은 PC 윈도우 환경에서 사람과 기계 간의 음성 입출력 기술을 개발하는 것이다. 이를 위해 음성 인식 분야에서는 화자 적응, 잡음 적응, 및 인식 대상 어휘 적응 기술을 개발하며, 합성 분야에서는 시스템 메시지 합성 기술을 개발한다. 또, 음성이 기존의 입출력 수단인 키보드나 마우스를 모두 대치할 수 없으므로, 본 과제에서는 음성이 추가됨으로써 입출력이 편리해지는 다중 모드 입출력 기술의 갭라에 초점을 맞추어 기술을 개발하고 있다. 인식 분야의 주요 연구내용은 음성검출 및 비음성 제거, 인식 속도 향상, 인식 성능 향상이며, 합성 분야 주요 연구 항목은 학습형 합성기 알고리즘 및 이의 문제점 해결이다. 본 논문은 이러한 점을 정리하여 발표한다.정리하여 발표한다.

  • PDF

음성입출력장치의 성능평가

  • 이용주;김경태;정현열;조철우
    • 정보와 통신
    • /
    • 제11권9호
    • /
    • pp.79-92
    • /
    • 1994
  • 음성인식 및 합성 시스템으로 대표되는 음성입출력장치의 개발 및 실용화에 따라 이들의 성능을 객관적으로 평가할 수 있는 방법이 중요하게 되었다. 그러나 국내에서의 이분야에 대한 체계적인 연구는 맞지 않다. 본고에서는 이와 관련한 지금까지의 국내외 연구예들을 검토하고 우리 실정에 맞는 평가법 작성을 위한 방법을 모색하고자 한다. 음성입출력장치의 객관적인 평가방법이 확립되면 연구 개발자는 여러방식의 우열을 객관적으로 파악할 수 있고 신뢰성있는 시스템을 효율적으로 개발할 수 있으며 관련제품의 사용자입장에서는 제품간의 성능비교가 가능하게 될 것이다.

  • PDF

음성DB 및 음성입출력 평가법 관련 국제협력활동 소개 및 제안 (International Cooperative efforts for speech DB and speech I/O assessement technology)

  • 이용주
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.363-366
    • /
    • 1998
  • 음성언어처리기술의 응용이 활발해져 감에 따라 각국에서는 이들 기술의 성능을 객관적으로 평가하기 위한 국제적인 협력활동이 활발하다. 본고에서는 이들 음성 DB 및 음성 입출력 평가법 관련 국제협력활동을 소개하고 국내에서도 이에 적극적으로 대응하기 위한 방안을 제안하고자 한다.

  • PDF

칼만필터 기반의 다채널 입출력 음향학적 반향제거 방법에 관한 연구 (A Study on MIMO Acoustic Echo Cancellation Based on Kalman filtering)

  • 박지환;장준혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.460-461
    • /
    • 2018
  • 본 논문에서는 기존의 단일입출력 환경에서의 칼만필터 기반 반향제거방법을 다중입출력 구조로 확장하는 방법을 제안한다. 다중입출력 구조의 반향제거방법은 단일입출력방식보다 우수한 반향제거 성능을 보이면서도 더욱 낮은 음성왜곡도를 보였다.

3 차원 오브젝트 직접조작을 위한 데이터 글러브 기반의 멀티모달 인터페이스 설계 (Design of dataglove based multimodal interface for 3D object manipulation in virtual environment)

  • 임미정;박범
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.1011-1018
    • /
    • 2006
  • 멀티모달 인터페이스는 인간의 제스처, 시선, 손의 움직임, 행동의 패턴, 음성, 물리적인 위치 등 인간의 자연스러운 행동들에 대한 정보를 해석하고 부호화하는 인지기반 기술이다. 본 논문에서는 제스처와 음성, 터치를 이용한 3D 오브젝트 기반의 멀티모달 인터페이스를 설계, 구현한다. 서비스 도메인은 스마트 홈이며 사용자는 3D 오브젝트 직접조작을 통해 원격으로 가정의 오브젝트들을 모니터링하고 제어할 수 있다. 멀티모달 인터랙션 입출력 과정에서는 여러 개의 모달리티를 병렬적으로 인지하고 처리해야 하기 때문에 입출력 과정에서 각 모달리티의 조합과 부호화 방법, 입출력 형식 등이 문제시된다. 본 연구에서는 모달리티들의 특징과 인간의 인지구조 분석을 바탕으로 제스처, 음성, 터치 모달리티 간의 입력조합방식을 제시하고 멀티모달을 이용한 효율적인 3D Object 인터랙션 프로토타입을 설계한다.

  • PDF

연구 및 평가용 음성 데이터베이스의 개발동향과 제안

  • 이용주;김경태
    • ETRI Journal
    • /
    • 제8권3호
    • /
    • pp.24-28
    • /
    • 1986
  • 음성인식 기술개발을 위해서는 음성 데이터베이스가 필요하다. 본고에서는 음성 입출력기술 표준화의 일환으로서의 공통음성 데이터 제정에 관한 각국의 현황을 소개하였고, 우리말을 대상으로 한 음운특성 연구용의 데이터베이스를 확보하기 위한 고려사항을 검토하였다.

  • PDF

신경망을 이용한 음성인식 시스템

  • 석용호;김기철;한일송;이황수
    • 정보와 통신
    • /
    • 제11권9호
    • /
    • pp.93-107
    • /
    • 1994
  • 본 글에서는 음성인식에 적용된 신경망 구조를 알아본다. 또한 신경망 VLSI와 국내에서 개발된 신경망 VLSI인 URAN에 대해서 살펴보고 URAN을 이용한 음성인식 시스템의 설계에 관해 기술한다. 시뮬레이션을 통해 낮은 정밀도의 입출력 및 연결강도, 선형 출력함수를 가지는 뉴런을 사용하는 신경망 음성인식 시스템의 성능을 분석하고 잡음 환경에서 낮은 정밀도를 사용한 신경망의 성능저하 정도를 검토한다.

  • PDF

멀티미디어 입출력 서버를 위한 오디오 변환 필터 (Audio Transformation Filter for Multimedia I/O Server)

  • 조병호;장유탁;김우진;김기종;유기영
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제6권6호
    • /
    • pp.580-587
    • /
    • 2000
  • 본 논문에서는 음성 입력으로 받아들인 멜로디를 MIDI 데이타로 변환하는 필터의 설계 방법과 분산 멀티미디어 환경에서 동작하는 입출력 서버 시스템인 MuX 환경에 적용하는 방법에 관해 기술한다. MuX는 다양한 입출력 디바이스와의 인터페이스를 위해 장치 독립적인 DLM(Dynamic Linking Module)을 사용하는데, 현재 MuX 시스템의 입출력 디바이스 인터페이스로 사용되는 웨이브 형식의 오디오 DLM과 MIDI(Musical Instrument Digital Interface) DLM의 기능을 보강하기 위해서 사람의 음성을 MIDI 데이타로 변환해주는 필터를 설계하고 구현하였다. MIDI 데이타의 입력 방식이 파일이나 MIDI 악기 외에도 사람의 음성 데이타로도 가능하므로 악기 연구에 익숙하지 않은 사람들도 MIDI 데이타를 입력할 수 있고, 미디어의 표현력이 증가되어 다양한 응용에 활용될 수 있다.

  • PDF