• Title/Summary/Keyword: 음성 동작

Search Result 317, Processing Time 0.023 seconds

An Implementation of Multimedia Game using Speech Recognition for Windows (Windows환경에서 음성인식을 이용한 멀티미디어 게임의 구현)

  • 윤재선
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06e
    • /
    • pp.335-338
    • /
    • 1998
  • 본 논문에서는 음성인식 알고리즘인 HMM을 사용하여 Windows 환경에서 온라인으로 사용할 수 있는 음성인식 게임“Voice Illust Magic”개발에 관하여 소개한다. 사용자와 컴퓨터가 상호작용(Interaction)할 수 있는 매체를 마우스와 키보드뿐만 아니라 게임에 필요한 명령어를 음성인식으로 실행함으로써 정보전달이 매우 효과적으로 이루어져 사용자가 접근하기 쉽고 편리하게 되었으며 의사전달 효율을 높일 수 있었다. 음성인식 과정을 온라인으로 마이크를 통해 들어온 음성을 자동으로 끝점을 검출한 후, Mel-Cepstrum을 추출하여 Word 단위의 reference HMM과 비교하여 최적의 model이 선택되면, 윈도우즈에게 메시지를 보내어 마우스나 키보드가 동작하는 것과 마찬가지로 실행되도록 하였다. 또한, 입력 음성을 모든 reference pattern과 비교하는 것이 아니라 그 상황에 적용될 수 있는 표준 패턴을 한정함으로써 탐색시간을 줄일 수 있었으며 높은 인식률을 나타내었다.

  • PDF

Mobile Control System using Semantic Analysis of User's Intent (화자 의도 분석을 통한 모바일 기기 제어 시스템)

  • Park, Hee-Guen;Jang, Jung-Hoon;Ahn, Young-Min
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06b
    • /
    • pp.282-284
    • /
    • 2012
  • 음성 인식 기술의 발전과 더불어 다양한 분야에서 음성 인식 시스템이 활용되고 있다. 본 논문에서는 사용자 음성으로부터 입력된 문장의 의도를 파악하여 모바일 기기를 제어할 수 있는 시스템에 대해서 기술한다. 사용자의 의도를 파악하기 위해, 동일한 의미를 가진 문장 형태들을 LSP(Lexico Semantic/Syntactic Pattern)로 구성하였고, 이를 이용하여 입력된 문장의 의도를 파악할 수 있는 문장-의미 분석 시스템을 구현하였다. 사용자의 음성 인식은 구글 안드로이드 음성 인식 모듈을 이용하였으며, 음성 인식 모듈과 문장-의미 분석 시스템을 통해 얻어진 화자의 의도는 모바일 기기의 동작과 연결된다. 본 논문은 자연적인 음성 명령을 통해 자연스러운 모바일 제어가 가능하다는 것을 보여준다.

Design and Implementation of a Phone System Operating on PDA (PDA기반 음성전화시스템의 설계 및 구현)

  • 안용운;김상철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.04a
    • /
    • pp.199-201
    • /
    • 2001
  • 최근 모바일 컴퓨팅 기술이 발전되면서, PDA 등과 같은 소형 컴퓨팅 장치가 빠른 속도로 보급되고 있다. PDA는 이동전화나 무선 LAN 등을 통해서 다른 PDA 또는 일반 컴퓨터에 접속해서 메일 수신, 인터넷, 채팅 등에 사용되고 있다. 우리는 PDA간 또는 PDA와 데스크탑 컴퓨터간의 음성통신 기능을 제공하는 음성 전화 시스템을 개발하였다. 본 논문은 우리가 개발한 음성 전화 시스템의 기능, 구조, 구현을 소개한다. 우리의 음성 전화 시스템은 Windows CE 환경 하에서 동작하고 H.323을 지원하도록 설계되어있다. 또한, 본 논문에서는 음성통신을 위한 송, 수신 버퍼 사용의 효율적인 방법을 제안한다. 우리의 조사에 의하면, Windows CE 기반의 음성전화시스템에 대한 기존 연구가 거의 발표되지 않았다.

HEEAS: On the Implementation and an Animation Algorithm of an Emotional Expression (HEEAS: 감정표현 애니메이션 알고리즘과 구현에 관한 연구)

  • Kim Sang-Kil;Min Yong-Sik
    • The Journal of the Korea Contents Association
    • /
    • v.6 no.3
    • /
    • pp.125-134
    • /
    • 2006
  • The purpose of this paper is constructed a HEEAAS(Human Emotional Expression Animaion System), which is an animation system to show both the face and the body motion from the inputted voice about just 4 types of emotions such as fear, dislike, surprise and normal. To implement our paper, we chose the korean young man in his twenties who was to show appropriate emotions the most correctly. Also, we have focused on reducing the processing time about making the real animation in making both face and body codes of emotions from the inputted voice signal. That is, we can reduce the search time to use the binary search technique from the face and body motion databases, Throughout the experiment, we have a 99.9% accuracy of the real emotional expression in the cartoon animation.

  • PDF

Enhancement of Noisy Speech by FORWARD/BACKWARD Adaptive Digital Filtering (FORWARD/BACKWARD 적응필터를 이용한 음질향상에 관한 연구)

  • 김제우;은종관
    • The Journal of the Acoustical Society of Korea
    • /
    • v.5 no.1
    • /
    • pp.17-23
    • /
    • 1986
  • 본 논문에서는 FORWARD/BACKWARD 적응 디지털필터를 이용하여 잡음이 섞인 음성의 음질 을 향상하는 방법에 대해 고찰하였다. 이 알고리즘은 음성신호의상관성을 잘 이용하기 위한 현재의 sample을 예측하기 위해 음성신호의 과거 신호뿐만 아니라 미래의 신호도 사용하였다. 이 결과 이 방법 은 백색잡음뿐만 유색잡음의 제거에도 효과적임을 알 수 있었다. 또, 이 방법을 개선한 modified forward/backward 적응 디지털 필터링 방법을 제시하여 성능 향상을 꾀하엿다. 이 개선된 방법은 비교 적 구조가 간단하면서도 여러 종류의 additive noise 에 대해서 잘 동작하며 기존의 방법에 비하여 약 2 유 정도의 개선된 효과를 가져온다.

  • PDF

Intelligent Peripheral 의 기능과 Signaling

  • 신석현;권은희;홍성주
    • Information and Communications Magazine
    • /
    • v.11 no.3
    • /
    • pp.66-73
    • /
    • 1994
  • IP(intelligent peripheral)은 AIN(Advanced Intelligent Network)을 구성하는 망 요소들 중의 하나로 사용자와의 상호동작을 제공하여 지능망 서비스를 보다 유연하고 다양하게 하는 지능망 지원 시스팀인 동시에, 자체적으로 새로운 서비스를 제공할 수도 있는 시스팀이다. IP는 AIN 교환기에 ISDN PRI(primary rate access interface)를 통하여 연결되어지고, SCP(Service Control Point)/Adjunct의 통제하에 음성안내, 음성인식, 테스트/음성 변환 등의 기술을 이용하여 사용자로부터 정보를 수집하고, 저장된 정보를 전달하는 기능을 수행한다. 본 고에서는 IP 시스팀의 하드웨어/소프트웨어적인 구조, 기능, 사용자와의 IP를 연결시켜주는 신호방식, IP가 서비스 제공을 위해 사용자와 어떻게 연결되는지를 프로토콜 측면에서 예를 들어 설명하고, 마지막으로 이러한 IP 개발 관련 소요기술과 활용방안을 고찰한다.

  • PDF

Design and Implementation of the Language Processor for Educational TTS Platform (음성합성 플랫폼을 위한 언어처리부의 설계 및 구현)

  • Lee, Sang-Ho
    • Proceedings of the KSPS conference
    • /
    • 2005.11a
    • /
    • pp.219-222
    • /
    • 2005
  • 본 논문에서는 한국어 TSS 시스템을 위한 언어처리부의 설계 및 구현 과정을 설명한다. 구현된 언어처리부는 형태소 분석, 품사 태깅, 발음 변환 과정을 거쳐, 주어진 문장의 가장 적절한 발음열과 각 음소의 해당 품사를 출력한다. 프로그램은 표준 C언어로 구현되어 있고, Windows와 Linux에서 모두 동작되는 것을 확인하였다. 수동으로 품사가 할당된 4.5만 어절의 코퍼스로부터 형태소 사전을 구축하였으며, 모든 단어가 사전에 등록되어 있다고 가정할 경우, 488문장의 실험 자료에 대해 어절 단위 오류율이 3.25%이었다.

  • PDF

An Implementation of Crossward Game using Speech Recognition and Synthesis System (음성인식 및 합성을 이용한 십자말 게임의 구현)

  • Kim Dong-Ju;Youn Jeh-Seon;Lee Young-Ju;Kim Dong-Hwan;Hong Kwang-Seok
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.29-32
    • /
    • 2001
  • 본 논문에서는 연구실에서 만든 음성인식기와 합성기를 이용하여 십자말 게임을 구현하였다. 십자말 게임에는 고사성어 600개 정도의 단어가 사용되었으며, 다른 영역별 사전을 추가 할 수 있도록 만들어졌다. 구현된 게임은 시작, 진행 등의 모든 과정이 음성으로 동작하며, 부과적인 정보는 음성 합성(TTS)에 의해 이루어진다. 십자말 게임에 사용되는 단어의 배열은 매번 랜덤하게 선택되도록 구성되며, 음성 인식기는 VCCV (Vowel + Consonant + Consonant + Vowel) 기반의 화자독립으로 구현되었다. 선택된 문제에 대한 설명은 텍스트로 보여주면서, 동시에 TTS 시스템에 의해 음성으로 출력된다.

  • PDF

An End Point Detection Technique Using the LSP Distance in EVRC Packets (EVRC 패킷에서 LSP 거리를 이용한 음성 끝점 검출)

  • 민병준;강명수
    • The Journal of the Acoustical Society of Korea
    • /
    • v.18 no.6
    • /
    • pp.44-48
    • /
    • 1999
  • This paper presents a simple and fast method for end point detection under low-level noisy environment. The proposed algorithm uses a threshold logic with LSP distances and takes vocoded packets as input to the recognition system. The results from the proposed method are compared with those manually checked in decoded speeches. From the result it exhibits acceptable accuracy.

  • PDF

Automatic Adaptation Based Metaverse Virtual Human Interaction (자동 적응 기반 메타버스 가상 휴먼 상호작용 기법)

  • Chung, Jin-Ho;Jo, Dongsik
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.11 no.2
    • /
    • pp.101-106
    • /
    • 2022
  • Recently, virtual human has been widely used in various fields such as education, training, information guide. In addition, it is expected to be applied to services that interact with remote users in metaverse. In this paper, we propose a novel method to make a virtual human' interaction to perceive the user's surroundings. We use the editing authoring tool to apply user's interaction for providing the virtual human's response. The virtual human can recognize users' situations based on fuzzy, present optimal response to users. With our interaction method by context awareness to address our paper, the virtual human can provide interaction suitable for the surrounding environment based on automatic adaptation.