• Title/Summary/Keyword: 음성 대화 인식 모듈

Search Result 14, Processing Time 0.037 seconds

A Out-of-vocabulary Processing Technology for the Spoken Language Understanding Module of a Dialogue Based Private Secretary Software (대화형 개인 비서 시스템의 언어 인식 모듈(SLU)을 위한 미등록어(OOV) 처리 기술)

  • Lee, ChangSu;Ko, YoungJoong
    • Annual Conference on Human and Language Technology
    • /
    • 2014.10a
    • /
    • pp.3-8
    • /
    • 2014
  • 대화형 개인 비서 시스템은 사람의 음성을 통해 인식된 음성 인식 결과를 분석하여 사용자에게 제공할 정보가 무엇인지 파악한 후, 정보가 포함되어 있는 앱(app)을 실행시켜 사용자가 원하는 정보를 제공하는 시스템이다. 이러한 대화형 개인 비서 시스템의 가장 중요한 모듈 중 하나는 음성 대화 인식 모듈(SLU: Spoken Language Understanding)이며, 발화의 "의미 분석"을 수행하는 모듈이다. 본 논문은 음성 인식결과가 잘못되어 의미 분석이 실패하는 것을 방지하기 위하여 음성 인식 결과에서 잘못 인식된 명사, 개체명 단어를 보정 시켜주는 미등록어(OOV:Out-of-vocabulary) 처리 모듈을 제안한다. 제안하는 미등록어 처리 모듈은 미등록어 탐색 모듈과 미등록어 변환 모듈로 구성되며, 미등록어 탐색 모듈을 통해 사용자의 발화에서 미등록어를 분류하고, 미등록어 변환 모듈을 통해 미등록어를 사전에 존재하는 유사한 단어로 변환하는 방법을 제안한다. 제안한 방법을 적용하였을 때의 실험 결과, 전체 미등록어 중 최대 52.5%가 올바르게 수정되었으며, 음성 인식 결과를 그대로 사용했을 경우 "원본 문장"과 문장 단위 67.6%의 일치율을 보인 것에 반해 미등록어 처리 모듈을 적용했을 때 17.4% 개선된 최대 85%의 문장 단위 일치율을 보였다.

  • PDF

Design of an Automatic Speech translation system on the Telephone Line (전화망을 통한 자동음성번역 서비스 시스템 설계)

  • Lee Sung-Joo;Lee Yunggik;Yang Jea-Woo
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • spring
    • /
    • pp.57-60
    • /
    • 2002
  • 본 논문에서는 현재 ETRI에서 개발 중인 유/무선 전화망을 통한 다국어간 대화체 음성번역서비스 시스템에 대해서 소개한다. 전화망을 통한 자동음성번역서비스 시스템은 여행대화영역을 서비스 대상영역으로 하고 있고 자동음성번역서비스를 필요로 하는 사용자들은 동일한 장소에서 대면하고 있으며 서로 다른 언어를 사용하기 때문에 서로 의사 소통에 어려움을 겪고 있다고 가정한다. 따라서 여기서 말하는 자동음성번역 시스템의 특징은 인간과 기계간의 인터페이스를 그 대상으로 하는 것이 아니라 인간과 인간사이의 인터페이스를 그 대상으로 하고 있다는 정이다. 인간과 인간사이의 인터페이스 상황에서는 인간의 이해력이 시스템 오류를 정정할 수 있는 여지를 지니고 있다. 따라서 시스템이 사용자의 말하는 의도 혹은 개념만 잘 전달할 수 있다면 서로 다른 언어를 사용하는 사용자들 사이에서도 이러한 시스템을 통한 의사소통이 가능하다. 자동음성번역서비스 시스템은 크게 음성인식모듈 문장해석 및 번역 모듈, 음성합성모듈, 시스템통합 모듈 그리고 전화망 인터페이스 모듈로 나뉜다. 여기서는 자동음성번역 서비스 시스템의 각 모듈들의 주요 특징과 상호 인터페이스 방법에 대해서 소개한다.

  • PDF

Automatic Dialog System for the Elderly with Dementia (치매노인을 위한 자동대화시스템)

  • Kim, Sung-ill;Joo, Chang-bok;Shin, Wee-jae
    • Proceedings of the Korea Institute of Convergence Signal Processing
    • /
    • 2003.06a
    • /
    • pp.137-140
    • /
    • 2003
  • 본 연구는 치매노인환자의 생활의 질을 향상시키기 위한 대화시스템의 개발에 목표를 둔다. 제안된 시스템은 주로 세 가지 모듈, 즉, 음성인식, 시간테이블에 의해 구분된 대화 데이터베이스의 자동검색, 그리고 간호사의 녹음음성에 의한 응답 등으로 구성되어 있다. 우선 치매환자가 요양시설에서 자주 발화하는 대화의 내용을 조사하고, 그들의 발화 음성을 인식하고 적절히 응답하도록 구성하였다. 시스템의 평가를 위해서 시스템이 도입되었을 때와 도입되지 않았을 때를 비교, 조사하였다. 시스템이 도입되지 않았을 때는 간호사가 자유로이 케어서비스를 행할 수 있도록 하였다. 비디오 촬영을 통해서 대상자의 행동 및 반응을 조사한 결과, 치매환자의 요구를 충족시키는데 있어서 대화 시스템이 간호사들보다 더 응답적이었다는 것을 알 수 있었다. 게다가, 제안된 시스템은 상호 대화에 있어서 환자가 더 많이 말하도록 유도함을 알 수 있었다.

  • PDF

A Study On the ASP Module in Conversational Automatic Speech Recognition Flight Information System (대화형 음성 인식 항공정보 시스템에서의 ASP 모듈에 관한 연구)

  • 윤재석;장준식
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.6 no.4
    • /
    • pp.595-603
    • /
    • 2002
  • In this research, it has been shown that how the computer can recognize and understand spoken natural language and its symbolization using VoiceXML and Grammar Specific Language in developing telephone based conversational automatic speech recognition flight information system. In order for user to hear correct information, ASP Module has been revised and its effectivities has been experimented on the Voice portal airplane information system platform.

Dialog System based on Speech Recognition for the Elderly with Dementia (음성인식에 기초한 치매환자 노인을 위한 대화시스템)

  • Kim, Sung-Il;Kim, Byoung-Chul
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.6 no.6
    • /
    • pp.923-930
    • /
    • 2002
  • This study aims at developing dialog system to improve the quality of life of the elderly with a dementia. The proposed system mainly consists of three modules including speech recognition, automatic search of the time-sorted dialog database, and agreeable responses with the recorded voices of caregivers. For the first step, the dialog that dementia patients often utter at a nursing home is first investigated. Next, the system is organized to recognize the utterances in order to meet their requests or demands. The system is then responded with recorded voices of professional caregivers. For evaluation of the system, the comparison study was carried out when the system was introduced or not, respectively. The occupational therapists then evaluated a male subjects reaction to the system by photographing his behaviors. The evaluation results showed that the dialog system was more responsive in catering to the needs of dementia patient than professional caregivers. Moreover, the proposed system led the patient to talk more than caregivers did in mutual communication.

Virtual Dialog System Based on Multimedia Signal Processing for Smart Home Environments (멀티미디어 신호처리에 기초한 스마트홈 가상대화 시스템)

  • Kim, Sung-Ill;Oh, Se-Jin
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.15 no.2
    • /
    • pp.173-178
    • /
    • 2005
  • This paper focuses on the use of the virtual dialog system whose aim is to build more convenient living environments. In order to realize this, the main emphasis of the paper lies on the description of the multimedia signal processing on the basis of the technologies such as speech recognition, speech synthesis, video, or sensor signal processing. For essential modules of the dialog system, we incorporated the real-time speech recognizer based on HM-Net(Hidden Markov Network) as well as speech synthesis into the overall system. In addition, we adopted the real-time motion detector based on the changes of brightness in pixels, as well as the touch sensor that was used to start system. In experimental evaluation, the results showed that the proposed system was relatively easy to use for controlling electric appliances while sitting in a sofa, even though the performance of the system was not better than the simulation results owing to the noisy environments.

Development of Perfume-Injection Module of Robotic Cellular Phone (로보틱셀폰(RCP)의 감성발향 모듈의 개발)

  • 최재일;임찬영;김승우
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.770-773
    • /
    • 2004
  • IT(Information Technology)분야의 발전과 함께 RT(Robot Technology)분야도 21세기의 유망한 첨단기술로 손꼽히고 있다. 현재의 로봇은 그동안 주류를 이루던 산업용 로봇과는 달리 소프트컴퓨팅, 인간친화 인터페이스, 상호작용기술, 음성인식, 물체인식, 사용자 의도파악 등 갖가지 최첨단 기술들이 요구되는 퍼스널 로봇이 각광을 받고 있으며, 특히 오락용, 교육용 로봇들로 대표되는 엔터테인먼트 로봇(Entertainment Robot)분야가 요즘 국내·외에서 활발히 연구되고 있는 실정이다. 엔터테인먼트 로봇은 정형화된 작업만을 하는 것이 아니라 다양한 환경에서 여러 가지 작업을 해야만 한다. 따라서, 장난감 로봇처럼 인간과의 감정대화가 가능한 지능 시스템을 갖춰야만 한다. 그러므로 본 논문에서는 IT분야와 RT분야의 접목으로 시너지 효과를 크게 얻을 수 있는 새로운 기술 개념인 RCP(Robotic Cellular Phone)에 대한 개념을 정의하고, RCP의 기능성 모듈 중 하나인 감성발향 모듈에 대한 기본적인 이론과 실험적 결과를 통하여 로보틱 셀폰의 감성발향 모듈의 우수성을 확인한다.

  • PDF

Assistant Robot with Google Assistant (구글 어시스턴스를 탑재한 비서로봇)

  • Cha-Hun Park;Jae-Hwan Kim;Ho-Beom Kim;Jin-Yeong Kim;Jeong-Mi Son;Jae-Min Jeong
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2023.07a
    • /
    • pp.419-420
    • /
    • 2023
  • 최근 인공지능 기술과 로봇 기술의 발전으로 인해 비서 로봇을 만드는 기술적인 가능성이 커지면서 업무 자동화를 위해 많은 기업에서 도입하고 있다. 특히 인구 고령화가 진행되면서 노동력 부족이 심각한 문제로 대두되고 있다. 현재 비서로봇은 정형화된 대화는 잘 처리하지만 비정형화된 대화에 대해서는 한계가 있다. 본 논문은 앞선 문제를 해결하기 위해 비정형화된 대화도 가능하면서 사용자가 원하는 행동을 실행할 수 있는 보편화된 비서 로봇을 선보인다. 음성인식 모듈과 구글 어시스턴트를 활용하여 마이크를 통해 비서 로봇에게 스케줄 관리, 날씨 등을 질문하고, 스피커를 통해 대답을 듣는 등 비정형화된 의사소통을 할 수 있으며, 비서 로봇에게 원하는 행동을 지시하여 행동을 구현시킬 수 있는 비서로봇을 제안한다.

  • PDF

Machine Learning Based Domain Classification for Korean Dialog System (기계학습을 이용한 한국어 대화시스템 도메인 분류)

  • Jeong, Young-Seob
    • Journal of Convergence for Information Technology
    • /
    • v.9 no.8
    • /
    • pp.1-8
    • /
    • 2019
  • Dialog system is becoming a new dominant interaction way between human and computer. It allows people to be provided with various services through natural language. The dialog system has a common structure of a pipeline consisting of several modules (e.g., speech recognition, natural language understanding, and dialog management). In this paper, we tackle a task of domain classification for the natural language understanding module by employing machine learning models such as convolutional neural network and random forest. For our dataset of seven service domains, we showed that the random forest model achieved the best performance (F1 score 0.97). As a future work, we will keep finding a better approach for domain classification by investigating other machine learning models.

Development of Emotional-Vibration Module of Robotic Cellular Phone (로보틱셀폰(RCP)의 감성진동 모듈의 개발)

  • 최재일;임찬영;김승우
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 2004.05a
    • /
    • pp.766-769
    • /
    • 2004
  • IT(Information Technology)분야의 발전과 함께 RT(Robot Technology)분야도 21fl기의 유망한 첨단기술로 손꼽히고 있다. 현재의 로봇은 그동안 주류를 이루던 산업용 로봇과는 달리 소프트컴퓨팅, 인간친화 인터페이스, 상호작용기술, 음성인식, 물체인식, 사용자 의도파악 등 갖가지 최첨단 기술들이 요구되는 퍼스널 로봇이 각광을 받고 있으며, 특히 오락용, 교육용 로봇들로 대표되는 엔터테인먼트 로봇(Entertainment Robot)분야가 요즘 국내·외에서 활발히 연구되고 있는 실정이다. 엔터테인먼트 로봇은 정형화된 작업만을 하는 것이 아니라 다양한 환경에서 여러 가지 작업을 해야만 한다. 따라서, 장난감 로봇처럼 인간과의 감정대화가 가능한 지능 시스템을 갖춰야만 한다. 그러므로 본 논문에서는 If분야와 RT분야의 접목으로 시너지 효과를 크게 얻을 수 있는 새로운 기술 개념인 RCP(Robotic C태ular Phone)에 대한 개녕을 정의하고, RCP의 기능성 모듈 중 하나인 감성진동 모들에 대한 기본적인 이론과 실험적 결과를 롱하여 로보틱 셀폰의 감성진동 모듈의 우수성을 확인한다.

  • PDF