• 제목/요약/키워드: Text-to-Speech

검색결과 505건 처리시간 0.028초

다중 제어 레벨을 갖는 입모양 중심의 표정 생성 (Speech Animation with Multilevel Control)

  • 문보희;이선우;원광연
    • 인지과학
    • /
    • 제6권2호
    • /
    • pp.47-79
    • /
    • 1995
  • 오래 전부터 컴퓨터 그래픽을 이용한 얼굴의 표정 생성은 여러 분야에서 응용되어 왔고,요즘에는 가상현실감 분야나 원격 회의 분야 등에서 가상 에이전트의 표정을 생성하는데 사용되고 있다.그러나 네트워크를 통해 다중 참여자가 상호 작용을 하는 상황에서 표정을 생성하는 경우에는 상호작용을 위해 전송되어야 할 정보의 양으로 인해,실시간에 원하는 표정을 생성하기 어려운 경우가 생긴다.본 연구에서는 이러한 문지를 해결하기 위해 표정 생성에 Level-of-Detail을 적용하였다.Level-of-Detail은 그래픽스 분야에서 복잡한 물체의 외형을 좀 더 효율적으로 나타내기 위해 오랜 전부터 연구되어져 온 기법이지만 아직까지 표정 생성에 적용된 예는 없다.본 연구에서는 상황을 고려하여 적절하게 상세도를 변경하여 표정을 생성하도록 Level-of-Detail기법을 적용하는 방법에 대해 연구하였다.구현된 시스템은 텍스트,음성,Gui, 사용자의 머리의 움직임 등과 같은 다양한 입력에 대해 입모양과 동기화 되는 표정을 생성한다.

  • PDF

RFID를 이용한 Self-care System 설계 (The Design for Self-care System Based on RFID)

  • 초황;주곤봉;진우정;조용순;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2010년도 춘계학술대회
    • /
    • pp.879-881
    • /
    • 2010
  • 사회의 급속한 발전으로 다변화되어 핵가족화, 1인가구화 등 전통적인 가족기능의 변화로 인해 노인들은 고향집에 홀로 남겨지는 경우가 많다. 그러면서 노인들이 홀로 있으면서 건강관리와 안전상의 문제가 제기되어 왔다. RFID 기술의 급속한 발전과 함께, 그 애플리케이션은 우리 삶의 모든 영역을 확장하고 다양한 산업의 주요 주제가 되어있다. 현대사회의 급속한 경제성장, 그리고 과학과 의학의 발전은 노인들의 평균수명 연장이 연장되었고 그로인해 노인들의 안전한 보호시스템이 필요한 실정이다. 본 논문에서의 self-care 시스템은 RFID(Radio Frequency Identification)를 이용하며, 사용자를 인증하고 TTS(Text To Speech)로 문자신호를 음성신호로 변환하고, 적외선 방사 기술을 이용하여 집을 효과적으로 보호하고 또 전자 혈압 측정기를 통하여 고령자의 신체를 검사하는 기술로 설계된다.

  • PDF

화자 겹침을 고려한 화자 전환 검출 시스템 제안 (Proposal of speaker change detection system considering speaker overlap)

  • 박지수;윤영선;차신;박전규
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.466-472
    • /
    • 2021
  • 화자 전환 검출은 대화 중에 발성 화자가 다른 사람으로 바뀌는 시점을 검출하는 것을 의미한다. 이 과정에서 화자 중복, 화자 정보 표기의 부정확성, 데이터 불균형 등으로 화자가 바뀌는 순간을 검출하는 데 어려움이 발생한다. 본 논문에서는 이러한 문제를 해결하기 위해 음성 인식에 널리 사용되는 TIMIT 데이터를 가공하여 충분한 양의 훈련 데이터를 얻었으며, 화자가 겹치는지를 파악한 후에 화자 전환 여부를 판단하였다. 본 논문에서는 화자 겹침을 고려한 화자 전환 검출 시스템을 구축하기 위하여 다양한 접근법을 사용하여 성능을 평가하고 검증했다. 그 결과 화자 겹칩 영역을 제거하기 위해 X-Vector 구조와 유사한 형태의 검출 시스템과 화자 전환 검출 시스템을 모델링하기 위한 Bi-LSTM 모델을 제안하였다. 실험 결과 기준 시스템보다 상대적으로 각각 4.6 %, 13.8 % 성능 향상을 확인하였다. 또한, 실험 결과를 기반으로 텍스트 정보와 화자 정보 등을 고려한다면 좀 더 강인한 화자 전환 검출 시스템을 구축할 수 있을 것으로 판단한다.

콘텐츠 로봇의 감성적 반응을 위한 지능형 메신저 개발 (Development of Intelligent Messenger for Affective Interaction of Content Robot)

  • 박범준;소수환;박태근
    • 한국콘텐츠학회논문지
    • /
    • 제10권9호
    • /
    • pp.9-17
    • /
    • 2010
  • 사용자의 감성 상태에 적절한 반응을 보이는 로봇 또는 인터랙티브 캐릭터에 대한 연구들이 진행되고 있다. 본 논문에서는 사용자의 문장 입력에 대하여 사용자의 의도와 감성 상태에 적절한 응답을 제공하는 지능형 메신저를 개발한다. 사용자의 의도 및 감성 상태 인식을 위하여, 지능형 메신저는 화행 분석 및 감성 분석 기능을 포함한다. 또한, 감성 및 화행 표현을 위한 태그가 추가된 AIML 기반의 대화형 스크립트를 사용한다. 대화형 스크립트에서 사용자의 감성에 적합한 답변을 찾으면, 지능형 메신저는 그 답변을 대화창에 보여줌과 동시에 애니메이션 캐릭터가 사용자의 감성과 동조화된 감정 표현 동작을 수행하도록 한다. 만일 감정을 표현하는 애니메이션 캐릭터가 무선 네트워크를 통하여 콘텐츠 로봇과 동기화된다면, 사용자와 동일 공간에 존재하는 콘텐츠 로봇은 사용자에 대하여 감성적 반응을 보일 수 있다.

지속음 및 다층신경망을 이용한 화자증명 시스템 (Speaker Verification System Using Continuants and Multilayer Perceptrons)

  • Lee, Tae-Seung;Park, Sung-Won;Hwang, Byong-Won
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2003년도 추계종합학술대회
    • /
    • pp.1015-1020
    • /
    • 2003
  • 생체정보를 활용하여 개인정보를 보호하는 기술 가운데 화자증명은 다양한 사용편의성과 구현비용 면에서 이점을 갖고 있어 폭넓은 활용이 기대된다. 화자증명은 증명성능의 신뢰성, 음성문장 사용의 유연성, 증명시스템 복잡도의 효율성 면에서 높은 수준을 달성해야 한다. 지속음은 화자 구별력이 뛰어나며 구별되는 종류가 한정적이고, MLP(multilayer perceptron)는 높은 패턴인식률과 신속한 동작성능을 갖고 있어 화자증명 시스템이 이와 같은 특성을 달성하기 위한 유력한 수단을 제공한다. 본 논문에서는 지속음과 MLP를 적용한 시스템을 구현하고 한국어 음성 데이터베이스를 이용하여 이 시스템의 성능을 측정하고 분석한다. 실험의 결과는 지속음이 세 가지 특성에 대해 우수한 효과를 가지며 MLP가 높은 신뢰성과 효율성을 달성하는 데 실질적인 도움이 됨을 확인한다.

  • PDF

차량 보안을 위한 어구독립 화자증명의 등록시간 단축에 관한 연구 (A Study on the Fast Enrollment of Text-Independent Speaker Verification for Vehicle Security)

  • 이태승;최호진
    • 한국항행학회논문지
    • /
    • 제5권1호
    • /
    • pp.1-10
    • /
    • 2001
  • 음성은 차량 운행시 여러 가지 조작으로 분주한 운전자에게 간편한 장비 입력 및 조작을 위한 수단으로 유용한 특성을 지니고 있다. 본 논문에서는 이런 음성의 특성을 이용하여 차량 도난이나 중요한 온라인 서비스 접근시 신원을 증명할 수 있는 화자증명 방식을 제안한다. 이 방식에서는 음성의 언어정보를 이용하는 지속음 인식 기법과 함께 확률적 인식 방식에 비해 몇 가지 이점을 갖는 MLP(multi-layer perceptron)를 사용한다. 하지만 MLP를 사용하는 인식 기법은 학습에 많은 계산량을 요구하므로 실시간으로 화자를 등록해야 하는 화자증명에서는 적용하기가 쉽지 않다. 이 문제를 해결하기 위해 본 논문에서는 기존의 화자점수 평준화 방법에서 화자군집 모델 기법을 도입하여 배경화자를 사전에 여러 개의 작은 화자군집으로 분리하는 방법을 제안한다. 등록화자를 이렇게 나눈 화자군집 중 하나로 분류한 뒤 해당 화자군집에 대해서만 등록 학습과정을 거치는 방법으로 계산량을 큰 폭으로 줄일 수 있다.

  • PDF

텍스트 문서 기반의 감성 인식 시스템 (An Emotion Scanning System on Text Documents)

  • 김명규;김정호;차명훈;채수환
    • 감성과학
    • /
    • 제12권4호
    • /
    • pp.433-442
    • /
    • 2009
  • 요즈음 인터넷을 통해 물건을 구매하는 경향이 증가하고 있다. 또한 물건을 구매한 소비자는 리뷰, 댓글, 비평 또는 블로그 등의 형식으로 온라인에 그들의 사용 후기를 작성한다. 또한 작성된 사용 후기부터 많은 구매자들은 물건을 구매하기 전에 자신이 구입하고자 하는 물건에 대한 정보를 얻는다. 따라서 회사나 공공기관은 대중이 다른 사람의 의견에 관심을 기울인다는 점 때문에 대중의 의견을 수집하고 분석할 필요성에 직면하였다. 그러나 온라인상에 댓글이 너무 많고, 중복적이면서 짧은 경향이 있다. 이러한 환경 속에서 텍스트 문서의 감성을 인식하는 시스템의 필요성이 대두되었다. 텍스트로부터 작성자의 의견이나 주관적인 생각을 추출할 수 있게 영어에서는 단어에 속성이 주어진 GI와 LKB가 있으나 한글은 아직 속성이 주어진 사전이 존재하지 않는다. 이 논문에서는 한글 품사 중 4개의 품사(명사, 동사, 형용사, 부사)에 속성을 주었다. 그리고 학습 군을 만들어서 감성 단어의 패턴을 구성하고, 문장에서 단어 사이의 공기관계를 구성하여 학습 시켰다. 이 학습을 바탕으로, SO-PMI을 이용하여 문서를 긍정과 부정 2가지 극성을 분류하고, 4개의 품사(명사, 동사, 형용사, 부사)를 각각 조합하여 최상의 조건을 구하였다. 마지막으로 사용자 인터페이스를 통해 새로운 감성 표현, 구성형식, 단어 연관성을 반자동적으로 삽입하고 교정할 수 있는 시스템을 설계하였다.

  • PDF

위험사회 재난 안전 분야 대응을 위한 AI 조력자 (AI Advisor for Response of Disaster Safety in Risk Society)

  • 이용학;강윤희;이민호;박성호;강명주
    • Journal of Platform Technology
    • /
    • 제8권3호
    • /
    • pp.22-29
    • /
    • 2020
  • 4차 산업혁명은 초기 단순 제조업 혁신에서 사회 및 경제분야에서 다양한 기술적 융합 방향을 이끄는 메가 트랜드로서 국가별로 진행하고 있다. COVID-19와 같은 감염병의 유행은 디지털 중심의 비대면 비즈니스를 경제 운영에서 전환되고 있으며 온라인화 확산을 위해서는 개인 맞춤형서비스를 위한 AI와 빅데이터 기술의 활용은 필수적이다. 이 논문에서는 4차산업혁명을 주요한 기술 특징 및 정부에서 추진하는 디지털 뉴딜의 효과적 이행을 위해 핵심 기술인 인공지능기술의 적용을 중심으로 사례를 분석하고 재난대응 분야에서의 활용 사례를 기술한다. 재난대응 활용사례로서 AI 조력자는 긴급호출에서 신고자의 상태에 따른 적절한 대응책들을 제시한다. 이를 위해 AI 조력자는 적응적 대응을 위한 음성인식 데이터 기반 분석 및 변환 텍스트의 재난 분류를 제공한다.

  • PDF

구어체 말뭉치의 어휘 사용 특징 분석 및 감정 어휘 사전의 자동 구축 (Analyzing Vocabulary Characteristics of Colloquial Style Corpus and Automatic Construction of Sentiment Lexicon)

  • 강승식;원혜진;이민행
    • 스마트미디어저널
    • /
    • 제9권4호
    • /
    • pp.144-151
    • /
    • 2020
  • 모바일 환경에서 의사소통은 SMS 문자로 이루어진다. SMS 문자에서 사용되는 어휘들은 일반적인 한국어 문어체 문장에서 사용되는 어휘들과 다른 부류의 어휘들이 사용될 것으로 예상할 수 있다. 예를 들어, 일반적인 문어체의 경우 문장의 시작이나 끝맺음이 올바르고 문장의 구성요소가 잘 갖추어졌지만, SMS 문자 말뭉치의 경우 구성요소를 생략 및 간략한 표현으로 대체하는 경우가 많다. 이러한 어휘 사용 특성을 분석하기 위하여, 기존에 구축된 구어체 말뭉치와 문어체 말뭉치를 사용한다. 실험에서는 구어체 말뭉치인 SMS 문자 말뭉치와 네이버 영화평 말뭉치, 그리고 문어체 말뭉치인 한국어 문어체 원시 말뭉치의 어휘사용 특성을 비교-분석한다. 말뭉치별 어휘 비교 및 분석을 위하여 품사 태그 형용사(VA)를 기준으로 하였고, 공연강도를 측정하기 위해 변별적 공연어휘소 분석 방법론을 사용하였다. 그 결과 '좋-', '죄송하-', '즐겁-' 등 감정표현 형용사들이 SMS 문자 말뭉치에서 선호되는 반면, 네이버 영화평 말뭉치에서는 평가 표현과 관련된 형용사들이 선호되는 것을 확인할 수 있었다. 이러한 과정에서 추출된 공연강도가 높은 형용사를 기준으로 감정어휘 사전을 자동 구축하기 위하여 단어 임베딩 기법을 사용하였으며, 총 343,603개의 감성어휘를 자동 구축하였다.

자동음성인식 기술을 이용한 모바일 기반 발음 교수법과 영어 학습자의 발음 향상에 관한 연구 (The Study on Automatic Speech Recognizer Utilizing Mobile Platform on Korean EFL Learners' Pronunciation Development)

  • 박아영
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권6호
    • /
    • pp.1101-1107
    • /
    • 2017
  • 본 논문은 스마트폰의 플랫폼에 내장되어 있는 자동음성인식 기술을 활용하여 영어 학습자의 발음에 대한 즉각적인 문자 피드백을 제공하는 모바일 기반 발음 교수법이 영어 학습자의 자음 발음 (V-B, R-L, G-Z) 인식과 출력에 미치는 영향에 대해 연구했다. 특히, 자동음성인식 기술을 이용한 모바일 기반 발음 교수법을 사용한 그룹, 전통적인 교사 중심의 발음 교수법 그룹, 그리고 이 둘을 합친 하이브리드 교수법 그룹으로 나누어 영어 학습자의 발음 평가 결과를 (인지, 출력) 비교, 분석했다. ANCOVA를 이용한 분석 결과, 영어 학습자의 발음 출력에 있어 하이브리드 교수법 그룹이 (M=82.71, SD =3.3) 전통적인 교수법 그룹 (M=62.6, SD=4.05) 보다 유의미하게 높은 결과를 나타냈다 (p<.05).