• 제목/요약/키워드: Text-to-Speech

검색결과 501건 처리시간 0.027초

구문 관계와 운율 특성을 이용한 한국어 운율구 경계 예측 (Prediction of Prosodic Break Using Syntactic Relations and Prosodic Features)

  • 정영임;조선호;윤애선;권혁철
    • 인지과학
    • /
    • 제19권1호
    • /
    • pp.89-105
    • /
    • 2008
  • 본 논문에서는 자연스러운 한국어 운율구 경계를 예측하기 위해 (1) 문장 성분을 하위범주화하고, (2) 세분화된 문장 성분 간 의존관계를 이용하여 통사구를 추출하며 (3) 추출한 통사구의 유형에 따른 운율구 경계 예측 규칙을 설정하였다. 또한, (4) 통사적 정보 외에도 통사구와 문장의 길이, 통사구의 문장 내 위치, 문맥의 의미 정보 등에 따라 가변적인 운율구 경계를 판단하여 보다 자연스러운 한국어 운율구 경계 예측 시스템을 개발하였다. 그 결과 통사구 경계와 상관관계가 높은 강한 운율구 경계 예측과 운율구 내부 비경계 예측에 있어 90% 이상의 높은 재현율과 정확도를 보였으며, 전체 운율구 경계 예측에 있어서도 87% 이상의 성능을 보였다.

  • PDF

대화형 인공지능 아트 작품의 제작 연구 :진화하는 신, 가이아(An Evolving GAIA)사례를 중심으로 (Artificial Intelligence Art : A Case study on the Artwork An Evolving GAIA)

  • 노진아
    • 한국콘텐츠학회논문지
    • /
    • 제18권5호
    • /
    • pp.311-318
    • /
    • 2018
  • 본 논문에서는 대화형 인공지능 인터랙티브 아트인 "진화하는 신, 가이아" 작품을 중심으로 예술 의미적인 배경과 작품이 구현된 기술적 구조에 대해 제시한다. 최근 여러 분야에서 인공지능의 기술을 사용하면서 예술 분야에도 이러한 시도가 접목되고 있다. 또한 과학의 발달로 생체모방 기술이나 인공생명 기술이 발달하면서 기계와 인간의 구분이 모호해지고 있다. 본 논문에서는 이러한 기계 생명의 은유를 담고 있는 예술 작품 사례를 제시하고, 본 작품에서 차별적으로 구현된 대화 시스템에 대해 상세히 부각한다. 본 작품에서는 로봇이 관객과의 자연스러운 소통을 위해 관객을 인식하여 바라보고 눈을 맞추며, 관객의 음성을 직접 인식하고 이에 따른 적절한 응답을 음성 합성으로 출력한다. 본 작품의 대화 시스템은 작품 내에 내장된 안드로이드 클라이언트와 질문-대답 사전을 내장한 서버로 구성된 질의응답시스템으로 구현되었다. 본 작품은 이러한 인터랙션을 통해 넓은 의미에서의 생명에 대한 의미를 논하며 관객과의 공감을 이끌어낸다. 본 논문에서는 작품의 기계적 구조와 대화 시스템 등의 제작 방법 및 관객 반응을 살펴봄으로써 인공지능 예술 작품의 제작 및 전시 기획에 기여하고자 한다.

YOLO알고리즘을 활용한 시각장애인용 식사보조 시스템 개발 (Development a Meal Support System for the Visually Impaired Using YOLO Algorithm)

  • 이군호;문미경
    • 한국전자통신학회논문지
    • /
    • 제16권5호
    • /
    • pp.1001-1010
    • /
    • 2021
  • 시각이 온전한 사람들은 식사를 할 때 시각에 대한 의존도를 깊게 인지하지 못한다. 그러나 시각장애인은 식단에 어떤 음식이 있는지 알지 못하기 때문에 옆에 있는 보조인이 시각장애인 수저로 음식의 위치를 시계방향 또는 전후좌우 등 일정한 방향으로 설명하여 그릇 위치를 확인한다. 본 논문에서는 시각장애인이 스마트폰의 카메라를 이용하여 자신의 식단을 비추면 각각의 음식 이미지를 인식하여 음성으로 음식의 이름을 알려주는 식사보조 시스템의 개발 내용에 대해 기술한다. 이 시스템은 음식과 식기도구(숟가락)의 이미지를 학습한 YOLO모델을 통해 숟가락이 놓인 음식을 추출해 내고, 이 음식이 무엇인지를 인식하여 이를 음성으로 알려준다. 본 시스템을 통해 시각장애인은 식사보조인의 도움없이 식사를 할 수 있음으로써 자립의지와 만족도를 높일 수 있을 것으로 기대한다.

초소형 버추얼 프로덕션 환경에서 디지털 휴먼을 이용한 촬영 사례 (Case Study : Cinematography using Digital Human in Tiny Virtual Production)

  • 임재호;장민정;전상욱;이수빈;박민수;김유진
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제29권3호
    • /
    • pp.21-31
    • /
    • 2023
  • 본 논문에서는 디지털 휴먼을 활용한 버추얼 프로덕션에서의 촬영 사례를 소개한다. 본 촬영 사례는 LED를 활용한 버추얼 프로덕션의 시스템 구성과 디지털 휴먼을 활용한 효율적인 촬영 파이프라인을 다루고 있다. LED를 이용한 버추얼 프로덕션은 주로 LED에 배경을 투사하여 촬영하는 것과 달리 본 사례는 디지털 휴먼을 가상 배우로 사용하여 실제 배우와 소통하는 장면을 촬영하였다. 또한, 실제 배우와 디지털 휴먼의 대화 장면을 실시간 엔진을 이용하여 촬영하기 위해 음성과 텍스트 기반 한국어 립싱크 모션 자동 생성 기술을 적용하여 디지털 휴먼의 발화 애니메이션을 사전에 제작해 사용하였다. 우리는 실시간 엔진을 활용하여 LED 기반의 버추얼 프로덕션 환경에서 실제 배우와 디지털 휴먼을 이용한 짧은 드라마 콘텐츠를 제작함으로써 본 촬영 사례에 대하여 검증하였다.

소설과 영화 『희망 L'Espoir』의 서사담론 (The Narrative Discourse of the Novel and the Film L'Espoir)

  • 오세정
    • 비교문화연구
    • /
    • 제48권
    • /
    • pp.289-323
    • /
    • 2017
  • 앙드레 말로의 소설 "희망 L'Espoir"은 스페인 내란전쟁에 직접 참전한 경험을 바탕으로 이 사건의 전말을 논픽션으로 제시하는 르포타주문학의 특성을 보유하며, 영화 "희망 L'Espoir"은 이 소설을 각색하여 르포타주문학에 상응하는 세미다큐멘터리로 제작된다. 세미다큐멘터리 영화는 사회적 현상이나 사건에 대한 리얼리티를 추구하는 영화장르이다. 이처럼 소설과 영화 "희망 L'Espoir"은 각각 서로 다른 장르임에도 불구하고 창작활동이 밀접한 관련성을 맺고 있으며 서사적 연계성도 상당하다. 그러므로 소설과 영화 "희망 L'Espoir"에 대하여 주네트의 서사이론에 의거한 서사담론의 숙고는 연구의 당위성을 보유한다. 모든 종류의 이야기는 서사물 속에서 스토리시간과 담화시간이 서로 다른 이중적 시간을 보유한다. 왜냐하면 서사물 속에서 하나의 사건은 다른 것들보다 먼저 제시되거나 나중에 나타낼 수도 있고, 사건을 길게 혹은 짧게 이야기 할 수 있으며, 사건을 한 번 또는 여러 번 되풀이해 환기시킬 수 있기 때문이다. 이처럼 사건이 발생하는 시간과 이 사건을 기록하는 시간이 서로 다른 두 개의 시간성을 분석한 것이 순서, 지속, 빈도이다. 이러한 순서, 지속, 빈도의 시간성은 이야기의 흐름을 조절하는 극적 템포를 의미하기 때문에 편집적인 개념으로써 소설과 영화 "희망 L'Espoir"에서 나타나고 있다. 그것은 이야기를 배열하고 요약하며, 삭제하는 시간의 대응으로 호기심과 충격을 야기하는 미학적 담론이다. 또한 화법과 서술태는 텍스트에서 화자 또는 서술자의 위치와 시점의 문제를 명확하게 구분하기 위해 주네트가 제기한 개념이다. '누가 이야기하느냐'와 '누가 보느냐'하는 문제를 구분하는 것은 텍스트의 서술자와 텍스트의 시점이 동일하지 않기 때문이다. '누가 이야기하느냐'의 문제는 누가 이야기의 서술을 담당하고 있는가를 말한다. 그러나 '누가 보느냐'하는 문제는 이야기에서 누구의 시각에 의해 서술되고 있는 것인가의 문제와 관련된다. 소설 "희망 L'Espoir"에서는 제로초점과 내적 초점화를 통한 시점의 변화가 등장하며, 이것은 영화 "희망 L'Espoir"에서 다중촬영이 연계되고 있다. 또한 이야기의 메타적 서술로서 이야기의 액자구조가 소설과 영화 "희망 L'Espoir"에서 모두 서술태의 형태로 동일하게 재현된다. 그러므로 소설과 영화 "희망 L'Espoir"에서 서사담론의 의미는 텍스트와 화자, 수용자 사이에 이야기를 소통하는 양상이다.

XGBoost와 교차검증을 이용한 품사부착말뭉치에서의 오류 탐지 (Detecting Errors in POS-Tagged Corpus on XGBoost and Cross Validation)

  • 최민석;김창현;박호민;천민아;윤호;남궁영;김재균;김재훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권7호
    • /
    • pp.221-228
    • /
    • 2020
  • 품사부착말뭉치는 품사정보를 부착한 말뭉치를 말하며 자연언어처리 분야에서 다양한 학습말뭉치로 사용된다. 학습말뭉치는 일반적으로 오류가 없다고 가정하지만, 실상은 다양한 오류를 포함하고 있으며, 이러한 오류들은 학습된 시스템의 성능을 저하시키는 요인이 된다. 이러한 문제를 다소 완화시키기 위해서 본 논문에서는 XGBoost와 교차 검증을 이용하여 이미 구축된 품사부착말뭉치로부터 오류를 탐지하는 방법을 제안한다. 제안된 방법은 먼저 오류가 포함된 품사부착말뭉치와 XGBoost를 사용해서 품사부착기를 학습하고, 교차검증을 이용해서 품사오류를 검출한다. 그러나 오류가 부착된 학습말뭉치가 존재하지 않으므로 일반적인 분류기로서 오류를 검출할 수 없다. 따라서 본 논문에서는 매개변수를 조절하면서 학습된 품사부착기의 출력을 비교함으로써 오류를 검출한다. 매개변수를 조절하기 위해서 본 논문에서는 작은 규모의 오류부착말뭉치를 이용한다. 이 말뭉치는 오류 검출 대상의 전체 말뭉치로부터 임의로 추출된 것을 전문가에 의해서 오류가 부착된 것이다. 본 논문에서는 성능 평가의 척도로 정보검색에서 널리 사용되는 정밀도와 재현율을 사용하였다. 또한 모집단의 모든 오류 후보를 수작업으로 확인할 수 없으므로 표본 집단과 모집단의 오류 분포를 비교하여 본 논문의 타당성을 보였다. 앞으로 의존구조부착 말뭉치와 의미역 부착말뭉치에서 적용할 계획이다.

의사 N-gram 언어모델을 이용한 핵심어 검출 시스템에 관한 연구 (A Study on Keyword Spotting System Using Pseudo N-gram Language Model)

  • 이여송;김주곤;정현열
    • 한국음향학회지
    • /
    • 제23권3호
    • /
    • pp.242-247
    • /
    • 2004
  • 일반적인 핵심어 검출 시스템에서는 필러모델과 핵심어모델을 연결단어 인식 네트워크로 구성하여 핵심어 검출에 사용한다. 이것은 대량의 텍스트 데이터를 이용한 대어휘 연속 음성인식에서 구해지는 단어의 출현빈도의 언어모델을 핵심어 검출 시스템에서 효과적으로 구성할 수가 없는 어려움이 있기 때문이다. 이를 해결하기 위하여 본 논문에서는 의사 N-gram 언어모델을 이용한 핵심어 검출 시스템을 제안하고 핵심어와 필러모델의 출현빈도의 변화에 따른 핵심어 검출 성능을 조사하였다. 그 결과, 핵심어와 필러모델의 출현확률을 0.2:0.8의 비율에서 CA (Correctly Accept for Keyword: 핵심어를 제대로 인정한 경우)가 91.1%, CR (Correctly Reject for OOV: 비핵심어에 대해 제대로 거절한 경우)는 91.7%로써, 일반적인 연결단어인식 네트워크를 이용한 방법보다 제안된 방법이 CA-CR 평균 인식률의 에러감소율 (Error Reduction Rate)에서 14%향상되어 핵심어 검출에서의 언어모델 도입의 효과를 확인할 수 있었다.

텍스트 마이닝 기법을 활용한 인공지능 기술개발 동향 분석 연구: 깃허브 상의 오픈 소스 소프트웨어 프로젝트를 대상으로 (A Study on the Development Trend of Artificial Intelligence Using Text Mining Technique: Focused on Open Source Software Projects on Github)

  • 정지선;김동성;이홍주;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.1-19
    • /
    • 2019
  • 제4차 산업혁명을 이끄는 주요 원동력 중 하나인 인공지능 기술은 이미지와 음성 인식 등 여러 분야에서 사람과 유사하거나 더 뛰어난 능력을 보이며, 사회 전반에 미치게 될 다양한 영향력으로 인하여 높은 주목을 받고 있다. 특히, 인공지능 기술은 의료, 금융, 제조, 서비스, 교육 등 광범위한 분야에서 활용이 가능하기 때문에, 현재의 기술 동향을 파악하고 발전 방향을 분석하기 위한 노력들 또한 활발히 이루어지고 있다. 한편, 이러한 인공지능 기술의 급속한 발전 배경에는 학습, 추론, 인식 등의 복잡한 인공지능 알고리즘을 개발할 수 있는 주요 플랫폼들이 오픈 소스로 공개되면서, 이를 활용한 기술과 서비스들의 개발이 비약적으로 증가하고 있는 것이 주요 요인 중 하나로 확인된다. 또한, 주요 글로벌 기업들이 개발한 자연어 인식, 음성 인식, 이미지 인식 기능 등의 인공지능 소프트웨어들이 오픈 소스 소프트웨어(OSS: Open Sources Software)로 무료로 공개되면서 기술확산에 크게 기여하고 있다. 이에 따라, 본 연구에서는 온라인상에서 다수의 협업을 통하여 개발이 이루어지고 있는 인공지능과 관련된 주요 오픈 소스 소프트웨어 프로젝트들을 분석하여, 인공지능 기술 개발 현황에 대한 보다 실질적인 동향을 파악하고자 한다. 이를 위하여 깃허브(Github) 상에서 2000년부터 2018년 7월까지 생성된 인공지능과 관련된 주요 프로젝트들의 목록을 검색 및 수집하였으며, 수집 된 프로젝트들의 특징과 기술 분야를 의미하는 토픽 정보들을 대상으로 텍스트 마이닝 기법을 적용하여 주요 기술들의 개발 동향을 연도별로 상세하게 확인하였다. 분석 결과, 인공지능과 관련된 오픈 소스 소프트웨어들은 2016년을 기준으로 급격하게 증가하는 추세이며, 토픽들의 관계 분석을 통하여 주요 기술 동향이 '알고리즘', '프로그래밍 언어', '응용분야', '개발 도구'의 범주로 구분하는 것이 가능함을 확인하였다. 이러한 분석 결과를 바탕으로, 향후 다양한 분야에서의 활용을 위해 개발되고 있는 인공지능 관련 기술들을 보다 상세하게 구분하여 확인하는 것이 가능할 것이며, 효과적인 발전 방향 모색과 변화 추이 분석에 활용이 가능할 것이다.

패션 속성기반 혼합현실 시각화 서비스 (Fashion attribute-based mixed reality visualization service)

  • 유용민;이경욱;김경선
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.2-5
    • /
    • 2022
  • 딥러닝의 등장과 ICT(Information and Communication Technology)의 급속한 발전으로 정치, 경제, 문화 등 사회의 다양한 분야에서 인공지능을 활용한 연구가 활발히 진행되고 있다. 딥러닝 기반 인공지능 기술은 자연어 처리, 영상 처리, 음성 처리, 추천 시스템 등 다양한 영역으로 세분화된다. 특히, 산업이 고도화됨에 따라 시장 동향 및 개인의 특성을 분석하여 소비자에게 추천하는 추천 시스템의 필요성이 점점 더 요구되고 있다. 이러한 기술 발전에 발맞추어, 본 논문에서는 딥러닝 기반 '언어처리지능' 과 '영상처리지능'의 기술개발을 통해 정형 또는 비정형 텍스트 및 이미지 빅데이터로부터 속성 정보를 추출 추출하고, 분류하여 패션시장의 트랜드나 신규소재 등을 분석하고 소비자의 취향 분석을 통하여 '시장-소비자' 인사이트를 발굴하여, 스타일 추천, 가상 피팅, 및 디자인지원 등이 가능한 인공지능 기반 '맞춤형 패션 어드바이저' 서비스 통합 시스템을 제안한다.

  • PDF

CNN을 적용한 한국어 상품평 감성분석: 형태소 임베딩을 중심으로 (Sentiment Analysis of Korean Reviews Using CNN: Focusing on Morpheme Embedding)

  • 박현정;송민채;신경식
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.59-83
    • /
    • 2018
  • 고객과 대중의 니즈를 파악하기 위한 감성분석의 중요성이 커지면서 최근 영어 텍스트를 대상으로 다양한 딥러닝 모델들이 소개되고 있다. 본 연구는 영어와 한국어의 언어적인 차이에 주목하여 딥러닝 모델을 한국어 상품평 텍스트의 감성분석에 적용할 때 부딪히게 되는 기본적인 이슈들에 대하여 실증적으로 살펴본다. 즉, 딥러닝 모델의 입력으로 사용되는 단어 벡터(word vector)를 형태소 수준에서 도출하고, 여러 형태소 벡터(morpheme vector) 도출 대안에 따라 감성분석의 정확도가 어떻게 달라지는지를 비정태적(non-static) CNN(Convolutional Neural Network) 모델을 사용하여 검증한다. 형태소 벡터 도출 대안은 CBOW(Continuous Bag-Of-Words)를 기본적으로 적용하고, 입력 데이터의 종류, 문장 분리와 맞춤법 및 띄어쓰기 교정, 품사 선택, 품사 태그 부착, 고려 형태소의 최소 빈도수 등과 같은 기준에 따라 달라진다. 형태소 벡터 도출 시, 문법 준수도가 낮더라도 감성분석 대상과 같은 도메인의 텍스트를 사용하고, 문장 분리 외에 맞춤법 및 띄어쓰기 전처리를 하며, 분석불능 범주를 포함한 모든 품사를 고려할 때 감성분석의 분류 정확도가 향상되는 결과를 얻었다. 동음이의어 비율이 높은 한국어 특성 때문에 고려한 품사 태그 부착 방안과 포함할 형태소에 대한 최소 빈도수 기준은 뚜렷한 영향이 없는 것으로 나타났다.