• 제목/요약/키워드: 대화모델

검색결과 482건 처리시간 0.029초

병렬 파일 시스템에서의 하이브리드 채널 모델 (Hybrid Channel Model in Parallel File System)

  • 이윤영;황보준형;서대화
    • 정보처리학회논문지A
    • /
    • 제10A권1호
    • /
    • pp.25-34
    • /
    • 2003
  • 병렬 파일 시스템은 고속의 네트웍으로 여러 대의 컴퓨터들을 서로 연결하여 컴퓨터들 간에 메시지를 주고받으면서 파일을 분산 저장하고 병렬로 읽어오는 방식으로 파일 입출력 장치의 병목현상을 해결한다. 그러나 대부분의 병렬 파일 시스템은 전달하려는 메시지의 특성을 고려하지 않은 프로토콜의 사용으로 성능저하의 문제를 가지고 있다. 이에 따라 본 논문에서 메시지 처리 방법으로 HCM(Hybrid Channel Model)을 제안한다. 본 논문에서 제안하는 HCM은 병렬 파일 시스템에서 전달되는 메시지를 그 특성에 따라 분리해서 별개의 프로토콜을 이용하여 제어 메시지와 파일 데이터 블록을 전송한다. 안정성이 검증된 TCP/IP를 이용하여 구현한 메시지 채널을 통해 제어 메시지를 고속의 데이터 전송이 가능한 VIA를 이용하여 구현한 데이터 채널을 통해 파일 데이터 블록을 각각 분리하여 처리하도록 하고 있다 HCM을 병렬 파일 시스템에 구현하고 실험해본 결과 본 논문에서 제안한 채널 모델이 상당한 성능향상을 보였다.

효율적인 기계학습 자질 선별을 통한 한국어 운율구 경계 예측 모델의 성능 향상 (Performance Improvement of a Korean Prosodic Phrase Boundary Prediction Model using Efficient Feature Selection)

  • 김민호;권혁철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권11호
    • /
    • pp.837-844
    • /
    • 2010
  • 운율구 경계 예측은 대화체 음성합성을 실현하기 위한 주요한 자연언어처리 기술 중 하나이다. 본 논문은 자연스러운 한국어 운율구 경계 예측을 실현하고자 기존의 학습 자질을 대신할 새로운 학습 자질을 제안한다. 이 새로운 자질들은 기존의 학습 자질보다 실제 언어생활에서 운율구 경계 발생에 영향을 미치는 여러 요인을 더 잘 반영한다. 특히, 수작업으로 구축한 운율구 경계 예측 규칙을 이용하여 추출한 학습 자질은 높은 정확도 향상에 이바지한다. 본 논문에서 제안한 새로운 학습 자질을 바탕으로 CRFs(Conditional Random Fields)를 이용하여 운율구 경계 예측 모델을 만들었다. 그 결과 3단계 운율구 경계(강한 경계, 약한 경계, 운율구 내부 비경계) 예측에서 86.63%의 정확도를, 6단계 운율구 경계(상승조/하강조 강한 경계, 상승조/하강조/평탄조 약한 경계, 운율구 내부 비경계) 예측에서는 81.14%의 정확도를 보였다.

캐릭터 동작 애니메이션 제어를 위한 에이전트 시스템 (An Agent-based System for Character Motion Animation Control)

  • 김기현;김상욱
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권5호
    • /
    • pp.467-474
    • /
    • 2001
  • 사용자가 하나의 캐릭터 이상을 애니메이션 하기를 원할때 캐릭터들 사이에 충돌과 같은 기대되지 않은 동작 애니메이션을 생성할 수 있다. 그러므로, 이러한 문제가 적절한 제어 메커니즘을 이용하여 해결되어야 한다. 본 논문은 사용자의 의도를 반영한 애니메이션 시나리오를 표현하기 위해 캐릭터의 동작 애니메이션을 제어하는 에이전트 기반 시스템을 제안한다. 이 시스템은 3차원 공간상에서 캐릭터가 움직이는 경로에 따라 캐릭터들간의 충돌을 회피하고 동작의 형태를 조정하는 방법을 제공한다. 에이전트는 동작을 동기화하기 위해 다른 에이전트와 통신한다. 에이전트는 캐릭터의 동작을 조정하는 여러 지능적인 에이전트로 확장되어진다. 에이전트 시스템은 의도된 동작 애니메이션 뿐만 아니라 전체 캐릭터 애니메이션에 대한 동작의 스케쥴링을 가능하게 한다. 에이전트들의 정보를 전달하고 에이전트들의 현 상태를 추론하는 방법으로써 에이전트의 대화를 위한 페트리넷 분석을 이용하여 오토마타 모델을 디자인한다. 에이전트 기술을 이용하여 캐릭터의 동작을 제어하기 위한 에이전트 시스템을 구현한다. 인체 모델 캐릭터의 동작을 제어하는 예를 보이고, 동작 제어의 가능성을 보인다.

  • PDF

모바일 환경에서 맞춤형 콘텐츠 전달을 위한 비디오 적응성 모델 (Video Adaptation Model for User-Centric Contents Delivery in Mobile Computing)

  • 김스베틀라나;윤용익
    • 정보처리학회논문지A
    • /
    • 제16A권5호
    • /
    • pp.389-394
    • /
    • 2009
  • 이동하면서도 디지털 방송을 볼 수 있는 모바일 TV가 세계에 보급되기 시작하였다. TV 또는 HDTV와 같은 대화형 데이터 서비스를 제공 하기 위해서 데이터 표현, 전송 및 처리가 아주 중요하다. 특히 제한된 대역폭과 낮은 성능의 단말과 같은 모바일 방송통신 환경에서 오디오, 비디오, 이미지 등의 다양한 멀티미디어 서비스를 제공 받기 위해서는 효율적으로 전송 및 적응형 데이터 서비스 기술이 필수적으로 요구된다. 본 논문에서모바일 환경에서 사용자 중심으로 비디오서비스 대한 미들웨어 기술을 효율적으로 개발하기 위하여 사용자 환경상황인식(Usage Environment), 개인화(Personalization)를 위한 데이터 수정 및 처리 기술, 사용자 중심으로 맞춤형 적응 서비스 미들웨어 UP-SAM(User Personalization Context-Aware Service Adaptation Middleware) 모델을 제안한다.

화자 겹침을 고려한 화자 전환 검출 시스템 제안 (Proposal of speaker change detection system considering speaker overlap)

  • 박지수;윤영선;차신;박전규
    • 한국음향학회지
    • /
    • 제40권5호
    • /
    • pp.466-472
    • /
    • 2021
  • 화자 전환 검출은 대화 중에 발성 화자가 다른 사람으로 바뀌는 시점을 검출하는 것을 의미한다. 이 과정에서 화자 중복, 화자 정보 표기의 부정확성, 데이터 불균형 등으로 화자가 바뀌는 순간을 검출하는 데 어려움이 발생한다. 본 논문에서는 이러한 문제를 해결하기 위해 음성 인식에 널리 사용되는 TIMIT 데이터를 가공하여 충분한 양의 훈련 데이터를 얻었으며, 화자가 겹치는지를 파악한 후에 화자 전환 여부를 판단하였다. 본 논문에서는 화자 겹침을 고려한 화자 전환 검출 시스템을 구축하기 위하여 다양한 접근법을 사용하여 성능을 평가하고 검증했다. 그 결과 화자 겹칩 영역을 제거하기 위해 X-Vector 구조와 유사한 형태의 검출 시스템과 화자 전환 검출 시스템을 모델링하기 위한 Bi-LSTM 모델을 제안하였다. 실험 결과 기준 시스템보다 상대적으로 각각 4.6 %, 13.8 % 성능 향상을 확인하였다. 또한, 실험 결과를 기반으로 텍스트 정보와 화자 정보 등을 고려한다면 좀 더 강인한 화자 전환 검출 시스템을 구축할 수 있을 것으로 판단한다.

직접 볼륨 렌더링에서 사실적인 고속 피사계 심도 렌더링 (Realistic and Fast Depth-of-Field Rendering in Direct Volume Rendering)

  • 강지선;이정진;신영길;김보형
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제15권5호
    • /
    • pp.75-83
    • /
    • 2019
  • 직접 볼륨 렌더링은 의료영상과 같은 3차원 볼륨 데이터의 가시화에 널리 사용되는 방법이다. 본 논문은 직접 볼륨 렌더링의 깊이 인식을 향상시키기 위해 피사계 심도 효과를 볼륨 광선투사법에 적용하는 방법을 제안한다. 제안하는 방법은 인간의 지각 모델을 기반으로 카메라 모델을 적용하며 지터드 렌즈 샘플링을 사용하여 제한된 개수의 광선으로 사실적인 이미지를 획득할 수 있다. 또한, 전처리 과정 없이 GPU 파이프라인 안에서 피사계 심도를 바로 계산하여 볼륨 데이터의 대화식 탐색이 가능하다. 의료영상을 포함한 여러 데이터에 적용한 실험에서 기존 방법보다 2.6~4배 빠른 시간에 피사계 심도 효과를 표현하여 깊이 인식에 보다 도움을 주는 영상을 생성하는 것을 확인하였다.

대화 영상 생성을 위한 한국어 감정음성 및 얼굴 표정 데이터베이스 (Korean Emotional Speech and Facial Expression Database for Emotional Audio-Visual Speech Generation)

  • 백지영;김세라;이석필
    • 인터넷정보학회논문지
    • /
    • 제23권2호
    • /
    • pp.71-77
    • /
    • 2022
  • 본 연구에서는 음성 합성 모델을 감정에 따라 음성을 합성하는 모델로 확장하고 감정에 따른 얼굴 표정을 생성하기 위한 데이터 베이스를 수집한다. 데이터베이스는 남성과 여성의 데이터가 구분되며 감정이 담긴 발화와 얼굴 표정으로 구성되어 있다. 성별이 다른 2명의 전문 연기자가 한국어로 문장을 발음한다. 각 문장은 anger, happiness, neutrality, sadness의 4가지 감정으로 구분된다. 각 연기자들은 한 가지의 감정 당 약 3300개의 문장을 연기한다. 이를 촬영하여 수집한 전체 26468개의 문장은 중복되지 않으며 해당하는 감정과 유사한 내용을 담고 있다. 양질의 데이터베이스를 구축하는 것이 향후 연구의 성능에 중요한 역할을 하므로 데이터베이스를 감정의 범주, 강도, 진정성의 3가지 항목에 대해 평가한다. 데이터의 종류에 따른 정확도를 알아보기 위해 구축된 데이터베이스를 음성-영상 데이터, 음성 데이터, 영상 데이터로 나누어 평가를 진행하고 비교한다.

Rule-based Normalization of Relative Temporal Information

  • Jeong, Young-Seob;Lim, Chaegyun;Lee, SeungDong;Mswahili, Medard Edmund;Ndomba, Goodwill Erasmo;Choi, Ho-Jin
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.41-49
    • /
    • 2022
  • 문서에는 상대적인 시간표현이 포함되어있으며, 이를 다루기 위한 시간표현 체계를 구축하고 상대시간정보를 추출하는 모델을 개발하는 것은 중요하다. 본 연구에서는 timex3 태그에서 상대적인 시간표현의 정규값을 담을 수 있도록 하기 위해 연, 월, 일, 주, 시, 분, 초 단위에 대하여 총 7가지의 새로운 속성을 새롭게 제시하였으며, 이전, 이후, 번째 등에 대한 정규값의 기술방법도 함께 제시하였다. 또한, 새롭게 추가된 속성들의 정규값을 추출하는 규칙 모음을 설계하였다. 추가된 속성들을 바탕으로 구축한 데이터셋은 일상대화, 뉴스, 역사와 관련된 총 1,041개의 문서를 포함하고 있으며, 본 연구에서 설계한 규칙 모음을 전체 데이터셋에 대하여 적용하여 전반적으로 70% 이상의 정확도를 보이는 것을 확인하였다. 특히, 데이터셋에 자주 등장한 상대시간표현인 year, day, week 속성에 대한 성능이 비교적 높은 것을 확인할 수 있었다. 본 연구의 결과물인 추가적인 timex3 속성과 규칙기반 모델은 질의응답시스템, 챗봇 등의 서비스 개발에 유용하게 활용될 수 있을 것이다.

가치-태도-행동 모델에 기반한 음성 쇼핑 지속이용의도에 관한 연구 (Continuance Use Intention of Voice Commerce Using the Value-attitude-behavior Model)

  • 김효정
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.491-502
    • /
    • 2022
  • 인간과 정보기기간 대화를 통해 물품을 구매하는 음성 쇼핑에 대한 관심이 증가하고 있다. 본 연구는 가치-태도-행동 모델을 활용하여 음성 쇼핑 지속이용의도에 미치는 영향 요인들을 살펴보았다. 인공지능 비서를 이용해 음성 쇼핑을 이용하고 있는 20-40대 소비자들을 대상으로 온라인 조사를 실시하였고, 총 360명의 응답 자료가 분석에 사용되었다. 데이터 분석을 위해 SPSS 25.0과 Amos 23.0 프로그램을 이용하였고, 기술통계분석, 확인적요인분석, 그리고 구조모형분석을 실시하였다. 본 연구의 결과는 다음과 같이 요약될 수 있다. 첫째, 기능적 가치가 음성 쇼핑에 대한 만족도에 가장 많은 영향을 미치는 것으로 확인되었다. 둘째, 사회적 가치, 감성적 가치, 그리고 진귀적 가치가 음성 쇼핑에 대한 만족도에 정(+)적인 영향을 미치는 것으로 확인되었다. 셋째, 음성 쇼핑의 만족도가 지속이용의도에 정(+)적인 영향을 미치는 것으로 확인되었다. 본 연구의 결과는 음성 쇼핑 이용자들에 대한 특성을 파악하고, 음성 쇼핑에서 추구되는 다양한 가치를 이해하는데 기여할 수 있을 것이다.

음성 데이터의 내재된 감정인식을 위한 다중 감정 회귀 모델 (Multi-Emotion Regression Model for Recognizing Inherent Emotions in Speech Data)

  • 이명호;임명진;신주현
    • 스마트미디어저널
    • /
    • 제12권9호
    • /
    • pp.81-88
    • /
    • 2023
  • 최근 코로나19로 인한 비대면 서비스의 확산으로 온라인을 통한 소통이 증가하고 있다. 비대면 상황에서는 텍스트나 음성, 이미지 등의 모달리티를 통해 상대방의 의견이나 감정을 인식하고 있다. 현재 다양한 모달리티를 결합한 멀티모달 감정인식에 관한 연구가 활발하게 진행되고 있다. 그중 음성 데이터를 활용한 감정인식은 음향 및 언어정보를 통해 감정을 이해하는 수단으로 주목하고 있으나 대부분 단일한 음성 특징값으로 감정을 인식하고 있다. 하지만 대화문에는 다양한 감정이 복합적으로 존재하기 때문에 다중 감정을 인식하는 방법이 필요하다. 따라서 본 논문에서는 복합적으로 존재하는 내재된 감정인식을 위해 음성 데이터를 전처리한 후 특징 벡터를 추출하고 시간의 흐름을 고려한 다중 감정 회귀 모델을 제안한다.