• 제목/요약/키워드: Dialogue Data

검색결과 108건 처리시간 0.052초

Praat과 R로 분석한 한국인 대화 음성 말뭉치의 fundamental frequency(f0)값 분포 (The fundamental frequency (f0) distribution of Korean speakers in a dialogue corpus using Praat and R)

  • 양병곤
    • 말소리와 음성과학
    • /
    • 제15권3호
    • /
    • pp.17-25
    • /
    • 2023
  • 이 논문은 국립국어원에서 배포한 한국인 대화 음성 말뭉치에서 화자의 성대의 진동을 나타내는 fundamental frequency(f0)값을 측정해서 한국인이 일상 대화를 할 때 f0값의 기초적인 통계자료를 살펴보고, 나이와 f0값의 분포는 어떤 관계를 보이는지를 조사했다. 연구자료 수집과 분석은 Praat과 R을 이용했고, 개인별 억양구마다 상자도를 구하고 사분위값을 활용하여 극단값을 제거하는 방법으로 최종 f0값 자료를 구했다. 그 결과 전체 한국인들의 f0값의 평균값은 185 Hz이고 중앙값은 187 Hz로 나왔다. 자료의 분포모양을 나타내는 왜도는 0.11의 정적분포를 보였고, 첨도는 -0.09로 정상분포에 거의 가까운 모양을 보였다. 일상대화의 피치값의 변화범위로는 238 Hz로 나타났다. 남녀 간의 f0값의 차이는 남성의 중앙값 114 Hz의 거의 두 배에 해당하는 199 Hz가 여성의 중앙값으로 나타났고 t검증결과 유의미한 차이를 보였다. 분포모양을 나타내는 왜도는 남성이 1.24이었고, 여성은 그것의 반에 해당하는 0.58이었다. 첨도는 남녀집단 각각 5.21과 3.88로 나타나 남성의 값이 34% 정도 더 뾰족한 모양을 보였다. 연령대별로는 남녀집단을 합하여 볼 때, 나이가 들수록 f0값이 서서히 내려가는 경향을 보였다. 연령대별 f0중앙값과 나이 간의 회귀분석을 실행한 결과 기울기가 남성집단에서는 0.15, 여성집단에서는 -0.586으로 서로 반대되는 경향을 기록했다. 결론적으로, 대규모 참여자가 녹음한 대화 음성에서 한국인의 집단별 연령별 다양한 f0분포를 규명할 수 있지만, 나이와 f0관계는 더 정밀한 자료수집이 필요함을 알 수 있었다.

Automated Enterprise Data Model by Formulating Requirements

  • Lee, Sang-Won
    • Journal of Information Technology Applications and Management
    • /
    • 제16권4호
    • /
    • pp.263-283
    • /
    • 2009
  • Although some CASE tools supported conceptual data design, they required for users too much preliminary knowledge to learn how to use and handle them. In addition, in a number of studies on conceptual data design with natural language, they claimed passive participation for users with conforming to messages predefined by CASE tools. As an alternative to these traditional CASE tools, we proposed an ERD formulator for automated data design tool, called ERDF, so that even ordinary users, not necessarily data modeler, are capable of formulating ERD on business requirements by use of ERDF. We, first of all, introduced NSM as the standard methodology. We also designed the structure of ERDF including main controller, input controller, operation controller, regulation controller, schema controller, and output controller. We then defined conceptual domains and basic operations to lay down schema operations as well as sentence rules to handle input sentence in natural language. To get an ERD that is faithful to business requirements, we laid out supplementary design for dialogue and confirmation of soundness and completion.

  • PDF

모바일 기기와 가상 스토리지 기술을 적용한 자동적 및 편재적 음성형 지식 획득 (Mobile Device and Virtual Storage-Based Approach to Automatically and Pervasively Acquire Knowledge in Dialogues)

  • 유기동
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.1-17
    • /
    • 2012
  • 최근에 들어 많은 관심과 인기 속에 사용되고 있는 스마트폰은 클라우드 컴퓨팅의 편재적 기능성을 접목하여 즉각적인 지식의 획득에 효과적으로 활용될 수 있다. 또한 지식의 주제어 또는 명칭을 자동으로 파악하여 해당 지식을 저장할 수 있다면 전반적인 지식 획득 과정이 자동화될 수 있다. 본 논문은 텍스트마이닝 기반 주제어 추출 기술과 클라우드 스토리지 기반 스마트폰을 접목하여 지식이 발생되는 지점 및 시점에 즉각적으로 해당 지식을 획득할 수 있는 학제적 방안을 제시한다. 이를 위해 스마트폰은 지식이 포함된, 지식소유자의 대화를 녹음하는 역할을 함과 동시에 지식소유자의 대화의 내용을 부가적으로 특성화 할 수 있는 상황정보를 채취할 수 있는 센서의 역할을 수행한다. 또한 기계학습 알고리듬 중 텍스트마이닝분야에서 우수한 성능을 나타내는 것으로 알려진 Support Vector Machine 알고리듬을 사용하여 해당 대화의 주제어를 추출한다. 파악된 주제어와 상황정보를 연관시켜 일종의 비즈니스 규칙을 생성할 수 있으며, 최종적으로 규칙, 주제어, 상황정보, 그리고 문서화된 대화를 종합하여 하나의 지식을 자동으로 획득할 수 있다.

Implementation of Extracting Specific Information by Sniffing Voice Packet in VoIP

  • Lee, Dong-Geon;Choi, WoongChul
    • International journal of advanced smart convergence
    • /
    • 제9권4호
    • /
    • pp.209-214
    • /
    • 2020
  • VoIP technology has been widely used for exchanging voice or image data through IP networks. VoIP technology, often called Internet Telephony, sends and receives voice data over the RTP protocol during the session. However, there is an exposition risk in the voice data in VoIP using the RTP protocol, where the RTP protocol does not have a specification for encryption of the original data. We implement programs that can extract meaningful information from the user's dialogue. The meaningful information means the information that the program user wants to obtain. In order to do that, our implementation has two parts. One is the client part, which inputs the keyword of the information that the user wants to obtain, and the other is the server part, which sniffs and performs the speech recognition process. We use the Google Speech API from Google Cloud, which uses machine learning in the speech recognition process. Finally, we discuss the usability and the limitations of the implementation with the example.

A Study on Conversational AI Agent based on Continual Learning

  • Chae-Lim, Park;So-Yeop, Yoo;Ok-Ran, Jeong
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권1호
    • /
    • pp.27-38
    • /
    • 2023
  • 본 논문에서는 시간의 흐름에 따라 새로운 데이터를 지속적으로 학습하고 성장할 수 있는 연속 학습 기반 대화형 AI 에이전트를 제안한다. 연속학습 기반 대화형 AI 에이전트는 태스크 관리자 (Task Manager), 사용자 속성 추출(User Attribute Extraction), 자동 확장 지식 그래프(Auto-growing Knowledge Graph), 크게 3가지 요소로 구성된다. 태스크 관리자는 사용자와의 대화에서 새로운 데이터를 발견하면 이전에 학습한 지식을 통해 새로운 태스크를 생성한다. 사용자 특성 추출 모델은 새로운 태스크에서 사용자의 특성을 추출하고, 자동 확장 지식 그래프는 새로운 외부 지식을 지속적으로 학습할 수 있도록 한다. 한정된 데이터셋을 기반으로 학습된 기존 대화형 AI 에이전트와 달리, 본 논문에서 제안하는 방법은 지속적인 사용자의 특성과 지식 학습을 기반으로 대화를 가능하게 한다. 연속학습 기술이 적용된 대화형 AI 에이전트는 사용자와의 대화가 축적될수록 개인 맞춤형 대응이 가능하며, 새로운 지식에도 대응이 가능하다. 본 논문에서는 시간에 따른 대화 생성 모델의 성능 변화 실험을 통해 제안하는 방법의 가능성을 검증한다.

공중회선망을 이용한 원격 심전도 진단 시스템 (A Study on Remote ECG Diagnostic System Using Telephone Line)

  • 이명호;박상희;김용만;신건수;정희교;정기삼
    • 대한의용생체공학회:의공학회지
    • /
    • 제13권1호
    • /
    • pp.69-78
    • /
    • 1992
  • This Paper describes implementation of a remote ECG diagnostic system using telephone line. The overall system includes ECG data acquisition system, ECG terminal, system control software, automatic diagnosis system, and transmission system.'The proposed system provides various functions, which are ECG data acquisition, transmission, receiving, diagnosis and dialogue between patients and medical doctors. Thls system is very simple and convienient to use. We evaluate the performance of modem and the accuracy of automatic diagnosis algorithm. The obtained results suggest the Possibilities of a remote ECG diagnostic system using the only existed telephone line.

  • PDF

AutoCAD 프로그램을 이용한 자동 펌프설계 시스템 개발 (Development of an Automatic Pump Design System Using AutoCAD)

  • 김일수;정영재;이창우;박주석
    • 한국공작기계학회논문집
    • /
    • 제11권1호
    • /
    • pp.91-96
    • /
    • 2002
  • Recently industry has moved towards automated operations with the goal of achieving better product quality greater productivity and reliability The pump design in characterized by extensive utilization of the related database which contains performance data. The inputs to the system are through interactive dialogue sessions and the basic input consist of flow rate, head, of fluid efficiency and the customer special requirements. These basic inputs along with the numerous rules in the knowledge bases and the mathematical modeling enable the effective design of the pump industry This paper represents the development of an automatic pump design system that was composed of a main program the data input module the drawing module the drawing edit module and was programed by the AutoLISP language under the Auto CAD program The developed system ultimately generates the design for a pump through the AutoCAD language.

제2언어로서의 한국어 아동 학습자의 초기 문식성 발달 (Early Literacy Development of Child Korean Learners as a Second Language)

  • 최은지
    • 한국어교육
    • /
    • 제25권1호
    • /
    • pp.235-265
    • /
    • 2014
  • This study is for looking into distinguishing features in child KSL learners' early literacy development. For these, the writings, recording data of dialogue, and observational journals of KSL child learners was collected regularly and the data were analysed. As results, KSL child learners showed lots of writing errors due to difficulty in phonological awareness or letter awareness of Korean language. And they seemed to develop the competence of connecting letters and meanings prior to developing the competence of connecting letters and sounds. Three KSL child learners showed great individual differences in development rate, and it is supposed to be mainly caused from differences of literacy development in their mother tongue, or quantity and quality in exposure for Korean language.

영화를 이용한 AI 기반 콘텐츠 재생산 시스템 연구 (Study on AI-based content reproduction system using movie contents)

  • 양석환;이영숙
    • 한국멀티미디어학회논문지
    • /
    • 제24권2호
    • /
    • pp.336-343
    • /
    • 2021
  • AI technology is spreading not only to industrial fields, but also to culture, art, and content fields. In this paper, we proposed a system based on AI technology that can automate the process of reproducing contents using characters for movie contents. After creating the basic appearance of the character by using the StyleGAN2 model from the video extracted from the movie contents, analyzing the character's personality and propensity using the extracted dialogue data, it was determined from the contemplative appearance based on the yin-yang and five elements to the character's propensity. Accordingly, the external characteristics are reflected in the character. Using the OpenPose model, a character's motion is created, and the finally generated data is integrated to reproduce the content. It is expected that many movie contents can be reproduced through the study of the proposed system.

송전선로 설계 기술자료 계산시스템 개발 (Development of the Technical Calculation System for Transmission Line)

  • 변강;민병욱;위화복;김세현;박기용;남궁도
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2004년도 하계학술대회 논문집 A
    • /
    • pp.488-490
    • /
    • 2004
  • The technical data for transmission line design and maintenance are calculated by a very complicated numerical formula so it is almost impossible to solve them by hand. Therefore the TOWER+ EXPERT SYSTEM was developed to systematically support technical data for transmission line design and maintenance. This system is able to calculate technical data which is applied to all conductors in our county, - that is 12 kinds of systems with 86 numbers of standard conductors, - and is programed to be user friendly by adopting dialogue windows, menu selection functions. Moreover, it minimizes input data by automatically providing standard transmission line design data, and it includes guidance of applicable work, program usage, data input process, help, explanation of terms and automatic error recovery functions that even a beginner can easily use.

  • PDF