• Title/Summary/Keyword: 도메인 공학

Search Result 465, Processing Time 0.027 seconds

Integrated Dialogue Analysis using Long Short-Term Memory (Long Short-Term Memory를 이용한 통합 대화 분석)

  • Kim, Min-Kyoung;Kim, Harksoo
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.119-121
    • /
    • 2016
  • 최근 사람과 컴퓨터가 대화를 하는 채팅시스템 연구가 활발해지고 있다. 컴퓨터가 사람의 말에 적절한 응답을 하기 위해선 그 의미를 분석할 필요가 있다. 발화에 대한 의미 분석의 기본이 되는 연구로 감정분석과 화행분석이 있다. 그러나 이 둘은 서로 밀접한 연관이 있음에도 불구하고 함께 분석하는 연구가 시도 되지 않았다. 본 연구에서는 Long Short-term Memory(LSTM)를 이용하여 대화체 문장의 감정과 화행, 서술자를 동시에 분석하는 통합 대화 분석모델을 제안한다. 사랑 도메인 데이터를 사용한 실험에서 제안 모델은 감정 58.08%, 화행 82.60%, 서술자 62.74%의 정확도(Accuracy)를 보였다.

  • PDF

Guided Sequence Generation using Trie-based Dictionary for ASR Error Correction (음성 인식 오류 수정을 위한 Trie 기반 사전을 이용한 Guided Sequence Generation)

  • Choi, Junhwi;Ryu, Seonghan;Yu, Hwanjo;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.211-216
    • /
    • 2016
  • 현재 나오는 많은 음성 인식기가 대체로 높은 정확도를 가지고 있더라도, 음성 인식 오류는 여전히 빈번하게 발생한다. 음성 인식 오류는 관련 어플리케이션에 있어 많은 오동작의 원인이 되므로, 음성 인식 오류는 고쳐져야 한다. 본 논문에서는 Trie 기반 사전을 이용한 Guided Sequence Generation을 제안한다. 제안하는 모델은 목표 단어와 그 단어의 문맥을 Encoding하고, 그로부터 단어를 Character 단위로 Decoding하며 단어를 Generation한다. 올바른 단어를 생성하기 위하여, Generation 시에 Trie 기반 사전을 통해 유도한다. 실험을 위해 모델은 영어 TV 가이드 도메인의 말뭉치의 음성 인식 오류를 단순히 Simulation하여 만들어진 말뭉치로부터 훈련되고, 같은 도메인의 음성 인식 문장과 결과로 이루어진 병렬 말뭉치에서 성능을 평가하였다. Guided Generation은 Unguided Generation에 비해 14.9% 정도의 오류를 줄였다.

  • PDF

A Frequency Measure of Hangul in Korean Zip Code (우편번호 체계에서 사용중인 한글의 빈도수 조사)

  • Kim, Min-Ki;Kwon, Young-Bin
    • Annual Conference on Human and Language Technology
    • /
    • 1993.10a
    • /
    • pp.295-301
    • /
    • 1993
  • 제약이 없이 자유롭게 쓴 오프라인 필기체 한글을 인식하는 문제는 응용분야에 따른 도메인의 정보를 이용함으로써 보다 쉽게 접근할 수 있다. 본 연구는 오프라인 필기체 한글 인식을 위한 한 도메인으로 우편봉투를 대상으로 하였을 때, 우편번호가 할당된 지명과 건물명을 대상으로 글자의 종류와 빈도수를 통계 분석하였다. 분석 결과 가능한 한글 조합 11,172자중 403자만이 쓰이고 있음을 알았다. 이러한 정보는 자소 분할이 어려운 오프라인 필기체 한글 인식에 있어, 문자 단위 정합을 사용했을 때 인식속도 및 인식률 향상에 기여 할 것으로 생각된다.

  • PDF

A Quality Assurance based on Coding Standards for Communication System (통신 시스템을 위한 코딩 표준 기반 품질 보증)

  • Kang, Sun-Young;Lee, Eun-Seok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.203-206
    • /
    • 2010
  • 임베디드 소프트웨어의 소스 코드에 대한 품질 검증은 매우 중요한 사항이다. 이에 다양한 시험을 통해 요구되는 품질 속성을 만족하기 위해 노력한다. 본 연구에서는 이러한 품질 확보 활동의 일환으로 구현 단계에서 진행하는 코드리뷰에 코딩 표준을 적용한 사례를 소개한다. 코딩 표준에 대한 다양한 연구와 도메인 내의 결함 분석을 통해 몇 가지의 코딩 표준을 제안하였으며, 이를 조직에 적용하기 위한 고려사항을 언급하였다. 마지막으로 적용 결과에 대해 분석하여 향후 진행될 방향으로 마무리 지었다.

CommonAI: Quantitative and qualitative analysis for automatic-generation of Commonsense Reasoning sentence suitable for AI (AI에 적합한 일반상식 문장의 자동 생성을 위한 정량적, 정성적 연구)

  • Hyeon Gyu Shin;YoungSook Son
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.153-159
    • /
    • 2022
  • 본 논문에서는 인공지능이 생성하는 일상 대화의 품질 향상을 위해 상식 추론을 정의하고 설문을 통해 정량적, 정성적 분석을 진행하였다. 정량적 평가에서는 주어진 문장이 에게 학습시키기에 적합한가'라는 수용성 판단을 요청한 질문에서 40대 이상의 연령이 20, 30대와 유의미한 차이를 보였다. 정성적 평가에서는 '보편적 사실 여부'를 AI 발화 기준의 주요한 지표로 보았다. 이어서 '챗봇' 대화의 품질에 대한 설문을 실시했다. 이를 통해 일상 대화를 사용한 챗봇의 대화 품질을 높이기 위해서는 먼저, 질문의 요구에 적절한 정보와 공감을 제공해야 하고 두 번째로 공감의 정도가 챗봇의 특성에 맞는 응답이어야 하며 세 번째로 대화의 차례에 따라 담화의 규칙을 지키면서 대화가 진행되어야 한다는 결론을 얻을 수 있었다. 이 세 가지 요건이 통합적으로 적용된 담화 설계를 통해 완전히 인공지능스러운 대화가 가능할 것으로 여겨진다.

  • PDF

Implementation of User Preemptive Credit Scheduler in Desk-Top Virtualization (가상화 환경에서 사용자 선점형 Credit 스케줄러 구현)

  • Yoo, Seung-Hwan;Kim, Sung-Chun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2009.11a
    • /
    • pp.455-456
    • /
    • 2009
  • 기존의 가상화 시스템에서 사용되던 스케줄러는 기존 서버 환경을 기반으로 구현되었다. 즉, 기존 데스크톱 운영체계와는 달리 선점형 멀티테스킹 작업방식에 대한 고려가 부족하다. 때문에 본 논문에서는 데스크톱 환경에서 XEN 가상화 시스템을 사용할 경우 사용자 작업을 우선적으로 선점하는 Credit 스케줄러를 제시한다. Credit 스케줄러의 I/O 도메인 Boost 기능의 수정을 통해 데스크톱 사용자가 작업하는 가상 머신에 대한 성능을 향상시키는 Credit 스케줄러를 제안하였다. 또한 시뮬레이션을 통해 본 논문에서 제안한 스케줄러가 목적에 맞게 동작하는지 확인할 수 있었다.

A Case on Framework Reuse for Data Recorder Software Development (기록장치 소프트웨어 개발을 위한 프레임워크 재사용 사례)

  • Kim, Chan-Su;Shim, Jun-Yong;Wi, Soung-Hyouk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2011.11a
    • /
    • pp.1369-1371
    • /
    • 2011
  • 효과적이고 체계적인 소프트웨어의 재사용을 위해서는 해당 도메인에 대한 공통된 자산을 먼저 개발해야 한다. 재사용을 위한 컴포넌트 집합은 복잡한 소프트웨어를 컴포넌트 단위의 구조로 분해하고 이를 다시 조립할 수 있도록 하여 생산성을 향상시키지만 광범위한 분석으로 인해 컴포넌트를 개발하는데 필요한 비용과 기간을 증가시키기도 한다. 이러한 문제점을 극복하기 위해 소프트웨어 제품 라인 공학을 적용하여 해당 도메인의 수요나 업무 수행을 만족하는 일련의 공통된 기능들을 이용하여 재사용할 단위인 핵심 자산을 구축하고 요구사항에 따라 목표 시스템을 단기간에 저비용으로 개발할 수 있다. 본 논문에서는 소프트웨어 제품 라인 공학을 통해 정의된 M&S프레임워크의 핵심 자산을 제시하고 이를 재사용해 기록장치 소프트웨어를 개발한 사례에 대하여 설명한다.

Deep learning-based Answer Type Classifier Considering Topicality in Korean Question Answering (한국어 질의 응답에서의 화제성을 고려한 딥러닝 기반 정답 유형 분류기)

  • Cho, Seung Woo;Choi, DongHyun;Kim, EungGyun
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.103-108
    • /
    • 2019
  • 한국어 질의 응답의 입력 질문에 대한 예상 정답 유형을 단답형 또는 서술형으로 이진 분류하는 방법에 대해 서술한다. 일반적인 개체명 인식으로 확인할 수 없는 질의 주제어의 화제성을 반영하기 위하여, 검색 엔진 쿼리를 빈도수로 분석한다. 분석된 질의 주제어 정보와 함께, 정답의 범위를 제약할 수 있는 속성 표현과 육하원칙 정보를 입력 자질로 사용한다. 기존 신경망 분류 모델과 비교한 실험에서, 추가 자질을 적용한 모델이 4% 정도 향상된 분류 성능을 보이는 것을 확인할 수 있었다.

  • PDF

BERT-based Data Augmentation Techniques for Korean Coreference Resolution (한국어 상호참조해결을 위한 BERT 기반 데이터 증강 기법)

  • Kim, Kihun;Lee, Changki;Ryu, Jihee;Lim, Joonho
    • Annual Conference on Human and Language Technology
    • /
    • 2020.10a
    • /
    • pp.249-253
    • /
    • 2020
  • 상호참조해결은 문서 내에 등장하는 모든 멘션 중에서 같은 의미를 갖는 대상(개체)들을 하나의 집합으로 묶어주는 자연어처리 태스크이다. 한국어 상호참조해결의 학습 데이터는 영어권에 비해 적은 양이다. 데이터 증강 기법은 부족한 학습 데이터를 증강하여 기계학습 기반 모델의 성능을 향상시킬 수 있는 방법 중 하나이며, 주로 규칙 기반 데이터 증강 기법이 연구되고 있다. 그러나 규칙 기반으로 데이터를 증강하게 될 경우 규칙 조건을 만족하지 못했을 때 데이터 증강이 힘들다는 문제점과 임의로 단어를 변경 혹은 삭제하는 과정에서 문맥에 영향을 주는 문제점이 발생할 수 있다. 따라서 본 논문에서는 BERT의 MLM(Masked Language Model)을 이용하여 기존 규칙기반 데이터 증강 기법의 문제점을 해결하고 한국어 상호참조해결 데이터를 증강하는 방법을 소개한다. 실험 결과, ETRI 질의응답 도메인 상호참조해결 데이터에서 CoNLL F1 1.39% (TEST) 성능 향상을 보였다.

  • PDF

Extract Snippets Suitable for Search Intent (검색의도에 적합한 스니펫 추출)

  • Lee, Hyeon-gu;Yang, Yunyeong;Kim, Eunbyul;Cha, Woojune;Roh, Yunyoung;Kim, Eunyoung;Choi, Gyuhyeon;Shin, Dongwook;Park, Chanhoon;Kang, Inho
    • Annual Conference on Human and Language Technology
    • /
    • 2021.10a
    • /
    • pp.241-246
    • /
    • 2021
  • 스니펫 추출은 정보검색에서 주요한 문서 정보를 짧은 문단 형태로 보여주는 것으로 사용자가 검색결과를 좀 더 효율적으로 확인할 수 있게 도와준다. 그러나 기존 스니펫은 어휘가 일치하는 문장을 찾아 보여주기에 검색의도가 반영되기 어렵다. 또한 의미적 정답을 찾기 위해 질의응답 방법론이 응용되고 있지만 오픈 도메인 환경에서 품질이 낮은 문제가 있다. 본 논문은 이러한 문제를 해결하기 위해 스니펫 추출, 의도 부착, 검증 3단계로 스니펫을 추출하여 추출된 스니펫이 질의 의도에 적합하게 추출되도록 하는 방법을 제안한다. 실험 결과 전통적인 스니펫보다 만족도가 높은 것을 보였고, 스니펫 추출만 했을 때보다 의도 부착, 검증을 하였을 때 정확도가 0.3165만큼 향상되는 것을 보였다.

  • PDF