• Title/Summary/Keyword: 언어모형

Search Result 391, Processing Time 0.029 seconds

Emotion and Speech Act classification in Dialogue using Multitask Learning (대화에서 멀티태스크 학습을 이용한 감정 및 화행 분류)

  • Shin, Chang-Uk;Cha, Jeong-Won
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.532-536
    • /
    • 2018
  • 심층인공신경망을 이용한 대화 모델링 연구가 활발하게 진행되고 있다. 본 논문에서는 대화에서 발화의 감정과 화행을 분류하기 위해 멀티태스크(multitask) 학습을 이용한 End-to-End 시스템을 제안한다. 우리는 감정과 화행을 동시에 분류하는 시스템을 개발하기 위해 멀티태스크 학습을 수행한다. 또한 불균형 범주 분류를 위해 계단식분류(cascaded classification) 구조를 사용하였다. 일상대화 데이터셋을 사용하여 실험을 수행하였고 macro average precision으로 성능을 측정하여 감정 분류 60.43%, 화행 분류 74.29%를 각각 달성하였다. 이는 baseline 모델 대비 각각 29.00%, 1.54% 향상된 성능이다. 본 논문에서는 제안하는 구조를 이용하여, 발화의 감정 및 화행 분류가 End-to-End 방식으로 모델링 가능함을 보였다. 그리고, 두 분류 문제를 하나의 구조로 적절히 학습하기 위한 방법과 분류 문제에서의 범주 불균형 문제를 해결하기 위한 분류 방법을 제시하였다.

  • PDF

Improved Statistical Language Model for Context-sensitive Spelling Error Candidates (문맥의존 철자오류 후보 생성을 위한 통계적 언어모형 개선)

  • Lee, Jung-Hun;Kim, Minho;Kwon, Hyuk-Chul
    • Journal of Korea Multimedia Society
    • /
    • v.20 no.2
    • /
    • pp.371-381
    • /
    • 2017
  • The performance of the statistical context-sensitive spelling error correction depends on the quality and quantity of the data for statistical language model. In general, the size and quality of data in a statistical language model are proportional. However, as the amount of data increases, the processing speed becomes slower and storage space also takes up a lot. We suggest the improved statistical language model to solve this problem. And we propose an effective spelling error candidate generation method based on a new statistical language model. The proposed statistical model and the correction method based on it improve the performance of the spelling error correction and processing speed.

Behavior of Intrinsic Laryngeal Muscles : In vivo Canine Model (내후두근의 작용 : 개에서의 생체발성 모형)

  • 최홍식
    • Journal of the Korean Society of Laryngology, Phoniatrics and Logopedics
    • /
    • v.8 no.2
    • /
    • pp.185-192
    • /
    • 1997
  • Behavior of the intrinsic laryngeal muscles : Thyroarytenoid(TA), cricothyroid(CT), lateral cricoarytenoid(LCA), interarytenoid(IA) and posterior cricoarytenoid(PCA) : were evaluated under the in vivo canine laryngeal model in three individual papers. This is the review of the relating three articles. In vivo preparation of the laryngeal model was summarized. Video-laryngoscopic findings of the individual intrinsic laryngeal muscles were documented by electrical stimulation of the individual muscular branches of the laryngeal nerve. Effects on fundamental frequency, subglottic pressure, intensity and open quotient by the stimulation of the individual intrinsic laryngeal muscles were tested.

  • PDF

Extracting Web-Table Information Using Decision Tree and Rule Based Approach (기계학습과 규칙 기반 접근 방법을 결합한 의미 있는 표 구분과 헤드 영역 추출)

  • Jung, Sung-Won;Park, Dae-Won;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.5-11
    • /
    • 2004
  • 일반적으로 HTML문서는 크게 내용과 구조로 이루어져 있다. HTML은 일반 문서와 달리 태그라는 것으로 문서에 추가 정보를 주며, 문서의 내용을 더욱 명확하게 한다. 따라서 태그를 이용하면 일반 문서보다 정보를 쉽게 구별하고 추출할 수 있다. 이러한 여러 가지 태그들 중에서 본 연구는 표를 중점적으로 연구한다. 표는 행과 열을 이용하여 어떤 사실을 조직하여 전달하는 것으로, 다른 구조적 특성들 보다 정보를 조직하는데 매우 유용하며, 글로 기술할 많은 분량을 간단히 줄이는 역할을 한다. 이와 같은 표의 특성에 주목하여 표에서 정보를 추출하는 분야를 기존 연구자들은 Web Table Mining 명명하였다. 본 연구는 기존 연구자들이 간과한 표의 구조적인 특성을 이용하여 전체 인터넷 문서에 적용할 수 있는 방법과 함께, 표에서 의미 있는 정보 추출을 위한 단계적인 모형을 제시한다.

  • PDF

Development of the Robot Programing learning model which uses Visual Programing tool (비주얼 프로그래밍 도구를 이용한 로봇 프로그래밍 학습 모형의 개발)

  • Jeong, Sang-Yeob;Yoo, In-Hwan
    • 한국정보교육학회:학술대회논문집
    • /
    • 2008.01a
    • /
    • pp.148-153
    • /
    • 2008
  • 지식 기반 사회에서는 논리적인 사고를 통해 외부의 자극에서 새로운 가치를 창조하고 스스로 지식을 형성하는 능력이 필요하다. 그리고 컴퓨터 교육의 목적은 기능의 습득이 아니라 습득한 기능을 유기적으로 이용하여 주어진 문제를 해결하는 논리적 사고력의 향상에 있다. 따라서 논리적 사고력을 기를 수 있는 프로그래밍 교육을 학생들에게 지도하여야 한다. 본 연구에서 논 프로그래밍 입문기 학습자들이 갖는 어려움, 즉 프로그래밍 언어의 단어와 문법 암기 따른 부담을 덜고 프로그래밍 학습이 갖는 논리적 알고리즘 탐구에 집중하고자 기존의 구문 중심 프로그래밍 언어가 아닌 아이콘 기반의 비주얼 프로그래밍 도구를 제시한다. 그리고 기존의 프로그래밍 학습에서 아동들이 추상적으로 해 왔던 프로그래밍 과정을 로봇을 이용하여 구체적이고 실험적인 학습을 하도록 하며 아울러 일반 학급에서 적용할 수 있는 로봇 활용 프로그래밍 교육 프로그램을 구상하였다.

  • PDF

대명사의 종류에 따른 참조해결과정

  • Lee, Jae-Ho;Lee, Man-Yeong
    • Annual Conference on Human and Language Technology
    • /
    • 1990.11a
    • /
    • pp.104-111
    • /
    • 1990
  • 대명사의 종류에 따른 대명사의 어휘적 특성이 대용어 참조해결에 미치는 효과를 살펴보기 위해서 두개의 실험을 수행하였다. 실험 1에서는 대명사 문장의 읽기시간과 선행어에 대한 어휘판단과제를 통해서 복수가 단수에 비해 읽기시간은 빠르지만, 어휘판단시간은 단수가 빠른 경향을 보였다. 그리고 단수는 애매성에 따라 반응시간의 차이를 보였다. 실험 2에서는 단수가 복수에 비해 어휘판단이 빠름을 반복하였다. 그리고 단수는 여전히 성별단서의 애매성에 대한 차이를 보였다. 이러한 결과는 대용어의 참조해결에 미치는 여러 요인 중에서 대명사의 어휘적 특성이 한 요인임을 증명하였다. 결론적으로 대명사의 종류에 따라 참조해결과정이 다르게 일어 날 가능성과 표상되는 글 모형도 달라질 수 있는 가능성을 제시하였다.

  • PDF

Construction of Knowledge Base for Question/Answering on Internet (인터넷 질의/응답을 위한 지식베이스 구축)

  • Chang, Moon-Soo;Jang, Myung-Gil;Kim, Hyun-Jin;Oh, Hyo-Jung;Lee, Jae-Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.198-202
    • /
    • 2000
  • 차세대 검색 엔진의 모형으로 일컬어지는 질의/응답 시스템을 개발하는데 있어서 보다 정확하고 유연한 검색 결과를 제공하기 위하여 개념망에 기반한 지식베이스 구축의 필요성이 대두되고 있다. 본 논문은 기존의 개념망에 속성 구조를 추가한 확장 개념망과 속성에 의해 분류되는 정답문서 집합으로 구성되는 지식베이스를 이용한 질의/응답 시스템을 제안한다. 본 논문의 지식베이스에서 정의한 속성은 질의/응답에서 정답문서를 효과적으로 연계시켜 사용자에게 보다 유연한 정답을 제공할 수 있게 한다. 본 논문에서는 경제 분야의 지식베이스의 활용예를 설명한다.

  • PDF

Development of a Prototype of Web Based Assessment for Improvement of Teaching Method (교수법 향상을 위한 웹기반 평가의 프로토타입 개발)

  • 구정모;한병래;김성식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.583-585
    • /
    • 2003
  • 원격 교사 연수는 기존의 교사 연수를 보완할 수 있는 장점 때문에 그동안 많은 양적인 증대가 있었다. 그러나 이제 양적인 증대와 아울러 그 질적인 면도 같이 고려해야 할 때이다. 기존의 원격연수는 시간과 공간의 제약성과 연수생의 개별학습을 고려한다는 장정이 있지만 연수 강사와 연수생간의 상호작용의 문제점, 연수생의 요구에 부합하지 못하고 현장 적용성이 떨어지는 연수내용, 명확하지 못하고 획일적인 평가방법, 연수강사의 질, 교수 학습 모형 등과 같은 문제점들이 제기 되고 있다. 특히 원격 교사 연수의 핵심인 교수법을 향상시키기 위해서는 실제적이고 객관적인 평가 방법이 필요할 것이다. 따라서 본 연구에서는 교사의 언어적, 비언어적 행위에 대한 분석을 기반으로 하는 웹기반 평가의 프로토타입을 개발하여 교수법을 향상시키고자 한다.

  • PDF

A Study on Korean Fake news Detection Model Using Word Embedding (워드 임베딩을 활용한 한국어 가짜뉴스 탐지 모델에 관한 연구)

  • Shim, Jae-Seung;Lee, Jaejun;Jeong, Ii Tae;Ahn, Hyunchul
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.199-202
    • /
    • 2020
  • 본 논문에서는 가짜뉴스 탐지 모델에 워드 임베딩 기법을 접목하여 성능을 향상시키는 방법을 제안한다. 기존의 한국어 가짜뉴스 탐지 연구는 희소 표현인 빈도-역문서 빈도(TF-IDF)를 활용한 탐지 모델들이 주를 이루었다. 하지만 이는 가짜뉴스 탐지의 관점에서 뉴스의 언어적 특성을 파악하는 데 한계가 존재하는데, 특히 문맥에서 드러나는 언어적 특성을 구조적으로 반영하지 못한다. 이에 밀집 표현 기반의 워드 임베딩 기법인 Word2vec을 활용한 텍스트 전처리를 통해 문맥 정보까지 반영한 가짜뉴스 탐지 모델을 본 연구의 제안 모델로 생성한 후 TF-IDF 기반의 가짜뉴스 탐지 모델을 비교 모델로 생성하여 두 모델 간의 비교를 통한 성능 검증을 수행하였다. 그 결과 Word2vec 기반의 제안모형이 더욱 우수하였음을 확인하였다.

  • PDF

Korean Open Domain Question Answering System Using KorQuAD (KorQuAD를 활용한 한국어 오픈도메인 질의응답 시스템)

  • Cho, Sanghyun;Kim, Minho;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.321-325
    • /
    • 2019
  • 오픈 도메인 질의응답이란, 질문을 줬을 때 그 질문과 연관성이 높은 문서를 검색하고 검색된 문서에서 정답을 추출하는 태스크이다. 본 논문은 기계 독해 데이터인 KorQuAD를 활용한 오픈도메인 질의응답 시스템을 제안한다. 문서 검색기를 이용하여 질문과 관련 있는 위키피디아 문서들을 검색하고 검색된 문서에 단락 선택 모델을 통해서 문서 질문과 연관성이 높은 단락들을 선별하여 기계 독해 모델에서 처리해야 할 입력의 수를 줄였다. 문서 선별모델에서 선별된 여러 단락에서 추출된 정답 후보에서 여러 가지 정답 모형을 적용하여 성능을 비교하는 실험을 하였다. 본 논문에서 제안한 오픈도메인 질의응답 시스템을 KorQuAD에 적용했을 때, 개발 데이터에서 EM 40.42%, F1 55.34%의 성능을 보였다.

  • PDF