• Title/Summary/Keyword: 한글과컴퓨터

Search Result 347, Processing Time 0.025 seconds

Concept-based Automatic Scoring System for Korean Free-text or Constructed Answers (개념 기반 한국어 서답형 답안의 자동채점 시스템)

  • Park, Il-Nam;Noh, Eun-Hee;Sim, Jae-Ho;Kim, Myung-Hwa;Kang, Seung-Shik
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.69-72
    • /
    • 2012
  • 본 논문은 한국어 서답형(단어, 구 수준) 문항 유형을 분석하고 실제 채점자가 채점 기준표를 보고 채점하는 방법을 컴퓨터가 인식할 수 있도록 정답 템플릿을 설계 및 개념 정의를 하여 한국어 서답형에 특화된 자동채점 시스템 방법을 제시한다. 본 시스템을 사용하여 1000개의 학생 답안지에 대한 유형 가지수 500개 이하의 2011년도 학업성취도 평가 과학 6개 문항에 대하여 채점 기준표 내용을 정답 템플릿으로 작성한 뒤 250개 학생 답안을 학습데이터로, 정답 템플릿을 업데이트로 사용, 750개 학생 답안에 대하여 자동채점한 결과, 평균 카파계수 0.84라는 수치로서 실제 사람 채점 결과와 거의 완벽히 일치라는 결과를 얻었다.

  • PDF

CRFs versus Bi-LSTM/CRFs: Automatic Word Spacing Perspective (CRFs와 Bi-LSTM/CRFs의 비교 분석: 자동 띄어쓰기 관점에서)

  • Yoon, Ho;Kim, Chang-Hyun;Cheon, Min-Ah;Park, Ho-min;Namgoong, Young;Choi, Minseok;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.189-192
    • /
    • 2018
  • 자동 띄어쓰기란 컴퓨터를 사용하여 띄어쓰기가 수행되어 있지 않은 문장에 대해 띄어쓰기를 수행하는 것이다. 이는 자연언어처리 분야에서 형태소 분석 전에 수행되는 과정으로, 띄어쓰기에 오류가 발생할 경우, 형태소 분석이나 구문 분석 등에 영향을 주어 그 결과의 모호성을 높이기 때문에 매우 중요한 전처리 과정 중 하나이다. 본 논문에서는 기계학습의 방법 중 하나인 CRFs(Conditional Random Fields)를 이용하여 자동 띄어쓰기를 수행하고 심층 학습의 방법 중 하나인 양방향 LSTM/CRFs (Bidirectional Long Short Term Memory/CRFs)를 이용하여 자동 띄어쓰기를 수행한 뒤 각 모델의 성능을 비교하고 분석한다. CRFs 모델이 양방향 LSTM/CRFs모델보다 성능이 약간 더 높은 모습을 보였다. 따라서 소형 기기와 같은 환경에서는 CRF와 같은 모델을 적용하여 모델의 경량화 및 시간복잡도를 개선하는 것이 훨씬 더 효과적인 것으로 생각된다.

  • PDF

Spoken Dialogue Management System based on Word Spotting (단어추출을 기반으로 한 음성 대화처리 시스템)

  • Song, Chang-Hwan;Yu, Ha-Jin;Oh, Yung-Hwan
    • Annual Conference on Human and Language Technology
    • /
    • 1994.11a
    • /
    • pp.313-317
    • /
    • 1994
  • 본 연구에서는 인간과 컴퓨터 사이의 음성을 이용한 대화 시스템을 구현하였다. 특별히 음성을 인식하는데 있어서 단어추출(word apotting) 방법을 사용하는 경우에 알맞은 의미 분석 방법과 도표 형태의 규칙을 기반으로 하여 시스템의 응답을 생성하는 방법에 대하여 연구하였다. 단어추출 방법을 사용하여 음성을 인식하는 경우에는 형태소분석 및 구문분석의 과정을 이용하여 사용자의 발화 의도를 분석하기 어려우므로 새로운 의미분석 방법을 필요로 한다. 본 연구에서는 퍼지 관계를 사용하여 사용자의 발화 의도를 파악하는 새로운 의미분석 방법을 제안하였다. 그리고, 사용자의 발화 의도에 적절한 시스템의 응답을 만들고 응답의 내용을 효율적으로 관리하기 위한 방범으로 현재의 상태와 사용자의 의도에 따른 응답 규칙을 만들었다. 이 규칙은 도표의 형태로 구현되어 규칙의 갱신 및 확장을 편리하게 만들었다. 대화의 영역은 열차 예매에 관련된 예매, 취소, 문의 및 관광지 안내로 제안하였다. 음성의 오인식에 의한 오류에 적절히 대처하기 위해 시스템의 응답은 확인 및 수정 과정을 포함하고 있다. 본 시스템은 문자 입력과 음성 입력으로 각각 실험한 결과, 사용자는 시스템의 도움을 받아 자신이 의도하는 목적을 달성할 수 있었다.

  • PDF

Pattern Construction for Semantic Relation Extraction using Verb Information (동사 정보를 활용한 의미 관계 추출을 위한패턴 구축)

  • Kim, Se-Jong;Lee, Yong-Hun;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.118-123
    • /
    • 2008
  • 온톨로지란 실세계에 존재하는 사물 및 개념, 그리고 용어들 간의 관계들을 컴퓨터가 이해할 수 있는 형태로 표현한 것이다. 온톨로지 구축에 있어서 대용량 코퍼스의 활용은 해당코퍼스에서 등장하는 용어들과 이들 사이에서 나타나는 문자열을 일종의 패턴으로 취급하여 특정 패턴과 함께 나타나는 용어 쌍들을 해당 패턴이 대표하는 의미 관계로 설정하는 방식을 취한다. 그러나 기존의 방법은 주로 두 용어들 사이에서 나타나는 문자열만을 고려하여 패턴을 추출하기 때문에 해당 문장에 포함된 보다 다양한 문장 정보들을 활용할 수 없다. 본 논문은 이러한 한계점을 감안하여, 용어 쌍 사이에서 나타나는 문자열과 주변 동사 정보를 함께 고려함으로써 패턴의 정교성을 향상시키는 방법을 제안한다. 또한 동사들의 동의어를 활용하여 다양한 용어들을 포괄할 수 있는 일반화된 패턴을 구축한다. 본 방법론은 is-a 관계의 경우 64%, part-of 관계의 경우 83%, made-of 관계의 경우 73%, use 관계의 경우 72%의 정확률을 보였으며 모두 기존 방법보다 향상된 결과를 가져왔다.

  • PDF

An Ontology Construction using Seed Term Feedback Relevance (씨앗 용어 피드백 관련 검색에 근거한 온톨로지 구축)

  • Lee, In-K.;Hwang, Do-Sam;Kwon, Soon-H.
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.81-88
    • /
    • 2006
  • 컴퓨터를 활용한 지식과 정보의 고도 처리를 위해 온톨로지를 구축하고 활용하려는 요구가 강해지고 있다. 이런 요구에 부흥하여 온톨로지의 구축 방법에 대한 많은 연구가 이루어지고 있다 그러나 현재까지의 온톨로지 구축 이론과 온톨로지 개발 도구가 실제 구현 목적과 사례에 따라 제한적인 부분에서 개발되어 사용되고 있다. 그러므로 구축하고자 하는 분야의 온톨로지에 맞는 적절한 구축 프로세스와 도구가 필요하다. 분야 온톨로지(domain ontology)를 구축함에 있어 특정 분야의 전문가 또는 비전문가가 언어자원으로부터 지식을 개념화(conceptualization), 형식화(formalization)하여 온톨로지를 구축할 수 있도록 분야 관련 언어자원에 근거하여 온톨로지를 구축할 수 있는 온톨로지 구축 프로세스(OntoProcessl))를 제안한다. 그리고, 다수의 온톨로지 구축자가 동시에 같은 분야의 온톨로지를 구축할 경우, 개념화 과정에서 서로 다른 구축자가 동일한 개념을 중복 정의하거나, 형식화 과정에서 형식언어 이해 부족으로 인한 구축 능률 저하 문제가 발생할 수 있다. 이를 위해 메타 온톨로지(meta ontology)를 이용하여 다중 온톨로지를 구축할 때 발생하는 문제를 해결하는 다중 온톨로지 구축 프로세스를 제안한다. 현재 이 프로세스에 근거하여 온톨로지 구축 시스템(OntoCS2))을 개발하였고 국가 IT 온톨로지 인프라 기술 개발 프로젝트에서 IT분야 온톨로지의 개발에 활용되고 있다.

  • PDF

A Design of Dialogue Interface System Based on Statistical Approach (통계에 기반한 다영영 대화형 도우미 시스템의 설계)

  • Jeong, Hyoung-Il;Kim, Dong-Hyun;Jang, Hyo-Jun;Kim, Hark-Soo;Seo, Jung-Yun
    • Annual Conference on Human and Language Technology
    • /
    • 2006.10e
    • /
    • pp.262-267
    • /
    • 2006
  • 대화 인터페이스 시스템(dialogue interface system)은 인간과 컴퓨터의 상호작용을 위한 도구로서 자연언어(natural language)를 사용하여 정보를 공유하거나 특정 업무를 수행하는 프로그램이다. 대화 인터페이스 시스템에 대한 기존의 연구들은 영역 의존적인 스크립트나 계획 추론을 위한 계획 지식을 이용해 왔다. 스크립트 모델(script model)은 제한적인 실용시스템 개발을 위해 주로 연구되었고 계획에 기반한 모델은 대화의 원리를 이해하는 분야에서 주로 연구되어 왔다. 그러나 기존의 모델들은 시스템 확장이 매우 어려우며 예측하지 못한 사용자 발화에 대하여 대응이 어렵기 때문에 매우 제한적인 영역이나 정해진 형태의 대화만을 처리할 수 있다. 본 논문에서는 이런 단점들을 보완하기 위하여 통계에 기반한 다 영역(multi-domain) 대화 모델을 제안한다. 제안된 시스템은 각 작업들에 대하여 해당 작업에 적합한 영역 모델(domain model)을 잘 알려진 프레임 구조를 따르면서 사용자 의도 파악과 시스템 의도 생성에 통계적 방법을 사용한다. 이러한 하이브리드 형태의 구조 덕분에 제안된 시스템은 영역 확장성과 이식성이 뛰어나다는 장점을 가진다.

  • PDF

Online language rehabilitation and diagnostic system development : centered aphasia (온라인 언어 재활 훈련 및 진단 시스템 개발 : 실어증을 중심으로)

  • Yun, You-Dong;Lim, Heui-Seok
    • Annual Conference on Human and Language Technology
    • /
    • 2015.10a
    • /
    • pp.151-154
    • /
    • 2015
  • 실어증은 뇌손상으로 인해 발생하는 후천적 언어장애로서, 언어를 이해하고 표현하는 능력이 손상된 것이다. 이는 환자 개인의 어려움은 물론이고, 가족과 사회에도 문제를 초래할 수 있으므로 실어증 환자의 진단 및 치료는 중요하다. 그 중에서도 빠른 언어 치료는 발병 후 조기에 시작할수록 회복이 빠르다는 점에서 연구 결과들이 일치하고 있기 때문에 더욱 중요하다. 하지만 환자 대비 언어치료전문가의 수가 적어 치료시기를 놓칠 수 있기 때문에 가장 중요한 것은 빠른 실어증 진단과 전문가와의 접근성이다. 우리나라는 인터넷 보급률과 컴퓨터 보급률이 높기 때문에, 웹기반으로 시스템을 개발 한다면 우수한 접근성을 보장받을 수 있다. 본 연구에서는 개발된 '온라인 언어 재활 훈련 및 진단 시스템'을 제안하고 본 시스템을 통해 얻을 수 있는 데이터와, 이 데이터를 어떻게 가공하여 의미 있는 결과를 도출해 낼 수 있는지 소개한다. 본 시스템은 짧은 시간 안에 실어증 여부 확인과 언어 재활 훈련을 수행할 수 있고, 웹기반으로 개발되어 누구나 쉽게 치료와 관련된 콘텐츠, 정보, 그리고 재활 방법을 공유할 수 있다.

  • PDF

Implementation of Query Expansion Multimedia Data Retrieval System using "FUN" Based Ontology of Emotion (재미 감성 주제 온톨로지를 이용한 질의어 확장 멀티미디어 데이터 검색 시스템 구현)

  • Lee, Jung-Song;Byun, Dong-Ryul;Park, Soon-Cheol
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2010.06c
    • /
    • pp.279-284
    • /
    • 2010
  • 최근 컴퓨터와 네트워크의 기술 발달로 멀티미디어 데이터가 폭발적으로 증가하고 있다. 따라서 정보검색 시스템도 텍스트 데이터 위주에서 벗어나 멀티미디어 데이터 검색이 큰 비중을 차지하고 있다. 또한 멀티미디어 데이터 질의어처리도 기술적인 변화와 함께 다양한 질의어 확장으로 검색의 정확성을 높이고 있다. 본 논문에서는 인간의 감성에 대한 '재미' 주제 온톨로지를 구축하여 질의어 확장에 응용하였고, 한편의 동영상에서 재미 요소를 찾아내는 멀티미디어 데이터 검색 시스템을 구축하였다. 온톨로지 구축은 한글 워드넷(KorLex)에서 "재미"라는 특정 감소 요소의 의미 계층 구조를 파악하고 토픽맵을 이용하여 구축하였다. 또한, 온톨로지에 정의된 용어들 사이의 가중치는 실시간으로 계산하여 질의어를 확장에 적용하였으며, 따라서 검색의 효율성과 질을 높였다. 검색방법은 사용자가 질의어를 직접 입력하는 텍스트 입력 검색과 온톨로지 구조를 이용한 GUI 인터페이스 검색방법으로 나누어 사용자의 편의성을 증대시켰다.

  • PDF

Natural Language-based Immersive English Tutoring System (자연어 대화 기반 몰입환경 영어 교육 시스템)

  • Lee, Kyusong;Lee, Sungjin;Lee, Jonghoon;Noh, Hyeongjong;Lee, Gary Geunbae
    • Annual Conference on Human and Language Technology
    • /
    • 2010.10a
    • /
    • pp.22-27
    • /
    • 2010
  • 최근 국가적 차원에서 영어교육에 대한 많은 투자가 이루어지고 있으나 기존의 주입식, 암기식 영어 교육은 회화 실력 향상에 큰 도움을 주지 못하였다. 컴퓨터를 이용한 영어교육 또한 많은 관심을 얻고 있으나 실제 의사소통을 위한 회화 학습에 대한 고려는 깊지 않으며, 주어진 흐름의 대본을 따라 단순히 읽고 반복하는 수준의 시스템만 존재하고 있다. 이러한 학습형태는 흥미 유발 동기가 약하여 사용자로 하여금 장기간 꾸준히 학습하게 만들지 못한다는 문제가 있다. 이러한 문제점에 대하여 제2언어 습득 이론에 바탕을 둔 자연어 처리 기반 몰입 환경 영어 교육 시스템을 제안한다. 이는 도메인 확장성이 뛰어난 예제 기반 대화 시스템을 3 차원 가상공간과 결합한 시스템으로 자연스러운 대화를 통한 외국어 회화 연습을 하는 과정에서 학습자의 발화 오류를 분석하고 교육적 피드백을 제공한다. 또한 현실과 비슷한 몰입 환경에서 체험형 기술을 통해 자발적인 학습을 유도하고 집중력, 기억력을 획기적으로 높이고자 한다. 본 논문에서는 영어교육 시스템의 이론적 배경, 예제 기반 대화관리, 시스템 구성요소와 동작에 대하여 중점적으로 기술하였다.

  • PDF

Detecting and Interpreting Terms: Focusing Korean Medical Terms (전문용어 탐지와 해석 모델: 한국어 의학용어 중심으로 )

  • Haram-Yeom;Jae-Hoon Kim
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.407-411
    • /
    • 2022
  • 최근 COVID-19로 인해 대중의 의학 분야 관심이 증가하고 있다. 대부분의 의학문서는 전문용어인 의학용어로 구성되어 있어 대중이 이를 보고 이해하기에 어려움이 있다. 의학용어를 쉬운 뜻으로 풀이하는 모델을 이용한다면 대중이 의학 문서를 쉽게 이해할 수 있을 것이다. 이런 문제를 완화하기 위해서 본 논문에서는 Transformer 기반 번역 모델을 이용한 의학용어 탐지 및 해석 모델을 제안한다. 번역 모델에 적용하기 위해 병렬말뭉치가 필요하다. 본 논문에서는 다음과 같은 방법으로 병렬말뭉치를 구축한다: 1) 의학용어 사전을 구축한다. 2) 의학 드라마의 자막으로부터 의학용어를 찾아서 그 뜻풀이로 대체한다. 3) 원자막과 뜻풀이가 포함된 자막을 나란히 배열한다. 구축된 병렬말뭉치를 이용해서 Transformer 번역모델에 적용하여 전문용어를 찾아서 해석하는 모델을 구축한다. 각 문장은 음절 단위로 나뉘어 사전학습 된 KoCharELECTRA를 이용해서 임베딩한다. 제안된 모델은 약 69.3%의 어절단위 BLEU 점수를 보였다. 제안된 의학용어 해석기를 통해 대중이 의학문서를 좀 더 쉽게 접근할 수 있을 것이다.

  • PDF