• 제목/요약/키워드: 문법오류

검색결과 112건 처리시간 0.024초

문장틀 기반 Sequence to Sequence 구어체 문장 문법 교정기 (Template Constrained Sequence to Sequence based Conversational Utterance Error Correction Method)

  • 정지수;원세연;서혜인;정상근;장두성
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.553-558
    • /
    • 2022
  • 최근, 구어체 데이터에 대한 자연어처리 응용 기술이 늘어나고 있다. 구어체 문장은 소통 방식 등의 형태로 인해 정제되지 않은 형태로써, 필연적으로 띄어쓰기, 문장 왜곡 등의 다양한 문법적 오류를 포함한다. 자동 문법 교정기는 이러한 구어체 데이터의 전처리 및 일차적 정제 도구로써 활용된다. 사전학습된 트랜스포머 기반 문장 생성 연구가 활발해지며, 이를 활용한 자동 문법 교정기 역시 연구되고 있다. 트랜스포머 기반 문장 교정 시, 교정의 필요 유무를 잘못 판단하여, 오류가 생기게 된다. 이러한 오류는 대체로 문맥에 혼동을 주는 단어의 등장으로 인해 발생한다. 본 논문은 트랜스포머 기반 문법 교정기의 오류를 보강하기 위한 방식으로써, 필요하지 않은 형태소인 고유명사를 마스킹한 입력 및 출력 문장틀 형태를 제안하며, 이러한 문장틀에 대해 고유명사를 복원한 경우 성능이 증강됨을 보인다.

  • PDF

파스 트리를 이용한 불완전 XML 문서의 완성 (Completion of Incomplete XML Document Using Parse Tree)

  • 조용윤;박용관;유재우
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 봄 학술발표논문집 Vol.31 No.1 (B)
    • /
    • pp.868-870
    • /
    • 2004
  • 프로그래머는 프로그램 작성 중 문법적으로 올바르지 않은 문장을 입력할 수 있다. 문법적으로 불완전한 문장 입력은 사용자의 계속적인 편집 상태를 종료하고, 정상적인 파싱을 보장하지 않는 원인이 된다. 따라서, 사용자는 편집기가 제공하는 적절한 오류 처리 루틴을 통해 문법적으로 잘못된 문장에 대해 수정 작업을 실행해야 한다. 에디터 환경에서의 사용자 입력은 입력 부분의 왼쪽, 오른쪽에서 완전하지 못한 형태로 입력될 수 있다. 따라서, 에디터가 문법적으로 빠져있는 부분의 심볼이 무엇인지 정확히 인식 가능하고, 주어진 문법에 따라 부분적인 파스트리를 완성한다면, 사용자의 프로그래밍 편집 상태를 종료하지 않고 계속적인 편집과 성공적인 파싱을 보장할 수 있을 것이다. 본 논문은 파서가 문법적으로 올바르지 않은 문장의 입력에 대해 해당 문법에 따라 빠진 부분을 올바로 인식하고, 누락된 문법 심벌을 찾아 부족한 부분 파스 트리를 완성함으로써 성공적인 편집을 보장할 수 있는 파싱 방법을 제안하고 실험한다. 제안된 파싱 방법을 통해 사용자는 프로그래밍 편집 중 문법 오류에 대한 부담을 줄일 수 있으며, 불완전 입력에 대해 계속적인 파싱을 보장받아 편집 효율을 높일 수 있다.

  • PDF

문법 오류 교정을 위한 적대적 학습 방법 (Adversarial Training for Grammatical Error Correction)

  • 권순철;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.446-449
    • /
    • 2020
  • 최근 성공적인 문법 오류 교정 연구들에는 복잡한 인공신경망 모델이 사용되고 있다. 그러나 이러한 모델을 훈련할 수 있는 공개 데이터는 필요에 비해 부족하여 과적합 문제를 일으킨다. 이 논문에서는 적대적 훈련 방법을 적용해 문법 오류 교정 분야의 과적합 문제를 해결하는 방법을 탐색한다. 모델의 비용을 증가시키는 경사를 이용한 fast gradient sign method(FGSM)와, 인공신경망을 이용해 모델의 비용을 증가시키기 위한 변동을 학습하는 learned perturbation method(LPM)가 실험되었다. 실험 결과, LPM은 모델 훈련에 효과가 없었으나, FGSM은 적대적 훈련을 사용하지 않은 모델보다 높은 F0.5 성능을 보이는 것이 확인되었다.

  • PDF

언어이해과정에서의 구문/의미요소 분리에 대한 ERP특성연구 (Detection of Syntactic and Semantic Anomaly in Korean Sentences: an ERP study)

  • 김충명;이경민
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 춘계 학술대회
    • /
    • pp.61-67
    • /
    • 2000
  • 본고는 텍스트로 제시된 한국어 문장의 형태통사론적 오류와 의미적 논항결합시 하위범주화요건을 위배하는 논항선택 오류의 인식 및 판단에 따른 ERP(Event-Related Potential)를 검출하여, 이에 대한 문장이해과정의 시간추이적 양상을 연구의 대상으로 하였다. 참여한 피험자로부터 각각의 유형에 대한 통계분석 결과, 통사적 오류 추출에서 의미적 오류 추출에 이르기까지 기존의 연구에서 제시된 오류패턴 요소들(ELAN, N400, P600)을 확인하였으며, 아울러 한국어 문장이해과정의 특이성을 관찰할 수 있었다. 이를 통해 문장묵독시 일어나는 여러 종류의 문법오류에 대한 개별적 성격규명과 함께, 이들의 문법틀 내에서의 상호관계에 대한 일련의 가설설정이 이루어질 수 있으며, 또한 문장이해 메커니즘의 신경적 기전의 특성 규명으로 부수될 인간지능 모사가능성에 생리학적 토대가 더해 질 것으로 추정되는 바, 언어이해와 대뇌기전지형을 결정짓는 또 다른 규준이 될 것이다.

  • PDF

챗봇과 대화시스템을 이용한 영어 교육 시스템 (English Tutoring System Using Chatbot and Dialog System)

  • 최승권;권오욱;이기영;노윤형;황금하;김영길
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 춘계학술발표대회
    • /
    • pp.958-959
    • /
    • 2017
  • 본 논문은 챗봇과 대화시스템을 이용한 영어 교육 시스템을 기술하는 것을 목표로 한다. 본 논문의 시스템은 학습자의 대화 흐름을 제한하지 않고 주제를 벗어난 자유대화를 허용하며 문법오류에 대한 피드백을 한다. 챗봇과 대화시스템을 이용한 영어 교육 시스템은 대화턴 성공률로 평가되었는데, 평균 대화턴 성공률은 80.86%였으며, 주제별로는 1) 뉴욕시티투어 티켓 구매 71.86%, 2) 음식주문 71.06%, 3) 건강습관 대화 85.41%, 4) 미래화폐에 대한 생각 조사 95.09%였다. 또한 영어 문법 오류 교정도 측정되었는데 문법 오류 정확률은 66.7%, 재현율은 31.9%였다.

어휘적 중의성 제거 규칙과 부분 문장 분석을 이용한 한국어 문법 검사기 성능 향상 (Improvement of Korean Grammar Checker Using Partial Parsing based on Dependency Grammar and Disambiguation Rules)

  • 소길자;남현숙;김수남;원상연;권혁철;박동인
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1998년도 제10회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.253-260
    • /
    • 1998
  • 한국어 문서에는 여러 어절을 검증해야만 처리할 수 있는 의미 오류와 문체 오류가 있다. 다수 어절 사이에 있는 오류는 부분 문장 분석을 한다. 논문에서는 의미 오류와 문체 오류를 처리할 때 어휘적 중의성 때문에 생기는 문제점을 제시하고 해결방법을 제안한다. 어휘적 중의성이란 한 단어가 두 가지 이상의 형태소 정보를 가짐을 뜻한다. 철자검사기와는 달리 문법 검사기에서는 어휘적 중의성을 제거하지 않으면 여러 가지 검사 오류가 발생한다. 이 논문에서는 의미, 문체 시스템에서 어휘적 중의성 때문에 검사 오류가 발생할 수 있는 과정을 크게 세 단계로 분류하였다. 연어 오류가 발생할 수 있는 검사단어가 어휘적 중의성을 가지면 표제어가 다른 규칙이 여러 개 존재한다. 이 때 규칙 선택 문제가 생긴다. 중의성 문제는 부분 문장분석 과정에서도 지배소와 의존소 사이의 의존관계를 정확하게 설정하기 어렵게 한다. 본 논문에서는 각 단계에서 발생한 문제를 최소화하여 문법 검사기의 성능을 향상시킨다.

  • PDF

학령기 말더듬아동의 읽기유창성 및 쓰기유창성 비교연구 (Comparison of Reading, Writing Fluency of the Underachieving Children and Stuttering Children and School-Aged Children)

  • 박진원
    • 한국콘텐츠학회논문지
    • /
    • 제14권8호
    • /
    • pp.476-484
    • /
    • 2014
  • 이 연구의 목적은 학령기 말더듬아동과 학습부진아동을 대상으로 읽기과업과 쓰기과업을 제시하여 유창성 및 오류 유형별 빈도에 차이가 있는지 알아보고자 하였다. 학령기 말더듬아동, 학습부진아동, 일반아동을 각 15명 선정하여 읽기와 쓰기 과업을 통하여 집단 간 차이를 비교하기 위하여 일요인 분산분석을 실시한 후 사후검정을 실시하였다. 읽기과업의 오류유형은 생략, 대치, 반복, 삽입, 자기수정으로 분류하였고, 쓰기과업의 오류유형은 생략, 대치, 첨가, 문법오류로 분류하였다. 읽기유창성과 쓰기유창성을 비교한 결과 집단 간 유의한 차이가 나타났다. 읽기유창성은 모든 집단 간 유의하였으며, 쓰기유창성은 학습부진아동 집단이 다른 집단과 비교하여 유의하게 낮았다. 오류유형별 특성으로 읽기오류는 생략, 대치, 반복, 자기수정에서 집단 간 유의한 차이를 보였으며, 쓰기오류는 문법오류에서만 유의한 차이가 있는 것으로 나타났다. 본 연구는 읽기와 쓰기에 기초한 학습능력의 측면에서 말더듬아동과 학습부진아동의 특성을 살펴보고 임상실제에서 장애유형에 적절한 보다 효율적인 치료프로그램을 고안하는데 기초 자료로서의 의의를 지닌다.

영문법 학습 교재의 5문형 분류 체계 (On the Notion of 5 Sentence Patterns in English Grammar Learning Materials)

  • 엄태경
    • 한국콘텐츠학회논문지
    • /
    • 제16권6호
    • /
    • pp.283-292
    • /
    • 2016
  • 본 연구는 한국의 많은 영문법 학습 교재에 수록되어 있는 5형식 문형 분류에 대한 설명의 타당성을 검토하기 위해 실시되었다. 외국어 학습자를 위해 교재에 수록되어 있는 문법을 '학습 문법'으로 명명하고, 교재 집필자가 학습 문법을 설정하고 교재를 구성하기 위해 기준으로 삼아야 하는 문법을 '참조 문법'으로 규정한 후, 이 두 문법에서의 문형 설명을 비교하여 국내 영문법 학습 교재에서 나타나는 설명의 단순화 및 오류를 검토하였다. 5문형 체계는 일본식 문법이라는 인식이 있으나, 이 분류 방식은 C. T. Onions에 의해 1929년 처음 소개된 이론으로서, 오히려 영어학적 이론 문법이 영문법 학습 교재에 반영된 예로 볼 수 있었다. 특히 '필수적 부사구'와 '유표적 구문' 등에 관해 참조 문법의 내용이 반영된 새로운 설명의 시도들도 영문법 학습 교재 내에서 확인되었다. 정확성과 타당성에 기초한 학습 문법을 마련하기 위해 교재 집필자와 교사들이 해외의 권위있는 참조 문법서 및 이론 문법의 연구 성과를 좀 더 적극적으로 활용한다면 영문법 학습 교재에서 발견되는 문법 설명의 오류를 피하고 고급 학습자를 대상으로도 더욱 정확한 문법 체계를 교수할 수 있을 것이다.

딥 러닝을 이용한 음성인식 오류 판별 방법 (Speech Recognition Error Detection Using Deep Learning)

  • 김현호;윤승;김상훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.157-162
    • /
    • 2015
  • 자동통역(Speech-to-speech translation)의 최우선 단계인 음성인식과정에서 발생한 오류문장은 대부분 비문법적 구조를 갖거나 의미를 이해할 수 없는 문장들이다. 이러한 문장으로 자동번역을 할 경우 심각한 통역오류가 발생하게 되어 이에 대한 개선이 반드시 필요한 상황이다. 이에 본 논문에서는 음성인식 오류문장이 정상적인 인식문장에 비해 비문법적이거나 무의미하다는 특징을 이용하여 DNN(Deep Neural Network) 기반 음성인식오류 판별기를 구현하였으며 84.20%의 오류문장 분류성능결과를 얻었다.

  • PDF

한국어 어휘의미망을 활용한 의미 오류 검사 규칙 일반화 연구 (A Study on Generalization of Semantic Error Detection Rules in a Grammar Checker for Korean Using Korean WordNet 『KorLex』)

  • 소길자;권혁철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2010년도 추계학술발표대회
    • /
    • pp.640-643
    • /
    • 2010
  • 영어권에서는 통계적 기반 의미 오류 검사기에 대한 연구가 활발하게 진행되었으나 한국어에서는 자주 나타나는 오류를 중심으로 오류 단어를 검사할 문맥이나 공기정보를 갖는 규칙 기반의 연구가 이루어져왔다. 본 논문에서는 표제어나 사전 기반 범주화 정보로 표현되고 있는 기존 문법 검사기의 성능을 개선하는 방안으로 한국어 명사 어휘 의미망인 KorLex를 활용하는 방법을 연구한다. 특히, 용언은 목적어나 주어에 사용되는 명사의 표제어가 의미 제약 조건으로 사용되는 예가 많다. 본 논문에서는 용언의 의미 제약 조건을 명사 표제어 단위에서 명사 의미 그룹(class) 단위로 확대하여 문법 검사기의 의미 오류 검사 규칙의 의미 오류 제약 조건을 일반화 하는 방안을 연구한다.