• 제목/요약/키워드: 구문 수준 단어 오류

검색결과 3건 처리시간 0.016초

영작문 자동 채점 시스템을 위한 문맥 고려 단어 오류 검사기 (Context-sensitive Word Error Detection and Correction for Automatic Scoring System of English Writing)

  • 최용석;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권1호
    • /
    • pp.45-56
    • /
    • 2015
  • 본 연구에서는 문맥 정보를 함께 고려해야만 인식할 수 있는 단어 오류에 대하여 오류 인식 방법과 수정 후보 생성 방법을 제안한다. 이 문제는 기존의 영어권에서 이미 많이 다룬 연구 주제이다. 본 연구에서는 영어 자동채점 시스템에서 사용하도록 특화된 방법을 제안한다. 문맥 정보를 고려한 단어 오류 검사에서는 자주 혼동되어 사용되는 단어집합(confusion set)을 활용한다. 비영어권 사용자의 작문 특성을 반영하기 위해 기존의 영어권에서 구축한 혼동집합 이외에 자동으로 혼동집합을 구축하여 실험해 보았다. 또한 품사 중의성으로 인해 기존의 구문오류 검사기가 다루지 못하는 오류를 정의하고 오류 인식과 오류수정 후보를 생성하는 방법을 제안한다. 실제 한국어가 모국어이면서 초/중급 작문 수준의 수험생들이 작성한 영어 문장에 대해 평가해 본 결과, 약 70.48%의 f1 값을 얻어 기존의 영어권 결과에 비해 뒤지지 않는 성능을 보였다.

철자오류에 기인한 가의미 오류의 검출 및 교정 방법 (A Method for Detection and Correction of Pseudo-Semantic Errors Due to Typographical Errors)

  • 김동주
    • 한국컴퓨터정보학회논문지
    • /
    • 제18권10호
    • /
    • pp.173-182
    • /
    • 2013
  • 전자 문서의 초안 작성과정에서 추가되는 철자오류는 다른 유형의 오류보다 압도적으로 높은 비율을 차지한다. 입력 실수로 인한 이들 오류는 결과적으로 여전히 철자오류일 수도 있지만 상당수는 구문오류나 의미오류로 발전한다. 이러한 오류들 중 철자오류에서 발전된 가의미 오류는 순수 의미오류에 비해 문장 내에서 주변 단어의 의미에 대해 두드러진 상이성을 갖게된다. 따라서 이러한 의미 오류는 그것이 가지는 두드러진 문맥 상이성으로 인해 간단한 동시발생 빈도에 기초한 알고리즘으로 검출 및 교정이 가능하다. 본 논문에서는 이러한 오류들을 검출하고 교정하기 위한 동시발생 빈도에 기초한 알고리즘을 제안한다. 제안하는 방법에서 동시발생 빈도는 의존 구조상에서 직접 의존관계에 놓인 단어만을 대상으로 계산하며, 가의미 오류 여부를 판단하기 위해서 코사인 유사도 측정 방법을 사용한다. 제시하는 실험으로부터 제안한 방법은 전체 맞춤법 검사기 검출율을 약 2~3% 수준까지 향상 시킬 수 있을 것으로 예측하였다.

한국어 학습자의 쓰기 특성에 관한 융복합적 연구 - 구문산출성, 구문복잡성 및 구문오류를 중심으로 (A Composite Study on the Writing Characteristics of Korean Learners - Focused on Syntax Production, Syntax Complexity and Syntax Errors)

  • 이미경;노병호
    • 한국융합학회논문지
    • /
    • 제9권11호
    • /
    • pp.315-324
    • /
    • 2018
  • 한국어 학습자들에게 있어 쓰기는 다른 어떤 영역에 비해 어려워하는 부분이다. 그러나 향후 이들이 학교에서 수업을 듣고, 과제 및 발표를 하고 더 나아가 취업 등의 상황에 적응하기 위해서는 글을 구성하여 조직적으로 쓸 수 있는 능력이 필수적이다. 그러므로 이에 대한 지도방안을 강구할 필요성이 있다. 일반적으로 쓰기 특성은 쓰기 산출성, 쓰기 복잡성 및 쓰기 오류 등을 통해 많이 살펴본다. 이에 따라 본 연구는 우선 베트남인 한국어 학습자, 중국인 한국어 학습자 및 한국인 대학생들을 대상으로 그림과 A4 용지를 제공한 후 자유로이 글을 쓰게 하였다. 그 후 쓰기 자료를 토대로 구문 산출성(총 C-unit수, 총 어휘수), 구문 복잡성(C-unit당 단어의 수와 절밀도) 및 쓰기 오류(조사, 연결어미, 어휘오류, 띄어쓰기오류)의 차이를 살펴보았다 연구결과 베트남인, 중국인 한국어 학습자들은 한국인 대학생애 비해 구문 산출성, 복잡성이 유의미하게 낮았으며, 조사와 연결어미에서 한국인 대학생에 비해 많은 오류를 나타냈었다. 연구 결과에 따라 한국어 학습자들을 위한 쓰기 지도 방안을 논의하였다. 그러나 본 연구에서는 연구대상자의 한국어 수준 및 거주기간에 따른 쓰기 특성의 차이를 검증하지 못했다. 따라서 향후 연구에서는 이를 고려하여 살펴볼 필요성이 있다.