DOI QR코드

DOI QR Code

A Study of Parsing System Implementation Using Segmentation and Argument Information

구간 분할과 논항정보를 이용한 구문분석시스템 구현에 관한 연구

  • 박용욱 (울산과학대학교 컴퓨터정보학부) ;
  • 권혁철 (부산대학교 정보컴퓨터공학부)
  • Received : 2013.01.02
  • Accepted : 2013.03.28
  • Published : 2013.03.31

Abstract

One of the most important problems in syntactic analysis is syntactic ambiguities. This paper proposes a parsing system and this system can reduce syntactic ambiguities by using segmentation method and argument information method. The proposed system uses morphemes for the input of syntax analysis system, and syntactic analysis system generates all possible parse trees from the given morphemes. Therefore, this system generates many syntactic ambiguity problems. We use three methods to solve these problems. First is disambiguation method in morphological analysis, second is segmentation method in syntactic analysis processing, and the last method is using argument information. Using these three methods, we can reduce many ambiguities in Korean syntactic analysis. In our experiment, our approach decreases about 53% of syntactic ambiguities.

본 논문에서는 한국어 구문분석에서 발생하는 중의성을 해결하기 위하여 구간분할 방법과 논항정보를 사용하여 개선한 구문분석시스템을 소개한다. 본 논문에서 제안하는 구문분석 시스템은 어절대신 형태소를 입력으로 사용하고, 또한 주어진 형태소에 대하여 가능한 모든 구문 분석 구조를 생성하는 알고리즘을 사용한다. 따라서 많은 중의성을 포함한 구문 분석 결과를 생성한다. 이러한 중의성 구조 결과를 해결하기 위하여 세 가지 방법을 사용했다. 첫째 방법은 형태소분석 결과에서 중의성을 제거하는 방법이고 두 번째는 구문 분석시 구간 분할하는 방법, 세 번째 방법은 논항정보를 이용하는 것이다. 이러한 방법을 사용하여 많은 중의성을 제거할 수 있었다. 실험을 통하여 약 53%의 중의성을 제거할 수 있었음을 보여준다.

Keywords

References

  1. 김영택 외 공저, 자연언어처리, 생능출판사, 서울, 2001.
  2. 권혁철, 최준영, "단일화 기반 의존 문법을 이용한 한국어 분석기," 정보과학회논문지, 제19권 제5호, pp. 467-476, 1992.
  3. 정영임, 조선호, 윤애선, 권혁철, "구문 관계와 운율 특성을 이용한 한국어 운율구 경계 예측," 제19회 한글 및 한국어 정보처리 학술대회 논문집, pp. 7-14, 2007.
  4. 김광배, 박의규, 나동렬, 윤준태, "구간 분할 기반 한국어 구문분석," 제14회 한글 및 한국어 정보처리 학술대회, pp. 163-168, 2002.
  5. 이현영, 황이규, 이용석, "문형과 단문 분할을 이용한 한국어 구문 모호성 해결," 제12회 한글 및 한국어정보처리 학술대회, pp. 116-123, 2000.
  6. 최선화, "형태소 단위의 한국어 확률 의존문법 학습," 정보처리학회 논문지 B, 제9-B권, 제6호, pp. 791-798, 2002 https://doi.org/10.3745/KIPSTB.2002.9B.6.791
  7. 박의규, 나동열, "한국어 구문분석을 위한 구묶음 기반 의존 명사 처리," 인지과학, 제17권, 제2 호, pp. 119-138, 2006.
  8. 이성욱, 서정연, "한국어 문법관계에 대한 부분 구문 분석", 정보과학회논문지, 제32권, 제10호, pp. 984-989, 2005.
  9. 김창제, 정천영, 김영훈, 서영훈, "부분적인 어절 결합을 이용한 효율적인 한국어 구문 분석기," 한국정보과학회 가을 학술발표논문집, 제22권 제2호, pp. 597-600, 1995.
  10. 이은령, 윤애선, "피동 정보를 통한 한국어 동사 어휘의미망 정제," 한국어학, 제28권, pp. 139-166, 2005.
  11. 임경업, 정영임, 권혁철, "한국어 어휘의미망에 기반한 논항 정보를 이용한 의존문법 구문분석기의 구현," 제19회 한글 및 한국어 정보처리학술대회, pp. 158-164, 2007.
  12. 김영자, 김현주 "구조 기반 검색을 위한 색인 구조에 대한 분석," 멀티미디어학회논문지, 제7권, 제5호, pp. 601-616, 2004.
  13. 이익섭, 한국어 문법, 서울대학교출판부, 서울, 2009.
  14. I.A. Mel'cuk, Dependency Syntax : Theory and Practice, State Univ. of New York Press, New York, 1988.

Cited by

  1. A Study of Disambiguation Method To Improve The Syntactic Analysis System vol.16, pp.4, 2015, https://doi.org/10.5762/KAIS.2015.16.4.2764
  2. An Analysis of Korean Dependency Relation by Homograph Disambiguation vol.3, pp.6, 2014, https://doi.org/10.3745/KTSDE.2014.3.6.219
  3. 서술형 문항 채점을 위한 복합문 구문의미분석 시스템에 대한 연구 vol.21, pp.6, 2013, https://doi.org/10.32431/kace.2018.21.6.009
  4. 구문의미 분석을 활용한 복합 문단구분 시스템에 대한 연구 vol.24, pp.1, 2021, https://doi.org/10.9717/kmms.2020.24.1.106