Full Parsing Approach to Extracting Protein-to-Protein Interactions from the Biological Literature

생물학 문헌으로부터 단백질 상호작용 정보 추출을 위한 자연어 처리 기법

  • 노정호 (한양대학교 정보통신대학원) ;
  • 차재혁 (한양대학교 정보통신대학원) ;
  • 최용석 (한양대학교 컴퓨터교육과)
  • Published : 2004.10.01

Abstract

단백질 상호작용에 대한 연구는 생명현상의 전반적인 원리를 규명하는데 필수적이다. 생물학 문헌 데이터베이스로부터 단백질 상호작용 정보를 찾는 것은 많은 시간과 노력이 필요하기 때문에 컴퓨터로 자동화시키는 방법이 요구된다. 문헌으로부터 단백질 상호작용 정보를 추출하는 작업은 단순 문자열 비교를 통한 정보검색으로는 한계가 있으므로 자연어 처리 기법을 적용해 문장의 문법 구조, 품사 정보 등을 이용하면 더 정확한 추출이 가능하다. 본 논문에서는 자연어 처리를 이용하여 문장을 트리로 표현한 뒤 가지치기, 병합 등을 통해 추상화된 트리를 패턴과 매칭하는 방법을 제안한다. 그리고 실제 데이터를 이용한 실험 결과를 통해 기존 방법에 비해 더 높아진 정확도를 확인하였다.

Keywords