A study on the Algorithm for automated extraction for chemical term in Korean patents

국내 특허 문헌 내 화학 용어 자동 추출을 위한 알고리즘 연구

  • Lee, Hayoung (R&D Center, Korea Institute of Patent Information) ;
  • Kim, Hongki (R&D Center, Korea Institute of Patent Information) ;
  • Park, Jinwoo (R&D Center, Korea Institute of Patent Information)
  • 이하영 (한국특허정보원 R&D센터) ;
  • 김홍기 (한국특허정보원 R&D센터) ;
  • 박진우 (한국특허정보원 R&D센터)
  • Published : 2019.07.10


본 논문에서는 열 및 전기특성 플라스틱 복합수지와 한글에 특화된 인공지능 기술을 개발하기 위한 조성/물성 정보 복합수지 지식베이스를 구축하고자 국내 특허 문헌에서 화학 용어를 추출하고자 한다. 이를 위해 전문용어가 많이 쓰인 특허 문헌의 특수성을 고려하여 UIMA(Unstructured Information Management Architecture) 규칙 기반의 라이브러리를 사용해 한국어 화학 용어 코퍼스를 구축하고 이를 기반으로 딥러닝 알고리즘 중 하나인 Bidirectional LSTM-CRF를 기반으로 특허 문헌에서 화학 용어를 자동으로 추출하는 알고리즘을 연구하고자 한다.
