DOI QR코드

DOI QR Code

A Strategy for Constructing the Thesaurus of Traditional East Asian Medicine (TEAM) Terms With Machine Learning

기계 학습을 이용한 한의학 용어 유의어 사전 구축 방안

  • Oh, Junho (Korea Institute of Oriental Medicine)
  • Received : 2022.01.28
  • Accepted : 2022.02.07
  • Published : 2022.02.25

Abstract

Objectives : We propose a method for constructing a thesaurus of Traditional East Asian Medicine terminology using machine learning. Methods : We presented a method of combining the 'Automatic Step' which uses machine learning and the 'Manual Step' which is the operator's review process. By applying this method to the sample data, we constructed a simple thesaurus and examined the results. Results : Out of the 17,874 sample data, a thesaurus was constructed targeting 749 terminologies. 200 candidate groups were derived in the automatic step, from which 79 synonym groups were derived in the manual step. Conclusions : The proposed method in this study will likely save resources required in constructing a thesaurus.

Keywords

Acknowledgement

본 연구는 한국한의학연구원 주요사업 "AI 한의사 개발을 위한 임상 빅데이터 수집 및 서비스 플랫폼 구축(KSN2021110)"의 지원을 받아 수행되었습니다.

References

  1. 강형석, 양장훈. 한국어 단어 임베딩 모델의 평가에 적합한 유추 검사 세트. 디지털콘텐츠학회논문지. 2018. 19(10). pp.1999-2008.
  2. 김혜은 외 4인. 한의학 증상용어의 형태소 분석을 위한 자연어 표기 분석. 대한예방한의학회지. 2013. 17(2). pp.179-187.
  3. 백유상. 한의학정보 검색엔진 개발을 위한 시소러스 연구. 대한한의학원전학회지. 2006. 19(1). pp.155-167.
  4. 오준호. 한의학 고문헌 텍스트 분석을 위한 비지도학습 기반 단어 추출 방법 비교. 대한한의학원전학회지. 2019. 32(3). pp.47-57. https://doi.org/10.14369/JKMC.2019.32.3.047
  5. 오준호. 한의학 고문헌 데이터 분석을 위한 단어 임베딩 기법 비교:자연어처리 방법을 적용하여. 대한한의학원전학회지. 2019. 32(1). pp.61-74. https://doi.org/10.14369/JKMC.2019.32.1.061
  6. 이병욱, 심범상, 엄동명. 한의학 용어관리 시스템을 결합한 고전원문 제공 서비스에 관한 연구. 대한한의학원전학회지. 2009. 22(4). pp.167-176.
  7. 차승준 외 6인. 한의학 용어 수집 및 관리 시스템 구축. 대한예방한의학회지. 2010. 14(1). pp.59-76.
  8. 장현철 외 18명. 온톨로지 기반 한의학 지능형 정보체계 연구. 대전. 한국한의학연구원. 2013.
  9. 특허청. 한국전통지식포털. [cited on Jan 12, 2019]. Avaiable from: http://www.koreantk.com