Data Mining Technology for Application in Humanistic Computing

인문전산학 활용을 위한 데이터마이닝기법

  • Kwak, Ho-Hyung (Graduate school of Industry and Engineering, Seoul National University of Technology) ;
  • Bang, Hye-Ja (Dept of Computer Engineering, Seoul National University of Technology)
  • 곽호형 (서울산업대학교 산업대학원 컴퓨터공학과) ;
  • 방혜자 (서울산업대학교 컴퓨터공학과)
  • Published : 2005.05.13

Abstract

데이터마이닝은 대량의 실제 데이터로부터 이전에 잘 알려지지는 않았지만 묵시적이고 잠재적으로 유용한 정보를 추출하는 작업으로, 본 논문은 최근 인문학 정보 자료가 전산화되고 있는 가운데 대량의 정보와 특정 체계를 갖춘 ‘조선왕조실록’ 전산자료를 분석하고 기존의 단순한 정보 검색이 아닌 데이터마이닝 기법을 적용한 상세하고 예측가능 한 정보자료 추출법을 제시한다. 먼저 텍스트화 되어 있는 컨텐츠를 형태소분석기법을 사용하여 색인어를 추출하고 집계를 낸다. 질의어와 유관한 색인어의 군집정도와 출현시점을 분석하는데, 사용된 마이닝 기법은 연관규칙분석과 클러스터링 분석기법이다. 최종 결과치는 기존의 인문학연구 결과물과 비교하여 그 정확도를 분석해 보인다.

Keywords