DOI QR코드

DOI QR Code

Building Thesaurus for Science & Technology Domain Using Facets and Its Application to Inference Services

패싯(Facet)을 이용한 과학기술분야 시소러스 구축과 활용방안

  • 황순희 (부산대학교 BK21 U-Port IT 산학공동 사업단) ;
  • 정한민 (한국과학기술정보연구원, 정보시스템연구팀) ;
  • 성원경 (한국과학기술정보연구원, 정보시스템연구팀)
  • Published : 2006.09.30

Abstract

In this paper, we proposed one of the methods for building thesaurus in Science & Technology domain and investigated its applicability as an inference service based on ontology. There exist as many building methods for thesaurus as its role and function, and actually many thesauri capable of ensuring the accuracy and efficiency in information search are being built by many experts. After examining the previous studies related to the principles of building thesaurus and relevant concept "facet", we focused on its characteristics and applied it to building thesaurus. The facet is classified into 2 categories, conceptual facet and relational facet. The latter contains 3 subcategories: category relational facet, attribute relational facet and thematic relational facet. The thesaurus for Science & Technology domain using facets can be applied as a web-based inference service. As a result, the three types of inference service, COP(Communities of Practice), Researcher Tracing and Research Map are provided by means of ontology, and can be applied for the Query Expansion.

본 논문은 시소러스 구축 시 직면하는 문제점과 구축방법을 비판적으로 검토하고, 여러 가지 구축 방법 중 직접구축 방법을 제안하였다. 또한, 확장검색의 효율성을 보장할 수 있는 시소러스 구축을 위해 의미적 준거인 개념패싯, 관계패싯 등의 도입과 활용을 도입하였으며, 이를 이용하여 구축한 과학기술분야 시소러스의 구축사례를 제시하였다. 특별히, 패싯이 반영된 시소러스에는 다양한 관점이 반영될 수 있으므로 검색의 효율성이 보장된다는 장점이 있고, 인접 과학기술분야에 응용될 수 있다. 일례로 본 시소러스는 과학기술 연구자들의 협업을 지원하기 위한 정보유통 서비스에 응용될 수 있으며, 향후 고도화된 지식 서비스에도 확장 응용될 수 있다.

Keywords

References

  1. 한국과학기술정보연구원. 2005. 범용과학기술 분야 전문용어에 대한 계층적 개념망/어휘망, 15,000여 구축용어, 서울: 한국과학기술정보연구원(KISTI).
  2. 강신재, 박정혜. 2003. 대규모 말뭉치와 전산 언어 사전을 이용한 의미역 결정 규칙의 구축. 한국정보처리학회 논문지, 10(2B): 219-228. https://doi.org/10.3745/KIPSTB.2003.10B.2.219
  3. 류법모, 김재호, 최기선. 2005. 정보산업 분야 시소러스의 공학적 구축 방안, 제17회 한글 및 한국정보처리학술대회 논문집, 13-20.
  4. 양재군, 배재학. 2002. 온톨로지 정보를 이용한 범주 재편성: Roget 시소러스의 경우. 제17회 한국정보처리학회 춘계학술발표대회 논문집, 9(1): 515-518.
  5. 이선웅. 2004. 명사구 사전의 통사 정보 기술에 대하여. 한국사전학, 4: 153-184.
  6. 이재윤, 김태수. 1998. WordNet과 시소러스. 언어정보개발연구, 203-237.
  7. 이창기, 이근배. 1999. WordNet을 이용한 한국어 시소러스 자동구축, 제11회 한글 및 한국정보처리학술대회 논문집, 156-161.
  8. 임지희, 최호섭, 배영준, 옥철영, 최성필, 성원경, 박동인. 2005. 면역학 시소러스 및 온톨로지구축. 제17회한글및한국정보처리학술대회 논문집, 21-27.
  9. 영미, 김명옥, 이재윤, 한승희, 유재복. 2002. 과학기술 분야 통합 개념체계의 구축 방안 연구, 한국정보관리학회지, 1013-0799, 19(1): 135-161. https://doi.org/10.3743/KOSIM.2002.19.1.135
  10. 정한민, 구희관, 이병희, 성원경. 2005. 효율적인 자원 운영을 위한 전문용어 생명주 기 관리 연구. 한국컴퓨터종합학술대회, 32(1B): 457-459.
  11. 최기선, 송영빈. 2000. 전문용어연구 2, [Korterm: 전문용어언어공학연구센터].
  12. 한상길. 1999. 시소러스 용어관계의 확장에 관한 연구. 박사학위 논문, 중앙대학교 대학원, 문헌정보학과
  13. 황순희, 윤애선. 2005. 의미적 준거의 세목화를 고려한 과학기술 분야 시소러스 구축. 한국어의미학, 18: 99-124.
  14. Brewster, Ch., Wilks, Y. 2004. “Ontologies, Taxonomies, Thesauri: Learning from Texts.” in Proceedings of the Use of Computational Linguistics in the Extraction of Keyword Information from Digital Library Content Workshop. [cited 2006. 5]. .
  15. Buscaldi, D., Rosso, P., Arnal, E.S. 2006. “WordNet as a Geographical Information Resource.” in Global WordNet Conference 2006 Proceedings, Jeju Island, Korea, 37-42.
  16. Cimiano, P., Hotho, A., Staab, S. 2004. “Clustering Ontologies from Text.” in Proceedings of the Conference on Lexical Resources and Evaluation(LREC), Artipol, Portuga, 1721-1724.
  17. Faure, D., Nedellec, C. 1998. “A Corpus-Based Conceptual Clustering Method for Verb Frames and Ontology.” in Proceedings of the LREC Workshop on Adapting lexical and corpus resources to sublanguages and applications, Granada, Spain, 1-8.
  18. Grefenstette, G. 1994. Explorations in Automatic Thesaurus Discovery. Dordrech: Kluwer.
  19. Grunenberg, L. 2002. “Facet Analysis: Using Faceted Classification Techniques to Organize Site Content and Structure.” in Proceedings of the ASIS&T. [cited 2006.5]. .
  20. Maple, A.(1999), “Faceted Access: A Review of the Literature.” [cited 2006.5]. .
  21. Nilsson, M., Palme′r, M., Naeve, A. 2002. “Semantic Web Metatdata for e-Learning - Some Architectural Guidelines.” [cited 2006.5]. .
  22. Pereira, F., Tishby, N., Lee, L. 1993. “Distributional Clustering of English Words.” in Proceedings of the 31st ACL, 183-190.
  23. Peters, W., Kilgarriff, A. 2000.“ Discovering Semantic Regularity in Lexical Resources.” International Journal of Lexicography 13 (4): 287-312. [cited 2006.5]. . https://doi.org/10.1093/ijl/13.4.287
  24. Ryu, P.M. Kim, J.H., Nam, J., Huang, J.X, Shin, S. 2006. “Toward Domain Specific Thesaurus Construction: Divide-and-Conquer Method.” in Global Wordnet Conference 2006 Proceedings, Jeju Island, Korea, 69-83.
  25. Sinopalnikova, A. 2004. “Word Association Thesaurus As a Resource for Building WordNet.” in Global Wordnet Conference 2004 Proceedings, Brno, Czech Republic, 199-205.
  26. Sundheim, B.M., Mardis, S., Burger, J. 2006. “Gazetteer Linkage to WordNet.” in Global WordNet Conference 2006 Proceedings, Jeju Island, Korea, 103-104.

Cited by

  1. Application and Process Standardization of Terminology Dictionary for Defense Science and Technology vol.11, pp.8, 2011, https://doi.org/10.5392/JKCA.2011.11.8.247
  2. A Study on the Improvement of Accessibility to Public Records: Based on the Construction of Subject Thesaurus for Presidential Archives vol.14, pp.4, 2014, https://doi.org/10.14404/JKSARM.2014.14.4.127