빅데이터 기반 대용량 시맨틱 웹 검색 기술 동향

  • Published : 2012.10.31

Abstract

시맨틱 웹 기술은 웹의 초창기부터 다양한 연구와 표준이 개발되었지만 이를 활용한 데이터 서비스 분야는 그 역사에 비해 성공 사례가 부족한 것이 현실이다. 최근 웹 2.0을 시초로 링크드 데이터의 성장, 정부의 개방형 데이터 서비스, 소셜 웹 서비스의 등장으로 인해 웹의 구조적 데이터는 폭발적으로 성장해 왔으며, 대용량 시맨틱 웹 기반 서비스에 대한 요구와 연구가 진행되고 있다. 본 고에서는 킬러 애플리케이션으로서 기존 시맨틱 웹 기반 검색 기술의 문제점들을 알아보고 이를 해결하기 위해 최근 화두로 떠오르는 빅데이터(Big Data) 기술 요소인 하둡(Hadoop) 및 NoSQL을 활용하여 대용량 시맨틱 웹 데이터를 활용한 Daum의 영화/음악/인물 기반 의미 검색 및 의학 LOD를 기반한 검색 서비스 개발 사례를 제시한다. 이를 토대로 이종 모델 데이터간 연결 및 실시간 데이터 리비전 관리 등 한계점들을 살펴보고 향후 대용량 공공 데이터 활용을 위한 방향을 모색해 본다.

Keywords

References

  1. 박윤정, "웹 3.0 정보서비스의 사례와 시사점", 방송통신 정책, 21(20), pp. 25-43. 2009
  2. Alex Iskold, "Semantic Search: The Myth and Reality", http://www.readwriteweb.com/archives/semantic_search_the_myth_and_reality.php, 2008
  3. 네이버랩 시맨틱 영화검색, http://semantic.lab.naver.com/, 2008
  4. 김평, 김태홍, 정한민, "개체 식별 관점에서 바라본 링크 드 데이터 동향", 주간 기술 동향, 정보통신산업진흥원. 2011.12.2
  5. Seokchan Yun, Mina Song, Hyun Namgung, Sungkwon Yang, Harshit Kumar, Hong-Gee Kim, "Imporving the Workflow of Semantic Web Portals using Map/Reduce in Cloud Platform", International Conference on Knowledge Engineering and Ontology Development, pp.485-488, 2009
  6. 양성권, 정진욱, 윤석찬, 김홍기, "영화 컨텐츠 검색에서의 관계 기반 질의 확장", HCIKorea 2011 Conference
  7. 팀 오라일리, "열린 정부 만들기(모든 시민이 참여하는 투 명한 정부 2.0 프로젝트)", 에이콘 출판사, 2012
  8. Nansu Zong, Dong-Hyuk Im, Sungkwon Yang, Hyun Namgoong, Hong-Gee Kim, "Dynamic Generation of Concepts Hierarchies for Knowledge Discovering in Bio-medical Linked Data Sets", ACM International Conference on Ubiquitous Information Management and Communication, 2012.
  9. Dong-Hyuk Im, Nansu Zong, Eung-Hee Kim, Seokchan Yun, Hong-Gee Kim, "A Hypergraphbased Storage Policy for RDF Version Management System." ACM International Conference on Ubiquitous Information Management and Communication, 2012