DOI QR코드

DOI QR Code

Term Mapping Methodology between Everyday Words and Legal Terms for Law Information Search System

법령정보 검색을 위한 생활용어와 법률용어 간의 대응관계 탐색 방법론

  • Kim, Ji Hyun (LG CNS Entrue Consulting) ;
  • Lee, Jong-Seo (School of Integrated Technology, Yonsei University) ;
  • Lee, Myungjin (Dept. of Information and Industrial Engineering, Yonsei University) ;
  • Kim, Wooju (Dept. of Information and Industrial Engineering, Yonsei University) ;
  • Hong, June Seok (Management Information Systems Dept., Kyonggi University)
  • Received : 2012.05.16
  • Accepted : 2012.07.09
  • Published : 2012.09.30

Abstract

In the generation of Web 2.0, as many users start to make lots of web contents called user created contents by themselves, the World Wide Web is overflowing by countless information. Therefore, it becomes the key to find out meaningful information among lots of resources. Nowadays, the information retrieval is the most important thing throughout the whole field and several types of search services are developed and widely used in various fields to retrieve information that user really wants. Especially, the legal information search is one of the indispensable services in order to provide people with their convenience through searching the law necessary to their present situation as a channel getting knowledge about it. The Office of Legislation in Korea provides the Korean Law Information portal service to search the law information such as legislation, administrative rule, and judicial precedent from 2009, so people can conveniently find information related to the law. However, this service has limitation because the recent technology for search engine basically returns documents depending on whether the query is included in it or not as a search result. Therefore, it is really difficult to retrieve information related the law for general users who are not familiar with legal terms in the search engine using simple matching of keywords in spite of those kinds of efforts of the Office of Legislation in Korea, because there is a huge divergence between everyday words and legal terms which are especially from Chinese words. Generally, people try to access the law information using everyday words, so they have a difficulty to get the result that they exactly want. In this paper, we propose a term mapping methodology between everyday words and legal terms for general users who don't have sufficient background about legal terms, and we develop a search service that can provide the search results of law information from everyday words. This will be able to search the law information accurately without the knowledge of legal terminology. In other words, our research goal is to make a law information search system that general users are able to retrieval the law information with everyday words. First, this paper takes advantage of tags of internet blogs using the concept for collective intelligence to find out the term mapping relationship between everyday words and legal terms. In order to achieve our goal, we collect tags related to an everyday word from web blog posts. Generally, people add a non-hierarchical keyword or term like a synonym, especially called tag, in order to describe, classify, and manage their posts when they make any post in the internet blog. Second, the collected tags are clustered through the cluster analysis method, K-means. Then, we find a mapping relationship between an everyday word and a legal term using our estimation measure to select the fittest one that can match with an everyday word. Selected legal terms are given the definite relationship, and the relations between everyday words and legal terms are described using SKOS that is an ontology to describe the knowledge related to thesauri, classification schemes, taxonomies, and subject-heading. Thus, based on proposed mapping and searching methodologies, our legal information search system finds out a legal term mapped with user query and retrieves law information using a matched legal term, if users try to retrieve law information using an everyday word. Therefore, from our research, users can get exact results even if they do not have the knowledge related to legal terms. As a result of our research, we expect that general users who don't have professional legal background can conveniently and efficiently retrieve the legal information using everyday words.

인터넷 환경에서 월드 와이드 웹이 등장한 이후 웹을 통해 수많은 웹 페이지들이 생산됨에 따라 사용자가 원하는 정보를 검색하기 위한 다양한 형태의 검색 서비스가 여러 분야에서 개발되어 활용되고 있다. 특히 법령 검색은 사용자가 현재 자신이 처한 상황에 필요한 법령을 검색하여 법령에 대한 지식을 얻기 위한 창구로써 국민의 편의를 제공하기 위해 반드시 필요한 서비스 중 하나이다. 이에 법제처는 2009년부터 국민 누구나 편리하게 법령에 관련된 정보를 검색할 수 있도록 국가의 법령뿐만 아니라 행정규칙이나 판례 등 모든 법령정보를 검색할 수 있는 검색 서비스를 제공하고 있다. 하지만 현재까지의 검색엔진 기술은 기본적으로 사용자가 입력한 질의어를 문서에 포함하고 있는지의 여부에 따라 해당 문서를 검색 결과로 제시한다. 법령 검색 서비스 또한 해당 법령에 등장하는 키워드를 활용하여 사용자에게 검색 결과를 제공해주고 있다. 따라서 법제처의 이런 노력에도 불구하고 법령이 전문가의 시각에서 작성되었기 때문에 법에 익숙하지 않은 일반 사용자는 자신이 필요한 법령을 검색하기 어려운 한계점을 가지고 있다. 이는 일반적으로 법령에 사용되는 용어들과 일반 사용자가 실생활에 사용하는 단어가 서로 상이하기 때문에 단순히 키워드의 단순 매칭 형태의 검색엔진에서는 사용자들이 주로 사용하는 생활용어를 이용해서 원하는 법령을 검색할 수 없다. 본 연구에서는 법률용어에 관한 사전지식이 부족한 일반 사용자가 일상에서 주로 사용되는 생활용어를 이용하여 키워드 기반의 법령정보 검색 사이트에서 정확한 법령정보 검색이 가능하도록 생활용어와 법률용어 간의 대응관계를 탐색하고 이를 이용하여 법령을 검색할 수 있는 방법론을 제안하고자 한다. 우선 생활용어와 법률용어 간의 대응관계를 발견하기 위해 본 논문에서는 사용자들의 집단지성을 활용한다. 이를 위해 사용자들이 블로그의 분류 및 관리, 검색에 활용하기 위해 작성한 태그 정보를 이용하여 질의어인 생활용어와 관련된 태그들을 수집한다. 수집된 태그들은 K-means 군집분석 기법을 통해 태그들을 클러스터링하고, 생활용어와 가장 가까운 법률용어를 찾기 위한 평가 방법을 통해 생활용어에 대응될 수 있는 적절한 법률용어를 선택한다. 선택된 법률용어는 해당 생활용어와 명시적인 관계성이 부여되며, 이러한 생활용어와 법률용어와의 관계는 온톨로지 기반의 시소러스를 기술하기 위한 SKOS를 이용하여 표현된다. 이렇게 구축된 온톨로지는 사용자가 생활용어를 이용하여 검색을 수행할 경우 생활용어에 대응되는 적절한 법률용어를 찾아 법령 검색을 수행하고 그 결과를 사용자에게 제시한다. 본 논문에서 제시하고자 하는 방법론을 통해 법령 및 법률용어에 관련된 사전 지식이 없는 일반 사용자도 편리하고 효율적으로 법령을 검색할 수 있는 서비스를 제공할 것으로 기대한다.

Keywords

Acknowledgement

Supported by : 한국산업기술진흥원

References

  1. Begelman, G., P. Keller, and F. Smandja, "Automated Tag Clustering : Improving search and exploration in the tag space", In Proceedings of the Collaborative Web Tagging Workshop at WWW'06, 2006.
  2. Chang, I. H., "Developing and Evaluating an Ontology- based Legal Retrieval System", Journal of KLISS, Vol.45, No.2(2011), 345- 366.
  3. Garcia, E., "Cosine Similarity and Term Weight Tutorial", Article 2 of the series Information Retrieval Tutorials, 2006, Available at http:// www.miislita.com/information-retrieval-tut orial/cosine-similarity-tutorial.html#d (Acce ssed 12 September, 2012).
  4. Jung, S. T., "A Study on Methodology of Semantic Search for Law Information using Life Term", Thesis for Master Degree at Yonsei University, 2011.
  5. Han, S., "A Comparative Study on Clustering Methods for Grouping Related Tags", Journal of KLISS, Vol.43, No.3(2009), 399-416.
  6. Harabagiu, S., D. Moldovan, M. Pasca, R. Mihalcea, M. Surdeanu, R. Bunescu, R. Girju, V. Rus, and P. Morarescu, "FALCON : Boosting Knowledge for Answer Engines", In the Proceedings of Text Retrieval Conference (TREC-9) (2000), 479-488.
  7. Kim, E. H. and Y. M. Chung, "Enhancing the Performance of Blog Retrieval by User Tagging and Social Network Analysis", Journal of Korea Society for Information Management, Vol.27, No.1(2010), 61-77. https://doi.org/10.3743/KOSIM.2010.27.1.061
  8. Kim, K. N., Y. J. Ko, and J. Y. Seo, "Automatic Text Summarization with Lexical Clustering", In the Proceedings of 2001 KISS Conference, Vol.29, No.1(2001).
  9. Kim, Y. Y. and S. G. Park, "Design and Implementation of the Graphical Relational Searching for Folksonomy Tags in the Participational Architecture of Web 2.0", Journal of Korean Society for Internet Information, Vol.8, No.5(2007), 1-10.
  10. Lame, G., "Using NLP Techniques to Identify Legal Ontology Components : Concepts and Relations", Artificial Intelligence and Law, Vol.12, No.4(2005), 169-184.
  11. Lee, K. J., M. J. Lee, and W. J. Kim, "Study for Blog Clustering Method Based on Similarity of Titles", Journal of Intelligence and Information Systems, Vol.15, No.2(2009), 61-74.
  12. Lee, I. J. and M. K. Kim, "Multi-document Summarization Based on Cluster using Term Co - occurrence", Journal of KIISE, Vol.33, No.2(2006), 143-266.
  13. Miles, A. and S. Bechhofer, "SKOS Simple Knowledge Organization System Reference", W3C Recommendation, 2009.
  14. Specia, L. and E. Motta, "Integrating Folksonomies with the Semantic Web", Lecture Notes in Computer Science, Vol.4519(2007), 624- 639.
  15. Simpson, E., "Clustering Tags in Enterprise and Web Folksonomies", Second International Conference on Weblogs and Social Medial, 2008.
  16. Yeon, C., A. T. Ji, H. N. Kim, and G. S. Jo, "Collaborative Tag-based Filtering for Recommender Systems", Journal of Intelligence and Information Systems, Vol.14, No.2(2008), 157-177.
  17. Yoo, D. H., G. W. Kim, K. H. Choi, and Y. M. Suh, "CTKOS : Categorized Tag-based Knowledge Organization System", Journal of Intelligence and Information Systems, Vol.17, No.4(2011), 59-74.

Cited by

  1. A Study on the use of Artificial Intelligence on the Online Dispute Resolution vol.17, pp.3, 2012, https://doi.org/10.16960/jhlr.17.3.201609.63