Customized Knowledge Creation Framework using Context- and intensity-based Similarity

상황과 정보 집적도를 고려한 유사도 기반의 맞춤형 지식 생성프레임워크

  • Received : 2011.04.15
  • Accepted : 2011.08.08
  • Published : 2011.10.31

Abstract

As information resources have become more various and the number of the resources has increased, knowledge customization on the social web has been becoming more difficult. To reduce the burden, we offer a framework for context-based similarity calculation for knowledge customization using ontology on the CBR. Thereby, we newly developed context- and intensity-based similarity calculation methods which are applied to extraction of the most similar case considered semantic similarity and syntactic, and effective creation of the user-tailored knowledge using the selected case. The process is comprised of conversion of unstructured web information into cases, extraction of an appropriate case according to the user requirements, and customization of the knowledge using the selected case. In the experimental section, the effectiveness of the developed similarity methods are compared with other edge-counting similarity methods using two classes which are compared with each other. It shows that our framework leads higher similarity values for conceptually close classes compared with other methods.

정보의 출처와 형식이 다양해지고 정보의 양 또한 많아짐에 따라 소셜 웹에서의 맞춤형 지식 생성은 더욱 어려워지고 있다. RSS(Really Simple Syndication)가 정보 수집 방법의 개선에 일조했으나, 웹에 산재된 정보를 찾아 필요한 정보들만으로 구성된 맞춤형 지식을 생성하는 것은 여전히 사용자들의 몫으로 남아 있다. 본 논문에서는 맞춤형 지식 생성의 용이성을 제고하기 위해 상황 기반 유사도를 이용한 맞춤형 지식생성 프레임워크를 제안하였다. 본 프레임워크는 기본적으로 사례 기반추론의 절차를 따르지만, 기존 사례 기반의 유사도 계산 방식이 문법적 추론에 기반했던 것과 달리, 온톨로지를 활용한 의미적 유사도를 이용한 사례 기반 추론을 활용한다. 또한 사용자 요구를 만족하는 유사사례의 보정을 위해 온톨로지를 활용한 정보 집적도 기반의 유사도 방법론을 제안하였다. 본 프레임워크에서는 첫째 비구조적인 웹 정보를 사례 형태의 구조적 정보로 변환하고, 둘째 사용자의 요구에 적합한 의미론적 유사사례를 찾은 후 셋째, 선택된 유사사례의 정보 집적도를 고려한 보정을 통해 맞춤형 지식을 생성하는 과정을 거친다. 본 논문에서는 유사도 계산에 일반적으로 활용되는 여러 방법론들과 비교를 통하여 제안한 온톨로지 기반 의미적 유사도 계산 방법론의 타당성을 입증하였다.

Keywords

References

  1. A. P. Bernstein and L. Haas, "Information Integration in the Enterprise," Communications of the ACM, vol. 51, no. 9, 2008,pp. 72-79. https://doi.org/10.1145/1378727.1378745
  2. V. Alexiev, et al., "Information Integration with Ontologies: Experiences from an Industrial Showcase,"Wiley, 2005
  3. Y. A. Halevy, et al., "Enterprise information integration:challenges and controversies," Proceedings of the 2005 ACM SIGMOD international conference on Management of data, 2005, pp. 778-787.
  4. M. Philippe and P. W. Eklund, "Knowledge Retrieval and the World Wide Web," IEEE Intelligent Systems, 2000 (May/June), pp.18-25.
  5. I. Mani and E. Bloedorn, "Machine learning of Generic and User-Focused Summarization," In proceedings of the National Conference on Artificial Intelligence (AAAI), 1998, pp. 820-826.
  6. S. Teufel and K. Moens, "Sentence extraction as a classification task," Workshop of Intelligent and scalable text summarization, ACL/EACL 1997, 1997, pp.58-65.
  7. T. Slimani, B. B.Yaghlane, and K. Mellouli, "A New Similarity Measure based on Edge Counting," World Academy of Science, Engineering and Technology 23 2006, 2006, pp 34-38.
  8. L. Song, et al., "Fuzzy Semantic Similarity Between Ontological Concepts," Advances and Innovations in Systems, Computing Sciences and Software Engineering, 2007, pp 275-280.
  9. R. Rada,, Mili, H., Bicknell, E., Blettner, M., "Development and application of a metric on semantic nets," IEEE Transactions on Systems, Man, and Cybernetics vol. 19, no. 1, 1989, pp. 17-30 https://doi.org/10.1109/21.24528
  10. A. Hliaoutakis, Varelas G., Voutsakis E., Petrakis E. G. M., Milios E., "Information Retrieval by Semantic Similarity", International Journal on Semantic Web & Information Systems, vol. 2, 2006, pp. 55-73
  11. Resnik P., Using information content to evaluate semantic similarity in a taxonomy, Proc. 14th International Joint Conference on Artificial Intelligence, vol. 1, 1995, pp. 448-453