A Search Method for Components Based-on XML Component Specification

XML 컴포넌트 명세서 기반의 컴포넌트 검색 기법

  • Published : 2000.02.15

Abstract

Recently, the component technology has played a main role in software reuse. It has changed the code-based reuse into the binary code-based reuse, because components can be easily combined into the developing software only through component interfaces. Since components and component users have increased rapidly, it is necessary that the users of components search for the most proper components for HTML among the enormous number of components on the Internet. It is desirable to use web-document-typed specifications for component specifications on the Internet. This paper proposes to use XML component specifications instead of HTML specifications, because it is impossible to represent the semantics of contexts using HTML. We also propose the XML context-search method based on XML component specifications. Component users use the contexts for the component properties and the terms for the values of component properties in their queries for searching components. The index structure for the context-based search method is the inverted file indexing structure of term-context-component specification. Not only an XML context-based search method but also a variety of search methods based on context-based search, such as keyword, search, faceted search, and browsing search method, are provided for the convenience of users. We use the 3-layer architecture, with an interface layer, a query expansion layer, and an XML search engine layer, of the search engine for the efficient index scheme. In this paper, an XML DTD(Document Type Definition) for component specification is defined and the experimental results of comparing search performance of XML with HTML are discussed.

최근 들어 컴포넌트는 소프트웨어 재사용의 핵심 기술로 인식되고 있다. 컴포넌트는 인터페이스 부분만을 이용하여 개발되는 소프트웨어에 바로 바인딩시켜 재사용될 수 있는 독립적인 바이너리 코드이다. 많은 컴포넌트 사용자들이 인터넷 상에서 적합한 컴포넌트를 검색하고 사용할 수 있도록, 컴포넌트 명세서는 웹 문서 형태를 사용하는 것이 바람직하다. 기존의 HTML 웹 문서 기반의 검색 엔진을 통하여 컴포넌트를 검색할 때 정확한 의미 검색이 불가능하다는 문제점이 있다. 본 논문에서는 정확한 의미 검색을 수행할 수 있도록 컴포넌트 명세서를 HTML 문서 대신 XML 문서로 사용할 것을 제안한다. 또한, XML 컴포넌트 명세서를 통하여 사용자가 원하는 컴포넌트를 정확하게 검색할 수 있는 XML 문맥 기반 검색(context-based search)을 제안한다. 문맥 기반 검색은 컴포넌트의 특성을 나타내는 문맥(context)과 컴포넌트 특성의 실제 값인 용어(term)를 사용하여 사용자가 원하는 컴포넌트의 특성을 정확하게 질의하고 검색할 수 있는 방법이다. 이 검색 방법은 용어-문맥-컴포넌트 명세서 순으로 된 역화일 인덱싱 (Inverted File Indexing) 방법을 사용한다. 이와 함께 사용자의 편의를 위하여, 기존의 소프트웨어 재사용 라이브러리에서 사용되던 검색 방법인 키워드 검색, 퍼싯 검색, 브라우징 검색 방법 등을 지원한다. 이들 다양한 검색 방법들은 인터페이스 레이어, 질의 확장 레이어, XML 검색 엔진 레이어 등 3-레이어 검색엔진 구조를 통한 효율적인 인덱스 스킴에 의해 지원된다. 본 논문에서는 컴포넌트 사용자들이 원하는 컴포넌트를 정확하게 검색할 수 있도록 하기 위하여 컴포넌트 명세서를 대한 XML DTD(Document Type Definition)를 정의하고, HTML 기반 검색 방법과 XML 기반 검색 방법에 대한 컴포넌트 검색 성능을 비교한다.

Keywords

References

  1. AlphaBeans, http://www.alphaworks.ibm.com/alphabeans
  2. AltaVista, http://www.altavista.com/
  3. ASSET, http://source.asset.com/
  4. S. Browne, J. Dongarra, S. Green, K. Moore, T. Pepin, T. Rowan, and R.Wade, 'Location-Independent Naming for Virtual Distributed Software Repositories,' Proc. of the ACM SIGSOFT Symp. on Software Reusability, pp.179-185, 1995
  5. G. Caldiera and V. R. Basili, 'Identifying and Qualifying Reusable S/W Component,' IEEE S/W, Vol.8, No.2, pp61-72, Feb. 1991
  6. D. Chappell, Understanding ActiveX and OLE, Microsoft Press, 1996
  7. S. M. Chen and J.Y. Wang, 'Document retrieval using knowledge-based fuzzy information retrieval techniques,' IEEE Trans. Syst., Man, Cybern.,Vol.25, No.5, pp.793-803, May 1995 https://doi.org/10.1109/21.376492
  8. S. M. Chen and Y. J. Horng, 'Fuzzy Query Processing for Document Retrieval Based onExtended Fuzzy Concept Networks,' IEEE Trans. on Sys., Man, and Cybern., Vol. 29, No.1, Feb. 1999
  9. P. Ciancarini, F. Vitali, and C. Mascolo, 'Managing Complex Documents Over the WWW:A Case Study for XML,' IEEE Trans. on Knowledge and Data Engineering, Vol. 11, No. 4, pp. 926-638, July/Aug 1999 https://doi.org/10.1109/69.790821
  10. DARPA STARS, http://www.asset.com/stars/
  11. D. Dubois, H. Prade, and R. R. Yager, Fuzzy Information Engineering, Wiley, 1997
  12. E.A. Fox, Extending the Boolean and Vector Space Models of Information Retrieval with P-Norm Queries and Multiple Concept Types., Cornell University, August 1983
  13. W. B. Frakes, R. Baeza-Yates, Information Retrieval Data Structures & Algorithms, Prentice Hall PTR, 1992
  14. GAGS, http://kal-el.ugr.es/GAGS/
  15. GAMS, http://gams.nist.gov/
  16. R. J. Glushko, J. M. Tenensaum, and B. Meltzer, 'An XML FRAMEWORK For Agent-based E-Commerce,' Communications of ACM, Vol.42, No.3, March, 1999 https://doi.org/10.1145/295685.295720
  17. HotBot, http://www.hotbot.com/
  18. P. Iglio and G. Attardi, 'Software Components for Computer Algebra,' Proc. of 1998 Int. Symp. on Symbolic and Algebraic Computation, pp.62-69, 1998 https://doi.org/10.1145/281508.281548
  19. InfoSeek, http://infoseek.go.com/
  20. T.C. Jones, 'Reusability in Programming: A Survey of the State of the Art,' IEEE Trans. on Software Engineering, Vol. SE10, No. 5, pp.488-494, September 1984
  21. N. H. Lassing, D.B.B. Rijsenbrij, and J.C. van Vliet, 'A View on Components,' Proc. of 9th Int. Workshop on Database and Expert Sys. Applications, pp.768-777, 1998
  22. A. C. Lear, 'XML Seen as Integral to Application Integration', IT Pro, pp. 12-16, September/October 1999
  23. H. Mili, F. Mili, and A. Mili, 'Reusing Software : Issues and Research Directions,' IEEE Transactions on Software Engineering, Vol.21, No.6, pp528-562, June 1995 https://doi.org/10.1109/32.391379
  24. T.D. Milner, Context Based Retrieval of Distributed Information Objects, Honours Thesis, Monash University, Caulfield, 1998
  25. T.D. Milner, SCOOBS, A Context Based Search Engine, Technical Report 1999/36, Monash University, Australia, 1999
  26. M. Morrison, presenting JAVABEANS, Sams net, 1997
  27. Robert Orfali and Dan Harkey, Client/Server Programmnng with JAVA and CORBA, John Wiely & Sons, 1998
  28. Prieto-Diaz, R., Freeman, P., 'Classifying software for reusability,' IEEE Software, Vol.4, No.1, pp6-16, January, 1987
  29. R. C. Seacord, S. A. Hissam, and K. C. Wallnau, 'Agora: A Search Engine for SoftwareComponents,' Technical Report, CMU/SEI-98-011, 1998
  30. C. Szyperski, Component Software Beyond Objectoriented Programming, Addison-Wesley, 1998
  31. WebCrawler, http://www.webcrawler.com/
  32. M. Wood, and I. Somerville, 'An information systemfor S/W Components,' SIGIR Forum Vol. 22, No. 3, pp.11-25, Spring/Summer 1988
  33. Netlib, http://www.netlib.org/