• Title/Summary/Keyword: 검색어 확장 시스템

Search Result 122, Processing Time 0.027 seconds

A Knowledge-Based Query Processing System for an Information Agent (정보에이전트를 위한 지식 기반(동물) 질의 처리 시스템)

  • 오정옥;변영태
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10c
    • /
    • pp.102-104
    • /
    • 1998
  • 본 시스템은 현재 연구 개발중인 정보에이전트 시스템의 일부로서 특정분야에 대한 사용자의 관심 주제에 관련된 정보와 함께 적절한 문서를 제공하는 지식 기반 시스템이다. 이러한 목적을 위해서 본 시스템의 지식베이스는 구조적인 방식으로 표현된 BKB(Biology Knowledge Base)와 DIC(DICtionary)로 구성된다. DIC는 특정분야에서 일반적으로 사람들이 사용하는 용어와 학명을 기준으로 하는 시스템에서 사용하는 용어와의 관계와 그러한 용어들간의 동의어 관계를 갖고 있다. 또한 BKB는 동물에 관련된 지식베이스로써 상위.하위 개념과 함께 사용자가 원하는 정보를 제공하기 위해 객체의 속성과 이에 관계된 값들을 포함한다. 본 시스템은 문서를 검색할 때 사용자 초기 질의를 상위.하위 개념 그리고 동의어로 확장할 뿐만 아니라 사용자 의도의 정확한 표현을 위해서 제공하는 다양한 질의 형식에 따른 질의 처리 결과로도 확장하므로 효과적인 문서 검색 결과를 보인다.

  • PDF

Information Retrieval from XML Documents based on Contents (내용기반 XML 문서의 검색)

  • 김수희;조명찬;한예지
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10b
    • /
    • pp.73-75
    • /
    • 2003
  • 이 연구에서는 XML 문서의 효율적인 검색을 위해 XML 데이터에서 색인어를 추출하고 가중치를 부여하여 내용기반 인덱스를 구축하고, 질의와 문서간의 유사도가 높은 문서들을 사용자에게 제공함으로써 기존의 경로 중심 혹은 패턴매칭 형태의 XML 문서 검색 기능을 확장하고자 한다. 내용기반 검색을 지원하는 XML 문서 검색시스템을 설계하고, 내용기반 검색과 관련한 이슈들을 논의한다. 개발 중에 있는 연구용 프로토타입 시스템을 이용하여 질의에 대한 내용기반 검색 결과를 간단히 소개한다.

  • PDF

Design of XPath Query Processor in Decomposition Storage System (분할 저장 시스템에 적합한 XPath 질의 처리기 설계)

  • 고영기;홍의경
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10c
    • /
    • pp.52-54
    • /
    • 2002
  • 인터넷에서 XML은 고유의 확장성과 문서 관계성의 우수성을 활용하여 새로운 정보 공유 환경의 표준으로 자리잡고 있으며 XML문서 안의 정보 검색을 위해서 XPath 질의어가 널리 사용 중이다. 따라서, XML 문서를 데이터베이스에 효율적으로 저장하고 검색하는 연구들이 진행되고 있다. 본 연구는 관계형 데이터베이스(RDBMS)를 통하여 XML문서를 저장하고 검색할 수 있게 하기 위해 XPath 질의어에 적합하도록 하부 저장 스키마를 설계하였다. 그리고, XPath 질의를 SQL문으로 변화시켜 수행함으로써 XML 데이터에 대한 접근을 허용하였다. 더욱이 SQL문 수행 후의 결과를 효율적으로 DOM 형식의 XML 문서를 생성시킴으로써 문서의 재 조작을 가능하게 하였다.

  • PDF

Implementation of an Internet Homepage Retrieval System and Improvement of Retrieval Efficiency (인터넷 홈페이지 검색시스템 구현과 검색효율 향상)

  • Park, Hyun-Joo;Choi, Jae-Duck;Kang, Sang-Bae;Park, Seung;Park, Yong-Uk;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 1997.10a
    • /
    • pp.227-232
    • /
    • 1997
  • 이 논문은 인터넷 홈페이지를 검색하는 정보검색시스템인 미리내 시스템을 제시한다. 웹 문서의 특성을 고려하여 로봇의 기능을 확장하고, 색인, 등록, 수정, 삭제, 분류의 자동화를 구현하여 관리효율을 높인다. 자동화에 따른 문제점과 해결방법을 제시하고, 불리언질의검색 외에 자연언어질의 검색에서 질의어 확장의 방법으로 웹페이지 링크속성검색, Relevance feedback을 통한 검색효율을 높인다.

  • PDF

Implementation of the Speech Interface for Information Retrieving System (정보검색 시스템의 음성 인터페이스 구현)

  • 김정철;배건성
    • Journal of the Korean Institute of Telematics and Electronics S
    • /
    • v.36S no.5
    • /
    • pp.104-111
    • /
    • 1999
  • 본 논문에서는 HMM 고립단어인식 기술을 이용하여 정보 사용자들이 윈도즈 환경에서 편리하게 정보를 검색할 수 있는 시스템을 구현하였다. 인식 시스템에서 인식단위로 유사음소모델을 이용하여 인식어의 확장성을 고려하였고 기본모델은 SPHINX 시스템에서 사용하는 형태의 음소모델을 연속분포 HMM으로 구현하였다. 정보검색 도구에서는 기능을 단순화하고 검색절차를 음성으로 출력하도록 하여 사용자의 편의성을 고려하였다.

  • PDF

A Study of Designing the Knowledge Base System for the Query Extension by Index File (색인파일 기반의 질의어 확장용 지식베이스 구축에 관한 연구)

  • Seo, Whee
    • Journal of Korean Library and Information Science Society
    • /
    • v.40 no.2
    • /
    • pp.139-159
    • /
    • 2009
  • This study is to develop knowledge base system for query extension to the user oriented information retrieval. This study has survey the theories of the concept-based information retrieval method and statistic based information retrieval method. In the construction method of knowledge base, the common hypothesis is that the emergence of related term is the frequency of simultaneous emergence of a set of documents. Using the subject index file algorithms and the 'and' operator of boolean logic based on this hypothesis, this study builds the knowledge base. In this research experiment, a subject of knowledge base is education. Using the book of the Introduction to Education, two experimental knowledge base systems is constructed by the different indexing method. One system has constructed by controlled language indexing method, and another system has constructed by natural language indexing method. The performance of two knowledge base system is evaluated.

  • PDF

A Web-document Recommending System using the Korean Thesaurus (한국어 시소러스를 이용한 웹 문서 추천 에이전트)

  • Seo, Min-Rye;Lee, Song-Wook;Seo, Jung-Yun
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.13 no.1
    • /
    • pp.103-109
    • /
    • 2009
  • We build the web document recommending agent system which offers a certain amount of web documents to each user by monitoring and learning the user's action of web browsing. We also propose a method of query expansion using the Korean thesaurus. The queries to search for new web documents generate a candidate set using the Korean thesaurus. We extract the words which are mostly correlated with the queries, among the words in the candidate set, by using TF-IDF and mutual information. Then, we expand the query. If we adopt the system of query expansion, we can recommend a lot of web documents which have potential interests to users. We thus conclude that the system of query expansion is more effective than a base system of recommending web-documents to users.

A Document Summary System based on Personalized Web Search Systems (개인화 웹 검색 시스템 기반의 문서 요약 시스템)

  • Kim, Dong-Wook;Kang, Soo-Yong;Kim, Han-Joon;Lee, Byung-Jeong;Chang, Jae-Young
    • Journal of Digital Contents Society
    • /
    • v.11 no.3
    • /
    • pp.357-365
    • /
    • 2010
  • Personalized web search engine provides personalized results to users by query expansion, re-ranking or other methods representing user's intention. The personalized result page includes URL, page title and small text fragment of each web document. which is known as snippet. The snippet is the summary of the document which includes the keywords issued by either user or search engine itself. Users can verify the relevancy of the whole document using only the snippet, easily. The document summary (snippet) is an important information which makes users determine whether or not to click the link to the whole document. Hence, if a search engine generates personalized document summaries, it can provide a more satisfactory search results to users. In this paper, we propose a personalized document summary system for personalized web search engines. The proposed system provides increased degree of satisfaction to users with marginal overhead.

Concept Network-based Personalized Web Search Systems (개념 네트워크 기반 사용자 인지형 웹 검색 시스템)

  • Yune, Hong-June;Noh, Joon-Ho;Kim, Han-Joon;Lee, Byung-Jeong;Kang, Soo-Yong;Chang, Jae-Young
    • Journal of Internet Computing and Services
    • /
    • v.12 no.2
    • /
    • pp.63-73
    • /
    • 2011
  • In general, conventional search engines provide the same search results for the same queries of users, and however such techniques do not consider users' characteristics. To overcome this problem, we need a new way of personalized search which returns customized search results according to users' preference. In this paper, we propose a concept network profile-based personalized web search system in which the concept network is developed for accumulating users' characteristics. The concept network-based user profile is used to expand initial search queries to achieve personalized search. The concept network is a network structure of concepts where each concept is generated whenever each query is submitted, and it can be defined as a set of keywords extracted from the selected documents. Furthermore, we have improved the concept networks by augmenting intent keywords of each concept with a set of classification tags, called folksonomy, assigned to each document. For an additional personalized search technique, we propose a new re-ranking method that analayzes the degree of overlapped search results.

Semantic Information Retrieval using User-Word Intelligent Network (사용자 어휘지능망을 이용한 의미적 정보검색)

  • Kim, Chang-Hwan;Im, Ji-Hui;Choe, Ho-Seop;Yoon, Hwa-Mook;Ock, Cheol-Young
    • Annual Conference of KIPS
    • /
    • 2006.11a
    • /
    • pp.157-160
    • /
    • 2006
  • 웹 자원이 방대함에 따라, 사용자가 원하는 정보를 얼마나 정확하게 제시하느냐가 정보검색시스템 성능을 판단하는 기준이 된다. 그러나 동형이의어만을 질의어로 이용한 검색 결과는 동형이의어 각 의미에 관련된 문서가 혼재되어 있거나, 특정 의미에 관련된 문서가 집중적으로 나타나는 현상을 볼 수 있다. 이에 본 논문에서는 한국어 사용자 어휘지능망(U-WIN)의 관계정보를 이용하여 질의어의 모호성을 해결하고 의미적 정보검색의 기반을 마련하고자 한다. 우선, 전문분야에 주로 사용되는 동형이의어와 보편적으로 사용하는 동형의어를 구번하여 질의어로 선정하고, '질의어+상위어' 형태의 확장 질의어에 대해 두 개의 포탈사이트(Google, Naver)를 대상으로 웹 문서를 검색하여 정확률이 각각 81.5%(Naver), 65.5%(Google)로 나타났다.

  • PDF