• Title/Summary/Keyword: Korean Thesaurus

Search Result 224, Processing Time 0.024 seconds

Effectual Fuzzy Query Evaluation Method based on Fuzzy Linguistic Matrix in Information Retrieval (정보검색에서 퍼지 언어 매트릭스에 근거한 효율적인 퍼지 질의 평가 방법)

  • 최명복;김민구
    • Journal of the Korean Institute of Intelligent Systems
    • /
    • v.10 no.3
    • /
    • pp.218-227
    • /
    • 2000
  • In this paper, we present a new fuzzy information retrieval method based on thesaurus. In the proposed method th thesaurus is represented by a fuzzy linguistic matrix, where the elements in fuzzy linguistic matrix represent a qualitative linguistic values between terms. In the fuzzy linguistic matrix, there are three kinds of fuzzy relationships between terms, i.e., similar relation, hierarchical relation, and associative relation. The implicit fuzzy relationships between terms are inferred by the transitive closure of the fuzzy linguistic matrix based on fuzzy theory. And the proposed method has the capability to deal with a qualitative linguistic weights in a query and in indexing of information items to reflect qualitative measure of human based on vague and uncertain decisions rather than a quantitiative measure. Therefore the proposed method is more flexible than the ones presented in papers[1-3]. Moreover our method is more effectual of time than the ones presented in papers[1-3] because we use a fuzzy linguistic matrix and AON (Associate Ordinary Number) values in query evaluation process. As a result, the proposed method allows the users to perform fuzzy queries in a more flexible and more intelligent manner.

  • PDF

A Search-Result Clustering Method based on Word Clustering for Effective Browsing of the Paper Retrieval Results (논문 검색 결과의 효과적인 브라우징을 위한 단어 군집화 기반의 결과 내 군집화 기법)

  • Bae, Kyoung-Man;Hwang, Jae-Won;Ko, Young-Joong;Kim, Jong-Hoon
    • Journal of KIISE:Software and Applications
    • /
    • v.37 no.3
    • /
    • pp.214-221
    • /
    • 2010
  • The search-results clustering problem is defined as the automatic and on-line grouping of similar documents in search results returned from a search engine. In this paper, we propose a new search-results clustering algorithm specialized for a paper search service. Our system consists of two algorithmic phases: Category Hierarchy Generation System (CHGS) and Paper Clustering System (PCS). In CHGS, we first build up the category hierarchy, called the Field Thesaurus, for each research field using an existing research category hierarchy (KOSEF's research category hierarchy) and the keyword expansion of the field thesaurus by a word clustering method using the K-means algorithm. Then, in PCS, the proposed algorithm determines the category of each paper using top-down and bottom-up methods. The proposed system can be used in the application areas for retrieval services in a specialized field such as a paper search service.

Refinement of KorLex based on WordNet (워드넷 기반 한국어 명사 어휘의미망의 정제)

  • Hwang, Soon-Hee;Yoon, Ae-Sun
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2005.05a
    • /
    • pp.267-272
    • /
    • 2005
  • 최근 들어 온톨로지(ontology), 시소러스(thesaurus) 등과 함께 주목받고 있는 Princeton 대학의 워드넷(WordNet, 이하 PWN) 은 자연어 처리(NLP)와 관련하여 대안을 제시할 수 있는 어휘의미망(lexico-semantic network)이다. 또한 PWN을 기반으로 상이한 개별어 어휘의미망 구축이 여러 차례 시도되었고, 현재도 진행 중이다. 본 연구는 간접 구축 방식에 의한 어휘의미망 구축 시 요구되는 정제(refinement) 방식들을 검토하고, 이를 한국어 명사 어휘의미망(KL)에 적용하여 정확도 검증 방법의 한 대안으로 제시하였다. 또한 보다 정교한 정제 방법의 모색과 고찰은 향후 과제로 삼고자 한다.

  • PDF

Development of OPAC and theories on online subject access (OPAC의 발전과정과 주제접근방법론)

  • 최달현
    • Journal of Korean Library and Information Science Society
    • /
    • v.20
    • /
    • pp.155-186
    • /
    • 1993
  • This study aims at defining the concept of OPAC, tracing of research trends and development of it, and clarifying various methods of subject access and patterns of bibliographic searching in OPAC as well as strategies for improving to implement online catalogs. Although OPAC is so far the most user-friendly bibliographic searching method, there are still a lot of issues including online subject access in particular. Therefore a more effective and useful method for computer end-users have to be developed, for instance, improvement of an indexing system, a n.0, pplication of the classification system as a searching tool, a new design and construction of standardized thesaurus, betterment of user interface, introducing of expert system into bibliographic searching, establishment of subject authority file. Those would raise the success-rate of users seeking bibliographic information in the library catalogs. Korean libraries are in very early stage of OPAC implementation so that every efforts and concerns to improve strategies and techniques for subject access to OPAC have been strongly asked.

  • PDF

Facets on Thesaurus for Science and Technology Domain (과학기술 분야 시소러스 상에서의 패싯들)

  • Jung Hanmin;Sung Won-Kyung;Park Dong-In;Hwang Soonhee
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2005.11b
    • /
    • pp.535-537
    • /
    • 2005
  • 본 논문에서는 시소러스 상에서 개념간 세분화를 위한 의미적 기준인 개념 패싯 (Conceptual Facet)과 관계 패싯 (Relational Facet) 그룹을 사용하는데, 패싯이란 공통의 특성을 갖는 개념들을 함께 그룹화하고 용어간 관계를 구조화하기 위한 장치이다. 개념 패싯은 용어가 갖는 대표적인 의미속성, 범주를 의미하며, 용어 각각을 구별되는 의미장 (Semantic Field)에 분류하도록 한다. 관계 패싯은 상$\cdot$하위 개념 간 의미 관계를 표현한 메타 개념이다. 본 시소러스는 여러 전문가들의 다양한 관점을 반영하도록 설계되었다. 관점이란 주관적이며, 임의적이어서 개별 개념에 내재된 자질 또는 속성과는 구별되는 독립적 속성이다. 개념 패싯, 관계 패싯의 도입은 계층 관계, 동등 관계, 범주 관계 등과 더불어 용어 간 관계를 보다 구체적으로 명시함으로써 최종 사용자에게 검색의 효율성과 정확성을 제공할 수 있다.

  • PDF

Query Expansion Using Thesaurus for Korean to Chinese Cross- Language Text Retrieval (한.중 교차언어 검색에서 시소러스를 이용한 질의 확장)

  • Jin, Feng;Kang, In-Su;Lee, Jong-Hyeok
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2003.10a
    • /
    • pp.538-540
    • /
    • 2003
  • 본 논문은 한.중 교차언어 검색을 위한 효과적인 질의 확장에 대해 기술하고 있다. 한.중 교차언어 검색은 한국어 질의로 중국어 문서를 검색하는 것이고 본 논문에서는 대역어 사전을 이용하여 한국어 질의를 중국어 질의로 변환하는 방식을 사용한다. 질의 확장을 위한 방법으로 중국어 시소러스인“동의사사림”을 사용하였다. 그리고 동의어들과 주변 단어간의 상호 정보를 비교함으로서 재현률과 정확률을 높였다. 실험을 통하여 검증한 결과 사전만 사용하여 변환하는 방법에 비하여 검색 성능이 향상되었다.

  • PDF

A Study on Automatic Construction of Thesaurus in the field of Law (시소러스 자동생성에 관한 실험적 연구 -법학 분야를 중심으로-)

  • 남영준;최석두;이두영
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1997.08a
    • /
    • pp.25-30
    • /
    • 1997
  • 정보의 양이 많아질수록 색인과 검색의 중요성도 증가한다. 특히, 시소러스는 법학 분야와 같이 세부주제간 구분이 가능하고 복합적인 분야의 검색에는 매우 중요한 검색도구로 사용될 수 있다. 한편, 시소러스를 개발하는 가장 합리적인 방법으로는 기존에 개발된 시소러스의 수정 및 보완이라 할 수 있다. 즉, 기존에 구축된 시소러스를 대상으로 문헌정보학전문가와 법학 전문가가 함께 연구하는 것이 가장 바람직한 시소러스 구축방법이 될 것이다. 본 연구에서는 완전한 시소러스를 자동생성하기보다는 언어분석 도구를 이용하여 반제품형태의 시소러스를 제공하므로서, 기존에 개발된 법학분야의 시소러스가 있는 것과 같은 효과를 얻을 수 있는 반제품 시소러스의 개발방법을 제시한다.

  • PDF

An Operator Assisted Call Routing System

  • Lee, Chun-Jen;Jason S. Chang
    • Proceedings of the Korean Society for Language and Information Conference
    • /
    • 2002.02a
    • /
    • pp.271-280
    • /
    • 2002
  • A system to assist call routing task for telephone operators at the Directorate General of Telecommunications (DGT) in Taiwan is reported in this paper. The system was developed based on DGT organization profile with description of its six divisions instead of a corpus of recorded and transcribed call-routing dialogs. An acoustic module and an information retrieval module were built specifically for this task. The construction of IR module was based on term extraction and thesaurus discovery processes. By integrating acoustic and IR module, the system achieves satisfactory performance and provides a promising approach to call routing. Simulation results indicated that the proposed algorithm outperforms standard classification methods. A working system based on the proposed approach has been implemented and experimental results are presented.

  • PDF

Implementation of Thesaurus Constructor and Visual Browser Based on Object-Oriented Paradigm (객체 지향 개념을 이용한 시소러스 구축기 및 시각화 브라우져의 구현)

  • 김기현;최재훈;한종진;양재동;금창섭
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.336-338
    • /
    • 1998
  • 시소러스는 구축 방법에 따라 매뉴얼 시소러스와 통계적 시소러스로 구분된다. 매뉴얼 시소러스는 정확한 의미 표현이 가능하지만 구축과정에 많은 비용이 소요되며, 통계적 시소러스는 자동으로 구축될 수는 있지만 개념간 의미 표현력이 부족하여 만족할 만한 검색 성능 향상을 기대할 수 없다. 따라서, 본 논문에서는 메뉴얼 시소러스에 객체 지향 개념을 적용하여 구축 비용을 감소시킬 수 있는 시소러스 구축기와 데이터 추상화 기법을 이용하여 선별적으로 개념들 간의 관계를 쉽게 참조할 수 있는 시소러스 시각화 브라우져를 구현하였다. 이 시스템은 시소러스 구축 과정에서 한 사람 이상의 전문가에게 일관된 관점을 제공하며 사용자에게는 높은 정확률의 검색 질의를 구성할 수 있도록 지원한다.

A Comparative Study about Construction and the Service of the Domestic Biographical Database (국내 인물데이터베이스의 구축과 서비스에 관한 비교 분석)

  • Han, Sang-Kil
    • Journal of Korean Library and Information Science Society
    • /
    • v.39 no.4
    • /
    • pp.331-352
    • /
    • 2008
  • The person information is a database given free most lively. This study investigates the construction of the domestic person information database and the service present situation. And I compare a search item and a search method with problems for the biographical database construction process and analyze it. I analyze the problems of the person information database and show the person idea who can solve this. I use term relations and the attribute data of the person which used thesaurus by biographical database construction with this purpose.

  • PDF