• Title/Summary/Keyword: 시소러스

Search Result 341, Processing Time 0.034 seconds

Automatic Structuralization of Thesaurus (시소러스 자동 구조화)

  • 김해수;이남경;이원규
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1994.12a
    • /
    • pp.97-100
    • /
    • 1994
  • 정보과학 분야에서 필요로 하는 의미해석 기술 개발에 중요한 역할을 하는 것이 시소러스이다. 정확한 관계 정의 및 대량정보 수용의 필요성은 시소러스 구축의 커다란 장애 요인이다. 시소러스 구축에은 다방면의 전문지식 활용과 막대한 비용 및 시간 투자가 요구된다. 기계적으로 관리 운영이 가능한 시소러스내의 관계는 BT, NT로 표현되는 계층관계와 USE, UF로 표현되는 등가관계로 이루어 진다. 본 연구는 개념적인 관계를 정의하는 두 관계를 기계적으로 추출하고, 기존의 평면적인 시소러스 구조를 실세계의 정보 구조에 적합하게 조직화하여 시소러스 구축에 있어서의 문제점을 개선하는데 그 목적이 있다. 제시되는 알고리즘은 단일 언어내의 시소러스 구축 뿐만 아니라, 구축된 시소러스들의 융합 및 다국어 시소러스 구축에도 적용된다.

  • PDF

Thesaurus Updating Using Collective Intelligence: Based on Wikipedia Encyclopedia (집단지성을 활용한 시소러스 갱신에 관한 연구: 위키피디아를 중심으로)

  • Han, Seung-Hee
    • Journal of the Korean Society for information Management
    • /
    • v.26 no.3
    • /
    • pp.25-43
    • /
    • 2009
  • The purpose of this study is to suggest how the classic thesaurus structure of terms and links can be mined and updated from Wikipedia encyclopedia, which is the best practice of collective intelligence. In a comparison with ASIS&T thesaurus, it was found that Wikipedia contains a substantial coverage of domain-specific concepts and semantic relations. Furthermore, it was resulted that the structural characteristics of Wikipedia, such as redirects, categories, and mutual links are suitable to extract semantic relationships of thesaurus. It is needed to apply to update various thesauri, including multilingual thesaurus, in order to generalize the results of this research.

Practical Construction of Hangul Macro-Thesaurus (한글 매크로시소러스 구축의 실제)

  • 최석두
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1998.08a
    • /
    • pp.223-226
    • /
    • 1998
  • 우리나라에도 여러 가지 분야별 시소러스가 연구되고 있으나 여러 분야를 망라하는 대규모 한글매크로시소러스는 아직 없다고 보아야 할 것이다. 또한 분야별 시소러스를 통합하여 매크로시소러스를 구축하는 것은 거의 불가능하며, 통합할 만큼의 분야별 한글시소러스도 없다. 본 연구에서는 처음부터 매크로시소러스 구축을 위하여 개발한 범용시소러스 관리시스템의 내용과 이 시스템을 이용하여 전 분야를 대상으로 개발하고 있는 한글 매크로시소러스의 개발현황에 대하여 논하고자 한다.

  • PDF

Design and Implementation of Efficient Storage System for Storing and Searching Thesaurus Data (시소러스 데이터의 저장과 검색을 위한 효율적인 저장 시스템의 설계 및 구현)

  • 김점숙;안동언;정성종
    • Proceedings of the Korean Society for Cognitive Science Conference
    • /
    • 2000.06a
    • /
    • pp.205-209
    • /
    • 2000
  • 본 논문에서는 시소러스를 효율적으로 구축하고 사용할 수 있는 시소러스 저장 구조를 구현하였다. 정보 검색 시스템은 사용자의 질의어를 용어들과 용어들 사이에 관계 집합으로 구성된 일종의 용어 사전인 시소러스를 이용하여 문헌에 대한 색인과 검색을 정확하고 통제된 용어 형태로 바꾸어 색인과 검색 작업의 효율을 높인다. 데이터베이스에 저장된 시소러스 구조에서 시소러스 검색을 할 때 속도가 감소하는데 이를 해시함수를 이용한 리스트 구조를 이용함으로써 전체적인 시소러스 검색 속도의 증가를 기대할 수 있다. 또한 현재 데이터베이스 형태의 시소러스를 다른 곳에 이식하려면 데이터베이스 시스템이 있어야 한다. 따라서 메모리에 올릴 수 있는 구조를 가지면 시소러스 보급에 기여할 수 있다. 본 논문에서 제안한 데이터베이스에 저장된 시소러스 구조와 해시함수를 이용한 리스트 구조를 비교, 분석하고 보다 더 효율적인 시소러스의 역할 및 구조 형태에 대해 제안한다.

  • PDF

Design and Implementation of Efficient Storage System for Storing and Searching Thesaurus Data (시소러스 데이터의 저장과 검색을 위한 효율적인 저장 시스템의 설계 및 구현)

  • Kim, Jum-Suk;An, Dong-Un;Jong, Sung-Chung
    • Annual Conference on Human and Language Technology
    • /
    • 2000.10d
    • /
    • pp.205-209
    • /
    • 2000
  • 본 논문에서는 시소러스를 효율적으로 구축하고 사용할 수 있는 시소러스 저장 구조를 구현하였다. 정보 검색 시스템은 사용자의 질의어를 용어들과 용어들 사이의 관계 집합으로 구성된 일종의 용어 사전인 시소러스를 이용하여 문헌에 대한 색인과 검색을 정확하고 통제된 용어 형태로 바꾸어 색인과 검색 작업의 효율을 높인다. 데이터베이스에 저장된 시소러스 구조에서 시소러스 검색을 할 때 속도가 감소하는데 이를 해시함수를 이용한 리스트 구조를 이용함으로써 전체적인 시소러스 검색 속도의 증가를 기대할 수 있다. 또한 현재 데이터베이스 형태의 시소러스를 다른 곳에 이식하려면 데이터베이스 시스템이 있어야 한다. 따라서 메모리에 올릴 수 있는 구조를 가지면 시소러스 보급에 기여 할 수 있다. 본 논문에서 제안한 데이터베이스에 저장된 시소러스 구조와 해시함수를 이용한 리스트 구조를 비교, 분석하고 보다 더 효율적인 시소러스의 역할 및 구조 형태에 대해 제안한다.

  • PDF

The Problems of translating English thesaurus terms in korean (외국 시소러스 번역시 나타나는 문제점에 관한 연구)

  • 오재익;이두영
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1996.08a
    • /
    • pp.41-44
    • /
    • 1996
  • 본 논문은 시소러스의 구축에있어 시간, 비용, 노력의 최소화를 위해 외국 시소러스를 번역하는 방법이 언어, 제도, 사고방식, 문화 등의 이유로 어떤 문제점이 발생하는지를 고찰해 보고자 한다. 연구 대상으로 ERIC 시소러스를 번역하여 구축한 [KEDI 교육 시소러스]와 [ERIC 시소러스(7판)]를 선정하여 비교 분석하였다. 번역에 의존하는 한글시소러스 구축 방법은 권장할만한 방법이 되지못하며, 단지 우리말 시소러스 구축을위한 Discriptor를 추출하는 수단 이상을 기대하기란 어려우리라 여겨진다.

  • PDF

A Study on Automatic Construction of Thesaurus in the field of Law (시소러스 자동생성에 관한 실험적 연구 -법학 분야를 중심으로-)

  • 남영준;최석두;이두영
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1997.08a
    • /
    • pp.25-30
    • /
    • 1997
  • 정보의 양이 많아질수록 색인과 검색의 중요성도 증가한다. 특히, 시소러스는 법학 분야와 같이 세부주제간 구분이 가능하고 복합적인 분야의 검색에는 매우 중요한 검색도구로 사용될 수 있다. 한편, 시소러스를 개발하는 가장 합리적인 방법으로는 기존에 개발된 시소러스의 수정 및 보완이라 할 수 있다. 즉, 기존에 구축된 시소러스를 대상으로 문헌정보학전문가와 법학 전문가가 함께 연구하는 것이 가장 바람직한 시소러스 구축방법이 될 것이다. 본 연구에서는 완전한 시소러스를 자동생성하기보다는 언어분석 도구를 이용하여 반제품형태의 시소러스를 제공하므로서, 기존에 개발된 법학분야의 시소러스가 있는 것과 같은 효과를 얻을 수 있는 반제품 시소러스의 개발방법을 제시한다.

  • PDF

Implementation of Thesaurus Constructor and Visual Browser Based on Object-Oriented Paradigm (객체 지향 개념을 이용한 시소러스 구축기 및 시각화 브라우져의 구현)

  • 김기현;최재훈;한종진;양재동;금창섭
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 1998.10b
    • /
    • pp.336-338
    • /
    • 1998
  • 시소러스는 구축 방법에 따라 매뉴얼 시소러스와 통계적 시소러스로 구분된다. 매뉴얼 시소러스는 정확한 의미 표현이 가능하지만 구축과정에 많은 비용이 소요되며, 통계적 시소러스는 자동으로 구축될 수는 있지만 개념간 의미 표현력이 부족하여 만족할 만한 검색 성능 향상을 기대할 수 없다. 따라서, 본 논문에서는 메뉴얼 시소러스에 객체 지향 개념을 적용하여 구축 비용을 감소시킬 수 있는 시소러스 구축기와 데이터 추상화 기법을 이용하여 선별적으로 개념들 간의 관계를 쉽게 참조할 수 있는 시소러스 시각화 브라우져를 구현하였다. 이 시스템은 시소러스 구축 과정에서 한 사람 이상의 전문가에게 일관된 관점을 제공하며 사용자에게는 높은 정확률의 검색 질의를 구성할 수 있도록 지원한다.

Development of Web-based Workbench for the Construction of Thesaurus (시소러스 구축을 위한 웹 기반 워크벤치 개발)

  • Lee, Seung-Jun;Jung, Han-Min;Sung, Won-Kyung;Choi, Kwang;Lee, Sang-Hun;Choi, Suk-Doo
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.999-1004
    • /
    • 2006
  • 본 연구에서는 다양한 개념 패싯과 관계 패싯들을 수용한 범용 과학기술 시소러스 구축용 웹 기반 워크벤치 개발에 대해 기술한다. 기존 국내 시소러스 구축용 워크벤치들이 제공하는 기본적인 용어 관계구축 기능을 확장하여 개념 패싯, 범주 관계 패싯, 의미역 관계 패싯, 속성 관계 패싯 및 속성 키워드 처리 기능을 원활히 제공할 수 있는 사용자 중심적 워크벤치를 개발함으로써 시소러스 상의 개념들에 대한 효율적인 구축이 가능하도록 한다. 또한 시멘틱 웹 상의 온톨로지 영역에 보다 근접한 고도화되니 시소러스 구축을 위해 용어들을 개념화시키고, 개념간의 다양한 관계를 설정하는 프로세스 중심적 설계로 분야 적합성이 높은 정보 처리 기반을 갖춘다. 궁극적으로 여러 마이크로 시소러스들을 통합하여 운용할 수 있는 복합 모델을 구축하는 것을 목표로 하고 있다. 이러한 목적에 부합하는 시스템 구현을 위해 CBD(Component Based Development) 개발 방법론으로 MSF/CD를 이용하였으며, 분산 환경에서 이기종간의 데이터 교환을 용이하게 하기 위하여 웹 서비스 (XML Web Services)를 이용하였다. 또한 시멘틱 웹 기반 연구자 간 협업 지원 서비스 구현을 위한 확장 검색용으로서도 활용할 수 있도록 하였다. 시소러스 반출은 CSV, XML 및 RDF를 모두 지원할 수 있도록 함으로써 다양한 사용자 요구 사항에 부합할 수 있도록 하였다. 시소러스 브라우징을 시각화 기반의 3단계 구조를 가진 플래시로 구현하여 사용자가 쉽게 시소러스를 탐색하고 분석할 수 있는 기반을 제공하였다. 또한 다양한 검색 요구를 만족시키고자 기본 검색, 고급 검색, 메타 검색을 선택할 수 있도록 하며, 개념 편집 및 시소러스 브라우징과 연동시켜 효율적인 시소러스 구축이 가능하도록 하였다. 본 연구의 워크벤치를 이용하여 구축된 시소러스는 기존 시소러스들에 비해 사용자가 보다 폭넓은 의미 기반 검색을 수행할 수 있도록 함으로써 다각적인 정보를 쉽게 획득할 수 있는 기반을 마련하고 있다는 데 의의가 있으며, 다국어 시소러스 및 다중 시소러스를 수용할 수 있는 방향으로 발전시킬 계획이다.

  • PDF

Searching Thesaurus Construction with Word Association Test: A Pilot Study (단어연상검사법을 이용한 탐색 시소러스 구축에 관한 실험적 연구)

  • Han Seung-Hee
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.40 no.3
    • /
    • pp.289-304
    • /
    • 2006
  • The purpose of this pilot study is to construct a searching thesaurus with word association test in the library and information science field and to confirm it's functionality as searching aids through query expansion experiments. The test results were analyzed to four types of relationship between stimulus words and response words, and the terms of association thesaurus were compared with descriptors of an existing thesaurus. The test results show that the word association test is a fruitful method to identify many related terms and narrower and equivalent terms in some degree to the stimulus terms. Furthermore. in the query expansion experiment. the Performance of association thesaurus was better than that of an existing thesaurus, This result demonstrates that word association thesaurus can apply to query expansion.