• 제목/요약/키워드: Thesaurus Construction

검색결과 63건 처리시간 0.026초

한글 매크로시소러스 구축의 실제 (Practical Construction of Hangul Macro-Thesaurus)

  • 최석두
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1998년도 제5회 학술대회 논문집
    • /
    • pp.223-226
    • /
    • 1998
  • 우리나라에도 여러 가지 분야별 시소러스가 연구되고 있으나 여러 분야를 망라하는 대규모 한글매크로시소러스는 아직 없다고 보아야 할 것이다. 또한 분야별 시소러스를 통합하여 매크로시소러스를 구축하는 것은 거의 불가능하며, 통합할 만큼의 분야별 한글시소러스도 없다. 본 연구에서는 처음부터 매크로시소러스 구축을 위하여 개발한 범용시소러스 관리시스템의 내용과 이 시스템을 이용하여 전 분야를 대상으로 개발하고 있는 한글 매크로시소러스의 개발현황에 대하여 논하고자 한다.

  • PDF

인권 시소러스 구축에 관한 연구 (A Study on Construction of Human Rights Thesaurus)

  • 심민석;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2004년도 제11회 학술대회 논문집
    • /
    • pp.57-60
    • /
    • 2004
  • 인권 시소러스는 인권 관련 색인어 작성시 특정성 및 일관성을 유지하고, 다양한 이용자 계층의 정보 검색의 효율성을 증진시키고자 하는 일반적인 목적과 함께, 모호하게 사용되고 있는 인권 용어의 개념화를 통해 전문가 뿐 아니라 일반인들도 손쉽게 인권 전문정보에 접근할 수 있는 토대를 마련하고자 하였다. 이를 위해 본 연구에서는 인권 관련어로 유의미하게 사용되는 용어군을 수집한 후 실험대상군을 설정하여 어느 정도의 관련성을 가지는가를 실험한 것이다.

  • PDF

자연어처리를 이용한 시소러스 자동생성 (Automatic construction of thesaurus using natural language processing)

  • 남영준;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1994년도 제1회 학술대회 논문집
    • /
    • pp.89-92
    • /
    • 1994
  • 시소러스를 구축하기 위해서는 해당분야의 심도깊은 이해와 지식이 필요하다. 특히, 디스크립터의 선정과 디스크립터의 관계설정은 시소러스 개발자의 주관적인 판단에 따라 이루어지게 된다. 그러나 디스크립터의 선정은 자동색인분야의 연구로서 어느 정도 객관화가 가능하지만, 디스크립터개념간의 관계설정은 개발자의 주관에 전적으로 의존하게 된다. 본 논문은 자연어처리방법과 문헌내 용어출현빈도를 근거로 기계를 이용한 디스크립터간의 관계 설정방안을 제시하고 그 가능성을 조사하였다.

  • PDF

컴포넌트 검색을 위한 효율적 시소러스 구축에 관한 연구 (A Study on Efficient Thesaurus Construction for Component Retrieval)

  • 한정수
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 추계학술발표논문집 (하)
    • /
    • pp.1957-1960
    • /
    • 2002
  • 본 연구는 컴포넌트의 효율적인 검색을 위하여 각 컴포넌트의 코드 정보를 분석하고, 카이제곱 검정 방법을 통하여 분석한 컴포넌트 정보인 term들을 최적화하였다. term의 최적화를 위한 시뮬레이션에서 전체 term 중 약 20%가 제거되었다. 또한 최적화된 term들을 이용하여 term-component 관계를 이용한 매칭, 비매칭 관계 계산을 통하여 term-term 사이의 유의어 매트릭스를 구성함으로써 시소러스를 구축하였다. 시소러스를 통한 검색 결과 최적화 이전의 검색결과와 성능이 비슷하게 나타나 본 연구의 시소러스 구축이 더 효율적임을 알 수 있었다.

  • PDF

단어의 의미연상을 이용한 시소러스 설계 (Thesaurus Construction Using Word Association)

  • 한승희
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2006년도 제13회 학술대회 논문집
    • /
    • pp.233-238
    • /
    • 2006
  • 본 연구에서는 단어의 의미연상을 이용하여 시소러스를 작성해봄으로써 탐색 시소러스 구축에 있어 단어연상검사법의 적용가능성을 살펴보았다. 문헌정보학 분야를 대상으로 단어연상검사를 실시한 후 자극어와 반응어간의 의미관계를 파악하고 반응어와 통제어휘를 비교 분석하였다. 실험 및 분석결과, 단어연상검사를 이용하면 다양한 연관관계 용어들을 시소러스에 포함시킬 수 있으며, 통제어휘집에 나타난 하위관계와 동등관계 용어들을 어느 정도 반영할 수 있다는 것을 확인하였다. 단어의 의미연상을 이용하여 구축된 탐색 시소러스는 정보검색환경에서 질의확장에 응용될 수 있다.

  • PDF

한국어 단어 시소러스 구축 시스템의 설계 (Design of construction system for thesaurus of korean world)

  • 이종인;한광록
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 하계종합학술대회논문집
    • /
    • pp.313-316
    • /
    • 1998
  • 본 논문은 한국어 단어의 의미 영역 정보를 저장하기 위한 시소러스를 설게하고 이를 구축하기 위한 시스템을 설계하였다. 기존에 TOP_DOWN이나 BOTTOM_UP 방식을 이용하는 경우 각각 비 객관성과 작업 속도의 문제와 비구조성, 비일관성의 문제를 안고 있어 이를 혼합하여 어의문을 이용하여 객관성을 유지하면서도 기본모델을 이용하여 비구조성과 비일관성의 문제를 해결하고 있다. 또한 그 동안 필요성이 증가되었으나 작업을 하지 못했던 가장 큰 이유인 단어의 방대성으로 기인한 작업속도의 문제해결하기 위하여 C/S 모델을 적용하여 다수의 입력자들에 의해 동시 입력을 가능케 함으로써 작업 속도의 향상을 이루었다.

  • PDF

자연어를 이용한 자동정보검색시스템 구축에 관한 연구 (A Study of Designing the Automatic Information Retrieval System based on Natural Language)

  • 서휘
    • 한국문헌정보학회지
    • /
    • 제35권4호
    • /
    • pp.141-160
    • /
    • 2001
  • 본 연구에서는 자연어를 이용하여 자동으로 정보검색을 수행하는 시스템을 구축하였다. 구현 시스템은 Delphi 4.0(PASCAL)으로 프로그래밍 하였으며, 자동색인, 클러스터링 기법, 자연어 계층관계의 구축과 표현, 자동정보탐색이 가능하도록 구성했다. 이 시스템을 이용하여 질의어의 표현, 생성, 확장, 탐색식의 구성, 피드백 탐색 등 정보탐색의 전과정을 자동으로 수행할 수 있었다.

  • PDF

시소러스 구축을 위한 웹 기반 워크벤치 개발 (Development of Web-based Workbench for the Construction of Thesaurus)

  • 이승준;정한민;성원경;최광;이상헌;최석두
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.999-1004
    • /
    • 2006
  • 본 연구에서는 다양한 개념 패싯과 관계 패싯들을 수용한 범용 과학기술 시소러스 구축용 웹 기반 워크벤치 개발에 대해 기술한다. 기존 국내 시소러스 구축용 워크벤치들이 제공하는 기본적인 용어 관계구축 기능을 확장하여 개념 패싯, 범주 관계 패싯, 의미역 관계 패싯, 속성 관계 패싯 및 속성 키워드 처리 기능을 원활히 제공할 수 있는 사용자 중심적 워크벤치를 개발함으로써 시소러스 상의 개념들에 대한 효율적인 구축이 가능하도록 한다. 또한 시멘틱 웹 상의 온톨로지 영역에 보다 근접한 고도화되니 시소러스 구축을 위해 용어들을 개념화시키고, 개념간의 다양한 관계를 설정하는 프로세스 중심적 설계로 분야 적합성이 높은 정보 처리 기반을 갖춘다. 궁극적으로 여러 마이크로 시소러스들을 통합하여 운용할 수 있는 복합 모델을 구축하는 것을 목표로 하고 있다. 이러한 목적에 부합하는 시스템 구현을 위해 CBD(Component Based Development) 개발 방법론으로 MSF/CD를 이용하였으며, 분산 환경에서 이기종간의 데이터 교환을 용이하게 하기 위하여 웹 서비스 (XML Web Services)를 이용하였다. 또한 시멘틱 웹 기반 연구자 간 협업 지원 서비스 구현을 위한 확장 검색용으로서도 활용할 수 있도록 하였다. 시소러스 반출은 CSV, XML 및 RDF를 모두 지원할 수 있도록 함으로써 다양한 사용자 요구 사항에 부합할 수 있도록 하였다. 시소러스 브라우징을 시각화 기반의 3단계 구조를 가진 플래시로 구현하여 사용자가 쉽게 시소러스를 탐색하고 분석할 수 있는 기반을 제공하였다. 또한 다양한 검색 요구를 만족시키고자 기본 검색, 고급 검색, 메타 검색을 선택할 수 있도록 하며, 개념 편집 및 시소러스 브라우징과 연동시켜 효율적인 시소러스 구축이 가능하도록 하였다. 본 연구의 워크벤치를 이용하여 구축된 시소러스는 기존 시소러스들에 비해 사용자가 보다 폭넓은 의미 기반 검색을 수행할 수 있도록 함으로써 다각적인 정보를 쉽게 획득할 수 있는 기반을 마련하고 있다는 데 의의가 있으며, 다국어 시소러스 및 다중 시소러스를 수용할 수 있는 방향으로 발전시킬 계획이다.

  • PDF

시소러스 자동생성에 관한 실험적 연구 -법학 분야를 중심으로- (A Study on Automatic Construction of Thesaurus in the field of Law)

  • 남영준;최석두;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1997년도 제4회 학술대회 논문집
    • /
    • pp.25-30
    • /
    • 1997
  • 정보의 양이 많아질수록 색인과 검색의 중요성도 증가한다. 특히, 시소러스는 법학 분야와 같이 세부주제간 구분이 가능하고 복합적인 분야의 검색에는 매우 중요한 검색도구로 사용될 수 있다. 한편, 시소러스를 개발하는 가장 합리적인 방법으로는 기존에 개발된 시소러스의 수정 및 보완이라 할 수 있다. 즉, 기존에 구축된 시소러스를 대상으로 문헌정보학전문가와 법학 전문가가 함께 연구하는 것이 가장 바람직한 시소러스 구축방법이 될 것이다. 본 연구에서는 완전한 시소러스를 자동생성하기보다는 언어분석 도구를 이용하여 반제품형태의 시소러스를 제공하므로서, 기존에 개발된 법학분야의 시소러스가 있는 것과 같은 효과를 얻을 수 있는 반제품 시소러스의 개발방법을 제시한다.

  • PDF

An Operator Assisted Call Routing System

  • Lee, Chun-Jen;Jason S. Chang
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 Language, Information, and Computation Proceedings of The 16th Pacific Asia Conference
    • /
    • pp.271-280
    • /
    • 2002
  • A system to assist call routing task for telephone operators at the Directorate General of Telecommunications (DGT) in Taiwan is reported in this paper. The system was developed based on DGT organization profile with description of its six divisions instead of a corpus of recorded and transcribed call-routing dialogs. An acoustic module and an information retrieval module were built specifically for this task. The construction of IR module was based on term extraction and thesaurus discovery processes. By integrating acoustic and IR module, the system achieves satisfactory performance and provides a promising approach to call routing. Simulation results indicated that the proposed algorithm outperforms standard classification methods. A working system based on the proposed approach has been implemented and experimental results are presented.

  • PDF