• 제목/요약/키워드: 시소러스 시스템

검색결과 155건 처리시간 0.021초

시소러스를 이용한 XML 태그 검색 시스템 (An XML Tag Search System By Using Thesaurus)

  • 양승원;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.145-147
    • /
    • 2000
  • 현재 웹 기술은 HTML에서 정보를 표현하는 외형과 내용을 분리하여 정보를 구조화할 수 있는 XML을 사용하고 있다. 구조적으로 구성된 XML은 새로운 정보 검색의 방법을 제시하였다. 즉, 태그를 이용한 정보검색으로 검색어에 의미를 부여함으로써 정보 검색자에게 좀더 효율적인 검색을 가능하게 하였다. 그러나 이러한 구조화 문서 검색 기법은 정확한 태그를 입력하였을 경우에만 결과를 얻을수 있는 단점을 지니고 있다. 따라서 본 논문에서는 XML문서의 태그 검색에 있어 정확한 태그 검색을 확장한 유사 태그 검색기법을 설계하고 구현하였다. 유사한 태그를 검색하기 위하여 시소러스를 구성하였으며, 작성된 시소러스를 이용하여 유사한 태그에 대한 검색을 수행하였다. 기존의 XML문서 검색 시스템은 정한 태그에 대한 검색만을 수행할 수 있는 반면, 본 시스템은 태그검색에 있어 시소러스를 활용함으로써 질의에 입력되어진 태그와 유사한 태그에 대한 검색 결과를 보여줌으로써 사용자에게 질의어 선정의 불편함을 감소시켰다.

  • PDF

객체기반 시소러스 시스템의 설계 및 구현: 반자동화 방식의 구축, 추상화 방식의 개념 브라우징 및 질의기반 참조 (Design and Implementation of an Object-Based Thesaurus System: Semi-automated Construction, Abstracted Concept Browsing and Query-Based Reference)

  • 최재훈;김기헌;양재동
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제27권1호
    • /
    • pp.64-78
    • /
    • 2000
  • 본 논문에서는 객체지향 패러다임을 적용함으로써 도메인 종속적인 시소러스를 효율적으로 구축하고 관리할 수 있는 객체기반 시소러스 시스템을 설계하고 구현하였다. 이때, 객체지향 패러다임은 시소러스의 구축, 개념 브라우징 그리고 질의기반 참조 기능에 적용된다. 이 시스템에서 객체지향 패러다임의 상속 메커니즘은 시소러스에 표현된 개념들간의 관계를 구조적으로 파악할 수 있게 하여 전문가가 시소러스를 반자동 방식으로 구축할 수 있도록 지원한다. 특히, 방대한 시소러스를 여러 전문가들이 서로 다른 호스트에서 구축할 경우, 이 메커니즘에 의해 파악된 정보는 시소러스의 의미적 일관성을 유지시킬 수 있도록 도와주며, 전문가가 직접 개념들간의 관련 정도를 모두 명시해야하는 부담을 최소화할 수 있다. 객체기반 시소러스 시스템은 또한 질의기반 참조 기능과 추상화 방식의 개념 브라우징 기능을 제공한다. 이 기능들은 검색 질의에 이용될 시소러스 개념들을 사용자가 사전에 탐색해 봄으로써 쉽게 검증할 수 있게 한다. 특히, 이 질의 검증 과정은 높은 정확률을 요구하는 도메인에 적절히 이용될 수 있다.

  • PDF

Case 기반 컴포넌트 검색 시스템 설계 (Case-Based Retrieval System Construction)

  • 김귀정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2005년도 춘계학술발표대회
    • /
    • pp.357-360
    • /
    • 2005
  • 본 연구는 소스 코드를 재사용하기 위한 Case 기반 검색에 있어서 효율적인 검색 시스템을 구축하는 방법을 제안하고자 한다. 소스 코드의 객체지향적인 특성을 만족하기 위하여 각 노드 간 객체지향 상속의 개념을 표현할 수 있도록 초기 관련값을 시소러스로 구축하고자 한다. 이때, 각 Case를 구성하는 클래스들을 상속관계에 따라 개념적으로 분류하였고, 시소러스 방법에 퍼지 논리를 적용하여 객체지향 시소러스를 생성하여 의미망을 구축한다. 또한, 의미망의 노드와 간선을 활성화시키고 활성값을 전파시키기 위해 사용되는 spreading activation 방법의 단점을 보완하여 spreading activation의 성능은 최대한 유지하면서 검색 속도를 향상시킬 수 있는 방법을 제안하고자 한다.

  • PDF

한국어 명사의 시소러스 구축을 위한 시스템 설계 및 구현 (Design and Implementation of a System for Constructing Thesaurus of Korean Nouns)

  • 이종인;한광록;양승현;김영섬
    • 한국정보처리학회논문지
    • /
    • 제6권2호
    • /
    • pp.347-356
    • /
    • 1999
  • 본 논문에서는 한국어 명사의 의미 개념의 계층을 생성하기 위한 시소러스 구성 방법과 시소러스를 구축하기 위한 개발 시스템을 구현하였다. 기존의 시소러스 구축에 있어서 나타나는 계층 설정의 비객관성 및 작업속도 문제, 비구조성, 비일관성 등의 문제를 해결하기 위하여 상향식과 하향식 방법을 혼합 적용하는 다단계 구축 방법을 사용한다. 온라인 전자 사전의 뜻풀이 문을 이용하여 객관성을 유지하고, 기존 시소러스의 기본 모델을 참조하여 비구조성과 비일관성의 문제를 해결한다. 또한 방대한 양의 표제어를 포함하는 시소러스를 빠른 시간 내에 구축하기 위하여 클라이언트/서버 환경의 개발 도구를 구현하여 여러 사람이 다중 입력 작업을 할 수 있도록 하였다.

  • PDF

지질용어 시소러스 시스템의 설계 및 구축 (Design and Implementation of Thesaurus System for Geological Terms)

  • 황재홍;지광훈;한종규;연영광;류근호
    • 한국지리정보학회지
    • /
    • 제10권2호
    • /
    • pp.23-35
    • /
    • 2007
  • 최근 정보 검색 분야에서 시맨틱 웹 기술에 따른 인터넷 용어사전과 더불어 시소러스의 필요성이 더욱 중요시되고 있다. 시소러스는 분류와 사전의 결합으로 상위 및 하위개념 사이의 전후관계를 명확히 하기 위해서 공식적으로 조직, 통제된 색인어의 어휘로 인간의 학습, 탐구활동 등 제반 지식활동의 대상이 되는 개념(용어)간의 관계를 표현한 지식구조의 토픽 맵이다. 하지만 시소러스가 용어의 통제 및 표준화와 더불어 정보를 능률적으로 처리하고 검색하는데 필수적인 수단으로 평가되고 있음에도 불구하고 아직까지 지질분야에서 우리말 시소러스가 없는 실정이다. 시소러스를 구축하기 위해서는 표준화되고 잘 정의된 지침이 필요하다. 이러한 표준화된 지침은 보다 효율적인 정보 관리를 가능하게 할 것이며, 정보 이용자 또한 보다 정확한 정보를 쉽고 편리하게 이용할 수 있게 될 것이다. 본 연구는 지질정보 중 가장 기본이 되는 용어 시소러스 시스템 구축 연구이다. 이를 위해서 첫째, 국내외 지질용어 표준화 동향을 살펴보았다. 둘째, 15개 분야에 대한 지질학적 주제를 정하고 각 주제에 대한 분류체계(안)를 마련하였다. 셋째, 지질용어 시소러스 분류체계를 바탕으로 지질용어 시소러스 명세서를 작성하였다. 마지막으로 이 명세서를 이용하여 인터넷기반 지질용어 시소러스 시스템을 설계하고 구축하였다.

  • PDF

자동정보검색을 위한 한글 시소러스 브라우저 구축에 관한 연구 (A Study of Designing the Han-Guel Thesaurus Browser for Automatic Information Retrieval)

  • 서휘
    • 한국도서관정보학회지
    • /
    • 제31권2호
    • /
    • pp.279-302
    • /
    • 2000
  • 본 연구는 질의어의 표현, 새성, 확장, 탐색식의 구성, 피드백 탐색 등 정보 탐색의 전과정을 지동으로 수행할 수 있는 한글 시소러스 브라우저 기반 자동정보검색 시스템을 구현하기 위해 시도되었다. 구현 시스템은 Delphi 4.0(PASCAL)으로 프로그래밍 되었으며, 자동색인, 클러스터링 기법, 시소러스의 구축과 표현, 자동정보겸색이 가능하도록 구성되었다. 구현된 시스템의 평가결과는 새로운 알고리즘에 의해 구축된 시소러스 브라우저가 정보검색에 있어서 시소러스의 구축의 용이성, 이용의 편리성, 검색 속도, 검색의 적합성 수준에서 우수힘을 입증하고 있다.

  • PDF

전문정보 검색시스템의 시소러스 개발에 관한 연구 (A Study on Development the Thesaurus for the Specialized Information Retrieval System)

  • 이상렬
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1994년도 제1회 학술대회 논문집
    • /
    • pp.109-112
    • /
    • 1994
  • 본고에서는 전문정보 검색시스템의 검색효율을 높일 수 있는 방안에 하나로서 해당주제분야별 전문정보의 시소러스 개발을 제안하고, 이를 통해 이용자 중심의 전문정보 검색시스템을 구축하는데 도움을 줄 수 있는 방안을 모색하고자 한다.

  • PDF

기록시소러스 구축지침 개정에 관한 연구 (A Study on the Revision Archival Thesaurus Construction)

  • 박지영;윤소영;이혜원
    • 한국기록관리학회지
    • /
    • 제17권1호
    • /
    • pp.117-141
    • /
    • 2017
  • 시소러스는 분류체계의 분류명을 제어해 주고, 분류표의 색인 역할을 수행할 수 있다. 기록관리에 있어서 시소러스는 기능어를 제어하고, 검색의 접근점을 확장시켜 기능분류체계를 보완해 준다. 그런데 최근에는 정보환경의 변화와 시소러스 구축 및 활용 시스템의 발전으로 시소러스 구축에 관한 국제표준인 ISO 25964가 개정되었다. 또한 기록관리 전반에 대한 국제표준인 ISO 15489의 제1부도 2016년에 개정되었다. 또한 영국의 IPSV나 유럽의 EuroVoc, 뉴질랜드의 FONZ 등은 최근의 경향을 반영하여 효과적으로 시소러스를 구축하고 연계하고 있었다. 이에 본 연구에서는 체계적인 기록관리를 위한 시소러스 구축지침을 관련 표준과 사례 측면에서 살펴보고, 현재의 우리나라 기록관리 분야 시소러스 구축지침의 개선 방안을 제안하였다.

질의어 자동수정을 이용한 메타시소러스 검색 방법 (The Method of Searching Metathesaurus, Using Automatic Modified a Query)

  • 김종광;하원식;김태용;류중경;이정현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.454-456
    • /
    • 2003
  • UMLS(2003AA edition 기준)의 메타시소러스는 다국어를 지원하며 875.233개의 개 (concept)과 2,146,897개의 개념명(concept name)을 포함한다. 현재 UMLS 메타시소러스 검색을 제공하는 PubMed나 NLM에서는 UMLS에서는 개념명에 존재하지 않는 잘못된 질의나, 잘못된 구문 또는 개념명의 일부를 이용한 검색이 불가능하다. 이는 사용자가 UMLS에서 정보를 얻기 위해서는 정확한 의학용어를 숙지해야 되며. UMLS 메타시소러스의 데이터가 잘못 되었을 경우 정보를 얻을 수 없다. 본 연구에서는 이러한 문제점을 보완하기 위해서 자연어처리에서 연구되고 있는 문자열 간의 유사도 측정방식을 적용하여 잘못된 질의어에 대한 자동수정 기능을 이용한 메타시소러스 검색방법을 제안한다. 제안한 방법에서는 질의어를 자동수정하기 위하여 철자사전을 자동으로 추출하고 문자열 비교알고리즘을 도입하여 질의어와 철자사전간의 용어의 유사도를 측정한다. 유사도에 의하여 얻어진 용어를 메타시소러스의 형식에 맞게 변환하여 질의에 대한 최적의 결과를 얻을 수 있도록 한다. 제안된 방법의 성능을 평가하기 위해서 최근(2003년 8월) bi-gram 방식을 도입한 NLM에서의 시스템과 비교 평가한다.

  • PDF

시소러스범주정보를 이용한 질의응답시스템 (A Question Answering System Using the Information of the Category Information of Thesaurus)

  • 김수민;백대호;김상범;임해창
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.179-183
    • /
    • 2000
  • 정보검색시스템은 사용자의 질의를 입력받아 사용자가 원하는 정보를 검색해주는 시스템을 의미한다. 그러나, 대부분의 정보검색시스템은 단어와 연산자의 조합으로 이루어진 질의를 입력받아 문서를 검색해 주고, 사용자는 그 문서들 중에서 원하는 정보를 다시 찾아내야 한다. 본 논문에서는 영어 자여어질의를 입력 받아 사용자가 원하는 정보에 좀 더 근접한 형태의 답으로서 제한된 길이의 짧은 답을 제시하는 시스템을 구현한다. 시스템은 크게 질의분석단계, 문서검색 및 분석단계, 정보추출단계의 세 단계로 나눌 수 있다. 사용자 질의분석단계에서는 의문사 정보와 오토마타, 시소러스 범주 정보를 이용하여 질의에 대한 정답이 될 수 있는 단어의 속성을 예측하였다. 문서분서단계에서는 정답이 될 수 있는 단어의 후보를 선정하기 위해서 시소러스의 범주정보를 사용하였고, 선정된 정답후보중에서 정답을 추출하기 위해 각 후보단어의 질의단어와의 평균거리가중치, 범주간유사도, 공기질의어비율을 사용하였다. 실험을 통해 평균거리가중치만을 이용하는 것 보다 범주간유사도와 공기질의어비율을 함께 이용하는 것이 성능의 향상을 보였다.

  • PDF