• Title/Summary/Keyword: Korean Thesaurus

Search Result 224, Processing Time 0.03 seconds

시소러스를 이용한 XML 태그 검색 시스템 (An XML Tag Search System By Using Thesaurus)

  • 양승원;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (1)
    • /
    • pp.145-147
    • /
    • 2000
  • 현재 웹 기술은 HTML에서 정보를 표현하는 외형과 내용을 분리하여 정보를 구조화할 수 있는 XML을 사용하고 있다. 구조적으로 구성된 XML은 새로운 정보 검색의 방법을 제시하였다. 즉, 태그를 이용한 정보검색으로 검색어에 의미를 부여함으로써 정보 검색자에게 좀더 효율적인 검색을 가능하게 하였다. 그러나 이러한 구조화 문서 검색 기법은 정확한 태그를 입력하였을 경우에만 결과를 얻을수 있는 단점을 지니고 있다. 따라서 본 논문에서는 XML문서의 태그 검색에 있어 정확한 태그 검색을 확장한 유사 태그 검색기법을 설계하고 구현하였다. 유사한 태그를 검색하기 위하여 시소러스를 구성하였으며, 작성된 시소러스를 이용하여 유사한 태그에 대한 검색을 수행하였다. 기존의 XML문서 검색 시스템은 정한 태그에 대한 검색만을 수행할 수 있는 반면, 본 시스템은 태그검색에 있어 시소러스를 활용함으로써 질의에 입력되어진 태그와 유사한 태그에 대한 검색 결과를 보여줌으로써 사용자에게 질의어 선정의 불편함을 감소시켰다.

  • PDF

퍼지 언어적 관련도에 근거한 시소러스 모델 (Thesaurus Model based on Fuzzy Linguistic Relation Degree)

  • 최명복;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.72-74
    • /
    • 1998
  • 정보검색 시스템에서 시소러스는 정보항목에 대한 용어들간의 관계를 계층적 구조로 나타낸다. 따라서 정보검색 시스템에서 시소러스의 사용은 이용자의 질의에 있는 탐색어와 관련된 정보항목들을 검색할 수 있기 때문에 정보검색 시스템의 검색효율을 크게 증가시킬 수 있다. 그러나 기존의 시소러스 모델들은 용어들간의 관련 정도를 무시하거나 정량적인 수치값으로 부여하기 때문에 인간의 주관성과 부정확성을 다루는데 적합하지 않다. 용어들간 의미의 밀접한 정도(Degree of Closeness)는 모호하고 부정확한 판단에 근거하는 인간의 정성적인 측정 단위이다. 그러므로 관련정도를 정량적으로 표현하는 것은 정성적 개념을 정확한 숫자 값으로 변환하는 것이기 때문에 인간의 정성적 측정 단위를 정확하고 용이하게 정량적으로 측도하여 반영한다는 것은 어렵다. 따라서 본 논문에서는 용어들간의 관련도를 정성적으로 부여한 시소러스 모델을 제안한다. 이 시소러스 모델에서는 색인어간의 관련도를 정성적으로 표현하기 위해 퍼지 집합 이론에 근거한 언어적 설명자들을 정의한다. 언어적 설명자들은 존재론적 문제가 고려되고 다분히 인식론적인 표현에 근거한다.

  • PDF

시소러스를 이용한 온톨로지의 Is-a 관계 설정 (Identification of Is-a Relation in Ontology based on Thesaurus)

  • 황금하;이신목;남윤영;신지애;최기선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.20-23
    • /
    • 2006
  • 시소러스의 개념과 개념간 계층관계가 온톨로지 구축에 흔히 이용되고 있다. 다만 시소러스 계층관계는 is-a관계 뿐만 아니라 세분화되지 않은 관계도 포함되고 있기 때문에, 온톨로지의 기본 관계인 is-a관계를 분별하는 작업이 필요하다. 본 논문은 개념의 어휘표현 정보를 이용하여 온톨로지의 is-a관계를 설정하는 규칙을 제시하였고, 개념의 정의문 정보를 이용하여 is-a관계를 검수하는 방법을 제안하였다. IT분야 시소러스에 대한 is-a관계 설정 실험결과, 어휘표현 정보를 이용한 규칙 기반 is-a관계 설정은 85.83%의 정확도를 보였고, 정의문 정보를 이용한 is-a관계 판단의 일관성 평가 결과 일치도가 86.44%였다.

  • PDF

시소러스범주정보를 이용한 질의응답시스템 (A Question Answering System Using the Information of the Category Information of Thesaurus)

  • 김수민;백대호;김상범;임해창
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.179-183
    • /
    • 2000
  • 정보검색시스템은 사용자의 질의를 입력받아 사용자가 원하는 정보를 검색해주는 시스템을 의미한다. 그러나, 대부분의 정보검색시스템은 단어와 연산자의 조합으로 이루어진 질의를 입력받아 문서를 검색해 주고, 사용자는 그 문서들 중에서 원하는 정보를 다시 찾아내야 한다. 본 논문에서는 영어 자여어질의를 입력 받아 사용자가 원하는 정보에 좀 더 근접한 형태의 답으로서 제한된 길이의 짧은 답을 제시하는 시스템을 구현한다. 시스템은 크게 질의분석단계, 문서검색 및 분석단계, 정보추출단계의 세 단계로 나눌 수 있다. 사용자 질의분석단계에서는 의문사 정보와 오토마타, 시소러스 범주 정보를 이용하여 질의에 대한 정답이 될 수 있는 단어의 속성을 예측하였다. 문서분서단계에서는 정답이 될 수 있는 단어의 후보를 선정하기 위해서 시소러스의 범주정보를 사용하였고, 선정된 정답후보중에서 정답을 추출하기 위해 각 후보단어의 질의단어와의 평균거리가중치, 범주간유사도, 공기질의어비율을 사용하였다. 실험을 통해 평균거리가중치만을 이용하는 것 보다 범주간유사도와 공기질의어비율을 함께 이용하는 것이 성능의 향상을 보였다.

  • PDF

시소러스 데이터의 저장과 검색을 위한 효율적인 저장 시스템의 설계 및 구현 (Design and Implementation of Efficient Storage System for Storing and Searching Thesaurus Data)

  • 김점숙;안동언;정성종
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2000년도 한글 및 한국어 정보처리
    • /
    • pp.205-209
    • /
    • 2000
  • 본 논문에서는 시소러스를 효율적으로 구축하고 사용할 수 있는 시소러스 저장 구조를 구현하였다. 정보 검색 시스템은 사용자의 질의어를 용어들과 용어들 사이에 관계 집합으로 구성된 일종의 용어 사전인 시소러스를 이용하여 문헌에 대한 색인과 검색을 정확하고 통제된 용어 형태로 바꾸어 색인과 검색 작업의 효율을 높인다. 데이터베이스에 저장된 시소러스 구조에서 시소러스 검색을 할 때 속도가 감소하는데 이를 해시함수를 이용한 리스트 구조를 이용함으로써 전체적인 시소러스 검색 속도의 증가를 기대할 수 있다. 또한 현재 데이터베이스 형태의 시소러스를 다른 곳에 이식하려면 데이터베이스 시스템이 있어야 한다. 따라서 메모리에 올릴 수 있는 구조를 가지면 시소러스 보급에 기여할 수 있다. 본 논문에서 제안한 데이터베이스에 저장된 시소러스 구조와 해시함수를 이용한 리스트 구조를 비교, 분석하고 보다 더 효율적인 시소러스의 역할 및 구조 형태에 대해 제안한다.

  • PDF

지능형 정보검색을 위한 지식 기반 시소러스 (A Knowledge Based Thesaurus for Intelligent Information Retrieval)

  • 정정호;김민구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1998년도 가을 학술발표논문집 Vol.25 No.2 (2)
    • /
    • pp.12-14
    • /
    • 1998
  • 지식구조로 시소러스를 이용하는 기존의 정보검색 시스템들이 사용자에게 만족할 만한 검색결과를 제시하지 못하고 있다. 이것은 기존의 정보검색 시스템들이 이용하고 있는 시소러스 구조가 사람의 지식구조와 다르고, 시소러스를 이용하는 검색 방법이 사람의 검색 방법과 차이가 있기 때문이다. 본 논문에서는 어떤 분야의 인간 전문가가 해당분야에 관한 전문지식이 없는 일반인이 필요로 하는 정보를 찾아주는 방법을 모델링한 지능형 정보검색 시스템을 개발하기 위하여 인간 전문가의 지식구조를 모방한 시소러스 구조를 설계하였고, 인간 전문가의 검색 방법을 모방한 검색 방법을 고안하였다. 설계된 시소러스 구조에는 인간 전문가의 지식구조 내에 표현되어 있는 여러 종류의 관계들이 포함되어있고, 고안된 검색방법은 관련도를 사용자의 질의어와 확장된 색인어 사이의 관계의 종류를 추론한 결과와 거리 단계를 고려하여 평가한다.

  • PDF

시소러스와 토픽맵의 연관성 연구 (A Study on the Association between Thesaurus and Topic Map)

  • 남영준
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2005년도 제12회 학술대회 논문집
    • /
    • pp.403-408
    • /
    • 2005
  • 현재 정보검색분야에서는 검색도구로써 시소러스가 갖는 장점에도 불구하고 기존에 개발된 시소러스의 유지관리와 활용이 극히 제한적으로 이루어지고 있기 때문이다. 왜냐하면 정보의 급격한 증가로 인하여 전통적인 시소러스의 구조와 유지관리, 활용기법으로는 현대 정보의 홍수 현상에 적극적으로 대처하는데 한계에 직면하였기 때문이다. 이러한 한계점을 극복하기 위해 토픽맵의 구축알고리즘이 절대적으로 필요하였다. 이에 따라 본 연구에서는 토픽맵의 기본요소인 토픽과 대상물, 연관관계, 토픽타입 등을 이용한 시소러스 구조화 알고리즘을 제안하였다. 특히 토픽맵의 기본 요소가운데 대상물(occurrence)은 시소러스의 검색효율가운데 정도율의 확보를 가능하게 하며, 시소러스의 구축에 필요한 지식베이스의 역할을 수행하는 주요한 기법임을 확인하였다.

  • PDF

객체지향 시소러스를 RDF Schema로 변환하기 위한 매핑 구조의 설계 및 구현 (Design of Mapping Structure and Implementation to transform Object-Oriented Thesaurus into RDF Schema)

  • 양경아;방선이;양재동
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
    • /
    • pp.289-291
    • /
    • 2002
  • 본 논문에서는 객체지향 패러다임의 구조적 특성을 적용하여 만든 시소러스를 이용하여 웹 자원의 의미적 연관성을 RDF 형식으로 표현할 수 있는 RDF 문서 자동 생성기를 소개한다. 객체지향 시소러스를 RDF 형식으로 나타내기 위해 시소러스에 사용된 객체와 관계의 내용을 명세한 네임 스페이스를 정의하여 시맨틱 웹에서 메타데이타를 기술하는 표준이 되는 RDF와 RDF Schema 형식으로 매핑할 수 있다. 이러한 연구를 통해 객체지향 시소러스의 내용을 RDF 형식으로 표현함으로써 지식베이스(KnowledgeBase)라 불리는 온톨로지를 생성할 수 있으며, 구축된 온톨로지는 시맨틱 웹 상의 에이전트나 다른 어플리케이션에 응용될 수 있다.

  • PDF

동적 시소러스와 GA을 이용한 개별화된 E-Mail1 분류시스템 (PECS) (Personalized I-Mail Classification System Using Dynamic Thesaurus and Genetic Algorithm)

  • 안희국;노희영
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 봄 학술발표논문집 Vol.29 No.1 (B)
    • /
    • pp.472-474
    • /
    • 2002
  • 본 논문에서는 전자메일을 사용자 적합도(선호도)를 기준으로 분류하기 위한 구조를 제안한다. 분류는 1차 분류와 2차 분류로 나눠지는데, 1차 분류에서는 사용자 적합도를 판단하기 위해 사용자 관련 정보로부터 동적 시소러스를 구축하고, 구축된 시소러스와의 비교를 통해 사용자에게 유용한 메일인지 아닌지를 결정하고, 2차 분류에서는 사용자가 지정한 폴더키워드를 중심으로 사용자 시소러스로부터 유전자 알고리즘을 이용해 추출한 키워드들과의 적합도 비교를 통해서 특정 폴더로의 분류가 이뤄지게 된다 테스트에는 메일 정보값(Mail Information Word)을 추출하기 위해 HAM(Hangup Analysys Module)을 포함하는 메일정보추줄 에이전트를 사용하였고, mail의 subject와 본문(body)로부터 추출된 16개의 word정보와 시소러스 적합도 정보, 분류 적합도 정보를 하나의 데이터구조로 사용하였다. 이러한 통할된 시스템 구조와 data structure를 이용해 mail을 사용자의 선호도에 따라. 1차와 2차에 걸친 분류시 분류가 사용자 선호도에 근접하게 이루어 질 수 있음을 확인하였다.

  • PDF

정보검색에서 시소러스를 이용한 효율적이고 효과적인 질의 평가 방법 (Efficient and Effective Query Evaluation Method based on Thesaurus in Information Retrieval)

  • 최명복;김민구
    • 한국지능시스템학회논문지
    • /
    • 제10권6호
    • /
    • pp.605-615
    • /
    • 2000
  • 본 논문에서는 정보검색에서 시소러스를 이용한 효율적이고 효과적인 질의 평가 기법을 제안한다. 제안된 방법에서 시소러스 내부 용어들 간의 관계와 관련도가 용어 매트릭스로 표현되며, 용어들 간의 관계는 동의, 계층, 그리고 연관관계의 세 가지 관계가 제공된다. 시소러스 내부 용어들 간의 무시된 관련도가 퍼지 이론에 근거한 용어 매트릭스의 전이폐쇄 알고리즘에 의해 추론된다. 따라서 다양한 관계에 따른 시소러스에 표현된 지식을 이용할 수 있다. 또한 질의 평가시 용어 매트릭스를 이용하기 때문에 논문[3-7]에서 사용되는 방법보다 시간적으로 효율적이다. 그리고 정의된 용어 매트릭스는 논문[8]에서 발생되는 문제점을 제거하여 검색 효과를 높이기 위해 논문[6]에서 제안된 질의 평가함수와 용이하게 통합시킨다.

  • PDF