• 제목/요약/키워드: thesaurus construction

검색결과 62건 처리시간 0.025초

시각화된 환경에서 다차원 관점을 지원하는 객체기반 패싯 시소러스 관리 시스템 모델의 정형화 및 구현 (A Data Model for an Object-based Faceted Thesaurus System Supporting Multiple Dimensions of View in a Visualized Environment)

  • 김원중;양재동
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권9호
    • /
    • pp.828-847
    • /
    • 2007
  • 본 논문에서는 패싯 분류에 기반하여 다차원 사용자 관점의 도메인 시소러스를 체계적으로 구축하고, 각 관점에 따라 시각화된 환경에서 시소러스를 브라우징, 항해 그리고 검색할 수 있는 다차원 관점객체기반 패싯 시소러스 시스템을 제안한다. 기존의 패싯 시소러스 시스템들과 달리, 본 시스템은 개념들간의 다각적인 상관 관계를 객체 지향 패러다임에 따라 자동으로 설정 구축할 수 있고, 브라우징과 항해를 통해 다차원 시소러스의 복잡한 개념 구조를 적절히 시각화할 수 있기 때문에, 시소러스의 유지 보수 관리가 용이하다. 다차원 브라우징 및 항해는 계층화된 패싯 용어들간의 조합으로 이루어진 패싯화된 시소러스를 필요시 동적으로 생성함으로써 이루어진다. 패싯화된 시소러스는 일종의 다차원 가상 시소러스 계층들로 볼 수 있다. 제안하는 방식에 의한 시소러스 자동 구축은 패싯들의 조합으로 새로운 차원의 시소러스를 용이하게 추가할 수 있기 때문에, 융통성 있는 시소러스 확장이 가능하고 대량의 시소러스 인스턴스들을 관점에 따라 적절한 해석을 부여하는 방식으로 구조화하기 때문에 개별적 사용자 관점에 부합되는 인스턴스들을 참조 질의에 의해 효율적으로 검색할 수 있다. 본 논문에서는 먼저 제안 시스템을 체계화하기 위한 모델을 정형화하고 이를 바탕으로 모델의 실용성을 입증하기 위해 그 프로토타입을 구현하였다.

토픽맵을 이용한 시소러스의 구조화 연구 (A Study on the Thesaurus Construction Using the Topic Map)

  • 남영준
    • 정보관리학회지
    • /
    • 제22권3호
    • /
    • pp.37-53
    • /
    • 2005
  • 시소러스의 효율성을 유지하기 위해서는 지속적인 용어 관리가 절대적으로 필요하다. 실제적으로 특정 주제영역의 정보와 키워드들은 생성과 분화, 소멸 과정 등이 동적으로 이루어지기 때문에 시소러스의 효율적인 관리가 매우 어려운 실정이다. 따라서 시소러스의 구조와 관리를 유연하게 수행할 수 있는 방안이 필요하다. 이에 따라 본 연구에서는 토픽맵의 기본요소인 토픽과 대상물, 연관관계 등을 활용하여 시소러스 관리를 위한 구조화 방안을 제안하였다. 한편 구조체계의 맵핑 알고리즘과 구조체계의 병합 알고리즘을 이용한 시소러스 기본관계와 세부관계 표현 방법도 제안하였다. 또한 토픽 타입을 이용한 연결중심문서를 기준으로 디스크립터의 확장과 디스크립터의 대치 방안을 제시하였다. 특히, 고정된 개념을 통한 이중 용어관리라는 새로운 방안도 개발하였다. 이는 시간과 공간의 비종속적인 개념을 표현하는 용어를 고정시키고, 해당 개념의 범주에 속하면서 외부의 정보적 상황에 따라 디스크립터를 자유롭게 선정하는 방법이다.

동사 어휘의미망의 반자동 구축을 위한 사전정의문의 중심어 추출 (The Extraction of Head words in Definition for Construction of a Semi-automatic Lexical-semantic Network of Verbs)

  • 김혜경;윤애선
    • 한국언어정보학회지:언어와정보
    • /
    • 제10권1호
    • /
    • pp.47-69
    • /
    • 2006
  • Recently, there has been a surge of interests concerning the construction and utilization of a Korean thesaurus. In this paper, a semi-automatic method for generating a lexical-semantic network of Korean '-ha' verbs is presented through an analysis of the lexical definitions of these verbs. Initially, through the use of several tools that can filter out and coordinate lexical data, pairs constituting a word and a definition were prepared for treatment in a subsequent step. While inspecting the various definitions of each verb, we extracted and coordinated the head words from the sentences that constitute the definition of each word. These words are thought to be the main conceptual words that represent the sense of the current verb. Using these head words and related information, this paper shows that the creation of a thesaurus could be achieved without any difficulty in a semi-automatic fashion.

  • PDF

SKOS를 이용한 신학 시소러스의 온톨로지로의 변환에 관한 연구 (A Study on Converting the Theological Thesaurus to the Ontology by Using SKOS)

  • 유영준
    • 한국도서관정보학회지
    • /
    • 제43권3호
    • /
    • pp.143-163
    • /
    • 2012
  • 개인이 구축한 시소러스를 온톨로지로 구축하기 위해서는 먼저 시소러스를 온톨로지로 변환하기 위해서 적합할 뿐만 아니라 W3C에서 국제표준으로 선택한 SKOS로 기술하는 것이 첫 번째 단계이다. SKOS는 시소러스나 주제명표, 분류체계 등을 온톨로지로 변환하는데 적합한 온톨로지이지만 온톨로지로 기술하려면 RDF/XML과 같은 언어가 필요하다. 그러나 RDF/XML은 읽고 쓰기에 어렵기 때문에 RDFa처럼 HTML에 내장할 수 있거나 훨씬 구조가 쉽고 기술하기도 간편한 Turtle기술 언어도 필요할 수 있다. SKOS로 기술한 것과 더불어 온톨로지 구축 프로그램인 $Prot{\acute{e}}g{\acute{e}}$ 4.2를 사용해서 시험적으로 8개의 클래스와 151개의 용어를 사용해서 온톨로지를 구축하였다. 이 온톨로지에는 시소러스의 기본 개념 관계인 동의관계, 계층관계, 연관관계 이외에도 SKOS에서 제안하는 전이 계층 관계의 사례도 포함시켰다.

Implementation of Annotation and Thesaurus for Remote Sensing

  • Chae, Gee-Ju;Yun, Young-Bo;Park, Jong-Hyun
    • 대한원격탐사학회:학술대회논문집
    • /
    • 대한원격탐사학회 2003년도 Proceedings of ACRS 2003 ISRS
    • /
    • pp.222-224
    • /
    • 2003
  • Many users want to add some their own information to data which was on the web and computer without actually needing to touch data. In remote sensing, the result data for image classification consist of image and text file in general. To overcome these inconvenience problems, we suggest the annotation method using XML language. We give the efficient annotation method which can be applied to web and viewing of image classification. We can apply the annotation for web and image classification with image and text file. The need for thesaurus construction is the lack of information for remote sensing and GIS on search engine like Empas, Naver and Google. In search engine, we can’t search the information for word which has many different names simultaneously. We select the remote sensing data from different sources and make the relation between many terms. For this process, we analyze the meaning for different terms which has similar meaning.

  • PDF

대학기록관 시소러스 구축 지침의 개발 연구 - 명지대학교 대학사료실의 사례를 중심으로 - (Study on the Development of Guidelines for Thesaurus Construction at University Archives: Case Study of Myongji University Archives Center)

  • 이해영;이미영;이은영;이혁준;이현정;최영실;박미자
    • 한국기록관리학회지
    • /
    • 제8권1호
    • /
    • pp.189-210
    • /
    • 2008
  • 이 논문에서는 대학기록관에서 사용되는 용어들을 통제하여 검색 효율성을 제고할 수 있는 시소러스 구축을 위한 지침을 개발하고 적용하는 과정에서 도출된 다양한 상황과 그에 대응하는 방안들을 제시하였다. 개발 과정에서 고려된 중요한 이슈 및 적용 방안은 다음과 같다. 대학 기록관 기록물 정리과정에서 도출된 용어들은 고유명사가 많아 시소러스는 전거파일 기능을 동시에 하도록 개발되어야 했다. 대학의 공식문서에 자주 나타나는 용어를 우선어로 제시하였다. 또한 포함될 인명의 범위는 주요 보직자 및 주제가 된 개인들로 하되, 작성자 및 기증자들의 필드 통합 검색이 가능하면 지나친 범주의 포함은 불필요했다.

A Korean Noun Semantic Hierarchy (Wordnet) Construction

  • Lee, Juho;Koaunghi Un;Bae, Hee-Sook;Park, Key-Sun
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2002년도 Language, Information, and Computation Proceedings of The 16th Pacific Asia Conference
    • /
    • pp.290-295
    • /
    • 2002
  • Since thesaurus is used as a knowledge resource in many natural language processing systems, it is very useful and necessary for the high quality systems, especially for dealing with semantics. In this paper, we introduce a semi-automatic method for the construction of Korean noun semantic hierarchy by utilizing a monolingual MRD and an existing thesaurus.

  • PDF

시소러스를 활용한 온톨로지 구축방안 연구 - 시소러스의 SKOS 변환을 중심으로 - (A Study of Ontology Construction Using Thesaurus: Transformation of Thesaurus into SKOS)

  • 한성국;이현실
    • 한국비블리아학회지
    • /
    • 제17권1호
    • /
    • pp.285-303
    • /
    • 2006
  • 본 연구에서는 시소러스를 SKOS 기반 온톨로지로 구축하는 단계적 변환 방법을 제시하였다. 변환과정을 3단계로 형식화하였고, 각 단계별 수행작업, 산출물 및 가이드 라인을 개발하였다. 각 단계는(1) 시소러스의 어휘 용어 체계와 의미 관계를 이해하기 위해 시소러스의 기초자료를 수집하고 분석한다. (2) 대상온톨로지의 분석결과를 활용하여 변환방식을 정의하고 SKOS 온톨로지를 생성한다. (3) 대상시소러스와 생성된 SKOS 온톨로지 사이의 형태와 의미 구조 보존 여부를 검사하여 보정하고 문서화한다. 본 연구에서는 제시하고 있는 시소러스 기반형 온톨로지 구축 방법은 복잡한 어휘 관계를 갖는 시소러스에도 적용이 가능하다. 향후, 본 연구에서 제시한 단계별 변환 알고리즘을 프로그램으로 구현하여 시소러스의 자동 SKOS 온톨로지 변환기를 구현하여야 할 것이다.

한국 주제명 표목의 패싯 유형 개발에 관한 연구 (A Study on Developing Facets for Subject Headings in Korea)

  • 최윤경;정연경
    • 한국문헌정보학회지
    • /
    • 제49권4호
    • /
    • pp.179-201
    • /
    • 2015
  • 주제명 표목은 키워드 검색 환경에서 정교한 주제 브라우징과 검색을 제공할 수 있는 도구이다. 본 연구의 목적은 기존 주제 접근 도구에서 적용된 다양한 패싯 유형을 분석하여, 우리나라 주제명 표목에 적용 가능한 패싯을 제안하는 것이다. 먼저, 문헌 연구에서는 지금까지 혼재된 주제와 패싯에 대한 개념을 종합적으로 고찰하고 정의하였다. 다음으로 사례 연구에서는 OCLC FAST와 PRECIS 제2판과 시소러스의 구축 지침인 "Thesaurus construction and use", 콜론 분류법 제7판, 블리스 서지 분류법 제2판, 국제십진분류법 제3판의 패싯 유형을 분석하였다. 분석 결과를 바탕으로 우리나라 주제명 표목에 적용 가능한 22개 패싯을 제안하였다. 상위 패싯으로 토픽, 사건, 장소, 시대, 개인명, 단체명, 표제명, 형식, 장르, 언어, 인물인 11개 패싯을 정의하고, 토픽 패싯은 하위에 토픽-사물/개체와 토픽-행동, 그리고 이 두 패싯의 하위로 부분, 종류, 전체, 속성, 물질, 수혜자, 산물, 부산물, 주체 패싯을 정의하였다.