• Title/Summary/Keyword: 시소러스 표준

Search Result 25, Processing Time 0.043 seconds

The Ambiguity Exclusion Using Definitions as Meaning Description of Descriptors (디스크립터의 의미기술로서 정의를 통한 애매성 제거)

  • Kim, Ji-Hun
    • Journal of Information Management
    • /
    • v.36 no.3
    • /
    • pp.97-126
    • /
    • 2005
  • Until now, the meaning of terms in most of thesauri has been indirectly presented through relationships and scope notes. However, as thesaurus has been expanded quantitatively, it has become difficult to understand meaning of terms clearly using those relationships and scope notes. Though some thesauri take the form of 'thesaurus dictionary' in order to present the meaning of descriptors, the contents and forms of provided definitions are not satisfying. As standardized definitions of terms integrate into thesaurus on the basis of necessity of definitions providing meaning of terms, this study has shown a possibility for further development of thesaurus.

Ontology Modeling of Thesaurus Using SKOS and LOD Publishing (SKOS를 이용한 시소러스의 온톨로지 모델링과 LOD 공개)

  • Hwang, Mi-Nyeong;Jeong, Do-Heon;Choi, Sung-Pil;Cho, Min-Hee;Jung, Han-Min
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2012.06c
    • /
    • pp.92-94
    • /
    • 2012
  • 시맨틱 웹은 인터넷 환경에서 지식을 표현하고 공유하기 위한 표준 기술들의 집합체이며, 온톨로지는 특정 지식 도메인의 용어와 용어 사이의 관계를 정의한 지식 표현체계이다. 본 연구에서는 시소러스를 SKOS 기반 온톨로지로 모델링하여 LOD로 공개하는 실제적 방법을 제시한다. 시소러스의 어휘 용어 체계와 의미 관계를 분석하고, 이 분석 결과를 활용하여 변환 방식을 정의한 후, SKOS 온톨로지를 생성하며, 그 결과를 DataHub에 등록함으로써 LOD에 공개된다. 과학기술 분야의 한 중 일 대역어와 유사어, 관계어 등의 시소러스를 SKOS 온톨로지로 변환한 데이터는 http://thedatahub.org/dataset/steak에서 확인할 수 있다.

A Study on Converting the Theological Thesaurus to the Ontology by Using SKOS (SKOS를 이용한 신학 시소러스의 온톨로지로의 변환에 관한 연구)

  • Yoo, Yeong-Jun
    • Journal of Korean Library and Information Science Society
    • /
    • v.43 no.3
    • /
    • pp.143-163
    • /
    • 2012
  • In order to convert a thesaurus described by a person to ontology, the first step is to translate the thesaurus to the ontology by using SKOS, which is suitable for conversion to ontology and was chose an international standard by W3C. SKOS is suitable for converting thesaurus or subject headings or classification system to ontology, but we need a web language to describe an ontology as RDF/XML. RDF/XML is so difficult to read and write that we can need RDFa embedded in HTML document or Turtle, which is more easily describable and readable. Along with description using SKOS, this research has experimentally constructed the ontology by using ontology construction program $Prot{\acute{e}}g{\acute{e}}$ 4.2. In addition to basic concept relationships of thesaurus like equivalent relationship, hierarchical relationships, association relationships transitive hierarchical relationships are included suggested by SKOS in this research.

Construction of Immunology Thesaurus and Ontology (면역학 시소러스 및 온톨로지 구축)

  • Im, Ji-Hui;Choe, Ho-Seop;Bae, Young-Jun;Ock, Cheol-Young;Choi, Sung-Pil;Sung, Won-Kyung;Park, Dong-In
    • Annual Conference on Human and Language Technology
    • /
    • 2005.10a
    • /
    • pp.21-27
    • /
    • 2005
  • 본 논문에서는 국가에서 추진하는 차세대신성장동력산업과 관련된 특정 분야('바이오 신약/장기' 분야 중 '면역 기능 제어')를 선택하여, 기구축된 면역학 전문용어사전을 비롯하여 의학용어사전, 표준국어대사전 등을 참조하여 핵심 용어와 관련 용어를 중심으로 면역학 시소러스(어휘 3,462개) 및 온톨로지(개념 노드 4,703개)를 구축하였다. 이것은 전문용어사전부터 온톨로지에 이르기까지 통일화된 표준 체계를 가지고 있으며, 도메인 온톨로지를 구축하여 향후 온톨로지 개발 방향을 설정할 수 있는 계기가 되었다고 할 수 있다. 또한 면역학 시소러스는 검색의 성능을 향상시킬 수 있도록 충분한 양의 데이터를 구축하였고 면역학 온톨로지는 언어처리적 관점에서의 온톨로지를 표현하였다. 이는 정보검색에서의 효율성을 비롯하여, 특정 웹 온톨로지 언어를 이용한 웹 온톨로지로의 변환성, 대규모 도메인 온톨로지라는 점에서 의미를 가진다고 할 수 있다.

  • PDF

Automatic English MeSH keywords assignment to Korean medical documents - spacing variant effect (한국어 의학 문서에 대한 영문 MeSH 키워드의 자동 부여 - 띄어쓰기 변이 처리 효과를 중심으로)

  • Lee, Jae-Sung;Kim, Mi-Suk;Lee, Young-Sung
    • Annual Conference on Human and Language Technology
    • /
    • 2004.10d
    • /
    • pp.82-89
    • /
    • 2004
  • 본 논문에서는 한국어 의학 논문의 요약문으로부터 자동 영문 MeSH 키워드 제안 시스템을 소개하고, 띄어쓰기 변이(spacing variant) 문제를 해결할 수 있는 방법을 제안한다. 띄어쓰기 변이란 표준 한글 맞춤법에 비해 다르게 띄어쓰기된 것을 말한다. 이를 위해 시소러스에는 생성 가능한 모든 띄어쓰기 변이 대신에 최대 띄어쓰기 어구만을 저장하고, 문서에서 K-MeSH 용어를 찾기 위해 음절단위 부분문자열 검색을 사용한다. 이 방법으로 한국어 의학 논문의 요약문에서 K-MeSH 용어를 추출한 후, TF-IDF 순위 함수를 이용하여 상위 10위내의 키워드를 저자가 선정한 영문 키워드와 비교한 결과 58%가 일치하였다. 이는 기존 방법에 비해 42%정도의 시소러스 크기가 축소되었고, 상위 10위내에서 영문 MeSH 키워드 추천 재현률이 약 7.8% 증가한 것으로 효과적인 방법임을 보여주었다.

  • PDF

Research to establish a road map for the standardization in military and commercial terminology (민·군규격용어 표준화를 위한 로드맵 구축 연구)

  • Park, jeong-ho;Choi, young-ho;Im, ik-soon;Jang, hyo-jun
    • Proceedings of the Korea Contents Association Conference
    • /
    • 2015.05a
    • /
    • pp.251-252
    • /
    • 2015
  • 본 연구는 국방규격서의 전문어, 오용어, 어문규정 및 순화어 미(未)준수 어휘를 추출, 정의 또는 순화어로 정제하는 맵핑구조를 제시, 민 군규격용어 표준화를 위한 정보업무 로드맵을 구축하여 민간용어와의 호환성 및 일관성을 유지할 수 있는 지원체계를 연구하였다. 대상 규격용어는 KS용어표준 원칙을 기본으로 한 신뢰도 평가와 텍스트 마이닝 (text mining)빈도분석을 이용하여 선정하였으며, 시소러스(thesaurus) 체계를 삽입, 개념기반 서비스의 확장성을 제시하였다. 이를 기반으로 산출된 규격용어 DB는 민간 및 국방 관련분야의 용어표준관리 정보체계에 검색 및 용어설명에 활용될 수 있다.

  • PDF

A Study on the Thesaurus-based Ontology System for the Semantic Web (시소러스를 기반으로 한 온톨로지 시스템 구현에 관한 연구)

  • Jeong, Do-Heon;Kim, Tae-Su
    • Journal of the Korean Society for information Management
    • /
    • v.20 no.3
    • /
    • pp.155-175
    • /
    • 2003
  • The purpose of the study was to construct a system based on the semantic web environment's ontology by utilizing the ontology schema derived from the facet-type Art and Architecture Thesaurus(AAT). The aforementioned ontology schema is based on the Web Ontology Language(OWL), which is being widely considered the standard ontology language for the W3C-centered semantic web environment. Also, the concepts were limited to terms within AAT'S Furniture Facet, and the system was tested using the Chair concept, which is a lower-level facet that has a diverse conceptual relationship and broad vocabulary base. The ontology system is capable of searching for concepts, while controlling the search results by always providing a 'Preferred term' for synonymous terms. In addition, the system provides the user with first, a relationship between the terms centered around the inquiry, and second, related terms along with their classification properties. Also, the system is presented as and application example of the ontology system that constructs a information system that intakes an Instance value and reproduces it into a RDF file. During this process, utilization of multiple ontologies was introduced, and the stored Instance value's meta-data elements were used.

Development and Automatic Extraction of Subcategorization Dictionary (하위범주화 사전의 구축 및 자동 확장)

  • 이수선;박현재;우요섭
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.179-181
    • /
    • 2000
  • 한국어의 통사적, 의미적 중의성 해결을 위해 하위범주화 사전을 구축하였다. 용언에 따라 제한될 수 있는 문형 패턴과 의미역(semantic roles) 정보의 표준을 정하여 이를 부가하였고 구축한 하위범주화 사전이 명사에 대한 의미를 갖고 있는 계층 시소러스 의미사전과 연동하도록 용언과 명사와의 의미적 연어 관계에 따라 의미마커를 부여했다. 논문에서 구현된 하위범주화 사전이 구문과 어휘의 중의성을 어느 정도 해소하는지 확인하기 위해 반자동적으로 의미 태깅(Sense Tagging)된 말뭉치와 구문분석된 말뭉치를 통해 검증 작업을 수행했다. 이 과정에서 자동으로 하위범주 패턴에 대한 빈도 정보나, 연어정보, 각 의미역과 용언의 통계적 공기 정보 등을 추출하여 하위범주화사전에 추가시켰다. 또한 여기서 얻은 정보를 기준으로 하위범주화 사전을 자동으로 확장하는 알고리즘을 적용하여 확장시켰다.

  • PDF

Similarity Computation for XML Document with Semantically Extended Tags (의미적으로 확장된 태그들을 이용한 XML 문서들의 유사성 계산.)

  • Song, In-Sang;Paik, Ju-Ryun;Kim, Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2006.11a
    • /
    • pp.369-372
    • /
    • 2006
  • XML(eXtensible Markup language) 사용의 급속한 증가는 웹에 존재하는 많은 양의 정보들을 XML기반 데이터로 생성하게 했으며 저장과 교환에 있어서 표준이 되도록 했다. 이는 사용자에 의한 임의의 태그정의를 가능하게 하는 XML 사용의 용이성에 기반한다. 그러나 이러한 장점은 비슷한 내용을 갖는 XML 문서에 대해서 사람들마다 개개의 태그이름과 구조를 사용한다는 문제점을 만든다. 따라서 유사한 의미를 가지고 있지만 서로 다른 문서로 분류된다. 이러한 점을 개선하기 위해 XML 문서 태그들 간의 벡터 스페이스 모델과 XML 데이터를 이용하여 시소러스를 구축하는 방법 등이 연구되고 제안되어 왔지만 아직 초보적인 단계이다. 본 논문에서는 XML 문서를 구성하는 태그들을 동의어로 확장하여 벡터를 생성하고 생성된 벡터를 가지고 태그들 간의 유사성을 체크하여 서로 다른 XML 문서들의 유사성을 수치적으로 계산한다.

  • PDF

Traveal Information Retrieval System based on Bridge XMDR (브리지 XMDR 기반의 여행정보 검색 시스템)

  • Kim Ik-Han;Kook Yoon-Kyu;Eum Young-Hyun;Jung Kye-Dong;Choi Young-Keun
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06c
    • /
    • pp.103-105
    • /
    • 2006
  • 최근 기업들은 분산된 조직과 각 조직의 목적에 따라 데이터베이스도 분산되어 있기 때문에 이들 간의 공유 및 협업을 통한 상호 운용성을 지원하기 어려우므로 일관적인 형태로 연동하기 위해서 메타데이터 수준의 표준이 필요하다. 또한 협업적인 거래환경에서의 EAI시스템은 다양한 정보 시스템에서 관리되는 지식들을 유기적으로 통합하고 공유함으로서 효율적인 검색 및 비용절감 등 많은 효과를 기대할 수 있다. 그러나 기존의 시스템은 특정 목적에 따라 관리되고 공유되므로 사실상 통합 외 공유에는 상당한 어려움이 있다. 따라서 본 논문에서 제시하는 XMDR은 온톨로지와 메타데이터 결합된 형태로 각종 표준들을 일관적인 형태로 온톨로지와 시소러스 개념을 도입함으로서 데이터수준의 정보를 통합 하기위한 메타데이터 공유 및 정보 시스템 통합의 일관성을 유지 할 수 있다. 본 논문에서 제시되는 브리지 XMDR 검색시스템은 원시데이터 계층, XMDR 계층. 브리지 XMDR 계층으로 3계층으로 구성된다. XMDR 계층은 분산된 데이터베이스의 속성표현의 표준과 관계성을 정의한 표준 온톨로지, 카테고리 분류 온틀로지, 사이트의 정보를 제공하는 로케이션 온톨로지로 구성되는 XMDR을 정의한다. 브리지 XMDR 계층은 XMDR간의 정보를 공유하기 위한 공유 도메인 속성을 추출한 하이브리드 통합방식으로 업무간의 의미적 통합이 가능하다.

  • PDF