• Title/Summary/Keyword: 용어 관계설정

Search Result 49, Processing Time 0.021 seconds

A Study on the Effects of Application of Relational Attribute on Construction of Structured Glossary - A Semantic Analysis of Legal Terminology (구조적 용어사전 구축에서 법률용어 성분분석을 통한 관계속성 지정의 효과에 관한 연구)

  • Jo, La-Hyoun
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2014.08a
    • /
    • pp.135-141
    • /
    • 2014
  • 본 연구는 법률명 용어의 의미적 성분분석을 통해 '보충적 관계속성'을 도출하고, 이를 구조적 용어사전의 관계속성 설정에 적용하였을 때 용어관계에 나타나는 효과를 확인하는 것을 목적으로 한다. '보충적 관계속성'이란 클래스(범주)별 용어들이 가지는 특징에 기반하여 만든 관계속성을 말하며, 용어사전 구축 시 도출한 관계속성을 반영함으로서 용어 간 관계가 유기적이고 명확하게 표현될 수 있도록 하는 보조적 구축지침의 역할을 하도록 한다. 이를 위해 법원도서관 '법률용어 관련어집의 316개 용어쌍을 분석하여 '보충적 관계속성'을 도출하였으며, 구조적 용어사전 용어에 적용하여 밀도 값과 밀도의 정도를 시각화하여 효과를 확인하였다. 그 결과, '보충적 관계속성' 전, 후의 변화는 적었으나 이는 법률명 용어의 특징으로 인한 결과라는 것을 알 수 있었고, '보충적 관계속성' 반영의 명확한 효과 확인을 위해서는 분석대상용어를 법률명에서 법률관련용어로 확장시켜 연구할 필요성을 확인하였다.

  • PDF

A Study on the Extend Guideline for the Equivalence Relationship in Thesaurus (대등관계 설정의 확장 지침에 관한 연구)

  • 남영준
    • Journal of the Korean Society for information Management
    • /
    • v.21 no.2
    • /
    • pp.1-21
    • /
    • 2004
  • For the guarantee of retrieval ratio, thesaurus's maintenance for descriptors are necessary. To maintain the optimum scale of thesaurus, new terms and existing terms should be structured to the equivalence relationship. Therefore, equivalence relationships are needed to new standard. This study proposes new standard of the equivalence relationships, which is more specified for better guarantee of retrieval ratios. The relationships have seven facets. These six facets will be used as new knowledge-base, which could be reestablished between the descriptors.

Construction of Thesaurus Using "The Korean Standard Dictionary" ("표준국어대사전"을 이용한 시소러스 구축)

  • Han, Sangkil
    • Journal of Korean Library and Information Science Society
    • /
    • v.44 no.4
    • /
    • pp.233-254
    • /
    • 2013
  • Collecting terms in thesaurus construction work is the most difficult. A dictionary is thesaurus can be used as an excellent term acquisition. Reflect faithfully the provisions of Korean literary "Standard Korean Dictionary" is a standard dictionary of the Korea. The "Standard Korean Dictionary" is simply the definition of entry, as well as a wide range of information about the term because it contains a systematic, it can be used to build a thesaurus. In this study, the "Standard Korean Dictionary" has the relevant information using a variety of terms, it is defined as the thesaurus term relationship. In addition, the separation of the term, equal relationships and hierarchical set of relationships, the use of qualifiers, North Korean issues, the issue presented in thesaurus construction, and suggest ways to solve the problem.

Pattern Construction for Semantic Relation Extraction using Verb Information (동사 정보를 활용한 의미 관계 추출을 위한패턴 구축)

  • Kim, Se-Jong;Lee, Yong-Hun;Lee, Jong-Hyeok
    • Annual Conference on Human and Language Technology
    • /
    • 2008.10a
    • /
    • pp.118-123
    • /
    • 2008
  • 온톨로지란 실세계에 존재하는 사물 및 개념, 그리고 용어들 간의 관계들을 컴퓨터가 이해할 수 있는 형태로 표현한 것이다. 온톨로지 구축에 있어서 대용량 코퍼스의 활용은 해당코퍼스에서 등장하는 용어들과 이들 사이에서 나타나는 문자열을 일종의 패턴으로 취급하여 특정 패턴과 함께 나타나는 용어 쌍들을 해당 패턴이 대표하는 의미 관계로 설정하는 방식을 취한다. 그러나 기존의 방법은 주로 두 용어들 사이에서 나타나는 문자열만을 고려하여 패턴을 추출하기 때문에 해당 문장에 포함된 보다 다양한 문장 정보들을 활용할 수 없다. 본 논문은 이러한 한계점을 감안하여, 용어 쌍 사이에서 나타나는 문자열과 주변 동사 정보를 함께 고려함으로써 패턴의 정교성을 향상시키는 방법을 제안한다. 또한 동사들의 동의어를 활용하여 다양한 용어들을 포괄할 수 있는 일반화된 패턴을 구축한다. 본 방법론은 is-a 관계의 경우 64%, part-of 관계의 경우 83%, made-of 관계의 경우 73%, use 관계의 경우 72%의 정확률을 보였으며 모두 기존 방법보다 향상된 결과를 가져왔다.

  • PDF

Automatic construction of thesaurus using natural language processing (자연어처리를 이용한 시소러스 자동생성)

  • 남영준;이두영
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 1994.12a
    • /
    • pp.89-92
    • /
    • 1994
  • 시소러스를 구축하기 위해서는 해당분야의 심도깊은 이해와 지식이 필요하다. 특히, 디스크립터의 선정과 디스크립터의 관계설정은 시소러스 개발자의 주관적인 판단에 따라 이루어지게 된다. 그러나 디스크립터의 선정은 자동색인분야의 연구로서 어느 정도 객관화가 가능하지만, 디스크립터개념간의 관계설정은 개발자의 주관에 전적으로 의존하게 된다. 본 논문은 자연어처리방법과 문헌내 용어출현빈도를 근거로 기계를 이용한 디스크립터간의 관계 설정방안을 제시하고 그 가능성을 조사하였다.

  • PDF

Construction of Ontology for River GeoSpatial Information (하천공간정보의 온톨로지 구축방안 연구)

  • Shin, Hyung Jin;Shin, Seung Hee;Hwang, Eui Ho;Chae, Hyo Sok
    • Proceedings of the Korea Water Resources Association Conference
    • /
    • 2015.05a
    • /
    • pp.627-627
    • /
    • 2015
  • 기존 물관련 시스템들은 독자적인 DB 구조를 가지고 있고 검색 서비스는 자체 시스템의 DB를 직접 접근하여 사용자에게 결과를 제시하는 형식이다. 이러한 서비스의 단점은 사용자가 개별 시스템의 서비스에 대한 지식이 없으면 접근하기 어렵다는 점이다. 개별 시스템의 개별 서비스의 개념을 벗어나기 위하여 물관련 시스템에 있는 하천공간자료 검색 정보를 카탈로그 서버에 등록하고, 카탈로그 서버에 등록된 검색정보를 사용자가 검색하는 방식을 적용하고자 한다. 카탈로그 서버에 자료에 대한 정보를 등록할 때 자료의 정보를 어떻게 기술할 것인가의 문제가 발생한다. 개별 서버마다 등록하게 된다면 용어 및 문화에 의한 차이로 같은 개념을 다른 용어로 등록하게 되는 혼란이 발생할 소지가 있다. 예를 들어 강우자료에 대하여 "강우", "Precipitation", "Railfall", "비" 등으로 등록할 소지가 있다. 이러면 실제 자료가 존재하는 데도 등록 방법에 따라 자료의 검색이 어려워진다. 이러한 상황을 제어하기 위하여 검사어휘(Controlled Vocabulary)를 도입한다. 이는 포털의 운영자가 미리 용어의 개념과 용어의 분류체계를 설정하고 등록 자료의 검색어를 미리 설정하여 자료의 원천 소유자가 자료를 등록 시 검사어휘를 참고하여 등록하거나 또는 등록되지 않는 용어의 자료인 경우 이 용어를 포탈에 신규로 등록한다. 검색용어의 난립을 피하기 위하여 사용자의 신규등록은 포탈의 운영자가 어느 정도 제어할 필요가 있다. 검사어휘의 정립과 하천 관련된 분류체계는 하천공간정보 검색의 포탈을 위한 필수사항이다. 검사어휘의 정립의 주된 목적은 이질성의 극복이다. 이질성의 종류는 문법적 이질성, 데이터 형식과 구조 및 문맥적 이질성이 있다. 이 중에서 문맥적 이질성이 가장 넓고 어려운 문제이다. 단위는 분야마다 호칭이 다르고 채택하는 기준마다 다르다. 유사어는 전문용어라도 분야마다 다르다. 우리나라에서 서비스 인코딩시 국어와 영어를 어떻게 처리할 지에 대한 대책도 필요하다. 수문학의 시계열 자료를 다루는 CUAHSI/HIS의 온톨로지는 대 개념으로 물리학적, 화학적 및 생물학적인 분야로 분류하고 있다. 하천공간정보의 온톨로지 구축을 위해 데이터 분석 및 분류, 온톨로지 요소 설정, 온톨로지 데이터 테이블 작성, 클래스 생성 및 계층화, 클래스 계층화에 따른 속성 설정, 클래스에 적합한 개체 삽입, 논리 관계 확인 및 수정과 같은 과정으로 온톨로지 개발을 진행하고자 한다.

  • PDF

Semantic Relation Extraction using Pattern Pairs Sharing a Term (용어를 공유하는 패턴 쌍을 이용한 의미 관계 추출)

  • Kim, Se-Jong;Lee, Yong-Hun;Lee, Jong-Hyeok
    • Journal of KIISE:Computing Practices and Letters
    • /
    • v.15 no.3
    • /
    • pp.221-225
    • /
    • 2009
  • Constructing an ontology using a mass corpus begins with an automatic semantic relation extraction. A general method regards words appearing between terms as patterns which are used to extract semantic relations. However, previous approaches consider only one sentence to extract a pattern, so they cannot extract semantic relations for terms in different sentences. This paper proposes a semantic relation extraction method using pairs of patterns sharing a term, where each pattern is extracted using one of the seed term pair satisfying the target relation. In our experiments, we achieved the accuracy 83.75% improving previous methods by 7.5% in is-${\alpha}$ relation and the accuracy 83.75% improved by 5% in part-of relation. We also present a possibility of improving the recall by the relative recall.

표준의 중요성과 환경(물) 표준화

  • 최형기
    • Proceedings of the Membrane Society of Korea Conference
    • /
    • 2004.05b
    • /
    • pp.9-31
    • /
    • 2004
  • 1. 표준화의 정의 - 표준화(Standardization)란 일반적으로 '사물에 합리적인 기준(standard)을 설정하고 다수의 사람들이 어떤 사물을 그 기준에 맞추는 것을 말함. - 산업규격 KS A 3001(품질관리용어)에 따르면 '표준을 합리적으로 설정하여 활용하는 조직적 행위'라고 정의함. ISO/STACO-1961에서는 '관계되는 모든 사람들의 편익을 목적으로 하는 특정한 활동을 향해 바르게 접근하기 위한 규칙을 작성하고 이를 적용하는 과정'으로 정의함(중략)

  • PDF

A Study on the Development of Thesaurus Using Terminological Definitions (용어 정의를 도입한 시소러스 개발 연구)

  • 김태수
    • Journal of the Korean Society for information Management
    • /
    • v.18 no.2
    • /
    • pp.231-254
    • /
    • 2001
  • As contemporary thesauri have become large and complex, it is increasingly difficult to assess the intended meaning of each one of the terms. Thereby the meaning of many descriptors seems to be very similar, and it is often not possible to distinguish among them and to identify the term correctly. Purpose of this article is to induce definitions of descriptors in thesaurus by specifying the characteristics of each concept, locating it in the domain and providing clear and prescriptive information on the meaning of each descriptor in the form of a standardized terminological definition. In this study, a small prototype thesaurus using definition of term in the field of information industry in Korean Standards has been developed. In this thesaurus definitions are written for each descriptor with the help of a proposed defining model and in accordance with defining rules borrowed from the field of terminology. In addition, elements of analyzed definition have been included in the relation structure of descriptors. It is revealed that terminological definition added to thesaurus may permit extraction of separate items of information from definitions for the representation of knowledge structures and makes it easier to confine the scope of descriptors to be included in thesaurus in a given subject field.

  • PDF

Determining the Specificity of Terms using Compositional and Contextual Information (구성정보와 문맥정보를 이용한 전문용어의 전문성 측정 방법)

  • Ryu Pum-Mo;Bae Sun-Mee;Choi Key-Sun
    • Journal of KIISE:Software and Applications
    • /
    • v.33 no.7
    • /
    • pp.636-645
    • /
    • 2006
  • A tenn with more domain specific information has higher level of term specificity. We propose new specificity calculation methods of terms based on information theoretic measures using compositional and contextual information. Specificity of terms is a kind of necessary conditions in tenn hierarchy construction task. The methods use based on compositional and contextual information of terms. The compositional information includes frequency, $tf{\cdot}idf$, bigram and internal structure of the terms. The contextual information of a tenn includes the probabilistic distribution of modifiers of terms. The proposed methods can be applied to other domains without extra procedures. Experiments showed very promising result with the precision of 82.0% when applied to the terms in MeSH thesaurus.