• 제목/요약/키워드: 용어 관계설정

검색결과 49건 처리시간 0.032초

구조적 용어사전 구축에서 법률용어 성분분석을 통한 관계속성 지정의 효과에 관한 연구 (A Study on the Effects of Application of Relational Attribute on Construction of Structured Glossary - A Semantic Analysis of Legal Terminology)

  • 조라현
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2014년도 제21회 학술대회 논문집
    • /
    • pp.135-141
    • /
    • 2014
  • 본 연구는 법률명 용어의 의미적 성분분석을 통해 '보충적 관계속성'을 도출하고, 이를 구조적 용어사전의 관계속성 설정에 적용하였을 때 용어관계에 나타나는 효과를 확인하는 것을 목적으로 한다. '보충적 관계속성'이란 클래스(범주)별 용어들이 가지는 특징에 기반하여 만든 관계속성을 말하며, 용어사전 구축 시 도출한 관계속성을 반영함으로서 용어 간 관계가 유기적이고 명확하게 표현될 수 있도록 하는 보조적 구축지침의 역할을 하도록 한다. 이를 위해 법원도서관 '법률용어 관련어집의 316개 용어쌍을 분석하여 '보충적 관계속성'을 도출하였으며, 구조적 용어사전 용어에 적용하여 밀도 값과 밀도의 정도를 시각화하여 효과를 확인하였다. 그 결과, '보충적 관계속성' 전, 후의 변화는 적었으나 이는 법률명 용어의 특징으로 인한 결과라는 것을 알 수 있었고, '보충적 관계속성' 반영의 명확한 효과 확인을 위해서는 분석대상용어를 법률명에서 법률관련용어로 확장시켜 연구할 필요성을 확인하였다.

  • PDF

대등관계 설정의 확장 지침에 관한 연구 (A Study on the Extend Guideline for the Equivalence Relationship in Thesaurus)

  • 남영준
    • 정보관리학회지
    • /
    • 제21권2호
    • /
    • pp.1-21
    • /
    • 2004
  • 시소러스가 적정한 검색효율을 유지하기 위해서는 등재된 디스크립터에 대한 지속적인 유지관리가 필수적이다. 시소러스의 규모를 적정하게 유지하기 위해서는 신규용어와 기존용어를 우선적으로 대등관계로 처리해야 한다. 따라서 전통적인 동의어 이외에도 여러 관계에 대한 새로운 대등관계선정기준이 요구된다. 본 연구는 기존의 대등관계 설정기준을 좀 더 세분하여 보다 효율적인 시소러스 역할을 수행할 수 있는 방안을 제시하였다. 대등관계로 설정할 수 있는 기준을 전통적인 동의어 관계를 비롯하여, 유사동의어, 전거어, 대립어 등도 대등관계로 설정될 수 있음을 제안하였다. 본 연구에서 제안한 대등관계는 여섯가지 국면(facet)으로 기준을 정하였으며, 이 기준은 검색효율을 위해 용어 관계의 재정립을 위한 지침으로 활용될 수 있다.

"표준국어대사전"을 이용한 시소러스 구축 (Construction of Thesaurus Using "The Korean Standard Dictionary")

  • 한상길
    • 한국도서관정보학회지
    • /
    • 제44권4호
    • /
    • pp.233-254
    • /
    • 2013
  • 시소러스 작성에 있어서 가장 현실적인 어려움은 용어의 수집에 있다. 용어사전 뿐만 아니라 어휘사전도 시소러스의 중요한 용어 수집원으로 사용될 수 있다. "표준국어대사전"은 어문 규정을 충실히 반영한 우리나라의 대표사전이다. 또한 "표준국어대사전"은 단순히 표제어에 대한 용어 정의뿐만 아니라 해당 용어에 대한 다양한 정보를 체계적으로 담고 있기 때문에, 이를 시소러스 사전 구축에 활용할 수 있을 것이다. 본 연구는 "표준국어대사전"이 갖고 있는 다양한 용어관계 정보를 시소러스 용어관계로 정의하는 방안을 모색하였다. 또한 용어의 분리, 동등관계와 계층관계의 설정, 한정어의 사용, 북한어 관계 등 시소러스 구축에서의 문제점과 해결 방안을 제시한다.

동사 정보를 활용한 의미 관계 추출을 위한패턴 구축 (Pattern Construction for Semantic Relation Extraction using Verb Information)

  • 김세종;이용훈;이종혁
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2008년도 제20회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.118-123
    • /
    • 2008
  • 온톨로지란 실세계에 존재하는 사물 및 개념, 그리고 용어들 간의 관계들을 컴퓨터가 이해할 수 있는 형태로 표현한 것이다. 온톨로지 구축에 있어서 대용량 코퍼스의 활용은 해당코퍼스에서 등장하는 용어들과 이들 사이에서 나타나는 문자열을 일종의 패턴으로 취급하여 특정 패턴과 함께 나타나는 용어 쌍들을 해당 패턴이 대표하는 의미 관계로 설정하는 방식을 취한다. 그러나 기존의 방법은 주로 두 용어들 사이에서 나타나는 문자열만을 고려하여 패턴을 추출하기 때문에 해당 문장에 포함된 보다 다양한 문장 정보들을 활용할 수 없다. 본 논문은 이러한 한계점을 감안하여, 용어 쌍 사이에서 나타나는 문자열과 주변 동사 정보를 함께 고려함으로써 패턴의 정교성을 향상시키는 방법을 제안한다. 또한 동사들의 동의어를 활용하여 다양한 용어들을 포괄할 수 있는 일반화된 패턴을 구축한다. 본 방법론은 is-a 관계의 경우 64%, part-of 관계의 경우 83%, made-of 관계의 경우 73%, use 관계의 경우 72%의 정확률을 보였으며 모두 기존 방법보다 향상된 결과를 가져왔다.

  • PDF

자연어처리를 이용한 시소러스 자동생성 (Automatic construction of thesaurus using natural language processing)

  • 남영준;이두영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 1994년도 제1회 학술대회 논문집
    • /
    • pp.89-92
    • /
    • 1994
  • 시소러스를 구축하기 위해서는 해당분야의 심도깊은 이해와 지식이 필요하다. 특히, 디스크립터의 선정과 디스크립터의 관계설정은 시소러스 개발자의 주관적인 판단에 따라 이루어지게 된다. 그러나 디스크립터의 선정은 자동색인분야의 연구로서 어느 정도 객관화가 가능하지만, 디스크립터개념간의 관계설정은 개발자의 주관에 전적으로 의존하게 된다. 본 논문은 자연어처리방법과 문헌내 용어출현빈도를 근거로 기계를 이용한 디스크립터간의 관계 설정방안을 제시하고 그 가능성을 조사하였다.

  • PDF

하천공간정보의 온톨로지 구축방안 연구 (Construction of Ontology for River GeoSpatial Information)

  • 신형진;신승희;황의호;채효석
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2015년도 학술발표회
    • /
    • pp.627-627
    • /
    • 2015
  • 기존 물관련 시스템들은 독자적인 DB 구조를 가지고 있고 검색 서비스는 자체 시스템의 DB를 직접 접근하여 사용자에게 결과를 제시하는 형식이다. 이러한 서비스의 단점은 사용자가 개별 시스템의 서비스에 대한 지식이 없으면 접근하기 어렵다는 점이다. 개별 시스템의 개별 서비스의 개념을 벗어나기 위하여 물관련 시스템에 있는 하천공간자료 검색 정보를 카탈로그 서버에 등록하고, 카탈로그 서버에 등록된 검색정보를 사용자가 검색하는 방식을 적용하고자 한다. 카탈로그 서버에 자료에 대한 정보를 등록할 때 자료의 정보를 어떻게 기술할 것인가의 문제가 발생한다. 개별 서버마다 등록하게 된다면 용어 및 문화에 의한 차이로 같은 개념을 다른 용어로 등록하게 되는 혼란이 발생할 소지가 있다. 예를 들어 강우자료에 대하여 "강우", "Precipitation", "Railfall", "비" 등으로 등록할 소지가 있다. 이러면 실제 자료가 존재하는 데도 등록 방법에 따라 자료의 검색이 어려워진다. 이러한 상황을 제어하기 위하여 검사어휘(Controlled Vocabulary)를 도입한다. 이는 포털의 운영자가 미리 용어의 개념과 용어의 분류체계를 설정하고 등록 자료의 검색어를 미리 설정하여 자료의 원천 소유자가 자료를 등록 시 검사어휘를 참고하여 등록하거나 또는 등록되지 않는 용어의 자료인 경우 이 용어를 포탈에 신규로 등록한다. 검색용어의 난립을 피하기 위하여 사용자의 신규등록은 포탈의 운영자가 어느 정도 제어할 필요가 있다. 검사어휘의 정립과 하천 관련된 분류체계는 하천공간정보 검색의 포탈을 위한 필수사항이다. 검사어휘의 정립의 주된 목적은 이질성의 극복이다. 이질성의 종류는 문법적 이질성, 데이터 형식과 구조 및 문맥적 이질성이 있다. 이 중에서 문맥적 이질성이 가장 넓고 어려운 문제이다. 단위는 분야마다 호칭이 다르고 채택하는 기준마다 다르다. 유사어는 전문용어라도 분야마다 다르다. 우리나라에서 서비스 인코딩시 국어와 영어를 어떻게 처리할 지에 대한 대책도 필요하다. 수문학의 시계열 자료를 다루는 CUAHSI/HIS의 온톨로지는 대 개념으로 물리학적, 화학적 및 생물학적인 분야로 분류하고 있다. 하천공간정보의 온톨로지 구축을 위해 데이터 분석 및 분류, 온톨로지 요소 설정, 온톨로지 데이터 테이블 작성, 클래스 생성 및 계층화, 클래스 계층화에 따른 속성 설정, 클래스에 적합한 개체 삽입, 논리 관계 확인 및 수정과 같은 과정으로 온톨로지 개발을 진행하고자 한다.

  • PDF

용어를 공유하는 패턴 쌍을 이용한 의미 관계 추출 (Semantic Relation Extraction using Pattern Pairs Sharing a Term)

  • 김세종;이용훈;이종혁
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제15권3호
    • /
    • pp.221-225
    • /
    • 2009
  • 대용량 코퍼스를 사용하여 온톨로지를 구축하는 것은 해당 코퍼스에서 등장하는 용어들과 이들 간의 의미관계를 보다 자동화된 방법으로 추출하는 것으로부터 시작한다. 이때 주로 사용하는 방법이 용어들 사이에서 나타나는 문자열을 일종의 패턴으로 취급하여 특정 패턴과 함께 나타나는 용어들을 해당 패턴에 할당된 의미 관계로 설정하는 방법이다. 하지만 기존의 패턴 기반 의미 관계 추출 방법은 한 문장만을 대상으로 패턴을 추출 및 적용하기 때문에 서로 떨어진 용어에 대한 의미 관계를 추출할 수 없다는 단점을 가지고 있다. 본 논문은 이러한 한계점에 착안하여, 의미 관계를 대표하는 각각의 용어를 하나씩 포함하고 기타 용어를 공유하고 있는 서로 떨어진 패턴 쌍을 추출하여 확장된 패턴을 생성하고 이를 의미 관계 추출에 적용하였다. 본 방법론은 is-${\alpha}$ 관계의 경우 기존 방법론 보다 7.5% 향상된 83.75%의 정확률을, part-of 관계의 경우에는 5% 향상된 동일한 83.75%의 정확률을 보였으며 상대적 재현율을 통해 실제 재현율의 향상 가능성도 함께 제시하였다.

표준의 중요성과 환경(물) 표준화

  • 최형기
    • 한국막학회:학술대회논문집
    • /
    • 한국막학회 2004년도 춘계 총회 및 학술발표회
    • /
    • pp.9-31
    • /
    • 2004
  • 1. 표준화의 정의 - 표준화(Standardization)란 일반적으로 '사물에 합리적인 기준(standard)을 설정하고 다수의 사람들이 어떤 사물을 그 기준에 맞추는 것을 말함. - 산업규격 KS A 3001(품질관리용어)에 따르면 '표준을 합리적으로 설정하여 활용하는 조직적 행위'라고 정의함. ISO/STACO-1961에서는 '관계되는 모든 사람들의 편익을 목적으로 하는 특정한 활동을 향해 바르게 접근하기 위한 규칙을 작성하고 이를 적용하는 과정'으로 정의함(중략)

  • PDF

용어 정의를 도입한 시소러스 개발 연구 (A Study on the Development of Thesaurus Using Terminological Definitions)

  • 김태수
    • 정보관리학회지
    • /
    • 제18권2호
    • /
    • pp.231-254
    • /
    • 2001
  • 특정 주제영역의 시소러스에 수록되는 디스크립의 의미 범위를 한정하고, 개념의 본질적인 속성을 제공하기 위해 정의를 도입하고, 정의를 구성하는 데이터요소를 정의모델에 따라 분석한 후, 이를 시소러스 관계구조로 표현하기 위한 연구이다. 이를 위해 한국산업규격(KS)의 정보산업분야에 수록된 용어정의 327개를 정의규칙과 정의모델에 따라 분석한 다음, 각 속성을 디스크립터의 관계구조로 표현한 시소러스를 실험적으로 구현하였다. 지금까지 시소러스 구축시 개발주체의 성격에 따라 디스크립터 수록범위와 관계구조의 설정을 달리해 왔다. 용어의 정의를 시소러스 구조에 도입하게 되면 각 디스크립터의 의미범위를 한정할 수 있고, 동시에 정의에 사용된 용어간의 의미관계를 디스크립터 관계고조로 표현할 수 있어, 의미범위와 관계구조의 표준화 가능성을 기대할 수 있다.

  • PDF

구성정보와 문맥정보를 이용한 전문용어의 전문성 측정 방법 (Determining the Specificity of Terms using Compositional and Contextual Information)

  • 류법모;배선미;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제33권7호
    • /
    • pp.636-645
    • /
    • 2006
  • 어떤 용어가 전문적인 개념을 많이 내포하고 있을 때 전문성이 높다고 말한다. 본 논문에서는 용어의 내부 구성정보와 외부 문맥정보를 이용하여 정보이론에 기반한 방법으로 전문용어가 내포하는 전문성을 정량적으로 계산하는 방법을 제안한다. 용어의 전문성은 용어간 상하위어 관계 설정에서 중요한 필요조건으로 사용될 수 있다. 제안한 방법은 전문용어의 내부 구성정보를 이용하는 방법, 문맥정보를 이용하는 방법 그리고 두 정보를 모두 이용하는 방법으로 나눈다. 구성정보를 이용하는 방법에서는 전문용어를 구성하는 단어의 빈도수, 가중치, 바이그램, 내부 수식구조 둥을 이용하고, 문맥정보를 이용하는 방법에서는 전문용어를 수식하는 단어들의 분포를 이용한다. 본 논문에서 제안한 방법은 분야에 독립적으로 적용될 수 있고, 전문용어 생성 절차에 대한 특정을 잘 반영할 수 있는 장점이 있다. MeSH 트리에 포함된 질병 이름의 전문성 값을 계산한 뒤 상위어의 전문성 값과 비교한 결과 82.0%의 정확률을 보였다.