• 제목/요약/키워드: 시소러스 기반 온톨로지

검색결과 35건 처리시간 0.019초

시소러스를 활용한 온톨로지 구축방안 연구 - 시소러스의 SKOS 변환을 중심으로 - (A Study of Ontology Construction Using Thesaurus: Transformation of Thesaurus into SKOS)

  • 한성국;이현실
    • 한국비블리아학회지
    • /
    • 제17권1호
    • /
    • pp.285-303
    • /
    • 2006
  • 본 연구에서는 시소러스를 SKOS 기반 온톨로지로 구축하는 단계적 변환 방법을 제시하였다. 변환과정을 3단계로 형식화하였고, 각 단계별 수행작업, 산출물 및 가이드 라인을 개발하였다. 각 단계는(1) 시소러스의 어휘 용어 체계와 의미 관계를 이해하기 위해 시소러스의 기초자료를 수집하고 분석한다. (2) 대상온톨로지의 분석결과를 활용하여 변환방식을 정의하고 SKOS 온톨로지를 생성한다. (3) 대상시소러스와 생성된 SKOS 온톨로지 사이의 형태와 의미 구조 보존 여부를 검사하여 보정하고 문서화한다. 본 연구에서는 제시하고 있는 시소러스 기반형 온톨로지 구축 방법은 복잡한 어휘 관계를 갖는 시소러스에도 적용이 가능하다. 향후, 본 연구에서 제시한 단계별 변환 알고리즘을 프로그램으로 구현하여 시소러스의 자동 SKOS 온톨로지 변환기를 구현하여야 할 것이다.

온톨로지 기반의 지능형 번역 에이전트를 이용한 실시간 번역 연구 (Using Machine Translation Agent Based on Ontology Study of Real Translation)

  • 김수경;김경아;안기홍
    • 한국지능정보시스템학회:학술대회논문집
    • /
    • 한국지능정보시스템학회 2006년도 춘계학술대회
    • /
    • pp.229-233
    • /
    • 2006
  • 기계번역(Machine Translaton, MT), 다국어 정보 검색, 의미 정보 검색 등에 대한 연구는 시소러스, 지식베이스, 사전 검색, 의미망, 코퍼스등과 같은 다양한 방법으로 이루어지고 있다. 시맨틱 웹이 등장과 시맨틱 웹 기반 기술의 발전에 따라 위 연구들을 시맨틱 웹에 적용시킬 필요성도 제안되었다. 특히 한국어 시소러스, 워드넷(WordNet), 전자 세종 사전, 가도까와(Kadokawa) 시소러스와 같은 지식베이스가 개발되었으나 활용 분야에 따라 그 구축 방법론이 다르게 적용되어, 위 연구에 효과적으로 통용될 수 있는 지식베이스는 실질적으로 구축되지 못한 실정이다. 따라서 본 연구에서는 세종 사전과 가도까와 시소러스, 한/일 기계 번역 사전 그리고 전문 용어 사전을 기반으로 한국어와 일본어 지식베이스를 위한 사전 온톨로지 서버를 정의하여 의미 정보를 구성하고, Semantic Web Rule Markup Language (이하 SWRL)을 이용해 구문 정보 규칙을 정의한다. 그리고 SWRL 기반 정방향 추론 엔진을 이용하여 번역에 필요한 추론 엔진을 구성하고 문장 구문형성 규칙 추론 엔진을 통해 사용자에게 한국어와 일본어의 문장 구성 변환을 제공한다. 본 연구는 현재 기계 번역이 갖고 있는 다의성, 술부 어순의 차이, 경어체 등 아직 해결해야 할 많은 부분들에 대한 해결 방안으로서 시맨틱 웹 기반 기술과의 활용방안을 제시하고자 한다.

  • PDF

ISO 25964-2를 기반으로 한 시소러스와 온톨로지 상호운용성 연구 - 행정부처명을 중심으로 - (Thesaurus and Ontology Based on ISO 25964-2: With a Focus on Administrative Departments Names)

  • 이혜원
    • 한국기록관리학회지
    • /
    • 제17권3호
    • /
    • pp.71-96
    • /
    • 2017
  • 2013년에 ISO 25964-2가 소개되었지만 지금까지 이에 대한 심층적인 분석이나 구체적인 활용 방안을 제시한 연구는 아주 미미하다. 본 연구에서는 ISO 25964-2에서 강조하고 있는 시소러스 상호운용성을 분석하고, 그 활용가능성을 살펴보았다. 구체적으로, 본 연구에서는 ISO 25964-2에서 제안한 개념 통합 방식인 매핑 유형을 분석하였다. 또한 ISO 25964-2의 매핑 유형을 확인하기 위해 온톨로지와의 연계 방안을 모색하고, 마지막으로 시소러스와 온톨로지의 상호운용성을 확인하기 위해 우리나라 행정부처의 기관명을 대상으로 한 온톨로지 모형을 시범적으로 설계하고 구축하였다.

시소러스와 온톨로지의 상호 호환성에 관한 연구 (A Study on the Interchangeability between a Thesaurus and an Ontology)

  • 조현양;남영준
    • 정보관리학회지
    • /
    • 제21권4호
    • /
    • pp.27-47
    • /
    • 2004
  • 본 연구에서는 다국어 시소러스에 수록된 디스크립터간의 관계를 온톨로지 언어로 표현하는 실험을 수행하였다. 대등관계는 equivalentClass와 equivalentProperty, sameAS 등으로, 그리고 연관관계는 ObjectProperty을 비롯하여 DatatypeProperty, inverseOf 등으로 표현할 수 있었다. 이러한 언어를 기반으로 실제 AAT에 배정된 디스크립터와 ICCD에서 구축한 다국어 시소러스의 디스크립터를 대상으로 디스크립터의 한글화 작업이 수행되었으며, 다국어간 개념일치를 위해 패싯개념이 시소러스 구조에 이용되었다. 본 연구를 통한 실험의 결과 다국어 시소러스를 온톨로지로 표현하기 위해서는 속성관련 온톨로지 언어를 사용하는 것이 가장 효과적임을 확인할 수 있었다.

역사용어 온톨로지 모형 적용 방안 연구 - 한국근현대사 인물을 중심으로 - (A Study on the Model of History Ontology: A Focus on Korean Modern Historical Person)

  • 이혜원;윤소영
    • 한국비블리아학회지
    • /
    • 제22권1호
    • /
    • pp.263-280
    • /
    • 2011
  • 본 연구에서는 역사인물 중심의 온톨로지를 구축하기 위해 기존의 한국역사용어시소러스의 문제점을 분석하는 동시에 한국역사용어시소러스 및 국편의 다양한 정보검색 시스템을 활용하는 전문가들의 인터뷰를 실시하였다. 한국역사용어시소러스의 개념 표현 기준과 전문가들이 작성한 마인드맵을 분석하여 현재 시스템과 전문가간의 정보 표현의 차이를 확인하였다. 이를 바탕으로 역사정보 이용자들의 정보요구에 부합하고 잠재력 있는 정보검색시스템에 적용할 역사용어 온톨로지 모형을 설계하였다. 본 연구에서는 먼저 클래스, 속성을 정의하고, 인스턴스 입력시 고려해야 할 점들을 나열함으로써, 역사정보가 갖는 고유한 특성들을 정리하였다. 또한 온톨로지의 장점인 개념 확장을 활용하여 역사정보의 다양한 특성들을 조합하고 이를 통해 새로운 정보를 제공할 수 있는 가능성을 제시하였다.

시소러스 구축을 위한 웹 기반 워크벤치 개발 (Development of Web-based Workbench for the Construction of Thesaurus)

  • 이승준;정한민;성원경;최광;이상헌;최석두
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2006년도 학술대회 1부
    • /
    • pp.999-1004
    • /
    • 2006
  • 본 연구에서는 다양한 개념 패싯과 관계 패싯들을 수용한 범용 과학기술 시소러스 구축용 웹 기반 워크벤치 개발에 대해 기술한다. 기존 국내 시소러스 구축용 워크벤치들이 제공하는 기본적인 용어 관계구축 기능을 확장하여 개념 패싯, 범주 관계 패싯, 의미역 관계 패싯, 속성 관계 패싯 및 속성 키워드 처리 기능을 원활히 제공할 수 있는 사용자 중심적 워크벤치를 개발함으로써 시소러스 상의 개념들에 대한 효율적인 구축이 가능하도록 한다. 또한 시멘틱 웹 상의 온톨로지 영역에 보다 근접한 고도화되니 시소러스 구축을 위해 용어들을 개념화시키고, 개념간의 다양한 관계를 설정하는 프로세스 중심적 설계로 분야 적합성이 높은 정보 처리 기반을 갖춘다. 궁극적으로 여러 마이크로 시소러스들을 통합하여 운용할 수 있는 복합 모델을 구축하는 것을 목표로 하고 있다. 이러한 목적에 부합하는 시스템 구현을 위해 CBD(Component Based Development) 개발 방법론으로 MSF/CD를 이용하였으며, 분산 환경에서 이기종간의 데이터 교환을 용이하게 하기 위하여 웹 서비스 (XML Web Services)를 이용하였다. 또한 시멘틱 웹 기반 연구자 간 협업 지원 서비스 구현을 위한 확장 검색용으로서도 활용할 수 있도록 하였다. 시소러스 반출은 CSV, XML 및 RDF를 모두 지원할 수 있도록 함으로써 다양한 사용자 요구 사항에 부합할 수 있도록 하였다. 시소러스 브라우징을 시각화 기반의 3단계 구조를 가진 플래시로 구현하여 사용자가 쉽게 시소러스를 탐색하고 분석할 수 있는 기반을 제공하였다. 또한 다양한 검색 요구를 만족시키고자 기본 검색, 고급 검색, 메타 검색을 선택할 수 있도록 하며, 개념 편집 및 시소러스 브라우징과 연동시켜 효율적인 시소러스 구축이 가능하도록 하였다. 본 연구의 워크벤치를 이용하여 구축된 시소러스는 기존 시소러스들에 비해 사용자가 보다 폭넓은 의미 기반 검색을 수행할 수 있도록 함으로써 다각적인 정보를 쉽게 획득할 수 있는 기반을 마련하고 있다는 데 의의가 있으며, 다국어 시소러스 및 다중 시소러스를 수용할 수 있는 방향으로 발전시킬 계획이다.

  • PDF

연구.학술정보 효율적 검색을 위한 온톨로지 기반의 주제 색인어 구조화 방안 연구 (A Study on Ontology-based Keywords Structuring for Efficient Information Retrieval)

  • 송인석
    • 정보관리연구
    • /
    • 제39권4호
    • /
    • pp.121-154
    • /
    • 2008
  • 본 연구에서는 정보검색도구 관점에서 지식조직체계로서 기존 시소러스 구축방안의 특성과 한계점을 검토하고, 대상 정보의 지식구조의 반영 및 정보 간의 의미관계 추론을 지원하는 온톨로지 기반의 주제 색인어 구조화 방안을 제시한다. 기존의 용어 중심의 시소러스와 달리, 단계별 연구프로세스 과정에서 수행되는 연구자의 정보행위 및 수요 분석에 때라 주제색인어의 개념을 식별 범주화하고, 인문사회과학 분야 학술논문의 지식체계를 구성하는 그 개념들 간의 유기적 관계정의를 통해 주제 색인어 집합의 의미구조를 정형화하였다. 이를 기반으로 각각의 온톨로지 기반 주제 색인어 집합은 구조화된 의미 색인으로서 대상 문서의 지식체계를 표현한다. 정보수요에 따라 정의된 공리나 추론규칙을 활용하여 이용자는 문제 해결에 적합한 정보를 대상 정보의 의미관계로 구성된 주제 도메인의 학술커뮤니케이션 네트워크상에서 분석적 정보탐색을 통해 효율적으로 검색 할 수 있다.

개념 및 관계 분류를 통한 분야 온톨로지 구축 (Building Domain Ontology through Concept and Relation Classification)

  • 황금하;신지애;최기선
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권9호
    • /
    • pp.562-571
    • /
    • 2008
  • 본 논문에서는 분야 온톨로지 구축을 위하여 분야 상위 온톨로지를 구축한 다음, 분야 시소러스의 개념과 관계를 이용하여 분야 상위 온톨로지를 확장하는 방법을 제안한다. 이를 위하여 우선 일반분야 시소러스와 분야 사전을 이용하여 분야 상위 개념 분류체계를 구축한다. 다음, 분야 시소러스의 개념을 분야 상위 온톨로지의 상위 개념으로 분류하고, 광의어(Broader Term: BT)-협의어(Narrower Term: NT) 및 광의어-관련어(Related Term: RT) 사이의 관계를 분야 상위 온톨로지에서 정의한 의미관계로 분류한다. 개념 분류는 두 단계로 진행되는데, 1단계에서는 빈도수 기반 방법, 2단계에서는 유사도 기반방법을 적용하여 시소러스 개념을 분야 상위 온톨로지의 개념으로 분류한다. 관계 분류에서는 두 가지 방법을 적용하였는데, (i) 훈련데이타가 부족한 경우를 위하여 규칙기반 방법으로 BT-NT/RT관계를 iso와 기타 관계(non-isa관계)로 분류하고, 다시 패턴기반 방법으로 non-isa관계를 온톨로지를 위한 의미관계로 분류한다. (ii) 훈련데이타를 충분히 가지고 있을 경우, 최대 엔트로피 모델(MEM)을 적용한 특징기반 분류 기법을 사용하되, k-Nearest Neighbors(k-NN)방법으로 훈련데이타를 정제하였다. 본 논문에서 제안한 방법으로 시스템을 구축하였고, 실험 결과 사람에 의한 판단 결과와 비교 가능한 성능을 보여 주었다.

시소러스를 기반으로 한 온톨로지 시스템 구현에 관한 연구 (A Study on the Thesaurus-based Ontology System for the Semantic Web)

  • 정도헌;김태수
    • 정보관리학회지
    • /
    • 제20권3호
    • /
    • pp.155-175
    • /
    • 2003
  • 본 연구는 W3C를 중심으로 시맨틱 웹을 위한 표준 온톨로지 언어로 제안된 OWL(Web Ontology Language)을 바탕으로 패싯형 시소러스인 AAT(Art and Architecture Thesaurus)의 개념 체계를 이용한 온톨로지 스키마를 구현하여 시맨틱 웹 환경의 온톨로지 기반 시스템을 구축하였다. 특히, 개념의 범위를 AAT의 Furniture 패싯 이하의 용어에 한정하였고 이 중 개념관계가 다양하고 많은 어휘를 가진 하위 패싯인 Chair 개념을 중심으로 시스템 구현 및 테스트를 하였다. 이 시스템은 올톨로지로 정의된 개념을 검색하며, 동의어에 대해 항상 우선어(Preferred term)를 제시하여 어휘를 제어한다. 또한 질의어를 중심으로 한 용어간의 관계를 이용자에게 제시하고 관련어 및 개념의 분류기준 속성을 제시한다. 그 밖에 개념에 인스턴스 값을 입력하고 이를 RDF 문서로 재생산하는 시스템을 구축하여 온톨로지 시스템 응용의 일례를 제시하였다. 이 과정에서 여러 온톨로지를 도입하였고, 인스턴스 값을 담기위한 컨테이너 기반으로 메타데이터 요소를 사용하였다.

기초학문자료 메타데이터 설계 분석 및 온톨로지 적용 방안 연구 (A Study on Design and Analysis of Metadata and Ontology based on Humanities and Social Sciences)

  • 이정연;김정민;최석두;김이겸
    • 한국문헌정보학회지
    • /
    • 제41권2호
    • /
    • pp.291-316
    • /
    • 2007
  • 기초학문자료의 특성인 복잡한 관계의 개념구조, 자료유형 및 자료간의 의미적 상관관계 등을 표현할 수 있는 기초학문자료 메타데이터 모형을 설계하였다. 설계된 메타데이터 모형의 정당성 및 효율성을 평가하기 위해 실제 구축된 자료의 분석을 토대로 실제적인 메타데이터 구성요소를 제시하였다. 메타데이터의 기반검색의 한계를 극복할 수 있는 확장된 시소러스를 설계하였으며 도메인 온톨로지를 구축하는 방안을 모색해 보았다. 또한 철학 종교학 분야의 주제분류 중심의 확장시소러스를 설계하고 토픽맵 기반 시스템으로 구현하여 주제 중심의 메타데이터 검색이 가능함을 보였다.