• 제목/요약/키워드: 트리플 인스턴스 생성

검색결과 9건 처리시간 0.02초

한국어 자가 지식 학습을 위한 패턴 및 인스턴스 생성 (Pattern and Instance Generation for Self-knowledge Learning in Korean)

  • 윤희근;박성배
    • 한국지능시스템학회논문지
    • /
    • 제25권1호
    • /
    • pp.63-69
    • /
    • 2015
  • 웹의 비구조 문서로부터 자동으로 인스턴스를 생성하기 위한 다양한 연구가 제안되었다. 영어권의 기존 연구들에서는 간단한 규칙과 정규식 기반의 패턴을 활용하였다. 영어에서는 단순한 정규식 기반의 패턴만으로도 충분히 높은 정확도를 보여주었지만. 한국어는 영어와 다른 언어적인 특성으로 인하여 기존의 정규식 형태의 패턴으로는 적합한 패턴을 생성할 수 없다. 이에 본 논문에서는 한국어에 적합한 패턴 및 인스턴스 생성 방법을 제안한다. 제안한 방법은 대상 문장의 의존 관계를 고려함으로써 높은 정확도를 가지는 패턴 집합을 생성한다. 또한 인스턴스의 주어(subject)와 목적어(object) 판별을 위하여 조사 정보를 함께 활용함으로써 한국어의 자유로운 어순으로부터 오는 제약을 해결한다. 실험 결과에 따르면 본 논문에서 제안한 패턴 생성 방법이 단순 어순만을 고려하여 생성된 패턴들에 비하여 더 높은 정확률을 보여주어, 한국어 대상 자동 인스턴스 생성에 적합함을 확인하였다.

온톨로지 인스턴스 생성을 위한 상호참조 해결 연구 (Reference Resolution for Ontology Population)

  • 최미란;이창기;왕지현;장명길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.140-144
    • /
    • 2007
  • 시맨틱 웹 기술의 주축을 이루는 온톨로지의 구축시에 인스턴스를 생성하기 위하여 대상 문서를 구성하는 자연어 문장을 텍스트 마이닝 기술을 이용하여 트리플을 추출한다. 인스턴스를 생성할 때 보다 많은 정보를 추출하기 위해서 문장에 나타나는 상호참조 해결이 필요하다. 본 연구에서는 문서에서 많이 나타나는 명사구로 이루어진 대용어를 해석하기 위하여 언어 분석된 다양한 결과 정보를 이용한다. 본 연구에서는 계층적인 의미구조와 청킹을 이용한 규칙기반의 상호참조 해결 방법을 제안하고 실험을 통해 알고리즘의 정확도를 제시한다.

  • PDF

i-Manager : LOD 인스턴스 개발 시스템의 구현 (i-Manager: An Implementation of LOD Instance Development System)

  • 문희경;한성국
    • 한국정보통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.1174-1182
    • /
    • 2017
  • 웹상에서 이질적 형태의 다양한 데이터를 개방, 공유하여 차세대 데이터웹을 실현하고자 하는 연구개발이 활발하게 수행되고 있다. 이를 위해 표준 데이터 모델로 온톨로지 기반의 LOD가 개발되었다. LOD기반 시스템을 효과적으로 개발하기 위해서는 전문화된 인스턴스 생성 시스템이 필수적으로 요구되고 있다. 본 논문은 LOD 시스템의 요구사항과 다양한 응용분야의 개발환경을 고려하여, LOD 인스턴스 개발에 적합한 i-Manager를 설계 구현하였다. i-Manager는 LOD 인터페이스 시트를 이용해서 온톨로지와 인스턴스 계층을 분리하고, 인스턴스 편집/저장, 시각화, LOD 질의 처리 등 LOD 인스턴스 개발에 전문화된 기능들을 제공한다. 본 논문은 LOD 인스턴스 개발의 새로운 방향을 제시하고 있으며, 구현된 i-Manager는 다양한 분야에서 LOD 개발 범용환경으로 활용할 수 있다.

트리플 생성을 위한 매핑 온톨로지 구축 및 이를 이용한 트리플 변환기 구현 (Development of a Mapping Ontology for Triple Creation and Implement of a Triple Translator)

  • 허홍수;오원석;김성혁
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.48-50
    • /
    • 2012
  • 정형화되어 있는 데이터를 트리플 형식의 RDF 데이터로 변환하기 위하여 매핑 온톨로지를 제안하며, 이 온톨로지를 이용하여 실제 데이터를 RDF로 변환하는 변환기를 구현하였다. 본 논문에서는 트리플 변환을 위해 수행하는 매핑 작업을 개념화하고, 일반적인 매핑 타입을 정형화하고 제약사항을 설정하여 온톨로지 스키마로 제공한다. 트리플 생성을 위해 사용자가 매핑 내용을 인스턴스로 생성하면, 이를 이용하여 정형화된 데이터를 RDF로 자동 변환하는 변환기를 구현한다. 제안하는 매핑 온톨로지를 이용한 매핑규칙 작업은 온톨로지 편집툴을 활용하여 작업의 편의성을 제공하며 변환 작업의 안내 역할을 할 것이다.

Onto Think-$K^{(R)}$: DBMS 기반 추론 서비스 (OntoThink-$K^{(R)}$: An Inference Service Based on DBMS)

  • 정한민;강인수;이미경;이승우;성원경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.200-204
    • /
    • 2006
  • 본 논문은 지식 기반 정보유통 플랫폼 OntoFrame-K$^{(R)}$ 상에서 추론을 이용하여 연구자 간 협업 서비스를 제공할 수 있도록 하는 DBMS 기반 추론 서비스 OntoThink-K$^{(R)}$에 대해 기술한다. 본 추론 서비스는 URI 서버를 이용하여 RDF 트리플을 생성하고 추론 규칙에 의해 해당 트리플을 확장하며 SPARQL을 통해 질의 결과를 생성해낸다. 특히 이 모든 과정은 DBMS 기반으로 설계 구현되었는데 URI 서버와 성과 비성과 등록 인터페이스를 통해 별도의 추론 엔진을 사용하지 않고도 정합성이 보장되는 지식을 생성 관리할 수 있도록 하며, 불안정한 성능을 보이는 추론 엔진을 이용하지 않기 때문에 안정적인 성능을 보장할 수 있다는 데 그 특징이 있다. OntoThink-K$^{(R)}$는 온톨로지 스키마 트리플, 인스턴스 트리플, 그리고 전방 추론을 통해 획득한 추가 트리플을 포함하는 확장 트리플을 기반 지식으로 하는데, 최종 사용되는 RDF 트리플의 크기는 지식 확장 이전 631,158개, 지식 확장 이후 1,112,100개이다.

  • PDF

URI 서버 내 DB 스키마 자동 생성 연구 (Study on the Automatic Generation of DB Schema in URI Server)

  • 정한민;이미경;강인수;성원경
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2007년도 제19회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.107-113
    • /
    • 2007
  • 본 연구는 시맨틱 데이터 정합성 검사와 RDF 트리플 생성 기능을 가진 URI 서버 내 DB 스키마의 자동 생성 방안을 기술한다. URI 서버는 시맨틱 웹 기술 기반 프레임워크 구성에 필요한 핵심 엔진으로서 인스턴스 생성 관리기, 검색 엔진, 추론 엔진 등과의 상호 작용을 통해 시맨틱 데이터를 서비스한다. 도메인이 바뀌거나 서비스가 변경되는 경우 DB 스키마를 전문가에 의해 수작업으로 생성함으로써 서비스 환경 변화에 즉각 대응하지 못하는 문제점을 가진 기존 URI 서버를, 적재되는 온톨로지에 따라 DB 스키마를 동적으로 자동 생성하는 방식으로 변경함으로써 다양한 응용 분야와 도메인에의 높은 이식성(Portability)을 보장할 수 있도록 한다. 기반정보 온톨로지, 응용 온톨로지, 개인화 온톨로지 등 3개 온톨로지 스키마와 11만 건 이상의 Citeseer Open Access Metadata로부터 추출된 인스턴스를 대상으로 한 실험을 통해 URI 서버 내 DB 스키마 자동 생성 가능성을 실증하였다.

  • PDF

분산 메모리 환경에서의 ABox 실체화 추론 (ABox Realization Reasoning in Distributed In-Memory System)

  • 이완곤;박영택
    • 정보과학회 논문지
    • /
    • 제42권7호
    • /
    • pp.852-859
    • /
    • 2015
  • 최근 지식 정보의 양이 방대해지면서, 대용량 온톨로지를 효과적으로 추론하는 연구가 활발히 진행되고 있다. 이러한 추론 방법들은 TBox 분류와 ABox 실체화로 나누어진다. TBox 추론은 스키마의 무결성과 종속성을 주로 다룬다면, ABox 추론은 인스턴스 위주의 다양한 문제를 다루어서 실제 응용에서의 중요성이 매우 크다. 따라서 본 논문은 클래스의 제약 조건을 분석하고, 이를 통해 인스턴스가 속하는 클래스를 추론할 수 있는 방법을 제안한다. 객체 지향 언어 기반의 분산 파일 시스템을 활용했던 기존 방법과 달리 함수형 프로그래밍 기반의 인 메모리 시스템인 스파크를 통해 대용량 온톨로지 실체화 방법에 대해서 설명한다. 제안하는 기법의 효율성을 검증하기 위해 W3C의 Wine 온톨로지를 이용해 인스턴스를 생성(1억 2천만~6억개의 트리플)하고 실험을 수행하였다. 6억개의 트리플을 대상으로 진행한 실험의 경우 전체 추론 시간이 51분(696 K Triple/sec)이 소요되었다.

DBMS 기반의 온톨로지 확장 모델 (Extended Ontology Model based on DBMS)

  • 이미경;김평;정한민;성원경
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.284-288
    • /
    • 2006
  • 본 논문은 시맨틱 웹 기술이 융합된 지식기반 정보유통 플랫폼(OntoFrame-K$^{(R)}$)의 추론 서비스 시스템 (OntoThink-K$^{(R)}$)에서 이용되는 Persistent Model인 DBMS기반의 온톨로지 확장 모델에 대해 설명하고자 한다. OntoFrame-K$^{(R)}$는 대용량의 지식 데이터를 다루기 때문에 기존에 개발된 온톨로지 추론 엔진을 이용할 경우 많은 한계점을 가지게 된다. 따라서 우리는 대용량의 지식 데이터를 안정적으로 처리할 수 있으며 추론의 신뢰성과 정합성을 가지는 온톨로지 확장 모델을 설계, 구현하였다. 본 모듈은 OWL과 인스턴스 데이터를 트리플 형태로 변환하여 입력 받은 후, 온톨로지 스키마 규칙과 사용자 정의 규칙을 이용한 정방향 추론 방법으로 추론 서비스에서 필요한 지식데이터들을 생성하는 역할을 한다. 본 모델은 DBMS를 이용하여 대용량의 지식 데이터를 저장할 수 있으며, 추론 규칙에 따른 정방향 추론을 통해 지식 모델을 확장하기 때문에 데이터의 정합성이 보장된다.

  • PDF

온톨로지 기반의 수강지도 시스템 (Ontology-based Course Mentoring System)

  • 오경진;윤의녕;조근식
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.149-162
    • /
    • 2014
  • 수강지도는 학생의 졸업인증이나 공학교육인증 이수를 위해 수강 신청 이전에 수행되는 과정을 지칭한다. 수강지도는 학생의 수강이력 점검과 향후 수강 과목의 안내 등을 포함하여 학생들의 졸업 및 교과과정 인증과 관련된 중요한 역할을 하고 있다. 현재 대부분 대학에서는 수강지도를 위한 전산시스템의 부재로 인해 지도교수가 직접 수동적으로 수강지도를 진행하고 있다. 하지만 이러한 수동적인 방식의 수강지도는 지도교수가 각 학생에 대한 정보를 분석해야 하고, 때때로 휴먼에러를 일으키게 된다. 수강신청이 학기 단위로 이루어지기 때문에 휴먼에러로부터 발생된 피해는 원상태로 되돌리는 것이 거의 불가능하다. 따라서 수강지도를 진행함에 있어 자동화된 시스템은 필수적인 요소로 판단된다. 관계 데이터 모델을 이용한 수강지도 시스템의 도입은 수동적인 수강지도의 문제점을 해결할 수 있게 해준다. 하지만 교육과정 및 인증제도의 변화에 따라 기존 시스템의 스키마 변경이 요구되고, 수강 과목 사이에 존재하는 관계 및 의미적인 검색을 제공하는 것이 어렵다는 한계가 존재한다. 본 논문에서는 수강지도 시스템을 위한 수강지도 온톨로지를 모델링하고, 온톨로지 기반의 수강지도 시스템을 설계한다. 온톨로지 인스턴스 생성을 위해 JENA 프레임워크를 이용하여 온톨로지 생성 모듈을 개발하였고, 실험에 참가한 학생의 수강 이력 데이터를 기반으로 온톨로지 인스턴스를 생성하고 추론과정을 통해 트리플 저장소에 저장하였다. 실험은 제안하는 시스템이 학생들이 향후 수강할 수 있는 과목을 모두 제공하는지 여부와 제공되는 과목에 대한 정보 및 학점 계산들이 정확한 지를 측정하였다. 실제 학생의 수강내역을 이용한 실험의 결과는 온톨로지 기반의 수강지도 시스템이 현 수강지도 시스템의 수동적 방법을 해결하고, 사람이 지도한 내용과 같은 내용을 도출하는 것을 확인함으로써 제안하는 시스템의 유효성을 보여준다.