• Title/Summary/Keyword: 트리플 추출

Search Result 39, Processing Time 0.021 seconds

Semiautomatic Pattern Mining for Training a Relation Extraction Model (관계추출 모델 학습을 위한 반자동 패턴 마이닝)

  • Choi, GyuHyeon;nam, Sangha;Choi, Key-Sun
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.257-262
    • /
    • 2016
  • 본 논문은 비구조적인 자연어 문장으로부터 두 개체 사이의 관계를 표현하는 구조적인 트리플을 밝히는 관계추출에 관한 연구를 기술한다. 사람이 직접 언어적 분석을 통해 트리플이 표현되는 형식을 입력하여 관계를 추출하는 규칙 기반 접근법에 비해 기계가 데이터로부터 표현 형식을 학습하는 기계학습 기반 접근법은 더 다양한 표현 형식을 확보할 수 있다. 기계학습을 이용하려면 모델을 훈련하기 위한 학습 데이터가 필요한데 학습 데이터가 수집되는 방식에 따라 지도 학습, 원격지도 학습 등으로 구분할 수 있다. 지도 학습은 사람이 학습 데이터를 만들어야하므로 사람의 노력이 많이 필요한 단점이 있지만 양질의 데이터를 사용하는 만큼 고성능의 관계추출 모델을 만들기 용이하다. 원격지도 학습은 사람의 노력을 필요로 하지 않고 학습 데이터를 만들 수 있지만 데이터의 질이 떨어지는 만큼 높은 관계추출 모델의 성능을 기대하기 어렵다. 본 연구는 기계학습을 통해 관계추출 모델을 훈련하는데 있어 지도 학습과 원격지도 학습이 가지는 단점을 서로 보완하여 타협점을 제시하는 학습 방법을 제안한다.

  • PDF

Semiautomatic Pattern Mining for Training a Relation Extraction Model (관계추출 모델 학습을 위한 반자동 패턴 마이닝)

  • Choi, GyuHyeon;nam, Sangha;Choi, Key-Sun
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.257-262
    • /
    • 2016
  • 본 논문은 비구조적인 자연어 문장으로부터 두 개체 사이의 관계를 표현하는 구조적인 트리플을 밝히는 관계추출에 관한 연구를 기술한다. 사람이 직접 언어적 분석을 통해 트리플이 표현되는 형식을 입력하여 관계를 추출하는 규칙 기반 접근법에 비해 기계가 데이터로부터 표현 형식을 학습하는 기계학습 기반 접근법은 더 다양한 표현 형식을 확보할 수 있다. 기계학습을 이용하려면 모델을 훈련하기 위한 학습 데이터가 필요한데 학습 데이터가 수집되는 방식에 따라 지도 학습, 원격지도 학습 등으로 구분할 수 있다. 지도 학습은 사람이 학습 데이터를 만들어야하므로 사람의 노력이 많이 필요한 단점이 있지만 양질의 데이터를 사용하는 만큼 고성능의 관계추출 모델을 만들기 용이하다. 원격지도 학습은 사람의 노력을 필요로 하지 않고 학습 데이터를 만들 수 있지만 데이터의 질이 떨어지는 만큼 높은 관계추출 모델의 성능을 기대하기 어렵다. 본 연구는 기계학습을 통해 관계추출 모델을 훈련하는데 있어 지도 학습과 원격지도 학습이 가지는 단점을 서로 보완하여 타협점을 제시하는 학습 방법을 제안한다.

  • PDF

A Comparative Research on End-to-End Clinical Entity and Relation Extraction using Deep Neural Networks: Pipeline vs. Joint Models (심층 신경망을 활용한 진료 기록 문헌에서의 종단형 개체명 및 관계 추출 비교 연구 - 파이프라인 모델과 결합 모델을 중심으로 -)

  • Sung-Pil Choi
    • Journal of the Korean Society for Library and Information Science
    • /
    • v.57 no.1
    • /
    • pp.93-114
    • /
    • 2023
  • Information extraction can facilitate the intensive analysis of documents by providing semantic triples which consist of named entities and their relations recognized in the texts. However, most of the research so far has been carried out separately for named entity recognition and relation extraction as individual studies, and as a result, the effective performance evaluation of the entire information extraction systems was not performed properly. This paper introduces two models of end-to-end information extraction that can extract various entity names in clinical records and their relationships in the form of semantic triples, namely pipeline and joint models and compares their performances in depth. The pipeline model consists of an entity recognition sub-system based on bidirectional GRU-CRFs and a relation extraction module using multiple encoding scheme, whereas the joint model was implemented with a single bidirectional GRU-CRFs equipped with multi-head labeling method. In the experiments using i2b2/VA 2010, the performance of the pipeline model was 5.5% (F-measure) higher. In addition, through a comparative experiment with existing state-of-the-art systems using large-scale neural language models and manually constructed features, the objective performance level of the end-to-end models implemented in this paper could be identified properly.

The Triple Relationship Extraction from Domain Article (특정 도메인 문서 내 관계 트리플 추출)

  • Lee, Hyokab;Kim, Pan-Koo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.04a
    • /
    • pp.359-361
    • /
    • 2010
  • 최근 정보의 의미적 검색을 위해 국내외 포털을 중심으로 시멘틱 웹 검색과 관련된 연구가 진행되고 일정부분 사용되고 있다. 이러한 시멘틱 웹 검색은 기존 작성된 정보를 인간이 가장 쉽게 이해할 수 있는 subject, predicate, object로 구성된 RDF Triple형태로 바꾸어 이를 쉽게 접근하고자 하는 연구가 필요하다. 본 논문에서는 정보의 재가공 후 문서 내 트리플 관계를 추출하는 과정을 실험을 통해 제시한다. 이를 통해 웹 도메인과 컨텐츠 정확한 검색을 가능하게 하고 검색 시간을 단축시켜 효율을 높여주는 계기가 될 것이다.

SPARQL Query Tool for Using OWL Ontology (OWL 온톨로지 사용을 위한 SPARQL 쿼리 툴)

  • Jo, Dae-Woong;Choi, Ji-Woong;Kim, Myung-Ho
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.11
    • /
    • pp.21-30
    • /
    • 2009
  • Semantic web uses ontology languages such as RDF, RDFS, and OWL to define the metadata on the web. There have been many researching efforts in the semantic web technologies based on an agent for extracting triple and relation about concept of ontology. But the extraction of relation and triple about the concept of ontology based on an agent ends up writing a limited query statement as characteristics of an agent. As for this, there is the less of flexibility when extracting triple and relation about the other concept of ontology. We are need a query tool for flexible information retrieval of ontology that is can access the standard ontology and can be used standard query language. In this paper, we propose a SPARQL query tool that is can access the OWL ontology via HTTP protocol and it can be used to make a query. Query result can be output to the soap message. These operations can be support the web service.

Design and Implementation of a COncept-based Image Retrieval System: COIRS (개념 기반 이미지 정보 검색 시스템 COIRS의 설계 및 구현)

  • Yang, Hyung-Jeong;Kim, Ho-Young;Yang, Jae-Dong;Hur, Dae-Young
    • The Transactions of the Korea Information Processing Society
    • /
    • v.5 no.12
    • /
    • pp.3025-3035
    • /
    • 1998
  • In this paper, we describe the design and implementationof COIRS COncept,based Image Retricval System). It differs from extant content-based image retrieval systems in that it enables users to query based on concepts- it allows users to get images concepmally relevant. A concept is basically an aggregation of promitive objects in an image. For such a cencept based image retrieval functionality. COIRS aglopts an image descriptor called triple and includes a triple thesaurus used for capturing concepts. There are four facilities in COIRS: a visual image indeses a triple thesaurus, an inverted fiel, and a user query interface. The visnal image indeser facilitates object laeling and the percification of positionof objects. It is an assistant tool designed to minimize manual work when indexing images. The thesarrus captires the concepts by analyzing triples, thereby extracting image semantics. The triples are then for formalating queries as well as indexing images. The user query interiare enables users to formulate...

  • PDF

A Document Generation System Based on an Ontology (온톨로지 기반의 문서 생성 시스템)

  • Ryu, Jae-Hyun;Park, Seong-Bae
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.313-316
    • /
    • 2016
  • 온톨로지란 사물이나 개념의 속성이나 관계를 사람과 컴퓨터 모두 이해할 수 있는 형태로 표현한 모델로 정보검색, 인공지능, 소프트웨어 공학 등의 분야에서 많이 활용된다. 온톨로지에는 다양한 정보가 구조화되어 저장되어 있지만 일반적으로 온톨로지가 제공하는 그래프 형태의 데이터들은 사용자들이 직관적으로 이해하기가 힘들다. 따라서 본 논문에서는 온톨로지의 정보를 문장화하여 한국어 문서를 생성하는 시스템을 제안한다. 제안하는 시스템은 주제와 관련된 트리플을 추출하고 이를 문장정렬, 결합, 생성을 위한 정보가 담긴 템플릿을 생성한 뒤 한국어 문법에 맞게 문장을 생성한다. 또한 기존 연구에서 다루지 않았던 이벤트 온톨로지의 내용을 포함하여 문장을 생성한다. 두 온톨로지로부터 생성된 문장을 연결하여 주제어를 설명하는 하나의 문서를 작성한다.

  • PDF

Implementation of Ontology-based Analytics Service by Exploiting Massive Crime Investigation Records (대규모 범죄 수사 기록을 활용한 온톨로지 기반 분석 서비스 구현)

  • Ko, Gun-Woo;Kim, Seon-Wu;Park, Sung-Jin;No, Yoon-Joo;Choi, Sung-Pil
    • Annual Conference on Human and Language Technology
    • /
    • 2018.10a
    • /
    • pp.477-481
    • /
    • 2018
  • 본 논문은 범죄 수사 기록 문서로부터 추출한 정보를 트리플로 구성하여 특정 분야의 온톨로지를 구축하고, 더 나아가 온톨로지 기반의 검색 서비스를 구현하는 일련의 과정을 설명한다. 특히 비정형 데이터로 부터 얻어낸 정보를 통해 온톨로지를 구축하고, 이를 토대로 실제 사용할 수 있는 레벨의 서비스를 구현하는 것이 특징이다. 서비스의 성능을 확인하기 위하여 사건 검색에 대한 정확도 측정 방법 중 하나인 Top-K 방식의 정확도 측정 실험을 수행하였으며, 실험 결과 완전 일치 실험에서는 약 93.52%, 유사 필드 활용 실험에서는 약 88.91%의 결과를 얻어낼 수 있었다.

  • PDF

An Invisible Image Pattern Watermark System Using Triplet (트리플릿을 이용한 비가시적 이미지 패턴 워터마크)

  • Park, Byung-Su;Shin, Soung-Wook;Chu, Hyung-Suk;An, Chong-Koo
    • Proceedings of the KIEE Conference
    • /
    • 2007.10a
    • /
    • pp.169-170
    • /
    • 2007
  • 인터넷과 통신기술의 급격한 발전으로 인한 디지털 컨텐츠의 저자 동의 없는 복사 배포의 증가는 저작권 침해 및 불법 복제 및 배포, 위조 등의 문제를 발생시켰다. 이러한 저작권 문제를 해결하기 위한 사후적 방법으로 디지털 워터마크 기술이 개발되었다. 본 논문은 이산 웨이블릿 변환의 트리플린 특징을 이용한 바코드 이미지 워터마크 알고리즘을 제안하였다. 바코드 이미지 워터마크에 일정한 패턴을 이용하여 여러 공격에 강인성을 갖게 하였다. 또한 워터마크 추출시 상관도를 구하지 않아도 시각적으로 워터마크의 삽입 여부를 확인 할 수 있으며, 낮은 상관도에서도 워터마크를 시각적으로 확인 할 수 있는 장점을 갖는다.

  • PDF