• Title/Summary/Keyword: Entity-based

검색결과 748건 처리시간 0.026초

개체형 통합설계모델의 객체지향 프로그래밍 (Object-Oriented Programming of Entity-Based Integrated Design Model)

  • 이창호;김진근
    • 한국전산구조공학회:학술대회논문집
    • /
    • 한국전산구조공학회 2002년도 가을 학술발표회 논문집
    • /
    • pp.211-218
    • /
    • 2002
  • An entity-based integrated design product and process model uses product and process entities to describe design information and design activities, respectively. The concepts and notation for product and process entities in the entity-based integrated design model are similar to the concepts of object-oriented programming languages such as C++ and Smalltalk. This paper uses C++ to program an entity-based integrated design model for building frames structures. The design information and activities involved in the three dimensional building space, the locations of frames, and the grouping of frames represented as entities in the entity-based integrated design model are transformed to C++ codes. Each product or process entity can be basically transformed to an class. The attributes of an entity can be defined as variables and member functions of a class.

  • PDF

위키피디아 기반의 효과적인 개체 링킹을 위한 NIL 개체 인식과 개체 연결 중의성 해소 방법 (A Method to Solve the Entity Linking Ambiguity and NIL Entity Recognition for efficient Entity Linking based on Wikipedia)

  • 이호경;안재현;윤정민;배경만;고영중
    • 정보과학회 논문지
    • /
    • 제44권8호
    • /
    • pp.813-821
    • /
    • 2017
  • 개체 링킹은 입력된 질의에 존재하는 개체를 표현한 개체 표현(entity mention)을 지식베이스에 존재하는 개체와 연결하여 의미를 파악하는 연구이다. 개체 링킹에 관한 연구는 지식 베이스 구축 문제, 다중 표현 문제, 개체 연결 중의성 문제, NIL 개체 인식 문제가 존재한다. 본 연구에서는 지식 베이스 구축 문제와 다중 표현 문제를 해결하기 위해 위키피디아를 기반으로 개체 이름 사전을 구축한다, 또한, 문맥 유사도, 의미적 관련성, 단서 단어 점수, 개체 표현의 개체명 타입 유사도, 개체 이름 매칭 점수, 개체인기도 점수 자질들을 기반으로 SVM(support vector machine)을 학습하여, NIL 개체를 인식하는 문제와 개체 연결 중의성을 해소하는 방법을 제안한다. 구축한 지식 베이스를 기반으로 제안한 두 방법을 순차적으로 적용하였을 때 좋은 개체 링킹 성능을 얻었다. 개체 링킹 시스템의 성능은 NIL 개체 인식 성능이 83.66%, 중의성 해소 성능이 90.81%의 F1 점수를 보였다.

개체 링킹을 위한 RDF 지식그래프 기반의 포괄적 상호의존성 짝 연결 접근법 (A Global-Interdependence Pairwise Approach to Entity Linking Using RDF Knowledge Graph)

  • 심용선;양성권;김홍기
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권3호
    • /
    • pp.129-136
    • /
    • 2019
  • 자연어 표현에는 인물, 조직, 장소, 제품 등의 다양한 개체들이 존재한다. 이러한 개체는 다양한 의미를 가질 수 있다. 이러한 개체가 갖는 중의성 문제는 자연어 처리 분야에 있어 매우 도전적인 과제이다. 개체 링킹(Entity Linking)이란 텍스트에 등장한 개체명을 지식베이스 내의 적절한 개체로 연결해주는 작업이다. 개체 링킹을 위한 대표적인 방법론인 짝 연결 접근법(Pairwise based method)은 한 문장에서 등장한 개체가 두 개 이상일 경우 서로의 연관성을 이용해 개체 링킹을 하는 방법이다. 이 방법은 동일 문장에서 등장하는 개체들 간의 상호의존성(interdependence)만을 고려하고 있어 포괄적인 상호의존성(Global interdependence)이 부족하다는 한계를 갖고 있다. 본 논문에서는 개체 링킹을 위해 RDF 형태의 지식베이스 정보를 바탕으로 Word2vec을 활용한 Entity2vec 모델을 생성하였다. 그리고 생성된 모델을 사용하여 각 개체에 대한 랭킹을 하였다. 본 논문에서는 짝 연결 접근법의 한계점을 보완하기 위해 포괄적인 상호의존성을 바탕으로 짝 연결 접근법을 고안하고 구현 및 실험을 통해 기존의 짝 연결 접근법과 비교하였다.

A Study on the Performance Analysis of Entity Name Recognition Techniques Using Korean Patent Literature

  • Gim, Jangwon
    • 한국정보기술학회 영문논문지
    • /
    • 제10권2호
    • /
    • pp.139-151
    • /
    • 2020
  • Entity name recognition is a part of information extraction that extracts entity names from documents and classifies the types of extracted entity names. Entity name recognition technologies are widely used in natural language processing, such as information retrieval, machine translation, and query response systems. Various deep learning-based models exist to improve entity name recognition performance, but studies that compared and analyzed these models on Korean data are insufficient. In this paper, we compare and analyze the performance of CRF, LSTM-CRF, BiLSTM-CRF, and BERT, which are actively used to identify entity names using Korean data. Also, we compare and evaluate whether embedding models, which are variously used in recent natural language processing tasks, can affect the entity name recognition model's performance improvement. As a result of experiments on patent data and Korean corpus, it was confirmed that the BiLSTM-CRF using FastText method showed the highest performance.

Towards Effective Entity Extraction of Scientific Documents using Discriminative Linguistic Features

  • Hwang, Sangwon;Hong, Jang-Eui;Nam, Young-Kwang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권3호
    • /
    • pp.1639-1658
    • /
    • 2019
  • Named entity recognition (NER) is an important technique for improving the performance of data mining and big data analytics. In previous studies, NER systems have been employed to identify named-entities using statistical methods based on prior information or linguistic features; however, such methods are limited in that they are unable to recognize unregistered or unlearned objects. In this paper, a method is proposed to extract objects, such as technologies, theories, or person names, by analyzing the collocation relationship between certain words that simultaneously appear around specific words in the abstracts of academic journals. The method is executed as follows. First, the data is preprocessed using data cleaning and sentence detection to separate the text into single sentences. Then, part-of-speech (POS) tagging is applied to the individual sentences. After this, the appearance and collocation information of the other POS tags is analyzed, excluding the entity candidates, such as nouns. Finally, an entity recognition model is created based on analyzing and classifying the information in the sentences.

ERX : 개체 관계 모델로부터 XML 스키마 생성 도구 (ERX : A Generation Tool of XML Schema based on Entity-Relationship Model)

  • 김영웅
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권2호
    • /
    • pp.149-155
    • /
    • 2013
  • 오늘날 대표적인 데이터베이스 설계 도구로 개체 관계 모델을 사용하고 있으며, 데이터를 표현하고 교환하는 표준 언어로 XML을 사용하고 있다. 그러나 많은 개체 관계 모델 제품들은 각각 서로 다른 표현형식을 사용하기 때문에 이들 제품들 사이에 호환성에 어려운 점이 있으며, XML은 언어가 갖는 복잡성으로 인해 XML을 이용하여 현실세계를 직접 설계하기에는 어려운 점이 있다. 본 논문은 이질적인 제품들 사이의 호환성을 제공하기 위해 개체 관계 모델을 XML 스키마로 변환하는 도구인 ERX(Entity-Relationship model to Xml)를 제안한다. ERX는 입력으로 개체 관계 다이어그램을 받아 이를 변환 규칙을 통해 XML 스키마를 출력한다. 변환 규칙에는 개체집합, 관계집합, 매핑 대응수(mapping cardinality), 일반화(generalization) 개념 등을 포함한다.

디자인패턴 기반 EJB Bean 클래스의 MIF와 CF의 측정에 관한 연구 (A Study of ME St CF Evaluation for EJB Bean Class Based Design Pattern)

  • 이돈양;신재준;송영재
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 하계종합학술대회 논문집 Ⅲ
    • /
    • pp.1613-1616
    • /
    • 2003
  • We will take a multitude EJB Design Patterns that you can harness to enhance your EJB Project today In this paper, we propose the EJB Based Entity Bean DBMS connecting system. Generally, EJB Based Entity Beans are respectively connected by DBMS. Therefore, for the this problems we suggest that Abstract Factory pattern uses DBMS connecting of Entity Beans. As a result, we evaluate MIF and CF in every class relationship.

  • PDF

개체 중의성 해소를 위한 사용자 유사도 기반의 트윗 개체 링킹 기법 (Tweet Entity Linking Method based on User Similarity for Entity Disambiguation)

  • 김서현;서영덕;백두권
    • 정보과학회 논문지
    • /
    • 제43권9호
    • /
    • pp.1043-1051
    • /
    • 2016
  • 트위터 문서는 웹 문서에 비해 길이가 짧기 때문에 웹 기반의 개체 링킹 기법을 그대로 적용시킬 수 없어 사용자 정보나 집단의 정보를 활용하는 방법들이 시도되고 있다. 하지만, 트윗의 개수가 충분하지 않은 사용자의 경우 데이터 희소성 문제가 여전히 발생하고 관련이 없는 집단의 정보를 사용할 경우 링킹의 결과에 악영향을 미칠 수 있다. 본 논문에서는 기존 연구의 문제를 해결하기 위해 단일 트윗 내의 의미 관련도 뿐만 아니라 사용자의 트윗 집합과 다른 사용자들의 트윗 집합까지 고려하여 데이터 희소성을 해결하고, 관련성이 높은 사용자들의 트윗 정보에 가중치를 주어 트윗 개체 링킹의 성능을 높이고자 한다. 실제 트위터 데이터를 활용한 실험을 통해 제안하는 트윗 개체 링킹 기법이 기존의 기법에 비해 높은 성능을 가지며, 유사도가 높은 사용자의 정보를 사용하는 것이 트윗 개체 링킹에서 데이터 희소성 해결과 링킹 정확도 향상에 연관성이 있음을 보였다.

Relation Extraction Using Convolution Tree Kernel Expanded with Entity Features

  • Qian, Longhua;Zhou, Guodong;Zhu, Qiaomin;Qian, Peide
    • 한국언어정보학회:학술대회논문집
    • /
    • 한국언어정보학회 2007년도 정기학술대회
    • /
    • pp.415-421
    • /
    • 2007
  • This paper proposes a convolution tree kernel-based approach for relation extraction where the parse tree is expanded with entity features such as entity type, subtype, and mention level etc. Our study indicates that not only can our method effectively capture both syntactic structure and entity information of relation instances, but also can avoid the difficulty with tuning the parameters in composite kernels. We also demonstrate that predicate verb information can be used to further improve the performance, though its enhancement is limited. Evaluation on the ACE2004 benchmark corpus shows that our system slightly outperforms both the previous best-reported feature-based and kernel-based systems.

  • PDF

ER_Modeler: 개체 관계 모델 기반 논리적 데이터베이스 설계 도구 (ER_Modeler: A Logical Database Design Tool based on Entity-Relationship Model)

  • 정인환;김영웅
    • 한국인터넷방송통신학회논문지
    • /
    • 제11권5호
    • /
    • pp.11-17
    • /
    • 2011
  • 본 논문은 개체 관계 모델을 기반으로 하는 논리적 데이터베이스 설계도구인 ER_Modeler 개발에 관한 연구이다. ER_Modeler는 윈도우 상에서 개체 관계 다이어그램(Entity-Relationship Diagram: ERD)을 작성할 수 있는 그래픽 편집도구 기능과 생성된 ERD 정보로부터 논리적 데이터베이스 테이블을 정의하기 위해 데이터 정의어(Data Definition Language: DDL)를 자동 생성하는 기능을 제공한다. 또한 상업적으로 가장 많이 사용되고 있는 Erwin 제품과의 호환성을 제공하기 위해 XML을 이용하여 ERwin과의 Export/Import 기능도 제공해준다.