• 제목/요약/키워드: Entity-Relation Model

검색결과 37건 처리시간 0.022초

데이터 모델을 위한 엔터티 도출 절차에 관한 연구 (A Study on Elicitation Procedures of the Entity for Data Model)

  • 김도유;여정모
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권7호
    • /
    • pp.479-486
    • /
    • 2013
  • 정보 시스템의 골격이라고도 할 수 있는 데이터 모델은 프로세스 모델과 함께 정보 시스템에 있어서 중요한 두개의 축을 이룬다. 데이터 모델의 핵심요소로는 엔터티, 속성, 관계가 있으며, 이 중에서도 엔터티는 데이터 모델에서 가장 근본적인 요소로서, 엔터티를 명확하게 도출하지 못한다면 데이터 모델 전체가 모호해지게 된다. 본 연구에서는 엔터티 도출에 대해서만 다루었다. 기존의 엔터티를 도출하는 방법은 설계자의 경험과 업무지식에 많이 의존되고 명확한 절차가 제시되지 않아, 초보자나 미숙련자가 접근하기에는 많은 어려움이 있다. 이를 해결하는데 도움이 될 수 있도록 본 연구에서는 선행연구의 제안 절차를 통해 미리 도출된 대상업무에서 체계적인 절차로 엔터티를 도출할 수 있는 업무기반 엔터티 도출 절차를 제안한다. 그리고 데이터 모델링에 경험이 없는 학부생들을 대상으로 가상업무에 대하여 제안 절차를 적용하도록 하였고, 기존 방법과 제안 절차의 비교가 불가능하다는 점을 감안하여 학생들이 도출한 엔터티와 모범 답안 간의 유사도 검사로 제안 절차를 검증하였다. 그 결과, 모범 답안에 상당히 근접하게 엔터티를 도출한 것을 확인하였다. 따라서 본 연구에서 제안한 절차가 데이터 모델링에 경험이 없는 초보자가 익숙하지 않은 업무에 적용하더라도 모범 답안에 근접하게 엔터티를 도출할 수 있음이 확인되었다. 엔터티를 제외한 데이터 모델의 핵심요소인 속성과 관계의 도출에 대한 연구는 차후로 미룬다.

심층 신경망을 활용한 진료 기록 문헌에서의 종단형 개체명 및 관계 추출 비교 연구 - 파이프라인 모델과 결합 모델을 중심으로 - (A Comparative Research on End-to-End Clinical Entity and Relation Extraction using Deep Neural Networks: Pipeline vs. Joint Models)

  • 최성필
    • 한국문헌정보학회지
    • /
    • 제57권1호
    • /
    • pp.93-114
    • /
    • 2023
  • 정보추출은 문헌 내에 존재하는 개체명을 인식함과 동시에 이들 간의 의미적 관계까지도 식별하여 최종적으로 문헌 내에 포함된 의미적 트리플을 자동으로 추출하여 활용할 수 있으므로 문헌에 대한 심층적인 분석과 이해에 많은 도움을 줄 수 있다. 그러나 지금까지 대부분의 정보추출에 대한 연구는 개체명 인식과 관계추출이 개별 연구로 각각 분리되어 진행되었으며, 그 결과 입력 문헌에 대한 정보추출의 최종 출력인 의미적 트리플 추출 성능에 대한 객관적이고 정확한 평가가 제대로 이루어지지 않았다. 이에 본 논문에서는 진료 기록 문헌에 나타나는 개체명과 그들 간의 관계를 트리플 형태로 직접 추출할 수 있는 종단형 정보추출의 2가지 모델인 파이프라인 및 결합형 모델을 구축하는 구체적인 방법론을 제시하고 성능 비교 실험을 진행하였다. 우선 파이프라인 모델은 양방향 GRU-CRFs를 활용한 개체명 인식 모듈과 다중 인코딩 기반 관계추출 모듈로 구현되었고, 결합형 모델을 위해서는 다중 헤드 레이블링 기반의 양방향 GRU-CRFs이 적용되었다. 두 가지 시스템을 바탕으로 진료기록 문헌 내의 개체명과 관계를 모두 태깅하여 구축된 i2b2/VA 2010 데이터셋을 활용한 비교 실험에서 파이프라인 모델의 성능이 5.5%(F-measure) 더 높게 나타났다. 추가적으로, 대규모 신경망 언어모델과 수작업으로 구축된 자질 정보를 활용한 최고 수준의 기존 시스템과의 비교 실험을 통해, 본 논문에서 구현한 종단형 모델의 객관적인 성능 수준을 파악할 수 있었다.

확률적 교차 연산을 이용한 보편적 관계 추출 (General Relation Extraction Using Probabilistic Crossover)

  • 이제승;김재훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권8호
    • /
    • pp.371-380
    • /
    • 2023
  • 관계 추출은 텍스트로부터 개체(named entity) 사이의 관계를 추출하는 과정이다. 전통적으로 관계 추출 방법은 주어와 목적어가 미리 정해진 상태에서 관계만 추출한다. 그러나 종단형 관계 추출에서는 개체 쌍마다 주어와 목적어의 위치를 고려하여 가능한 모든 관계를 추출해야 하므로 이 방법은 시간과 자원을 비효율적으로 사용한다. 본 논문에서는 이러한 문제를 완화하기 위해 문장에서 주어와 목적어의 위치에 따른 방향을 설정하고, 정해진 방향에 따라 관계를 추출하는 방법을 제안한다. 제안하는 방법은 기존의 관계 추출 데이터를 활용하여 문장에서 주어가 목적어를 가리키는 방향을 나타내는 방향 표지를 새롭게 생성하고, 개체 위치 토큰과 개체 유형 정보를 문장에 추가하는 작업을 통해 사전학습 언어모델 (KLUE-RoBERTa-base, RoBERTa-base)을 이용하여 방향을 예측한다. 그리고 확률적 교차 연산을 통해 주어와 목적어 개체의 표상을 생성한다. 이후 이러한 개체의 표상을 활용하여 관계를 추출한다. 실험 결과를 통해, 제안 모델이 하나로 통합된 라벨을 예측하는 것보다 3 ~ 4%p 정도 더 우수한 성능을 보여주었다. 또한, 제안 모델을 이용해 한국어 데이터와 영어 데이터를 학습할 때, 데이터 수와 언어적 차이로 인해 한국어보다 영어에서 1.7%p 정도 더 높은 성능을 보여주었고, 최상의 성능을 내는 매개변수의 값이 다르게 나타나는 부분도 관찰할 수 있었다. 제안 모델은 방향에 따른 경우의 수를 제외함으로써 종단형 관계 추출에서 자원의 낭비를 줄일 수 있다.

Topic Maps를 이용한 MARC데이터의 FRBR모델 구현에 관한 연구 (An Implementation of FRBR Model by Using Topic Maps)

  • 이현실;한성국
    • 정보관리학회지
    • /
    • 제22권3호
    • /
    • pp.289-306
    • /
    • 2005
  • FRBR 모델에서는 서지 요소와 관계를 중심으로 ER 모델링 방식을 제공하고 있지만, 단지 구조적 프레임워크로서 FRBR 모델을 효율적으로 구현할 수 있는 도구가 필요하다. 본 연구에서는 Topic Maps를 이용하여 FRBR 모델을 구현하는 방법을 제시한다. Topic Maps 기반의 FRBR 모델 구현의 유효성을 실증적으로 보이기 위하여, 명성황후라는 주제와 관련된 MARC 데이터를 추출하여 FRBR 모델을 설계하였고, Topic Maps를 이용하여 이를 구현하였다. 연구 결과, FRBR의 entity-relation과 Topic Maps의 topic-association이 개념적으로 동일하기 때문에 FRBR 모델 개발의 적합함을 알 수 있었다. FRBR 구조는 Topic Maps 패러다임과 그대로 일치하기 때문에 FRBR 모델은 Topic Maps로 구현함이 바람직하다.

클라우드 환경에서 개체 속성 기반 접근제어 모델 (An Entity Attribute-Based Access Control Model in Cloud Environment)

  • 최은복
    • 융합정보논문지
    • /
    • 제10권10호
    • /
    • pp.32-39
    • /
    • 2020
  • 클라우드 환경의 대규모 인프라 구조에서는 응용프로그램들과 디바이스의 공유로 인하여 불법적인 접근권한 문제가 빈번하게 발생하기 때문에 이러한 공격에 적극적으로 대응하기 위해서는 상황별로 대비가 가능한 강화된 접근통제 시스템이 요구된다. 우리는 대규모 인프라 환경에 기반한 보안등급과 릴레이션 개념의 개체 속성 기반 접근통제 모델을 제시하였다. 본 모델은 주체와 객체에 무결성과 기밀성 등급을 부여하고 동일한 역할에 대해 서로 다른 서비스가 가능한 강화된 접근제어 특성을 가지며, 서비스와 관련된 릴레이션과 상태정보인 컨텍스트에 의해 역할과 권한을 배정함으로써 권한 관리의 유연성을 갖는다. 또한, 대학이라는 대규모 인프라 구조를 갖는 다중 서비스 환경에 적용한 응용 사례를 통하여 본 모델의 적용 가능성을 제시하였다.

생의학 분야 학술 논문에서의 개체명 인식 및 관계 추출을 위한 언어 자원 수집 및 통합적 구조화 방안 연구 (A Study on Collecting and Structuring Language Resource for Named Entity Recognition and Relation Extraction from Biomedical Abstracts)

  • 강슬기;최윤수;최성필
    • 한국문헌정보학회지
    • /
    • 제51권4호
    • /
    • pp.227-248
    • /
    • 2017
  • 본 논문에서는 급격히 증가하는 생의학 분야 비정형 텍스트에서 핵심적 내용을 추출할 수 있는 기계학습 기반 정보 추출시스템을 구축하기 위한 언어자원 수집 및 통합적 구조화 방안을 제안한다. 제안된 방법은 정보 추출 시스템을 크게 개체명 인식과 개체명 간 관계 추출 시스템으로 구분하고, 각각의 시스템에 적합한 학습데이터를 구성하기 위해 생의학 분야 개체명 사전과 학습 집합을 수집한다. 그리고 수집된 해당 자원들의 특성을 분석하여 개체 구별을 위해 필수적으로 포함시켜야 할 항목들을 도출하고 이를 통해 시스템 학습과정에서 사용될 학습 데이터를 구성하기 위한 항목을 선정한다. 이와 같이 선정된 학습데이터의 구성 내용에 따라 수집된 자원들을 가공하여 학습 데이터를 구축한다. 본 연구에서는 생의학 분야의 하위 분야인 유전자, 단백질, 질병, 약물 4개 분야에 대한 개체명 사전과 학습 집합을 수집하여 각각을 학습 데이터로 구축하였으며, 개체명 사전을 통해 구축된 개체명 인식용 학습 데이터를 대상으로 개체명 수용 범위를 측정하기 위한 검증 과정을 수행하였다.

이질의 분산 데이타베이스에서 객체 통합을 위한 검증 모델 (Verification Model for Object Integration in Heterogeneous Distributed Database)

  • 김용원
    • 한국정보처리학회논문지
    • /
    • 제2권1호
    • /
    • pp.12-22
    • /
    • 1995
  • 분산된 지역 데이타베이스의 스키마 통합시 중심 개념은 엔티티 통합을 의미하며 이때 엔티티의 시멘틱은 여러 요소에 영향을 받는다. 따라서 분산된 데이타베이스 환경에서의 스키마 통합은 통합되어야 하는 각 지역의 스키마의 엔티티 타입간의 도메 인 관계의 정의로부터 시작된다할 수 있다. 이렇게 설계자에 의해 정의되는 각 엔티티 간의 도메인 관계는 스키마 통합 시스템의 신뢰도의 확보와 검증을 위한 작업이 반드 시 수행되어야 한다. 그러나 이러한 작업이 기존의 통합 시스템에서는 제시되지 못하였다. 본 논문은 분산 시스템 환경에서 지역 데이타베이스의 스키마 통합을 위한 객체 중심의 통합을 정의하고, 통합의 타당성 검증을 위한 모델을 제안하고 검증 시 스템을 구현한다.

  • PDF

언어모델에서 엔티티 정보를 이용한 관계 추출 성능 향상 기법 (A Technique for Improving Relation Extraction Performance using Entity Information in Language Model)

  • 허윤아;오동석;황태선;이설화;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.124-127
    • /
    • 2020
  • 관계 추출은 문장에서 두 개의 엔티티가 주어졌을 때 두 개의 엔티티에 대한 의미적 이해를 통해 관계를 분류하는 작업이다. 이와 같이 관계 추출에서 관계를 분류하기 위해서는 두 개의 엔티티에 대한 정보가 필요하다. 본 연구에서는 관계 추출을 하기 위해 문장에서 엔티티들의 표현을 다르게하여 관계 추출의 성능을 비교 실험하였다. 첫번째로는 문장에서 [CLS] 토큰(Token)으로 관계를 분류하는 Standard 엔티티 정보 표현과 두번째로는 엔티티의 앞과 뒤에 Special Token을 추가하여 관계를 분류하는 Entity-Markers 엔티티 정보 표현했다. 이를 기반으로 문장의 문맥 정보를 학습한 사전 학습(Pre-trained)모델인 BERT-Large와 ALBERT-Large를 적용하여 실험을 진행하였다. 실험 결과 Special Token을 추가한 Entity-Markers의 성능이 높았으며, BERT-Large에서 더 높은 성능 결과를 확인하였다.

  • PDF

웹 GIS 기반 철도 지반정보 관리프로그램의 개발 (Development of the Railroad Geotechnical Information Management System Using Web GIS)

  • 황선근;이성혁;김현기;김정무
    • 한국철도학회논문집
    • /
    • 제7권1호
    • /
    • pp.20-25
    • /
    • 2004
  • Railroad geotechnical information management system was developed by using Web GIS and DB in this study. The standardization of railroad geotechnical information is progressed by classifying three groups as like basic informations, vibration informations along railway lines and design drawings. The basic informations consisted of basic and dynamic properties of soils, geophysical exploration and seismic survey/exploration. And the specification for 'human exposure to whole-body vibration' was adopted to construct the vibration informations along railway lines. The informations as like drawings and photographs were saved by changing to graphic files in the standardization of design drawings. In the case of standardization of geographical information, the topographical maps(NGIS, 1:5000) were primarily used as digital maps. Another digital maps(KRRI, 1:5000) and their geographical DB based on NGI code system were added on this maps. The standardized informations were used to construct their database. And railroad information management system was developed using Entity-Relation(ER) model which had a good feasibility for expansion and transition to other system in designing stage of database. This system consisted of layer selection, search and analysis of geotechnical informations and Zeus DB was adopted for GIS operating and user interface. This system could be a good tool for saving, searching and analyzing the geotechnical and geophysical informations. These DB systems would offered the basic informations to plans, design and construction of railroad lines etc. in practical use.

웹사이트의 정보 모델과 사용성의 관계 (A Study on the Relation Between Information Model and Usability of Website)

  • 이지수
    • 디자인학연구
    • /
    • 제13권4호
    • /
    • pp.67-76
    • /
    • 2000
  • 웹사이트는 다양한 컨텐츠 영역에서 여러 유형의 사용자 활동을 지원하며, 이에 따라 주요 인터페이스 디자인 문제를 추출하기 위한 서로 다른 접근을 요구한다. 본 연구에서는 웹사이트의 매체적 역할을 중심으로 개발자, 사용자, 웹사이트간의 관계를 이해하고 사용성에 관한 디자인 요소들에 대해 보다 체계적인 관점에서 파악함으로써 인터페이스 구현의 기초적인 틀을 마련하고자 한다. 매체적 측면에서 웹사이트는 사용자와 개발자 사이에 존재하는 일종의 정보체라 할 수 있다. 사용성을 중심으로 한 정보체의 형성에는 사용자, 개발자, 웹사이트 및 여러 환경적 요인들과 관련된 다양한 디자인 요소들이 포함된다. 이는 궁극적으로 정보체를 매개로 한 상호작용에 있어서 사용자와 정보체가 보다 수용하는 상태, 즉 공통적인 개념모델의 형성을 위한 것이 되어야 한다. 이를 위해서는 사용자 목표 및 인지적, 정서적 측면의 사용자 특성에 대한 이해를 바탕으로 크게 합목적성, 효율성, 주관적 만족의 사용성이 요구된다. 이러한 맥락에 따라 정보체의 기본 구조 즉, 정보 모델을 설정하고 이에 따른 디자인 요소 및 이의 특질에 대해 파악한다. 정보모델은 크게 내용 수준, 구성 수준, 표현 수준으로 구분할 수 있으며 각 수준별로 사용자의 적절한 인지적, 정서적 측면의 작용을 위한 디자인 요소들을 파악함으로써 인터페이스 디자인의 주요 문제를 체계적으로 이해한다.

  • PDF