• 제목/요약/키워드: 관계 데이터 모델

검색결과 1,572건 처리시간 0.031초

RUP 기반의 Data Model 설계 (A Design On RUP based Data Model)

  • 최창민;김천식;정정수
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2003년도 춘계학술발표대회논문집
    • /
    • pp.154-158
    • /
    • 2003
  • RUP의 Unified Process Model에는 Use Case Model, Analysis Model, Design Model, Deployment Model, Implementation model, Test Model의 6가지 모델이 있다. 이 모델들은 모두 일관성이 있다. 한 모델에서 나오는 요소들은 전, 후 단계에서 다른 모델들과 Trace Dependencies를 갖는다. 이러한 관계들은 각각의 요소들 사이의 진행, 기록 관계를 나타낸다 그러나 일반적인 데이터간의 관계와 데이터 모델 설계는 이러한 관계없이 설계되어져 전체적인 일관성을 이루지 못 하였다 본 논문에서는 이러한 관계를 유지하면서 요구사항에 맞는 데이터 모델을 설계하고자 한다. 따라서 본 논문에서는 대학 종합정보시스템 구축의 일부분인 자산관리 시스템을 분석하여 데이터 모델을 제시한다.

  • PDF

원격지도학습데이터의 오류를 처리하는 강화학습기반 관계추출 모델 (Relation Extraction Model for Noisy Data Handling on Distant Supervision Data based on Reinforcement Learning)

  • 윤수지;남상하;김은경;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.55-60
    • /
    • 2018
  • 기계학습 기반인 관계추출 모델을 설계할 때 다량의 학습데이터를 빠르게 얻기 위해 원격지도학습 방식으로 데이터를 수집한다. 이러한 데이터는 잘못 분류되어 학습데이터로 사용되기 때문에 모델의 성능에 부정적인 영향을 끼칠 수 있다. 본 논문에서는 이러한 문제를 강화학습 접근법을 사용해 해결하고자 한다. 본 논문에서 제안하는 모델은 오 분류된 데이터로부터 좋은 품질의 데이터를 찾는 문장선택기와 선택된 문장들을 가지고 학습이 되어 관계를 추출하는 관계추출기로 구성된다. 문장선택기는 지도학습데이터 없이 관계추출기로부터 피드백을 받아 학습이 진행된다. 이러한 방식은 기존의 관계추출 모델보다 좋은 성능을 보여주었고 결과적으로 원격지도학습데이터의 단점을 해결한 방법임을 보였다.

  • PDF

학습 데이터 확장을 통한 딥러닝 기반 인과관계 추출 모델 (Deep Learning Based Causal Relation Extraction with Expansion of Training Data)

  • 이승욱;유홍연;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.61-66
    • /
    • 2018
  • 인과관계 추출이란 어떠한 문장에서 인과관계가 존재하는지, 인과관계가 존재한다면 원인과 결과의 위치까지 분석하는 것을 말한다. 하지만 인과관계 관련 연구는 그 수가 적기 때문에 말뭉치의 수 또한 적으며, 기존의 말뭉치가 존재하더라도 인과관계의 특성상 새로운 도메인에 적용할 때마다 데이터를 다시 구축해야 하는 문제가 있다. 따라서 본 논문에서는 도메인 특화에 따른 데이터 구축비용 문제를 최소화하면서 새로운 도메인에서 인과관계 모델을 잘 구축할 수 있는 통계 기반 모델을 이용한 인과관계 데이터 확장 방법과 도메인에 특화되지 않은 일반적인 언어자질과 인과관계에 특화된 자질을 심층 학습 기반 모델에 적용함으로써 성능 향상을 보인다.

  • PDF

A Data Model for XML

  • 이대우;최옥;김영찬
    • 한국정보기술응용학회:학술대회논문집
    • /
    • 한국정보기술응용학회 2001년도 추계공동학술대회 논문자료집 정보화 젼략 패러다임의 변화에 대한 보기술의 대응
    • /
    • pp.169-171
    • /
    • 2001
  • 본 논문에서는 XML(eXtensible Markup Language)을 위한 데이터 모델을 제시하기 위해 현재 광범위하게 사용되고 있는 관계형 데이터베이스(relational database) 개념을 적용한다. 관계형 데이터베이스는 업무 요구사항의 분석으로부터 고수준의 개념적 데이터 모델을 사용해서 데이터베이스에 대한 개념적 스키마(conceptual schema)를 생성한 다음, 고수준 개념적 데이터 모델을 구현 데이터 모델로 변환하여 논리적 데이터베이스 스키마를 생성한다. 이때, 고수준 개념적 데이터 모델링의 대표적인 방법으로 ER모델을 사용하고, 구현 데이터 모델로 관계 모델(relation model)을 사용한다. XML은 문서의 논리적 구조를 정의하는 DTD와 XML Schema 등을 갖는다. XML의 DTD와 정보 모델링 기법인 E/R 모델은 모두 작은 세계(real world)를 모델링하는 도구들이라고 할 수 있다. 본 논문에서는 XML의 DTD와 E/R 모델의 구성요소들을 분석하여 서로 사상(mapping)시키는 'XML을 위한 데이터 모델(A Data Model for XML)'을 제시한다. 최종적으로 제시된 XML을 위한 데이터 모델에 의해 작은 세계(real world)을 모델링하는 XML DTD에서 정의한 구조(XML Structure)을 따르는 유효한 XML문서(validate XML document)들은 관계형 데이터베이스에 저장할 수 있게 된다.

  • PDF

관계추출 모델 학습을 위한 반자동 패턴 마이닝 (Semiautomatic Pattern Mining for Training a Relation Extraction Model)

  • 최규현;남상하;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.257-262
    • /
    • 2016
  • 본 논문은 비구조적인 자연어 문장으로부터 두 개체 사이의 관계를 표현하는 구조적인 트리플을 밝히는 관계추출에 관한 연구를 기술한다. 사람이 직접 언어적 분석을 통해 트리플이 표현되는 형식을 입력하여 관계를 추출하는 규칙 기반 접근법에 비해 기계가 데이터로부터 표현 형식을 학습하는 기계학습 기반 접근법은 더 다양한 표현 형식을 확보할 수 있다. 기계학습을 이용하려면 모델을 훈련하기 위한 학습 데이터가 필요한데 학습 데이터가 수집되는 방식에 따라 지도 학습, 원격지도 학습 등으로 구분할 수 있다. 지도 학습은 사람이 학습 데이터를 만들어야하므로 사람의 노력이 많이 필요한 단점이 있지만 양질의 데이터를 사용하는 만큼 고성능의 관계추출 모델을 만들기 용이하다. 원격지도 학습은 사람의 노력을 필요로 하지 않고 학습 데이터를 만들 수 있지만 데이터의 질이 떨어지는 만큼 높은 관계추출 모델의 성능을 기대하기 어렵다. 본 연구는 기계학습을 통해 관계추출 모델을 훈련하는데 있어 지도 학습과 원격지도 학습이 가지는 단점을 서로 보완하여 타협점을 제시하는 학습 방법을 제안한다.

  • PDF

관계추출 모델 학습을 위한 반자동 패턴 마이닝 (Semiautomatic Pattern Mining for Training a Relation Extraction Model)

  • 최규현;남상하;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.257-262
    • /
    • 2016
  • 본 논문은 비구조적인 자연어 문장으로부터 두 개체 사이의 관계를 표현하는 구조적인 트리플을 밝히는 관계추출에 관한 연구를 기술한다. 사람이 직접 언어적 분석을 통해 트리플이 표현되는 형식을 입력하여 관계를 추출하는 규칙 기반 접근법에 비해 기계가 데이터로부터 표현 형식을 학습하는 기계학습 기반 접근법은 더 다양한 표현 형식을 확보할 수 있다. 기계학습을 이용하려면 모델을 훈련하기 위한 학습 데이터가 필요한데 학습 데이터가 수집되는 방식에 따라 지도 학습, 원격지도 학습 등으로 구분할 수 있다. 지도 학습은 사람이 학습 데이터를 만들어야하므로 사람의 노력이 많이 필요한 단점이 있지만 양질의 데이터를 사용하는 만큼 고성능의 관계추출 모델을 만들기 용이하다. 원격지도 학습은 사람의 노력을 필요로 하지 않고 학습 데이터를 만들 수 있지만 데이터의 질이 떨어지는 만큼 높은 관계추출 모델의 성능을 기대하기 어렵다. 본 연구는 기계학습을 통해 관계추출 모델을 훈련하는데 있어 지도 학습과 원격지도 학습이 가지는 단점을 서로 보완하여 타협점을 제시하는 학습 방법을 제안한다.

  • PDF

자기 학습 방법을 이용한 음성 대화 시스템의 슬롯 교정 (Self-learning Method Based Slot Correction for Spoken Dialog System)

  • 최태균;김민경;이인재;이지은;박규연;김경덕;강인호
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.353-360
    • /
    • 2021
  • 음성 대화 시스템에서는 사용자가 잘못된 슬롯명을 말하거나 음성인식 오류가 발생해 사용자의 의도에 맞지 않는 응답을 하는 경우가 있다. 이러한 문제를 해결하고자 말뭉치나 사전 데이터를 활용한 질의 교정 방법들이 제안되지만, 이는 지속적으로 사람이 개입하여 데이터를 주입해야하는 한계가 있다. 본 논문에서는 축적된 로그 데이터를 활용하여 사람의 개입 없이 음악 재생에 필요한 슬롯을 교정하는 자기 학습(Self-learning) 기반의 모델을 제안한다. 이 모델은 사용자가 특정 음악을 재생하고자 유사한 질의를 반복하는 상황을 이용하여 비지도 학습 기반으로 학습하고 음악 재생에 실패한 슬롯을 교정한다. 그리고, 학습한 모델 결과의 정확도에 대한 불확실성을 해소하기 위해 질의 슬롯 관계 유사도 모델을 이용하여 교정 결과에 대한 검증을 하고 슬롯 교정 결과에 대한 안정성을 보장한다. 모델 학습을 위한 데이터셋은 사용자가 연속으로 질의한 세션 데이터로부터 추출하며, 음악 재생 슬롯 세션 데이터와 질의 슬롯 관계 유사도 데이터를 각각 구축하여 슬롯 교정 모델과 질의 슬롯 관계 유사도 모델을 학습한다. 교정된 슬롯을 분석한 결과 발음 정보가 유사한 슬롯 뿐만 아니라 의미적인 관계가 있는 슬롯으로도 교정하여 사전 기반 방식보다 다양한 유형의 교정이 가능한 것을 보였다. 3 개월 간 수집된 로그 데이터로 학습한 음악 재생 슬롯 교정 모델은 일주일 동안 반복한 고유 질의 기준, 음악 재생 실패의 12%를 개선하는 성능을 보였다.

  • PDF

3차원 기하 모델에 대한 공간 관계연산 설계 (Design of Spatial Relationship for 3D Geometry Model)

  • 이동헌;홍성언;박수홍
    • 한국GIS학회:학술대회논문집
    • /
    • 한국GIS학회 2004년도 GIS/RS 공동 춘계학술대회 논문집
    • /
    • pp.31-37
    • /
    • 2004
  • GIS 분야에서 다루는 공간 데이터는 대부분 2차원의 데이터이다. 현실 공간에 존재하는 3차원 객체의 2차원 정보만을 취하거나 혹은 2차원 공간으로 투영하는 등의 방법으로 데이터를 저장한다. 이러한 방법은 정보의 손실로 인한 데이터 활용범위가 축소되고, 현실 공간을 정확하게 반영하지 못하는 문제가 있다. 최근 3차원 공간 데이터를 저장, 관리 가능한 DBMS가 개발되고, 3차원 데이터에 대한 관심과 요구가 높아가고 있다. 하지만 3차원 데이터를 단순 저장만 가능할 뿐 공간 연산에 대한 연구가 미흡한 실정이다. 본 연구에서는 3차원 공간 모델을 이용하여 공간 데이터베이스 표준에서 정의하고 있는 공간 관계 연산을 설계하였다. 공간 데이터 모델로는 OGC에서 제시한 GML3에서 정의하는 모델을 사용하였고, 공간 관계 연산에 대한 설계 도구로는 공간 관계를 연산하는데 가장 좋은 방법으로 알려진 DE-9IM을 이용하였다.

  • PDF

Dual Supervision 을 이용한 이미지 객체 간 관계 추출 (Relation Extraction between Image Objects using Dual Supervision)

  • 김민규;장민수;전희국;임동혁
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1244-1246
    • /
    • 2023
  • 비디오, 오디오, 이미지, 텍스트 등의 비정형 데이터는 데이터 구조가 없어 데이터 자체만으로는 내용에 대한 질의 처리가 힘들어 정형 데이터로 변환하는 과정이 필요하다. 관계 추출 작업은 문장 내 단어 간 속성 또는 관계를 예측하여, 문장을 구조적으로 표현한다. 자연어처리 기법인 Dual Supervision 모델은 인간이 레이블한 데이터와 기계가 레이블한 데이터를 기반으로 기존 모델보다 적은 리소스로 관계를 예측한다. 해당 자연어 처리 모델을 이미지 처리에도 적용하여 기존 방법보다 적은 리소스를 이용하여 이미지에 대한 내용을 구조적으로 나타내는 모델을 제안하였으며, 실험을 통해 효율적인 이미지 객체 관계 추출이 가능함을 확인하였다.

RiC을 적용한 아카이브 시스템 데이터 모델링 연구 (A Study in the Data Modeling for Archive System Applying RiC)

  • 신미라;김익한
    • 한국기록관리학회지
    • /
    • 제19권1호
    • /
    • pp.23-67
    • /
    • 2019
  • Records in Contexts(RiC)은 ICA의 네 가지 기술표준을 통합, 정규화하여 개발한 국제적 기술표준이다. RiC은 기록 기술을 다차원적으로 바꾸고 기록의 맥락을 드러내며 이질적 시스템 간 데이터 상호운용성을 확보할 수 있는 장점이 있다. 본 논문에서는 RiC을 아카이브 시스템 설계의 핵심 도구로 설정하고, 데이터베이스 구현을 위한 '논리적 데이터 모델링'을 수행한다. RiC의 개념 모델인 RiC-CM(Conceptual Model)은 데이터 참조 모델로 활용할 수 있기 때문에, 사용자 요구사항에 맞는 데이터 모델로 개발이 가능하다. 이에 본 논문에서는 이를 두 가지 데이터 모델, '관계형 데이터 모델'과 '그래프형 데이터 모델'로 구현하고자 한다. 관계형 데이터 모델은 대부분 레거시 시스템의 데이터베이스가 적용하고 있는 만큼 범용적이다. 한편 그래프형 데이터 모델은 정보 '개체(entity)' 사이의 '관계(relationship)'를 중심으로 개체를 유연하게 확장할 수 있다.