• 제목/요약/키워드: 생성형 정보추출

검색결과 246건 처리시간 0.028초

생성형 언어모델을 이용한 관계추출 (Relation Extraction using Generative Language Models)

  • 허정;신종훈;임수종;권오욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.707-710
    • /
    • 2023
  • 관계추출은 문장 내 두 개체 간의 의미적 관계를 추론하는 자연어분석 태스크이다. 딥러닝의 발전과 더불어 관계추출은 BERT 계열의 이해형 언어모델을 이용하였다. 그러나, ChatGPT의 혁신적인 등장과 함께, GPT계열의 생성형 언어모델에 대한 연구가 활발해졌다. 본 논문에서는 소규모의 생성형 언어모델(Kebyt5)을 이용하여 관계추출 성능개선을 위한 프롬프트 구성 및 생각의 사슬(CoT) 학습 방법을 제안한다. 실험결과 Kebyt5-large 모델에서 CoT 학습을 수행하였을 경우, Klue-RoBERTa-base 모델보다 3.05%의 성능개선이 있었다.

  • PDF

대화형 관계 추출 태스크에 최적화된 트리거 생성 방법론 (Methodology of Trigger Generation optimized for Dialogue Relation Extraction task)

  • 김경민;손준영;김진성;조재춘;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.374-378
    • /
    • 2022
  • 대화형 관계 추출의 목표는 주어진 대화에서 두 개체 간의 관계를 식별하는 것이다. 대화 중에 화자는 개체 및 관계와 관련이 있는 단서인 트리거를 통해 특정 개체 간 관계를 식별하는 것에 힌트를 얻을 수 있다. 그러나 데이터에 대해 항상 트리거 정보가 존재하는 것이 아니므로 트리거를 활용해 성능을 향상시키는 것은 어렵다. 본 논문은 이 문제점을 해소하기 위해 대화, 개체, 관계 중심으로 트리거 생성 모델을 학습하고, 이를 통해 생성된 트리거를 대화형 관계 추출에 학습하여 관계 식별에 효과적인 성능 향상을 보이는 접근법을 제안한다. 제안하는 접근법은 대화형 관계 추출 태스크에서 기존 성능과 비교한 결과 Dev, Test에서 각각 F1 19.74%p, F1 15.53%p 의 성능 향상을 보였다.

  • PDF

대화형 질의응답 말뭉치 자동 생성에 대한 연구 (A study on the Automatic Generation of Conversational QA Corpora)

  • 황선정;이근배
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.133-138
    • /
    • 2021
  • 최근 다양한 분야에서 자동 고객 응대 시스템을 도입하고 있으며 이에 따른 대화형 질의응답 시스템 연구의 필요성이 증가하고 있다. 본 논문에서는 새로운 도메인의 대화형 질의응답 시스템 구축에 필요한 말뭉치를 자동으로 생성하는 대화형 질의-응답 생성 시스템을 소개한다. 또한 이전 대화 내용을 고려하여 문서로부터 사용자의 다음 질문 대상이 될만한 응답 후보를 추출하는 맥락 관련 응답 추출 과제와 이에 대한 성능 평가 지표인 Sequential F1 점수를 함께 제안한다. 대화형 질의응답 말뭉치인 CoQA에 대해 응답 후보 추출 실험을 진행한 결과 기존의 응답 추출 모델보다 우리의 맥락 관련 응답 추출 모델이 Sequential F1 점수에서 31.1 높은 성능을 보였다. 또한 맥락 관련 응답 추출 모듈과 기존에 연구된 대화형 질의 생성 모듈을 결합하여 개발한 대화형 질의-응답 생성 시스템을 통해 374,260 쌍의 질의-응답으로 구성된 대화형 질의응답 말뭉치를 구축하였다.

  • PDF

음영합성 기법을 이용한 실사형 아바타 얼굴 생성 (Realistic Avatar Face Generation Using Shading Mechanism)

  • 박연출
    • 인터넷정보학회논문지
    • /
    • 제5권5호
    • /
    • pp.79-91
    • /
    • 2004
  • 본 논문에서는 음영합성 기법과 얼굴 인식 기술 중 특징추출 기법을 이용한 아바타 얼굴 자동생성 시스템을 제안한다. 제안하는 시스템은 사진으로부터 얼굴의 특징정보를 추출하여 사람의 얼굴과 유사한 아바타 얼굴을 자동으로 생성해 주는 시스템이며, 음영을 사진으로부터 추출하여 이를 각 이목구비 이미지와 합성하여 생성한다. 따라서 실사형에 좀 더 근접한 얼굴을 생성할 수 있다. 본 논문은 새로운 눈동자 추출 기법과 각 이목구비별 특징정보 추출 방법 그리고. 검색시간을 줄이기 위한 분류 방법, 유사도 계산에 의한 이미지 검색방법, 최종적으로 사진으로부터 음영을 추출하여 검색된 이목구비와 합성, 실사형 아바타 얼굴을 생성하는 방법을 제안한다.

  • PDF

맥락적 어휘 지식 그래프 추출 알고리즘의 설계 (Design of a Contextual Lexical Knowledge Graph Extraction Algorithm)

  • 남상하;최규현;함영균;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.147-151
    • /
    • 2016
  • 본 논문에서는 Reified 트리플 추출을 위한 한국어 개방형 정보추출 방법을 제시한다. 시맨틱웹 분야에서 지식은 흔히 RDF 트리플 형태로 표현되지만, 자연언어문장은 복수개의 서술어와 논항간의 관계로 구성되어 있다. 이러한 이유로, 시맨틱웹의 대표적인 지식표현법인 트리플을 따름과 동시에 문장의 의존구조를 반영하여 복수개의 술어와 논항간의 관계를 지식화하는 새로운 개방형 정보추출 시스템이 필요하다. 본 논문에서는 문장 구조에 대한 일관성있는 변환을 고려한 새로운 개방형 정보추출 방법을 제안하며, 개체 중심의 지식과 사건중심의 지식을 함께 표현할 수 있는 Reified 트리플 추출방법을 제안한다. 본 논문에서 제안한 방법의 우수성과 실효성을 입증하기 위해 한국어 위키피디아 알찬글 본문을 대상으로 추출된 지식의 양과 정확도 측정 실험을 수행하였고, 본 논문에서 제안한 방식을 응용한 의사 SPARQL 질의 생성 모듈에 대해 소개한다.

  • PDF

맥락적 어휘 지식 그래프 추출 알고리즘의 설계 (Design of a Contextual Lexical Knowledge Graph Extraction Algorithm)

  • 남상하;최규현;함영균;최기선
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.147-151
    • /
    • 2016
  • 본 논문에서는 Reified 트리플 추출을 위한 한국어 개방형 정보추출 방법을 제시한다. 시맨틱웹 분야에서 지식은 흔히 RDF 트리플 형태로 표현되지만, 자연언어문장은 복수개의 서술어와 논항간의 관계로 구성되어 있다. 이러한 이유로, 시맨틱웹의 대표적인 지식표현법인 트리플을 따름과 동시에 문장의 의존구조를 반영하여 복수개의 술어와 논항간의 관계를 지식화하는 새로운 개방형 정보추출 시스템이 필요하다. 본 논문에서는 문장 구조에 대한 일관성있는 변환을 고려한 새로운 개방형 정보추출 방법을 제안하며, 개체중심의 지식과 사건중심의 지식을 함께 표현할 수 있는 Reified 트리플 추출방법을 제안한다. 본 논문에서 제안한 방법의 우수성과 실효성을 입증하기 위해 한국어 위키피디아 알찬글 본문을 대상으로 추출된 지식의 양과 정확도 측정 실험을 수행하였고, 본 논문에서 제안한 방식을 응용한 의사 SPARQL 질의 생성 모듈에 대해 소개한다.

  • PDF

실사형 캐리커처 생성을 위한 형태 정보 추출 및 음영 함성 (Appearance Information Extraction and Shading for Realistic Caricature Generation)

  • 박연출;오해석
    • 정보처리학회논문지B
    • /
    • 제11B권3호
    • /
    • pp.257-266
    • /
    • 2004
  • 본 논문은 윤곽선만을 추출하여 캐리커처를 생성하던 기존의 시스템과 달리 음영을 윤곽선과 합성하여 캐리커처를 생성하는 캐리커처 생성 시스템을 제안한다. 이 방식을 사용할 경우 얼굴의 텍스추어 정보까지 생성시 고려하기 때문에 좀 더 실사형에 근접한 캐리커처를 생성할 수 있다. 본 논문에서 제안하는 시스템은 벡터를 기만으로 하기 때문에 사이즈에 제한 없이 자유로운 변형이 가능할 뿐만 아니라 2D 캐릭터에 자유로운 표정을 적용하는 데에도 쉽게 적용이 가능하다. 또, 벡터의 특징으로 인해 모바일 상에서도 적은 용량으로 이용 가능하다. 본 논문은 벡터 형태의 캐리커처를 생성하는 방법과 음영을 제작 및 합성하는 방법을 함께 제시한다.

카메라 내장형 휴대폰을 이용한 아바타 생성 시스템 연구 (A Study On The Avatar Generation System Using Camera Embedded Phone)

  • 이무열;이성준;안광선
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (2)
    • /
    • pp.571-573
    • /
    • 2003
  • 본 논문에서는 카메라 내장형 휴대폰을 이용한 아바타 영상 생성 시스템을 제안하고자 한다. 먼저 정면에서 찍은 상반신 컬러영상의 배경제거를 위하여 흑백영상으로 변환한 후, sobel edge 방법을 적용하여 수축 및 확장처리를 하였다. 이후, 배경이 제거된 영상의 얼굴을 구성하는 각 부분(머리카락, 얼굴형태, 눈, 코, 잎, 귀)을 추출하는 과정을 거친다. 제일먼저 filling 방법을 적용하여 머리카락 영역을 추출한 후, 얼굴영역은 skin-color 모델을 적용하여 추출하였다. 얼굴의 형태는 얼굴의 상하좌우의 끝점을 이용한 계란형을 기본으로 하였으며, 눈, 코. 잎. 귀 부분은 얼굴의 형태정보를 이용하여, 각 부분들의 위치 정보를 구하였다. 이 정보를 이용하여 이미 만들어 놓은 샘플 아바타와 가장 유사한 샘플을 선택한 후, 각 부분들을 조립함으로서 나와 닮은 아바타 영상을 만든다.

  • PDF

이벤트 템플릿을 이용한 정보 추출에 관한 연구 (A Study on Information Extraction Using Event Template)

  • 임수종;정의석;황이규;윤보현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2002년도 춘계학술발표논문집 (상)
    • /
    • pp.585-588
    • /
    • 2002
  • 본 논문에서는 개체형 인식이 된 일반 문서에서 정보 추출을 하기 위하여 이벤트 템플릿 구조를 사용하는 방법을 제안한다. 제한된 도메인 지식을 주로 사용하는 기존의 정보 추출 방법과 달리 predicate-argument 구조를 갖는 이벤트 템플릿은 일반적인 지식을 주로 사용하여 정보 추출을 한다. 이벤트 템플릿을 추출하기 위해서는 형태소 분석 결과 용언의 하위범주 정보를 이용하고 이벤트 템플릿의 논항 구조를 이용하여 필요시 이벤트 템플릿을 통합한다. 문서에서 생성된 일반적인 이벤트 템플릿은 정보수용자의 요구에 맞는 도메인 지식을 사용하여 최종적인 결과를 생성한다. 이벤트 템플릿을 사용하는 정보 추출 실험 결과는 제한된 도메인 정보를 사용하는 시스템에 비해 정확율은 떨어지지만 기존 정보 추출시스템의 문제인 이식성을 높일 수 있다.

  • PDF

복합형 카메라 시스템을 이용한 자율주행 차량 플랫폼 (Autonomous Driving Platform using Hybrid Camera System)

  • 이은경
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1307-1312
    • /
    • 2023
  • 본 논문에서는 자율주행 인지 기술의 핵심 요소인 객체 인식과 거리 측정을 위해 서로 다른 초점거리를 가진 다시점 카메라와 라이다(LiDAR) 센서를 결합한 복합형 카메라 시스템을 제안한다. 제안한 복합형 카메라 시스템을 이용해 장면 안의 객체를 추출하고, 추출한 객체의 정확한 위치와 거리 정보를 생성한다. 빠른 계산 속도와 높은 정확도, 실시간 처리가 가능하다는 장점 때문에 자율주행 분야에서 많이 사용하고 있는 YOLO7 알고리즘을 이용해 장면 안의 객체를 추출한다. 그리고 객체의 위치와 거리 정보를 생성하기 위해 다시점 카메라를 이용해 깊이맵을 생성한다. 마지막으로 거리 정확도를 향상시키기 위해 라이다 센서에서 획득한 3차원 거리 정보와 생성한 깊이맵을 하나로 결합한다. 본 논문에서는 제안한 복합형 카메라 시스템을 기반으로 주행중인 주변 환경을 더욱 정확하게 인식함과 동시에 3차원 공간상의 정확한 위치와 거리 정보까지 생성할 수 있는 자율주행 차량 플랫폼을 제안하였으며, 이를 통해 자율주행 차량의 안전성과 효율성을 향상시킬 수 있을 것으로 기대한다.