• 제목/요약/키워드: 그래프 기반

검색결과 1,197건 처리시간 0.028초

$\mathcal{K}o$-ATOMIC: 일반 상식 기반의 한국어 지식 그래프 ($\mathcal{K}o$-ATOMIC: Korean Commonsense Knowledge Graph)

  • 이재욱;서재형;이승준;박찬준;;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.412-417
    • /
    • 2022
  • 일반 상식 기반의 지식 그래프는 대규모 코퍼스에 포함되어 있는 일반 상식을 그래프로 표현하여, 자연어 처리의 하위 작업들에 적용할 수 있도록 하는 구조화된 지식 표현 방법이다. 현재 가장 잘 알려진 일반 상식 기반의 지식 그래프로는 ATOMIC [1]이 있다. 하지만 한국어를 주요 언어로 하는 일반 상식 기반의 지식 그래프에 대한 연구는 아직 활발하지 않다. 따라서 본 연구에서는 기존에 존재하는 영어 기반의 지식 그래프와 일반 상식 기반의 한국어 데이터셋을 활용해서 한국어 일반 상식 기반 지식 그래프를 구축하는 방법론을 제시한다. 또한, 제작한 지식 그래프를 평가하여 구축하는 방법론에 대한 타당성을 검증한다.

  • PDF

Dual Decomposition을 이용한 전이기반 및 그래프 기반 의존 파서 통합 모델 (Integrating Transition-based and Graph-based Dependency Parsers using Dual Decomposition)

  • 민진우;나승훈;신종훈;김영길
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.25-29
    • /
    • 2019
  • 딥러닝을 이용한 한국어 의존 파싱은 전이 기반 방식과 그래프 기반 방식으로 나뉘어 연구되어 왔다. 전이 기반 방식은 입력 버퍼와 스택으로부터 자질을 추출하여 모델을 통해 액션을 결정하고 액션에 따라 파스트리를 생성해 나가는 상향식(Botton-Up)의 지역적 모델이고 그래프 기반 방식은 문장 내의 모든 단어에 대해 지배소, 의존소가 될 수 있는 점수를 딥러닝 모델을 통해 점수화하여 트리를 생성하는 전역적 모델이다. 본 논문에서는 Dual Decomposition을 이용하여 하이브리드 방식으로 전이 기반 파서와 그래프 기반 파서를 결합하는 방법을 제안하고 BERT 언어 모델을 반영하여 세종 데이터 셋에서 UAS 94.47%, LAS 92.58% 그리고 SPMRL '14 데이터 셋에서 UAS 94.74%, UAS 94.20%의 성능을 보여 기존 그래프 기반 파서의 성능을 더욱 개선하였다.

  • PDF

Ko-ATOMIC 2.0: 한국어 상식 지식 그래프 구축 (Ko-ATOMIC 2.0: Constructing Commonsense Knowledge Graph in Korean)

  • 이재욱;서재형;정다현;박찬준;;임희석
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.319-323
    • /
    • 2023
  • 일반 상식 기반의 지식 그래프는 대규모 코퍼스에 포함되어 있는 일반 상식을 수집하고 구조화하는 지식의 표현 방법이다. 일반 상식 기반의 지식 그래프는 코퍼스 내에 포함되어 있는 다양한 일반 상식의 형태와 관계를 모델링하며, 주로 질의응답 시스템, 상식 추론 등의 자연어처리 하위 작업에 활용할 수 있다. 가장 잘 알려진 일반 상식 기반의 지식 그래프로는 ConceptNet [1], ATOMIC [2]이 있다. 하지만 한국어 기반의 일반 상식 기반의 지식 그래프에 대한 연구가 존재했지만, 자연어처리 태스크에 활용하기에는 충분하지 않다. 본 연구에서는 대규모 언어 모델과 프롬프트의 활용을 통해 한국어 일반 상식 기반의 지식 그래프를 효과적으로 구축하는 방법론을 제시한다. 또한, 제안하는 방법론으로 구축한 지식 그래프와 기존의 한국어 상식 그래프의 품질을 양적, 질적으로 검증한다.

  • PDF

Word2Vec을 이용한 반복적 접근 방식의 그래프 기반 단어 중의성 해소 (An Iterative Approach to Graph-based Word Sense Disambiguation Using Word2Vec)

  • 오동석;강상우;서정연
    • 인지과학
    • /
    • 제27권1호
    • /
    • pp.43-60
    • /
    • 2016
  • 지식기반을 이용한 비지도 방법의 단어 중의성 해소 연구는 그래프 기반 단어 중의성 해소 방법에 중점을 두고 있다. 그래프 기반 방법은 중의성 단어와 문맥이나 문장에서 같이 등장한 단어들과 의미그래프를 구축하여 연결 관계를 보고 중의성을 해소한다. 하지만, 모든 중의성 단어를 가지고 의미 그래프를 구축하게 되면 불필요한 간선과 노드 정보가 추가되어 오류를 증가시킨다는 단점이 있다. 본 연구에서는 이러한 문제를 해결하고자 반복적 접근 방식의 그래프 기반 단어 중의성 해소 방식을 사용한다. 이 방식은 모든 중의성 단어들을 특정 기준에 의해서 단어를 매칭 하고 매칭 된 단어들을 반복적으로 그래프를 재구축하여 단어중의성을 해소한다. 본 연구에서는 Word2Vec을 이용하여 문맥이나 문장 내에 중의성 단어와 의미적으로 가장 유사한 단어끼리 매칭하고, 매칭 된 단어들을 순서대로 그래프를 재구축하여 중의성 단어의 의미를 결정하였다. 결과적으로 Word2Vec의 단어 벡터정보를 이용하여 이전에 연구 되었던 그래프 기반 방법과 반복적 접근 방식의 그래프 기반 방법보다 더 높은 성능을 보여준다.

  • PDF

그래프 신경망 기반 질의응답 시스템에서 그래프 병합을 활용한 재추론 기법 (Re-Inference Method using Graph Merging in Graph Neural Network based Question Answering System)

  • 이필원;김상훈;신용태
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.480-482
    • /
    • 2021
  • 최근 다수의 문서를 고려해야하는 다중홉(multi-hop) 추론과 같은 복잡한 문제를 해결하기 위해 계층적 그래프 신경망기반 질의응답 시스템이 제안되었다. 계층적 그래프 신경망 기반 질의응답 시스템은 사람의 정확도를 뛰어넘었으나 제한된 문서를 통해 추론을 진행하기 때문에 문서에 충분한 정보가 없을 경우 추론에 실패할 가능성이 존재한다. 따라서 본 논문에서는 위 문제를 해결하기 위해 정보를 재탐색하고 기존의 그래프 정보와 병합하여 기존의 정보와 새로운 정보를 고려하여 재추론 할 수 있는 그래프 병합 기법을 제안한다. 제안하는 그래프 병합 기법은 사전에 정의된 규칙에 의해 수행되며 노드의 병합 및 연결을 통해 새로운 그래프를 도출한다. 새로운 그래프는 그래프 신경망을 통해 추론을 진행하여 기존 정보와 새로운 정보를 고려한 정답을 도출할 수 있다.

증강 그래프 기반 그래프 뉴럴 네트워크를 활용한 POI 추천 모델 (Next POI Recommendation based on Graph Neural Network of Augmented Graph)

  • 정현지;장광선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.16-18
    • /
    • 2023
  • 본 연구는 궤적 데이터(trajectory data)를 대상으로 증강 그래프 기반의 그래프 뉴럴 네트워크를 활용하여 다음에 방문한 장소를 추천하는 모델을 제안한다. 제안 모델은 전체 궤적 데이터를 그래프로 표현하여 추출한 글로벌 궤적 플로우의 특성을 다음 방문할 POI 추천에 활용한다. 이때, POI 추천시 자주 발생하는 두 가지 문제를 추가로 해결함으로써 POI 추천의 정확도를 높이는 것을 목표로 한다. 첫 번째 문제는 추천 대상 궤적 데이터의 길이가 짧은 경우에 성능 저하가 발생한다는 것이다. 두 번째 문제는 콜드-스타트 문제이다. 기존 POI 추천 모델은 매우 적은 방문 기록만 가지는 사용자 또는 POI에 대해서는 매우 낮은 예측 성능을 보인다. 본 연구에서는 궤적 그래프에서 일부 엣지를 삭제하여 생성한 증강 그래프 기반의 궤적 플로우 특징 기반 모델을 제안함으로써 짧은 길이의 궤적 데이터 및 콜드-스타트 사용자/POI에 대한 추천 성능을 높인다.

데이터베이스에 기반한 그래프 라이브러리 및 그래프 알고리즘 개발 (Development of Database Supported Graph Library and Graph Algorithms)

  • 박휴찬;추인경
    • 한국정보통신학회논문지
    • /
    • 제6권5호
    • /
    • pp.653-660
    • /
    • 2002
  • 본 논문은 관계형 데이터베이스 기반하여 그래프를 저장하고 그래프 알고리즘을 정의할 수 있는 방법을 제안한다. 이 방법에서 그래프는 릴레이션으로 표현되며, 그래프의 각 정점과 간선은 이 릴레이션의 튜플로서 데이터베이스에 저장된다. 이를 위해 그래프의 저장 및 관리뿐만 아니라 다양한 응용프로그램 개발에도 사용될 수 있는 기본적인 그래프 함수들을 라이브러리로 개발하였다. 또한, 그래프에 대한 알고리즘을 추출, 선택, 죠인과 같은 관계대수 연산을 이용하여 정의하였으며, SQL과 같은 데이터베이스 언어를 사용하여 구현하였다. 이와 같은 데이터베이스에 기반한 방법은 메모리에 수용되지 않는 크기의 그래프를 효과적으로 처리할 수 있을 뿐만 아니라 다양한 응용프로그램 개발을 용이하게 할 것이다.

심층신경망 언어이해에서의 벡터-그래프 변환 방법을 통한 설명가능성 확보에 대한 연구 (Vector2graph : A Vector-to-Graph Conversion Framework for Explainable Deep Natural Language Understanding)

  • 허세훈;정상근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.427-432
    • /
    • 2020
  • 딥러닝(Deep-learning) 기반의 자연어 이해(Natural Language Understanding) 기술들은 최근에 상당한 성과를 성취했다. 하지만 딥러닝 기반의 자연어 이해 기술들은 내적인 동작들과 결정에 대한 근거를 설명하기 어렵다. 본 논문에서는 벡터를 그래프로 변환함으로써 신경망의 내적인 의미 표현들을 설명할 수 있도록 한다. 먼저 인간과 기계 모두가 이해 가능한 표현방법의 하나로 그래프를 주요 표현방법으로 선택하였다. 또한 그래프의 구성요소인 노드(Node) 및 엣지(Edge)의 결정을 위한 Element-Importance Inverse-Semantic-Importance(EI-ISI) 점수와 Element-Element-Correlation(EEC) 점수를 심층신경망의 훈련방법 중 하나인 드랍아웃(Dropout)을 통해 계산하는 방법을 제안한다. 다양한 실험들을 통해, 본 연구에서 제안한 벡터-그래프(Vector2graph) 변환 프레임워크가 성공적으로 벡터의 의미정보를 유지하면서도, 설명 가능한 그래프를 생성함을 보인다. 더불어, 그래프 기반의 새로운 시각화 방법을 소개한다.

  • PDF

동시 발생 빈발 부분그래프를 이용한 그래프 분류 (Graph Classification using Co-occurrent Frequent Subgraphs)

  • 박기성;한용구;이영구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(C)
    • /
    • pp.109-111
    • /
    • 2011
  • 대부분의 빈발 부분그래프를 이용한 그래프 분류 알고리즘들은 빈발 부분그래프를 마이닝하여 개별적인 빈발 부분그래프의 포함 여부를 특징 벡터로 구성하는 단계와 기계학습 알고리즘들을 훈련시켜 분류 모델을 수립하는 단계로 구성된다. 이와 같은 그래프 분류 알고리즘들은 부분그래프의 개별적인 존재 여부만을 이용하여 특징을 구성하기 때문에 변별력이 떨어지는 문제점이 있다. 본 논문에서는 빈발 부분그래프들이 동시 발생하는 특징 벡터의 변별력을 반영할 수 있는 특징선택 기법을 적용한 모델 기반 탐색트리 기법을 제안한다. 동시 발생 부분그래프를 특징으로 사용하여 변별력을 향상시킬 수 있으며, 모델기반 탐색 트리를 사용하여 제안하는 기법이 기존의 방법보다 더 높은 그래프 분류 성능을 보이는 것을 입증하였다.

채팅 메신저 사용자 검증을 위한 그래프 랜덤 워크 분석 (Graph Random Walk Analysis for Chat Messenger User Verification)

  • 이다영;조환규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.79-84
    • /
    • 2021
  • 메신저 사용의 증가와 함께 관련 범죄와 사고가 증가하고 있어 메시지 사용자 검증의 필요성이 대두되고 있다. 본 연구에서는 그래프 기반의 인스턴트 메세지 분석 모델을 제안하여 채팅 사용자를 검증하고자 한다. 사용자 검증은 주어진 두 개의 텍스트의 작성자가 같은지 여부를 판단하는 문제다. 제안 모델에서는 사용자의 이전 대화를 토대로 n-gram 전이 그래프를 구축하고, 작성자를 알 수 없는 메세지를 이용해 전이 그래프를 순회한 랜덤워크의 특성을 추출한다. 사용자의 과거 채팅 습관과 미지의 텍스트에 나타난 특징 사이의 관계를 분석한 모델은 10,000개의 채팅 대화에서 86%의 정확도, 정밀도, 재현율로 사용자를 검증할 수 있었다. 전통적인 통계 기반 모델들이 명시적 feature를 정의하고, 방대한 데이터를 이용해 통계 수치로 접근하는데 반해, 제안 모델은 그래프 기반의 문제로 치환함으로써 제한된 데이터 분량에도 안정적인 성능을 내는 자동화된 분석 기법을 제안했다.

  • PDF