• 제목/요약/키워드: 인과관계 추출

검색결과 136건 처리시간 0.025초

단서 구문과 어휘 쌍 확률을 이용한 인과관계 추출 (Causal Relation Extraction Using Cue Phrases and Lexical Pair Probabilities)

  • 장두성;최기선
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2003년도 제15회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.163-169
    • /
    • 2003
  • 현재의 질의응답 시스템은 TREC(Text Retrieval Conference) 질의집합에 대해 최대 80% 정도의 응답 성공률을 보이고 있다. 하지만 질의 유형에 다라 성능의 많은 차이가 있으며, 인과관계에 대한 질의에 대해서는 매우 낮은 응답 성공률을 보이고 있다. 본 연구는 인접한 두 문장 혹은 두 문장 혹은 두 명사구 사이에 존재하는 인과관계를 추출하고자 한다. 기존의 명사구 간 인과관계 추출 연구에서는 인과관계 단서구문과 두 명사구의 의미를 주요한 정보로 사용하였으나, 사전 미등록어가 사용되었을 때 올바른 선택을 하기 어려웠다. 또한, 학습 코퍼스에 대한 인과관계 부착과정이 선행되어야 하며, 다량의 학습자료를 사용하기가 어려웠다. 본 연구에서는 인과관계 명사구 쌍에서 추출된 어휘 쌍을 기존의 단서구문과 같이 사용하는 방법을 제안한다. 인과관계 분류를 위해 나이브 베이즈 분류기를 사용하였으며, 비지도식 학습과정을 사용하였다. 제안된 분류 모델은 기존의 분류 모델과 달리 사전 미등록어에 의한 성능 저하가 없으며, 학습 코퍼스의 인과관계 분류 작업이 선행될 필요 없다. 문장 내 명사구간의 인과관계 추출 실험 결과 79.07%의 정확도를 얻었다. 이러한 결과는 단서구문과 명사구 의미를 이용한 방법에 비해 6.32% 향상된 결과이며, 지도식 학습방식을 통해 얻은 방법과 유사한 결과이다. 또한 제안된 학습 및 분류 모델은 문장간의 인과관계 추출에도 적용가능하며, 한국어에서 인접한 두 문장간의 인과관계 추출 실험에서 74.68%의 정확도를 보였다.

  • PDF

학습 데이터 확장을 통한 딥러닝 기반 인과관계 추출 모델 (Deep Learning Based Causal Relation Extraction with Expansion of Training Data)

  • 이승욱;유홍연;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.61-66
    • /
    • 2018
  • 인과관계 추출이란 어떠한 문장에서 인과관계가 존재하는지, 인과관계가 존재한다면 원인과 결과의 위치까지 분석하는 것을 말한다. 하지만 인과관계 관련 연구는 그 수가 적기 때문에 말뭉치의 수 또한 적으며, 기존의 말뭉치가 존재하더라도 인과관계의 특성상 새로운 도메인에 적용할 때마다 데이터를 다시 구축해야 하는 문제가 있다. 따라서 본 논문에서는 도메인 특화에 따른 데이터 구축비용 문제를 최소화하면서 새로운 도메인에서 인과관계 모델을 잘 구축할 수 있는 통계 기반 모델을 이용한 인과관계 데이터 확장 방법과 도메인에 특화되지 않은 일반적인 언어자질과 인과관계에 특화된 자질을 심층 학습 기반 모델에 적용함으로써 성능 향상을 보인다.

  • PDF

전자장비 고장진단 질의응답을 위한 인과관계 정의 및 추출 (Definition and Extraction of Causal Relations for Question-Answering on Fault-Diagnosis of Electronic Devices)

  • 이신목;신지애
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제35권5호
    • /
    • pp.335-346
    • /
    • 2008
  • 온톨로지의 인과관계는 특정 응용을 위한 추론에서 중요한 역할을 하므로, 인과관계는 응용에서 쓰이는 추론의 형태에 근거하여 정의되어야 한다. 본 논문에서는, 전자장비의 고장진단 질의응답을 위한 온톨로지에서의 인과관계를 정의하고 추출하는 모델을 제시한다. 질의응답의 패턴을 분석하여 인과범주를 정의하고, 질의응답에서 나타나는 개념들 사이의 관계들 중 인과범주에 속하는 경우를 인과관계로 정의한다. 인과관계 인스턴스는 응용분야의 정의문으로부터 어휘 패턴을 이용하여 추출되고 시소러스 정보를 이용하여 점진적으로 확장된다. 분야 전문가들의 평가 결과, 본 모델은 관계분류에 있어서 92.3%의 평균 정확률과 추출 단계의 인과관계 인식에 있어서 80.7%의 정확률을 보인다.

퍼지인식도에 기초한 인과관계 지식베이스 구축과 양방향 추론방식에 관한 연구 -주식시장 분석에의 적용을 중심으로- (Fuzzy Cognitive Map-Based A, pp.oach to Causal Knowledge Base Construction and Bi-Directional Inference Method -A, pp.ications to Stock Market Analysis-)

  • 이건창;주석진;김현수
    • 지능정보연구
    • /
    • 제1권1호
    • /
    • pp.1-22
    • /
    • 1995
  • 본 연구에서 퍼지인식도(Fuzzy Cognitive Map) 개념을 기초로 하여 (1) 특정 문제영역에 대한 전문가의 인과관계 지식(causal knowledge)을 추출하는 알고리즘을 제시하고, (2) 이 알고리즘에 기초하여 작성된 해당 문제영역에 대한 여러 전문가들의 인과관계 지식을 계층별로 분해하여, (3) 해당 계층간의 양방향 추론이 가능한 추론메카니즘을 제시하고자 한다. 특정 문제영역에 있어서의 인과관계 지식이란 해당 문제를 구성하는 여러 개념간에 존재하는 인과관계를 표현한 지식을 의미한다. 이러한 인과관계 지식은 기존의 IF-THEN 형태의 규칙과는 달리 행렬형태로 표현되기 때문에 수학적인 연산이 가능하다. 특정 문제영역에 대한 전문가의 인과관계 지식을 추출하는 알고리즘은 집합연산에 의거하여 개발되었으며, 특히 상반된 의견을 보이는 전문가들의 의견을 통합하여 하나의 통합된 인과관계 지식베이스를 구축하는데 유용하다. 그러나, 주어진 문제가 복잡하여 다양한 개념들이 수반되면, 자연히 인과관계 지식베이스의 규모도 커지게 되므로 이를 다루는데 비효율성이 개재되기 마련이다. 따라서 이러한 비효율성을 해소하기 위하여 주어진 문제를 여러계측(Hierarchy)으로 분해하여, 해당 계층별로 인과관계 지식베이스를 구축하고 각 계층별 인과관계 지식베이스를 연결하여 추론하는 메카니즘을 개발하면 효과적인 추론이 가능하다. 이러한 계층별 분해는 행렬의 분해와 같은 개념으로도 이해될 수 있다는 특징이 있어 그 연산이 간단명료하다는 장점이 있다. 이와같이 분해된 인과관계 지식베이스는 계층간의 추론메카니즘을 통하여 서로 연결된다. 이를 위하여 본 연구에서는 상향 또는 하향방식이 추론이 가능한 양방향 추론방식을 제시하여 주식시장에서의 투자분석 문제에 적용하여 그 효율성을 검증하였다.

  • PDF

한국어 특허문서상에서의 인과관계 관찰 및 추출 (Pattern-based Extraction of Causal Relations from Korean Patent Documents with Two Types of Criteria)

  • 이신목;김현수;황금하;최기선
    • 한국인지과학회:학술대회논문집
    • /
    • 한국인지과학회 2006년도 춘계학술대회
    • /
    • pp.21-27
    • /
    • 2006
  • 인과관계는 인간의 인지활동에 있어서 매우 중요한 역할을 한다. 특히 과학과 공학 분야에서 얻은 인과지식은 해당 분야를 이해하는 데에 중요한 역할을 한다. 대표적인 예로, 이들 분야 문서들의 논리적 흐름을 파악하는 데 사용 가능하다. 본 연구에서는, 정보기술 분야의 특허 문서들로부터 얻은 인과 지식을 획득하기 위하여, 문장 내에 나타나는 인과쌍들을 추출하는 방법론을 제시한다. 이를 위하여, 인과관계를 수동으로 태깅하고 관찰하는 작업을 수행하였으며, 태깅을 위한 기준을 설정하였다. 인과쌍의 추출은 패턴을 이용하여 수행하였다.

  • PDF

인과관계 정보 구성 체계를 활용한 디지털 증거 식별/분류 연구 (Digital Evidence Identification/Classification Study Using Causal Information Organization System)

  • 정종진;박종빈;김경원;이지현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.236-239
    • /
    • 2023
  • 본 논문에서는 디지털증거 분석을 위해 확보한 증거파일 들로부터 범죄 정황에 해당하는 단어 및 어휘를 추출하여 해당 범죄를 인과관계 분석을 하기 위해 핵심 단서와 원인을 효과적으로 파악하기 위해 필요한 인과정보를 제안한다. 이 정보들은 개체명 인식 및 분류를 할 수 있도록 구성되어 범죄 관계인, 관계인간 관계, 범죄 수법과 범죄관련 정보를 추출하고 유형화하여, 향후 해당 범죄에 대한 인과 분석 기법을 활용한 범죄 예방 분석과 수사에 기여할 수 있도록 도움을 준다.

원전 비상 발전기의 고장진단시스템을 위한 클래스 및 인과관계 모형 설계 (Design of Class and Causality Model for Diagnosis System of an Emergency Generator in Nuclear Plant)

  • 하창승;박종일
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.125-132
    • /
    • 2006
  • 원자력 발전소에서 비상사태가 발생하는 경우를 대비하여 비상 발전기의 고장진단시스템을 구축할 필요가 있다. 고장진단시스템의 지식베이스를 구현하기 위해서는 클래스와 인과관계 모형을 설계해야 한다. 클래스와 인과관계 모형을 설계하기 위해 먼저 진단대상을 선정하고, 정상과 비정상의 상태정보를 조사하여 시스템의 작동 원리를 외부지식인 개체와 활동으로 추출한다. 추출된 외부지식을 내부지식으로 표현하기 위해 개체를 클래스로 정의하고 활동을 인과관계로 변환한다. 인과관계의 반복적인 설정과 타당성 검토를 통해 지식베이스에 이식할 수 있는 수준의 진단지식을 완성한다. 본 연구는 결정테이블을 통한 설계 모형의 독립성을 고려하였기 때문에 이식성 높은 지식베이스의 구현이 가능하다.

  • PDF

음주문제와 우울 간의 인과관계와 빈곤상태 변화의 연관성 분석 (Examining the Association of Poverty Status Transition with the Causal Relationship between Drinking Problem and Depression)

  • 허만세
    • 한국사회복지학
    • /
    • 제65권2호
    • /
    • pp.203-230
    • /
    • 2013
  • 본 연구는 한국복지패널의 원자료를 cross-lagged panel design에 따라 분석자료를 추출하고 인과관계 분석 모형을 이용하여 음주문제와 우울의 인과관계를 분석하였다. 나아가 빈곤이 음주문제와 우울에 영향을 미친다는 국내외 선행연구들을 바탕으로, 음주문제와 우울 간의 인과관계와 빈곤 상태의 변화가 연관성이 있는지를 살펴보았다. 연구 대상은 한국복지패널의 1차년도와 2차년도의 자료에서 반복측정된 3,976명의 성인 남녀였으며, 인과관계 분석은 McArdle and Hamagami (2001)에 의해서 정립된 Latent Difference Scores (LDS)모델을 사용하였다. 분석단계에서는 먼저 음주문제와 우울의 인과관계를 밝힌 후에, 이러한 인과관계가 빈곤의 상태변화를 나타내는 4개의 하위집단 (빈곤 지속 집단, 빈곤 탈출 집단, 비빈곤 지속 집단, 빈곤시작 집단)에서 유지되는지를 분석하였다. 분석결과 연구대상전체를 이용한 LDS모델의 결과는 우울이 음주문제의 변화를 예측할 뿐 아니라 음주 역시 우울의 변화를 예측하는 것으로 나타나 우울과 음주가 상호 인과관계를 갖는 것으로 나타났다. 전체 연구 대상자를 빈곤 상태 변화에 따른 집단으로 구분하여 분석한 결과 빈곤지속 집단에서는 우울과 음주가 상호 인과관계를 갖는 것으로 나타났고, 빈곤 시작 집단과 비빈곤 지속 집단에서는 우울의 음주 변화에 선행하는 요인으로 나타났다. 그러나 빈곤 탈출 집단에서는 음주와 우울 사이의 인과관계가 나타나지 않았다. 본 연구의 결과는 음주와 우울 사이의 인과관계가 빈곤상태변화에 따라 다르게 나타날 수 있음을 체계적으로 보여주는 새로운 결과로서 기존의 횡단연구들에서 우울과 음주의 관계에 대한 서로 상충하는 다양한 결과들에 대한 종합적 설명을 제공할 수 있다는 의미가 있다.

  • PDF

청소년의 학업스트레스가 자살충동에 미치는 인과관계의 성별 차이검증 (The Test of Gender Difference on the Causal Relationships between Adolescent's Academic Stress and Suicidal Thoughts)

  • 노윤채;김경숙;박희서
    • 한국컴퓨터정보학회논문지
    • /
    • 제20권5호
    • /
    • pp.133-140
    • /
    • 2015
  • 이 연구는 청소년의 학업스트레스가 자살충동에 이르는 인과경로에 있어서 인과관계가 성(gender)에 따라 차이가 있는지를 검증해 봄으로써 시사점을 도출해 보는데 연구목적을 두었다. 이를 위해 고등학교 학생들을 대상으로 표본을 추출하여 설문조사를 실시하였다. 이 연구의 분석결과, 청소년의 학업스트레스는 우울감을 통하여 자살충동에 직 간접적으로 영향을 미치는 것으로 나타났으며, 학업스트레스와 우울감 사이의 인과관계와 우울감과 자살충동 사이의 인과관계에서 성별 차이가 있는 것으로 나타났다. 이 연구에서는 이러한 분석결과를 토대로 시사점을 도출하였다.

인과관계 지식 모델링을 위한 퍼지인식도와 베이지안 신뢰 네트워크의 비교 연구 (Fuzzy Cognitive Map and Bayesian Belief Network for Causal Knowledge Engineering: A Comparative Study)

  • ;김경윤;양형정;김수형;김정식
    • 정보처리학회논문지B
    • /
    • 제15B권2호
    • /
    • pp.147-158
    • /
    • 2008
  • 본 논문에서는 인과관계 지식의 표현과 추론에 가장 대표적으로 사용되는 퍼지인식도(FCM, Fuzzy Cognitive Map)와 베이지안 신뢰 네트워크(BBN, Bayesian Belief Network)를 구조적으로 분석한다. 퍼지인식도와 베이지안 신뢰 네트워크는 의사 결정을 지원하는데 중요한 인과관계 지식을 표현하고 추론하는데 사용되는 가장 대표적인 프레임워크이지만 인과관계 지식응용 영역에서 두 프레임워크의 역할에 대한 구조적 비교 연구는 이루어지지 않고 있다. 본 논문에서는 두 프레임워크의 구조적 비교를 통해 퍼지인식도와 베이지안 신뢰 네트워크의 중요한 특징들을 추출하고, 이를 통해 인과 지식 공학에서 어떻게 퍼지 인식도와 베이지안 신뢰 네트워크가 이용되어야 하는지를 보인다. 인과관계 지식의 표현과 추론의 과정을 평가하는데 비교 평가를 위한 항목으로서 본 논문에서는 사용성, 표현력, 추론능력, 정형화와 완결성이 사용되었다.