• 제목/요약/키워드: 근거 추출

검색결과 879건 처리시간 0.023초

양방향 장단기 메모리 네트워크를 활용한 높은 정밀도의 지지 근거 추출 (Extracting Supporting Evidence with High Precision via Bi-LSTM Network)

  • 박채훈;양원석;박종철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.285-290
    • /
    • 2018
  • 논지가 높은 설득력을 갖기 위해서는 충분한 지지 근거가 필요하다. 논지 내의 주장을 논리적으로 지지할 수 있는 근거 자료 추출의 자동화는 자동 토론 시스템, 정책 투표에 대한 의사 결정 보조 등 여러 어플리케이션의 개발 및 상용화를 위해 필수적으로 해결되어야 한다. 하지만 웹문서로부터 지지 근거를 추출하는 시스템을 위해서는 다음과 같은 두 가지 연구가 선행되어야 하고, 이는 높은 성능의 시스템 구현을 어렵게 한다: 1) 논지의 주제와 직접적인 관련성은 낮지만 지지 근거로 사용될 수 있는 정보를 확보하기 위한 넓은 검색 범위, 2) 수집한 정보 내에서 논지의 주장을 명확하게 지지할 수 있는 근거를 식별할 수 있는 인지 능력. 본 연구는 높은 정밀도와 확장 가능성을 가진 지지 근거 추출을 위해 다음과 같은 단계적 지지 근거 추출 시스템을 제안한다: 1) TF-IDF 유사도 기반 관련 문서 선별, 2) 의미적 유사도를 통한 지지 근거 1차 추출, 3) 신경망 분류기를 통한 지지 근거 2차 추출. 제안하는 시스템의 유효성을 검증하기 위해 사설 4008개 내의 주장에 대해 웹 상에 있는 845675개의 뉴스에서 지지 근거를 추출하는 실험을 수행하였다. 주장과 지지 근거를 주석한 정보에 대하여 성능 평가를 진행한 결과 본 연구에서 제안한 단계적 시스템은 1,2차 추출 과정에서 각각 0.41, 0.70의 정밀도를 보였다. 이후 시스템이 추출한 지지 근거를 분석하여, 논지에 대한 적절한 이해를 바탕으로 한 지지 근거 추출이 가능하다는 것을 확인하였다.

  • PDF

근거를 이용한 한국어 감성 분석 (Korean Sentiment Analysis using Rationale)

  • 정영준;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.160-163
    • /
    • 2022
  • 감성 분석(sentiment analysis)은 자연어 문장에 나타나는 감정 상태나 주관적인 의견을 분석하는 작업이다. 최근에는 자연어 처리(Natural Language Processing) 작업에서 딥러닝 기반의 모델이 좋은 성능을 보여주고 있다. 하지만, 모델의 복잡한 구조 때문에 모델이 어떠한 근거(rationale)로 판단하였는지 해석하기 어려운 문제가 있다. 모델이 좋은 성능을 보여도 예측에 관한 판단 근거가 없으면 결과를 해석하기 어렵고, 모델에 대한 신뢰가 떨어진다. 본 논문에서는 한국어 감성 분석 작업에 대해 사후 해석 모델을 이용하여 모델의 예측 결과에 대한 근거를 추출하고, 추출한 근거 정보를 이용한 근거 임베딩을 사용하여 근거 정보를 통합하는 방법이 감성 분석 모델의 성능을 개선함을 보인다.

  • PDF

디코더를 활용한 기계독해 모델의 근거 추출 방법 (Evidence Extraction Method for Machine Reading Comprehension Model using Recursive Neural Network Decoder)

  • 한규빈;장영진;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.609-614
    • /
    • 2023
  • 최근 인공지능 시스템이 발전함에 따라 사람보다 높은 성능을 보이고 있다. 또한 전문 지식에 특화된 분야(질병 진단, 법률, 교육 등)에도 적용되고 있지만 이러한 전문 지식 분야는 정확한 판단이 중요하다. 이로 인해 인공지능 모델의 결정에 대한 근거나 해석의 중요성이 대두되었다. 이를 위해 설명 가능한 인공지능 연구인 XAI가 발전하게 되었다. 이에 착안해 본 논문에서는 기계독해 프레임워크에 순환 신경망 디코더를 활용하여 정답 뿐만 아니라 예측에 대한 근거를 추출하고자 한다. 실험 결과, 모델의 예측 답변이 근거 문장 내 등장하는지에 대한 실험과 분석을 수행하였다. 이를 통해 모델이 추론 과정에서 예측 근거 문장을 기반으로 정답을 추론한다는 것을 확인할 수 있었다.

  • PDF

계층적 개념 트리를 이용한 문서 분할 기법 (Text segmentation using concept hierarchy tree)

  • 이병희;최익규;박승규;김인구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 가을 학술발표논문집 Vol.30 No.2 (1)
    • /
    • pp.166-168
    • /
    • 2003
  • 문서 분할 기법은 문서 내에 존재하는 다양한 주제들을 자동적으로 추출하는 기법이다. 이 분야의 연구는 크게 사전적 관계에 근거한 기법과 통계적 데이터에 근거한 기법으로 나누어져 연구되어 왔다. 사전적 관계에 의한 기법은 단어들의 사전적 의미와 관계에 근거한 기법이고 통계적 데이터에 의한 기법은 주로 단어들의 분포를 이용한 기법이다. 여기에는 몇가지 문제점이 있는데 사전적 관계에 근거한 경우에는 분산된 주제들을 통합하여 추출하기 어렵고. 통계적 데이터에 근거한 기법은 정확한 주제의 개수를 찾기 어렵다는 점이다. 본 논문에서는 계층적 개념 트리를 이용하여 보다 정확한 개수의 주제들을 찾아낼 수 있는 문서 분할 기법에 대해 소개 하고자 한다.

  • PDF

붓스트랩방법의 실제적활용1) -군집표본추출법에 근거한 분할표분석을 중심으로

  • 전명식
    • Communications for Statistical Applications and Methods
    • /
    • 제3권1호
    • /
    • pp.179-188
    • /
    • 1996
  • 복합조사표본추출법(complex survey sampling)에 근거한 분할표분석에 카이제곱검정법을 사용할 때의 문제점들과 해결방법들을 살펴보았다. 나아가, 군집표본추출의 경우에 붓스트랩방법의 타당성을 보였으며, 실제자료분석을 통하여 실제 활용가능성과 잇점을 제시하였다.

  • PDF

원형성과 선의 연결성에 근거한 배전설비도면 인식 (A Recognition of Power Distributed Facility Map Based on Circularity and Connectivity of Line)

  • 김계영;이봉재;한칠성;조선구
    • 한국정보처리학회논문지
    • /
    • 제7권10호
    • /
    • pp.3300-3309
    • /
    • 2000
  • 본 논문에서는 변전소에서 수용가까지의 전력공급설비를 나타내는 도면인 배전설비도면의 주요 기호인 전주와 전선인식 방법에 과하여 기술한다. 제안하는 방법은 원형성에 근거하여 전주후보를 추출한 후 이들 사이의 연결성에 근거하여 전선을 인식한 다음, 전주후보들 중에서 전주를 확인하는 방법으로 다음과 같이 네 개의 단계로 구성된다. 첫 번째는 히스토그램 분석을 통하여 얻어진 임계값을 사용하여 입력영상에서 배전설비영역을 추출하는 단계이고, 두 번째는 추출된 배전설비영역을 세선화 하는 단계이다. 세 번째는 세선영상의 분기점 근처에 정의된 탐색영역에서 원형성을 측정하여 전주후보를 추출하는 단계이다. 네 번째는 전주후보들이 가지는 분기점들 간의 연결성을 측정하여 전선을 인식하는 단계이다. 전선인식이 완료되면 전주후보들 중에서 전선을 가지는 후보들만을 추출하여 전주를 인식한다. 제안된 방법은 한국전력공사의 배전설비도면들 중에서 무작위로 추출한 표본 약 30매를 대상으로 실험하고 그 결과를 제시한다.

  • PDF

키워드 가중치 방식에 근거한 도서 본문 주제어 추출 (Thematic Word Extraction from Book Based on Keyword Weighting Method)

  • 안희정;최건희;김승훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제51차 동계학술대회논문집 23권1호
    • /
    • pp.19-22
    • /
    • 2015
  • 본 논문에서는 문장 및 문단에서 키워드의 역할에 따른 가중치에 근거하여 도서 본문에서 주제어를 추출하는 방법을 제안한다. 기존의 주제어 추출 방식은 도서 본문이 아닌 신문이나 논문에 대한 방식이므로 도서 본문에서의 주제어 추출에 그대로 적용하기에는 어려움이 있다. 따라서 본 논문에서는 빈도수뿐만 아니라 문장 내 중요 요소에 대한 가중치와 중요 문장에 대한 가중치를 후보 키워드에 부여하는 방식을 제안하였다. 제안한 계산 방식을 비문학 도서에 대하여 실험한 결과, 빈도수만으로 주제어를 추출한 기존 방식보다 본 논문에서 제안한 방식의 주제어 추출 결과의 정확도가 향상되는 것을 확인하였다.

  • PDF

시각 신경계 반응 모델에 근거한 필기체 off-line 문자에서의 특징 추출 (Feature Extraction of Off-line Handwritten Characters Based on Optical Neural Field)

  • 홍경호;정은화;안병철
    • 한국정보처리학회논문지
    • /
    • 제6권12호
    • /
    • pp.3530-3538
    • /
    • 1999
  • 필기체 오프라인 문자 인식을 위한 특징 추출의 새로군 접근 방법으로, 인간의 시각 신경계의 반응모델에 근거한 특징 추출 방법을 제안한다. 필기체 문자의 특징 추출을 위한 신경망은 평활화 처리, 외곽선 제거, 특징 정보 추출의 3가지 단계로 나누어진다. 필기체 문자에서 발생하기 쉬운 매끄럽지 못한 화소들을 전처리 단계인 평활화 처리를 통해 제거한다. 다음 단계로 인식에 영향을 주지 않는 외곽선 정보를 추출하여 이를 제거한다. 그리고 마지막으로 문자 특징에 해당하는 정보를 추출한다. 제안된 특징 추출 시스템의 타당성을 확인하기 위한 실험은 필기체 오프라인 문자인 PE2 데이터를 사용하였다. 실험을 통해 시각 신경계 반응모델에 근거한 필기체 문자의 특징을 추출하는 시스템은 곡선이나 원, 사각형이 포함된 형태의 필기 문자에서도 특징 추출이 용이하다는 것을 확인할 수 있다.

  • PDF

배전설비도면의 전주 및 전선 인식 (A Recognition of Electric Pole and Wire on Power Distribution Facility Map)

  • 이봉재;김계영;한칠성;조선구
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (2)
    • /
    • pp.446-448
    • /
    • 2000
  • 본 논문에서는 배전설비도면의 주요 기호인 전주와 전선인식 방법에 관하여 기술한다. 본 논문에서는 원형성에 근거하여 전주후보를 추출한 후 이들 사이의 연결성에 근거하여 전선을 인식한 다음, 전주후보들 중에서 전주를 확인함으로서 전주와 전선을 인식하는 방법을 제안한다. 제안된 방법은 한국전력공사의 배전설비도면들 중에서 무작위로 추출한 표본 약 30매를 대상으로 실험하고 그 결과를 제시한다.

  • PDF

입원환자를 대상으로한 근거기반 임상진료지침 추출에 관한 연구 (A Study for Evidence Based Clinical Pathway Extraction using Data of Inpatient)

  • 배인호;박한나;김용욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 춘계학술발표대회
    • /
    • pp.833-834
    • /
    • 2013
  • 진료데이터는 진료를 보면서 축척된 데이터로서 다양한 병명들에 대한 의사들의 진료행위를 추적해 볼 수 있는 유용한 정보가 될 수 있으며, 진료에 재활용함으로써 환자들에 대한 진료행위를 표준화하는데 사용될 수 있다. 본 연구에서는 다양한 상황에서 환자를 진료한 근거자료인 진료데이터를 이용하여 병원에서 활용 가능한 임상진료데이터를 추출하기 위한 방법에 대한 연구를 진행하였다.