• 제목/요약/키워드: 사실 검증

검색결과 705건 처리시간 0.026초

XH-DQN: Fact verification using a combined model of graph transformer and DQN (XH-DQN: 사실 검증을 위한 그래프 Transformer와 DQN 결합 모델)

  • Seo, Mintaek;Na, Seung-Hoon;Shin, Dongwook;Kim, Seon-Hoon;Kang, Inho
    • Annual Conference on Human and Language Technology
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.227-232
    • /
    • 2021
  • 사실 검증(Fact verification) 문제는 문서 검색(Document retrieval), 증거 선택(Evidence selection), 증거 검증(Claim verification) 3가지 단계로 구성되어있다. 사실 검증 모델들의 주요 관심사인 증거 검증 단계에서 많은 모델이 제안되는 가운데 증거 선택 단계에 집중하여 강화 학습을 통해 해결한 모델이 제안되었다. 그래프 기반의 모델과 강화 학습 기반의 사실 검증 모델을 소개하고 각 모델을 한국어 사실 검증에 적용해본다. 또한, 두 모델을 같이 사용하여 각 모델의 장점을 가지는 부분을 병렬적으로 결합한 모델의 성능과 증거의 구성 단위에 따른 성능도 비교한다.

  • PDF

Zero-Shot Fact Verification using Language Models Perplexities of Evidence and Claim (증거와 Claim의 LM Perplexity를 이용한 Zero-shot 사실 검증)

  • Park, Eunhwan;Na, Seung-Hoon;Shin, Dongwook;Jeon, Donghyeon;Kang, Inho
    • Annual Conference on Human and Language Technology
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.524-527
    • /
    • 2021
  • 최근 국외에서 사실 검증 연구가 활발하게 이루어지고 있지만 한국어의 경우 데이터 집합의 부재로 인하여 사실 검증 연구가 이루어지는데 큰 어려움을 겪고 있다. 이러한 어려움을 해소하고자 자동 생성 모델을 통하여 데이터 집합을 생성하는 시도도 있으나 생성 모델의 특성 상 부정확한 데이터가 생성되어 사실 검증 연구의 퀄리티를 떨어뜨린다는 문제점이 있다. 이러한 문제점을 해소하기 위해 수동으로 구축한 100건의 데이터 집합으로 최근에 이루어진 퓨-샷(Few-Shot) 사실 검증을 확장한 학습이 필요없는 제로-샷(Zero-Shot) 질의 응답에 대한 사실 검증 연구를 제안한다.

  • PDF

Knowability Paradox and Defeater for Counterfactual Knowledge (지식가능성 역설과 반사실적 조건 명제에 대한 논파자)

  • Kim, Namjoong
    • Korean Journal of Logic
    • /
    • 제17권1호
    • /
    • pp.109-136
    • /
    • 2014
  • Every (semantic) antirealist accepts one or another form of verification principle. The principle has strong and weak forms, the strong form being highly counterintuitive but the weak one being more plausible. Understandably, antirealists have preferred the weak form of verification principle. Unfortunately, the socalled knowability paradox shows that those two forms are indeed equivalent. To solve this problem, Edgington suggests a yet new form of verification principle. Unfortunately, her new principle has its own difficulty. To overcome this difficulty, Edgington provides a new model of knowledge, according to which every true proposition is somehow associated with a known counterfactual conditional. In this paper, I shall argue that even this new model of knowledge confronts with an insurmountable problem. It is a well-known fact that, in the microscopic levels, some facts manage to occur despite very low physical chances. I will argue that the counterfactuals linked with those facts cannot be known due to the existence of epistemic defeaters. Hence, Edgington's knowledge model does not work in all cases.

  • PDF

Learning Contextual Meaning Representations of Named Entities for Correcting Factual Inconsistent Summary (개체명 문맥의미표현 학습을 통한 기계 요약의 사실 불일치 교정)

  • Park, Junmo;Noh, Yunseok;Park, Seyoung
    • Annual Conference on Human and Language Technology
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.54-59
    • /
    • 2020
  • 사실 불일치 교정은 기계 요약 시스템이 요약한 결과를 실제 사실과 일치하도록 만드는 작업이다. 실제 요약 생성연구에서 가장 공통적인 문제점은 요약을 생성할 때 잘못된 사실을 생성하는 것이다. 이는 요약 모델이 실제 서비스로 상용화 하는데 큰 걸림돌이 되는 부분 중 하나이다. 본 논문에서는 원문으로부터 개체명을 가져와 사실과 일치하는 문장으로 고치는 방법을 제안한다. 이를 위해서 언어 모델이 개체명에 대한 문맥적 표현을 잘 생성할 수 있도록 학습시킨다. 그리고 학습된 모델을 이용하여 원문과 요약문에 등장한 개체명들의 문맥적 표현 비교를 통해 적절한 단어로 교체함으로써 요약문의 사실 불일치를 해소한다. 제안 모델을 평가하기 위해 추상 요약 데이터를 이용해 학습데이터를 만들어 학습하고, 실제 시나리오에서 적용가능성을 검증하기 위해 모델이 요약한 요약문을 이용해 실험을 수행했다. 실험 결과, 자동 평가와 사람 평가에서 제안 모델이 비교 모델보다 높은 성능을 보여주었다.

  • PDF

Hallucination Detection for Generative Large Language Models Exploiting Consistency and Fact Checking Technique (생성형 거대 언어 모델에서 일관성 확인 및 사실 검증을 활 용한 Hallucination 검출 기법)

  • Myeong Jin;Gun-Woo Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.461-464
    • /
    • 2023
  • 최근 GPT-3 와 LLaMa 같은 생성형 거대 언어모델을 활용한 서비스가 공개되었고, 실제로 많은 사람들이 사용하고 있다. 해당 모델들은 사용자들의 다양한 질문에 대해 유창한 답변을 한다는 이유로 주목받고 있다. 하지만 LLMs 의 답변에는 종종 Inconsistent content 와 non-factual statement 가 존재하며, 이는 사용자들로 하여금 잘못된 정보의 전파 등의 문제를 야기할 수 있다. 이에 논문에서는 동일한 질문에 대한 LLM 의 답변 샘플과 외부 지식을 활용한 Hallucination Detection 방법을 제안한다. 제안한 방법은 동일한 질문에 대한 LLM 의 답변들을 이용해 일관성 점수(Consistency score)를 계산한다. 거기에 외부 지식을 이용한 사실검증을 통해 사실성 점수(Factuality score)를 계산한다. 계산된 일관성 점수와 사실성 점수를 활용하여 문장 수준의 Hallucination Detection 을 가능하게 했다. 실험에는 GPT-3 를 이용하여 WikiBio dataset 에 있는 인물에 대한 passage 를 생성한 데이터셋을 사용하였으며, 우리는 해당 방법을 통해 문장 수준에서의 Hallucination Detection 성능이 baseline 보다 AUC-PR scores 에서 향상됨을 보였다.

The Method of Resident Management Using the Voice Identification System (화자인증시스템을 이용한 입주자 관리 방안)

  • Yang, Dong-Suk;Kee, Ho-Young
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1117-1118
    • /
    • 2015
  • 공공임대주택은 서민을 위한 주거안정 차원에서 중요한 복지정책 중 하나이다. 그러나 입주자에 대한 적합성 여부를 검증하는 데 있어서 실제 거주하고 있는지를 검증하는 데 많은 비용과 어려움이 발생하여 입주자가 거주하고 있지 않는 상태에서 재계약하는 경우가 많이 발생하고 있다. 본 연구에서는 거주하고 있는 사실을 검증할 수 있는 화자인증 시스템을 활용한 입주자 관리 방안을 제안한다. 제안된 방안으로 구현된 시스템을 통하여 적은 비용 및 높은 신뢰도로 거주사실을 확인할 수 있을 것이라 기대된다.

Explanation-Based Data Mining in Data Warehouse (데이터웨어하우스 환경에서의 설명기반 데이터마이닝)

  • 김현수;이창호
    • Journal of Intelligence and Information Systems
    • /
    • 제5권2호
    • /
    • pp.15-27
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이터들이 축적되고 있다. 이러한 데이터로부터 유용한 지식을 추출하기 위해 여러 가지 데이터마이닝 기법들이 연구되어 왔다. 특히 데이터웨어하우스의 등장은 이러한 데이터마이닝에 있어 필요한 데이터 제공 환경을 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이터마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또한 관련성 없는(Trivial, Spurious and Irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이터마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이터마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적인 이러한 데이터마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이터마이닝 기법 중 연관규칙탐사(Associations)로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하였고, 이를 위해 도메인 지식(Domain Knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현방법으로 관계형 술어논리(RPL : Relational Predicate Logic)를 개발하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대한 RPL로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(Explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사를 통해 검증한 후 새로운 지식을 얻는 설명기반 데이터마이닝 구조(Explanation-based Data Mining Architecture)를 제시하였다.

  • PDF

A study of Key Success Factors in New Product Development -Focused on Korean Cosmetic Industry- (신제품개발의 성공요인에 관한 연구)

  • 서성한;조서환
    • Asia Marketing Journal
    • /
    • 제2권3호
    • /
    • pp.64-89
    • /
    • 2000
  • 기업의 사활은 신제품개발의 성공여부에 달려 있다. 이러한 필요성과 중요성에 비추어볼 때, 국내에서의 신제품 성공 요인에 관한 연구는 그 기반이 미흡한 실정이다. 고로, 본 연구의 목적은 신제품 성공요인을 파악하고 이들 성공요인간의 관계를 유추해 보는 것으로 한다. 본 연구논문은, Day & Wensley 의 SPP(Source-Position-Performance) 연구모형을 바탕으로 국내 화장품시장을 중심으로 설문 조사한 결과, 11 개 기업에서 총 159 부를 수집하여 연구 모형 및 연구 가설을 검증하였다. 그래서 다음과 같은 사실을 밝혀냈다. 첫째, 신제품개발 과정에서 마케팅 능력이 직접적으로 제품차별화에 긍정적인 영향을 미치고 있다는 사실과 둘째, 임직원 몰입도가 부서간 통합에 유의한 영향을 미치고 있다는 사실이다. 그리고 셋째, 기술 능력이 단순히 뛰어나다 해서 제품을 차별화 시킬 수는 없다는 사실과 넷째, 부서간 통합정도가 직접적으로 제품차별화롤 가져올 수는 없었는데 이러한 결과는 부서내 커뮤니케이션의 부족 및 부서간 갈등 둥으로 인한 것으로 분석된다. 마지막으로, 제품의 차별화가 신제품 성과에 매우 유의한 영향을 미치고 있다. 본 연구결과를 종합해 보면, 제품이 출시되기 전에 철저한 시장 특성 및 동향을 파악하여 제품을 만들어야 한다는 사실이다. 기술 능력이 회사마다 평준화되어 있는 상황에서 무엇보다 필요한 것은 정확한 소비자 조사 및 이를 바탕으로 한 신제품개발이다. 또한 신제품개발과정에서 최고경영자 및 마케팅 담당자들은 주관적인 판단보다는 기업의 마케팅 능력에 따른 객관적인 판단에 따라 행동해야 한다. 특히 화장품시장에서는 브랜드마케팅에 의해 더욱 차별화시킬 수 있다는 사실이다. 단순한 제품에 생명력을 불어넣는 것이 마케터의 역할이다. 기업은 단순히 제품만을 파는 것이 아니라 소비자들에게 제품이상의 것을 판다, 그래서 소비자의 마음속에 정확하게 자사 제품을 포지션닝하는 것이 무엇보다 중요하다는 사실이다.

  • PDF

Explanation-based Data Mining in Data Warehouse (데이타 웨어하우스 환경에서의 설명기반 데이타 마이닝)

  • 김현수;이창호
    • Proceedings of the Korea Database Society Conference
    • /
    • 한국데이타베이스학회 1999년도 춘계공동학술대회: 지식경영과 지식공학
    • /
    • pp.115-123
    • /
    • 1999
  • 산업계 전반에 걸친 오랜 정보시스템 운용의 결과로 대용량의 데이타들이 축적되고 있다. 이러한 데이타로부터 유용한 지식을 추출하기 위해 여러 가지 데이타 마이닝 기법들이 연구되어왔다. 특히 데이타 웨어하우스의 등장은 이러한 데이타 마이닝에 있어 필요한 데이타 제공 환경을 제공해 주고 있다. 그러나 전문가의 적절한 판단과 해석을 거치지 않은 데이타 마이닝의 결과는 당연한 사실이거나, 사실과 다른 가짜이거나 또는 관련성이 없는(trivial, spurious and irrelevant) 내용만 무수히 쏟아낼 수 있다. 그러므로 데이타 마이닝의 결과가 비록 통계적 유의성을 가진다 하더라고 그 정당성과 유용성에 대한 검증과정과 방법론의 정립이 필요하다. 데이타 마이닝의 가장 어려운 점은 귀납적 오류를 없애기 위해 사람이 직접 그 결과를 해석하고 판단하며 아울러 새로운 탐색 방향을 제시해야 한다는 것이다. 본 논문의 목적은 이러한 데이타 마이닝에서 추출된 결과를 검증하고 아울러 새로운 지식 탐색 방향을 제시하는 방법론을 정립하는데 있다. 본 논문에서는 데이타 마이닝 기법 중 연관규칙탐사로 얻어진 결과를 설명가능성 여부의 판단을 통해 검증하는 기법을 제안하며, 이를 통해 얻어진 검증된 지식을 토대로 일반화를 통한 새로운 가설을 생성하여 데이타 웨어하우스로부터 연관규칙을 검증하는 일련의 아키텍쳐(architecture)를 제시하고자 한다. 먼저 데이타 마이닝 결과에 대한 설명의 필요성을 제시하고, 데이타 웨어하우스와 데이타 마이닝 기법들에 대한 간략한 설명과 연관규칙탐사에 대한 정의 및 방법을 보이고, 대상 영역에 대한 데이타 웨어하우스의 스키마를 보였다. 다음으로 도메인 지식(domain knowledge)과 연관규칙탐사를 통해 얻어진 결과를 표현하기 위한 지식표현 방법으로 Relational predicate Logic을 제안하였다. 연관규칙탐사로 얻어진 결과를 설명하기 위한 방법으로는 연관규칙탐사로 얻어진 연관규칙에 대해 Relational Predicate Logic으로 표현된 도메인 지식으로서 설명됨을 보이게 한다. 또한 이러한 설명(explanation)을 토대로 검증된 지식을 일반화하여 새로운 가설을 연역적으로 생성하고 이를 연관규칙탐사론 통해 검증한 후 새로운 지식을 얻는 반복적인 Explanation-based Data Mining Architecture를 제시하였다. 본 연구의 의의로는 데이타 마이닝을 통한 귀납적 지식생성에 있어 귀납적 오류의 발생을 고메인 지식을 통해 설명가능 함을 보임으로 검증하고 아울러 이러한 설명을 통해 연역적으로 새로운 가설지식을 생성시켜 이를 가설검증방식으로 검증함으로써 귀납적 접근과 연역적 접근의 통합 데이타 마이닝 접근을 제시하였다는데 있다.

  • PDF

한옥의 재발견

  • Park, Jun-Hyeong
    • 주택과사람들
    • /
    • 통권201호
    • /
    • pp.64-69
    • /
    • 2007
  • 사실 전통 가옥의 가치를 논하기란 쉽지 않다. 하지만 시대의 추억이 담긴 한옥은 자체로도 높은 가치를 지니고 과학적인 검증 위에도 친환경의 대표주자이다.

  • PDF