• Title/Summary/Keyword: 논문 요약

Search Result 1,976, Processing Time 0.028 seconds

A Study on Skimming of News Article for an Efficient Browsing (효과적인 브라우징을 위한 뉴스 기사 요약에 관한 연구)

  • 이주호;정승도;조정원;최병욱
    • Proceedings of the IEEK Conference
    • /
    • 2000.09a
    • /
    • pp.219-222
    • /
    • 2000
  • 수많은 종류의 비디오 데이터를 효율적으로 검색하기 위해서는 데이터를 분석하여 사용자에게 먼저 전체 비디오의 요약을 제시하는 것이 효과적이다. 본 논문에서는 기사 단위로 분할된 뉴스 기사 전체를 보여주지 않으면서도 기사의 내용을 왜곡됨이 없이 요약하여 효과적으로 사용자에게 보여주기 위한 방법을 제안한다. 본 논문에서는 사용자에게 시각적인 요약 정보를 앵커 프레임 추출 및 대표 프레임 추출을 통해 필름 스트림(film trip)의 형태로 제시하고, 기사를 소개하는 앵커의 첫 대사를 폐쇄 자막(closed-caption)을 이용하여 추출하여, 이를 기사의 내용에 대한 요약으로 필름 스트립과 같이 제시하도록 하였다. 앵커 프레임을 추출하기 위해 본 논문에서는 폐쇄 자막에서의 "앵커:" 태그가 존재하는 시간 구간과 동기된 프레임을 선정한다. 또한 대표 프레임은 공개형 자막(open-cpation)이 존재하는 프레임과 빈도에 기반한 가중치가 높은 .폐쇄 자막에서의 키워드와 동기된 프레임을 선정하도록 하였다. 본 논문의 뉴스 기사 요약 시스템은 시각적인 프레임제시와 함께 기사의 내용을 바탕으로 하는 기사 요약문을 같이 사용자에게 제공함으로써 기존의 필름 스트립형태만 제공하던 시스템에 비하여 사용자 중심의 지능형 요약 서비스가 가능함을 실험을 통해 보인다.

  • PDF

Document Summarization using Topic Phrase Extraction and Query-based Summarization (주제어구 추출과 질의어 기반 요약을 이용한 문서 요약)

  • 한광록;오삼권;임기욱
    • Journal of KIISE:Software and Applications
    • /
    • v.31 no.4
    • /
    • pp.488-497
    • /
    • 2004
  • This paper describes the hybrid document summarization using the indicative summarization and the query-based summarization. The learning models are built from teaming documents in order to extract topic phrases. We use Naive Bayesian, Decision Tree and Supported Vector Machine as the machine learning algorithm. The system extracts topic phrases automatically from new document based on these models and outputs the summary of the document using query-based summarization which considers the extracted topic phrases as queries and calculates the locality-based similarity of each topic phrase. We examine how the topic phrases affect the summarization and how many phrases are proper to summarization. Then, we evaluate the extracted summary by comparing with manual summary, and we also compare our summarization system with summarization mettled from MS-Word.

A Video Abstraction Algorithm Reflecting Various Users Requirement (사용자의 요구를 반영하는 동영상 요약 알고리즘)

  • 정진국;홍승욱;낭종호;하명환;정병희;김경수
    • Journal of KIISE:Software and Applications
    • /
    • v.30 no.7_8
    • /
    • pp.599-609
    • /
    • 2003
  • Video abstraction is a process to pick up some important shots on a video, while the important shots might vary on the persons subjectivity. Previous works on video abstraction use only one low level feature to choose an important shot. This thesis proposes an abstraction scheme that selects a set of shots which simultaneously satisfies the desired features(or objective functions) of a good abstraction. Since the complexity of the computation to find a set of shots which maximizes the sum of object function values is $0({2^n})$, the proposed .scheme uses a simulated annealing based searching method to find the suboptimal value within a short period of time. Upon the experimental results on various videos, we could argue that the proposed abstraction scheme could produce a reasonable video abstraction. The proposed abstraction scheme used to build a digital video library.

Analyses and Comparisons of Human and Statistic-based MMR Summarizations of Single Documents (단일 문서의 인위적 요약과 MMR 통계요약의 비교 및 분석)

  • 유준현;변동률;박순철
    • Journal of the Institute of Electronics Engineers of Korea CI
    • /
    • v.41 no.2
    • /
    • pp.43-50
    • /
    • 2004
  • The Statistic-based method is widely used for automatic single document summarization in large sets of documents such as those on the web. However, the results of this method shows high redundancies in the summarized sentences because this method selects sentences including words that frequently appear in the document. We solve this problem using the method MMR to raise the quality of document summary (The best results are appeared around λ=0.6). Also, we compare the MMR summaries with those done by human subjects and verify their accuracy.

Comparison of KoBART and KoBERT models for Korean paper summarization (한국어 논문 요약을 위한 KoBART와 KoBERT 모델 비교*)

  • Jaesung Jun;Suan Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2022.10a
    • /
    • pp.562-564
    • /
    • 2022
  • 통신 기술의 발전으로 일반인들도 다양한 자료들을 인터넷에서 손쉽게 찾아볼 수 있는 시대가 도래하였다. 개인이 접근할 수 있는 정보량이 기하급수적으로 많아 짐에 따라, 이를 효율적으로 요약, 정리하여 보여주는 서비스들의 필요성이 높아지기 시작했다. 본 논문에서는, 자연어 처리 모델인 BART를 40GB 이상의 한국어 텍스트로 미리 학습된 한국어 언어 모델 KoBART를 사용한 한국어 논문 요약 모델을 제안하고, KoBART와 KoBERT 모델의 한국어 논문 요약 성능을 비교한다.

  • PDF

Analysis of Research Article Conclusions (학술지 논문의 결론 구조 경향 분석)

  • Kim, Kapseon
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2018.08a
    • /
    • pp.51-54
    • /
    • 2018
  • 본 연구는 문헌정보학 학술지 논문의 결론 장(chapter)의 특색을 분석하기 위하여 결론의 분석도구를 개발하고, 결론의 구조와 경향성을 파악하는데 있다. 연구 결과, 문정학 학술지 논문의 결론 장은 평균 4.2개의 구성요소로 구성되었다. 결론 제목은 '결론'이 절반 이상이며, 그 다음은 '결론 및 제언' 이었다. 각 구성요소별 출현빈도는 '연구결과 요약'이 단연 우세하며, '연구전체 요약', '후속연구 제언', '연구 의의' 순이었다. 서술 분량은 '연구결과 요약'이 가장 우세하며, 결론의 절반 이상을 차지하였다. 결론을 시작하는 첫 번째 요소로 가장 우세한 요소는 '연구결과 요약'이며, 결론을 마무리하는 최종 요소로 가장 우세한 것은 '후속연구 제언'이었다. 문헌정보학 학술지 논문 결론 구조의 핵심 구성요소이자 핵심기능은 '요약하기'의 구성요소인 '연구결과 요약'과 '연구전체 과정 요약'이다. 이는 결론을 기술하는데 필수 요소로 밝혀졌다. '적용하기','확대하기'에 포함된 여타의 요인은 선별적 요인으로 적용하고 있었다.

  • PDF

Comparative Analysis of Language Model Performance in News Domain Summarization (언어 모델의 뉴스 도메인 요약 성능 비교 분석)

  • Sangwon Ryu;Yunsu Kim;Gary Geunbae Lee
    • Annual Conference on Human and Language Technology
    • /
    • 2023.10a
    • /
    • pp.131-136
    • /
    • 2023
  • 본 논문에서는 기존의 요약 태스크에서 주로 사용하는 인코더-디코더 모델과 디코더 기반의 언어 모델의 성능을 비교한다. 요약 태스크를 평가하는 주요한 평가 지표인 ROUGE 점수의 경우, 정답 요약문과 모델이 생성한 요약문 간의 겹치는 단어를 기준으로 평가한다. 따라서, 추상적인 요약문을 생성하는 언어 모델의 경우 인코더-디코더 모델에 비해 낮은 ROUGE 점수가 측정되는 경향이 있다. 또한, 최근 연구에서 정답 요약문 자체의 낮은 품질에 대한 문제가 되었고, 이는 곧 ROUGE 점수로 모델이 생성하는 요약문을 평가하는 것에 대한 신뢰도 저하로 이어진다. 따라서, 본 논문에서는 언어 모델의 요약 성능을 보다 다양한 관점에서 평가하여 언어 모델이 기존의 인코더-디코더 모델보다 좋은 요약문을 생성한다는 것을 보인다.

  • PDF

Backward Abstract Arithmetic Operations for Integer Congruence Analysis (정확한 정수 합동 분석을 위한 역방향 요약 연산자 정의)

  • 서선애
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.652-654
    • /
    • 2002
  • 정수 합동 분석(integer congruence analysis)은 프로그램 변수들의 의미 영역을 정수 합동(integer congruence) 집합으로 정의하여 분석한다. 정수 합동 분석을 위한 정수 합동 격자(lattice of integer congruences)와 순방향 요약 산술 연산자에 대한 정의는 이미 p. Granger에 의해 소개되었다. 하지만, 분석의 정확도에 영향을 미치는 역방향 요약 산술 연산자에 대한 연구는 아직 되어 있지 않다. 이 논문에서는 정수 합동 분석을 위한 역방향 요약 산술 연산자를 정의한다. 역방향 요약 산술 연산자를 정의하는 방법은 정수 방정식을 푸는 방법을 기반으로 고안되었다. 정의된 역방향 요약 산술 연산자는 프로그램 분석의 정확도를 높이는데 기여를 할 수 있는데, 이 논문에서는 예제를 통해서 이 사실을 보인다.

  • PDF

Copy-Transformer model using Copy-Mechanism and Inference Penalty for Document Abstractive Summarization (복사-메커니즘과 추론 단계의 페널티를 이용한 Copy-Transformer 기반 문서 생성 요약)

  • Jeon, Donghyeon;Kang, In-Ho
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.301-306
    • /
    • 2019
  • 문서 생성 요약은 최근 딥러닝을 이용한 end-to-end 시스템을 통해 유망한 결과들을 보여주고 있어 연구가 활발히 진행되고 있는 자연어 처리 분야 중 하나이다. 하지만 문서 생성 요약 모델을 구성하기 위해서는 대량의 본문과 요약문 쌍의 데이터 셋이 필요한데, 이를 구축하기가 쉽지 않다. 따라서 본 논문에서는 정교한 뉴스 기사 요약 데이터 셋을 기계적으로 구축하는 방법을 제안한다. 또한 딥러닝 기반의 생성 요약은 입력 문서와 다른 정보를 생성하거나, 또는 같은 단어를 반복하여 생성하는 문제점들이 존재한다. 이를 해결하기 위해 요약문을 생성할 때 입력 문서의 내용을 인용하는 복사-메커니즘과, 추론 단계에서 단어 반복을 직접적으로 제어하는 페널티를 사용하면 상대적으로 안정적인 문장이 생성될 수 있다. 그리고 Transformer 모델은 순환 신경망 모델보다 요약문 생성 과정에서 시퀀스 길이가 긴 본문의 정보를 적절히 인코딩하여 줄 수 있는 모델이다. 따라서 본 논문에서는 복사-메커니즘과 추론 단계의 페널티를 이용한 Copy-Transformer 모델을 한국어 문서 생성 요약 데이터에 적용하였다. 네이버 지식iN 질문 요약 데이터 셋과 뉴스 기사 요약 데이터 셋 상에서 실험한 결과, 제안한 모델을 이용한 생성 요약이 비교 모델들 대비 가장 좋은 성능을 보이고 양질의 요약을 생성하는 것을 확인하였다.

  • PDF

Abstract Interpretation and its Applications (요약 해석 및 응용)

  • 창병모
    • Journal of Software Engineering Society
    • /
    • v.13 no.3
    • /
    • pp.9-17
    • /
    • 2000
  • 본 논문에서는 시맨틱스를 기반으로한 대표적인 프로그램 분석 틀로써 최근에 활발한 연구가 진행되고 이는 요약 해석의 기본 개념에 대해서 소개하고 명령형 혹은 객체-지향 언어에서 많이 사용되고 있는 동작 시맨틱스를 기초로 하는 요약 해석에 대해서 설명한다. 또한 최근까지 소개된 요약 해석을 이용한 다양한 응용 분야에 대해서 설명한다.