• 제목/요약/키워드: 논문 요약

검색결과 1,985건 처리시간 0.047초

연구 보고서의 공기관계 정보에 제목 및 요약의 가중치를 적용한 유사도 계산 (Calculation of similarity by weighting title and summary in word co-occurrence of research reports)

  • 김남훈;주종민;박혁로;양형정
    • 한국컴퓨터교육학회 학술대회
    • /
    • 한국컴퓨터교육학회 2017년도 하계학술대회
    • /
    • pp.37-40
    • /
    • 2017
  • 본 논문에서는 국가 연구 보고서의 공기 관계 정보와 제목, 요약 등에 가중치를 적용한 유사도 계산방법을 제안한다. 이를 위해 국가 연구개발 보고서에서 텍스트를 추출하여 한 문장 단위로 문서를 분할하고, 기본 불용어와 보고서에서 특징적으로 나타나는 불용어를 처리하고 형태소 분석을 한 뒤 공기관계를 추출하였다. 또한 문서의 유사도 계산시 정확성을 높이기 위해 제목과 요약 부분에 가중치를 부여하였다. 이를 통해 본 논문에서 제안하는 방법이 문서 검색 라이브러인 루씬(Lucene)을 이용한 방법보다 2.5%의 검색성능 향상을 그리고 Knn-휴리스틱 방법보다는 1.1%의 검색성능 향상을 보였다. 이러한 결과를 통해 문서의 요약과 제목 그리고 공기관계 정보가 연구보고서의 유사도를 계산 하는데 영향을 미친다는 것을 보였다.

  • PDF

시소러스 및 요약화일을 이용한 문서 검색시스템 (The development of a document retrieval system using thesaurus and signature file)

  • 정상철;신동욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 1994년도 제6회 한글 및 한국어정보처리 학술대회
    • /
    • pp.400-408
    • /
    • 1994
  • 본 논문에서는 요약화일을 이용하여 복합명사를 효율적으로 처리하며 시소러스를 이용하여 검색하는 한글문서 검색시스템을 제안한다. 본 한글문서 검색 시스템은 한글문서를 대상으로 색인하는 자동색인기와 사용자의 질의를 받아 관련된 문서를 검색하는 검색기로 구성된다. 자동색인기는 우선 한글문서를 대상으로 최장일치 방법으로 명사들을 출출한 후 복합명사의 패턴을 분석하여 복합명사의 가능성이 높은 것들을 복합명사화한다. 두번째로 이들 복합명사들을 1+2SP 방식으로 코딩한 후 요약화일 방법을 이용하여 요약화일을 작성한다. 검색기는 사용자 질의어를 받아 명사들을 추출한 후 시소러스를 이용하여 질의어를 확장한다. 다음 확장된 질의어를 1+2SP 방식으로 코딩한 후 관련된 문서를 검색한다. 본 논문에서는 한국통신에서 만든 코퍼스를 이용하여 제안된 방법의 성능을 평가하였는데 복합명사 처리 및 시소러스 이용방식이 효율적임이 입증되었다. 또한 KAIST에서 개발한 문서검색 시스템보다 동일한 코퍼스로 실험하였을 경우 재현률 및 정확률이 $7{\sim}8%$ 정도 앞서 기존의 시스템보다도 성능이 우수하다는 것이 밝혀졌다.

  • PDF

스코어 정보를 이용한 농구 비디오의 자동요약 (Automatic Summarization of Basketball Video Using the Score Information)

  • 정철곤;김의진;이광국;김회율
    • 한국통신학회논문지
    • /
    • 제32권8C호
    • /
    • pp.738-744
    • /
    • 2007
  • 본 논문에서는 농구 비디오의 내용기반 자동 요약 방법을 제안하였다. 의미 있는 요약을 위해, 농구 비디오에 포함되어 있는 스코어 정보를 이용하였다. 스코어 정보는 비디오에 포함된 스코어 자막의 숫자들을 인식한 후, 인식된 스코어의 변화를 분석함에 의해 획득된다. 일반적으로 농구경기의 중요한 이벤트는 3점 슛, 일방적 리드, 역전 등이다. 제안된 방법은 스코어 정보를 활용해 이러한 이벤트들을 검출하였으며, 이를 기반으로 농구 비디오의 요약 및 하이라이트를 생성하였다.

실내 멀티카메라 환경에서의 퍼지 규칙 기반 이벤트 시퀀스 요약 (Fuzzy Rule-based Summarization of Event Sequences in an Indoor Multi-camera Environment)

  • 박한샘;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.288-292
    • /
    • 2007
  • 최근 동영상 데이터의 폭발적인 증가와 함께 이의 요약을 위한 연구가 활발히 이루어지고 있다. 동영상 데이터 수집 과정에서 하나의 카메라가 아닌 멀티 카메라를 활용하는 경우도 늘고 있는데 이들 대부분은 실내에서 넓은 영역을 커버하거나 물체를 추적하기 위한 목적으로 멀티 카메라 시스템을 사용하였다. 본 논문에서는 하나의 이벤트를 여러 방향으로부터 입력하여 하나의 대상에 대한 다양한 시각과 정보에 초점을 맞추며, 이를 바탕으로 수집된 이벤트 시퀀스에 대한 문제를 다룬다. 과정은 여러 개의 카메라 뷰 가운데 최적의 뷰를 선택하는 카메라 뷰 선택과정과, 그렇게 만들어진 하나의 전체 시퀀스를 요약하는 과정으로 나누어진다. 본 논문에서는 사용자 조사 및 분석을 통해 얻은 사용자 선호도 통계 정보로부터 카메라 뷰 선택을 위한 규칙을 획득하였고, 사람의 의사결정과정을 모방하고자 퍼지 규칙기반 시스템을 사용하여 이벤트를 평가한 후 그 점수에 근거한 요약을 수행하였다.

  • PDF

실시간 콜센터 상담사 보조를 위한 주요 상담 발화 추출 요약 시스템 (An Extractive Summarization System for Real-time Call Center Agent)

  • 정이안;이용택;김현목;김영철
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.53-58
    • /
    • 2022
  • 인공지능 기술이 발전하며, 다양한 산업군에 사람의 업무를 보조하는 인공지능 시스템이 적용되고 있다. 그 중 콜센터 상담사의 상담 업무를 보조하는 자연어 처리 기술 역시 활발히 연구되고 있는 분야 중 하나이다. 콜센터 상담사 보조 시스템은 상담사를 보조하기에 앞서 고객과 상담사의 대화로 진행되는 상담이 어떤 내용인지 정확히 인식해야 한다. 이때, 시스템이 상담의 목적을 대표할 수 있는 발화를 판별한다면 상담 내용을 보다 명확히 인식할 수 있다. 본 논문은 구어체로 진행되는 상담 스크립트의 특징을 주목하여, 실시간으로 상담 내용을 분석하고, 중요한 의미를 가지는 발화를 인지하여 추출하는 모델을 제안한다. 실험 결과, 제안한 모델이 기존 추출 요약과 비교하여, 우수한 성능을 보였다. 본 논문에 제안한 모델을 적용하여, 주요 상담 발화를 추출하고, 관련된 상담 문서 검색, 상담 내용 분류 등에 적용할 수 있다.

  • PDF

비음수 행렬 인수분해와 NMF 군집방법을 이용한 다중문서요약 (Multi-document Summarization using Non-negative Matrix Factorization and NMF Clustering Method)

  • 박선;이주홍;김철원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.427-430
    • /
    • 2008
  • 본 논문은 비음수 행렬 인수분해(NMF, non-negative matrix factorization)와 NMF 군집방법을 이용하여 다중문서를 요약하는 새로운 방법을 제안하였다. 본 논문에서 NMF에 의해 계산된 의미 특징(semantic feature)은 문서의 고유 구조(inherent structure)를 반영하여 문장을 추출함으로써 요약의 질을 높일 수 있고, 의미 변수(semantic variable)를 이용한 문장의 군집은 문장 간의 유사성과 다양성 고려하여서 쉽게 과잉정보를 제거하여 문장을 요약할 수 있는 장점을 갖는다.

개인화된 비디오 요약 서비스를 위한 비디오 스플리터 (Video Splitter for Personalized Video Summary Services)

  • 김원철;황인준
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (3)
    • /
    • pp.541-543
    • /
    • 2002
  • 멀티미디어 관련 기술이 발전하고 인터넷 사용이 보편화되면서 모바일 단말기 상에서 비디오 데이터를 검색하려는 요구가 증가하고 있다. 그러나 모바일 단말기의 경우 낮은CPU 처리율이나 대역폭, 배터리 용량 등의 제약으로 인해 비디오를 그대로 검색하기에는 어려움이 많다. 최근 들어 비디오 데이터의 요약을 통해 모바일 환경의 제약점을 극복하고 효율적으로 비디오를 검색하기 위한 연구가 활발히 진행되고 있다. 본 논문에서는 기존의 단편적인 비디오 데이터 요약 기술에서 벗어나 요약된 비디오 데이터에 특징이나 중요도를 MPEG-7을 이용해서 주석 처리하여 사용자에게 보다 효과적인 검색 환경을 제공하고자 한다. 이러한 요약 방법은 모바일 환경에서 사용자의 우선 순위나 요구하는 특징에 적합한 동영상을 볼 수 있고 비디오의 전송시 모바일 장비의 성능에 따라 차별적으로 요약 정보를 제공함으로써 모바일 환경의 제약을 상당히 완화시킨다.

  • PDF

사용자 로그분석을 이용한 멀티 카메라 사무실 이벤트 요약 (A Summarization of Multi-Camera Office Event Using User Log Analysis)

  • 박한샘;조성배
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2008년도 한국컴퓨터종합학술대회논문집 Vol.35 No.1 (B)
    • /
    • pp.186-190
    • /
    • 2008
  • 최근 카메라를 비롯한 다양한 센서 기술 및 디지털 저장장치의 발달로 사용자의 일상생활의 기록인 라이프 로그를 수집하고 분석하는 연구가 활발히 이루어지고 있다. 라이프 로그는 모바일 디바이스에 포함된 다양한 센서를 통해 실외에서 수집되는 경우와 실내에 카메라를 중심으로 한 센서를 설치하여 수집되는 경우로 나누어 볼 수 있으며, 수집된 로그는 다양한 방법을 통해 분석하여 사용자에게 요약이나 검색과 같은 서비스 제공에 활용될 수 있다. 본 논문은 오피스 환경에 다수의 카메라를 설치하여 수집한 실내 비디오 로그 데이터를 대상으로 하며, 사용자의 어플리케이션 로그를 분석하여 요약을 위해 활용한다. 다수의 카메라는 오피스의 가운데 부분을 비추도록 하여, 발생한 하나의 이벤트에 대한 다양한 시점의 영상을 얻을 수 있도록 하였다. 전체 요약 과정은 크게 데이터 어노테이션, 사용자 로그분석을 이용한 이벤트 시퀀스 요약, 도메인 지식을 이용한 카메라 뷰의 선택으로 나뉘어 수행된다. 최종적으로 실험을 통해 제안하는 요약 방법이 좋은 결과를 보임을 확인하였다.

  • PDF

딥러닝과 Maximal Marginal Relevance를 이용한 2단계 문서 요약 (Two-step Document Summarization using Deep Learning and Maximal Marginal Relevance)

  • 전재원;황현선;이창기
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.297-300
    • /
    • 2019
  • 문서 요약은 길이가 긴 원본 문서의 의미는 유지한 채 원본보다 짧은 문서나 문장을 생성하는 자연어 처리 태스크이다. 본 논문에서는 Maximal Marginal Relevance(MMR)를 이용한 sequence-to-sequence 문장 추출 모델을 이용하여 의미가 중복되는 문장을 최소화하는 문장을 추출하고 추출된 문장을 sequence-to-sequence 모델을 통해 요약문을 생성하는 2단계 문서 요약 모델을 제안한다. 실험 결과 MMR을 활용하지 않았던 기존의 방법론보다 Rouge 성능이 향상되었다.

  • PDF

문맥 요약을 접목한 한국어 생성형 질의응답 모델 연구 (A Study on Korean Generative Question-Answering with Contextual Summarization)

  • 남정재;김우영;백상덕;이원준;김태용;윤현수;김우주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.581-585
    • /
    • 2023
  • Question Answering(QA)은 질문과 문맥에 대한 정보를 토대로 적절한 답변을 도출하는 작업이다. 이때 입력으로 주어지는 문맥 텍스트는 대부분 길기 때문에 QA 모델은 이 정보를 처리하기 위해 상당한 컴퓨팅 자원이 필요하다. 이 문제를 해결하기 위해 본 논문에서는 요약 모델을 활용한 요약 기반 QA 모델 프레임워크를 제안한다. 이를 통해 문맥 정보를 효과적으로 요약하면서도 QA 모델의 컴퓨팅 비용을 줄이고 성능을 유지하는 것을 목표로 한다.

  • PDF