• 제목/요약/키워드: 회의록 요약

검색결과 12건 처리시간 0.022초

한국어 회의록 생성 요약을 위한 국회 회의록 요약 말뭉치 구축 연구 (Corpus Construction of National Assembly Minutes Summarization for Korean Abstractive Meeting Minutes Summarization)

  • 함영균;강예지;박서윤;정용빈;서현빈;이이슬;서혜진;서샛별;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.192-197
    • /
    • 2022
  • 요약 연구의 주류는 아직 문서를 대상으로 하지만, 최근에는 회의 요약 연구에 대한 관심이 크게 높아지고 있다. 본 연구는 국립국어원 국어 빅데이터 구축 사업의 일환으로 국내에서 아직 연구되지 않은 국회 회의록 생성 요약에 대해 연구를 진행하였으며, 국회 회의록에 대한 생성 요약 데이터세트를 구축하였다. 또한 생성 요약 모델을 통해 구축된 데이터세트에 대한 정량 및 정성적 평가를 진행함으로써 국회 회의록 요약 데이터세트에 대한 평가 및 향후 생성 요약과 회의록 요약의 연구 방향을 모색하였다.

  • PDF

어휘의 동시 발생 빈도와 분포를 이용한 다중 주제 회의록 요약 (Multi-Topic Meeting Summarization using Lexical Co-occurrence Frequency and Distribution)

  • 이병수;이지형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2015년도 제52차 하계학술대회논문집 23권2호
    • /
    • pp.13-16
    • /
    • 2015
  • 본 논문에서는 어휘의 동시 발생 (co-occurrence) 빈도와 분포를 이용한 회의록 요약방법을 제안한다. 회의록은 일반 문서와 달리 문서에 여러 세부적인 주제들이 나타나며, 잘못된 형식의 문장, 불필요한 잡담들을 포함하고 있기 때문에 이러한 특징들이 문서요약 과정에서 고려되어야 한다. 기존의 일반적인 문서요약 방법은 하나의 주제를 기반으로 문서 전체에서 가장 중요한 문장으로 요약하기 때문에 다중 주제 회의록 요약에는 적합하지 않다. 제안한 방법은 먼저 어휘의 동시 발생 (co-occurrence) 빈도를 이용하여 회의록 분할 (segmentation) 과정을 수행한다. 다음으로 주제의 구분에 따라 분할된 각 영역 (block)의 중요 단어 집합 생성, 중요 문장 추출 과정을 통해 회의록의 중요 문장들을 선별한다. 마지막으로 추출된 중요 문장들의 위치, 종속 관계를 고려하여 최종적으로 회의록을 요약한다. AMI meeting corpus를 대상으로 실험한 결과, 제안한 방법이 baseline 요약 방법들보다 요약 비율에 따른 평가 및 요약문의 세부 주제별 평가에서 우수한 요약 성능을 보임을 확인하였다.

  • PDF

ROUGE기반 중요도를 반영한 긴 회의록 요약 (A Long Meeting Summarization using ROUGE-based Importance)

  • 임진형;송현제
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.41-46
    • /
    • 2022
  • 본 논문에서는 중요도를 반영한 긴 회의록 요약 모델을 제안한다. 제안한 모델은 먼저 회의록을 일정 크기로 구분한 후 구분된 텍스트에 대해 중간 요약문을 생성하고 각 요약문의 중요도를 계산한다. 다음으로 생성된 중간 요약문과 중요도를 함께 사용하여 최종 요약문을 생성한다. 제안 방법은 최종 요약문을 생성할 때 중간 요약문을 다르게 반영하므로 중요한 중간 요약문에서는 핵심 내용을 중점적으로 생성하도록 한다. 실험에서 제안한 요약 모델은 BART기반 요약 모델과, 중요도를 고려하지 않는 요약 모델(SUMMN)보다 핵심 내용을 포함한 요약문을 생성하였고, 평가 데이터에 대해 ROUGE-1 기준 1.37, 0.29 향상된 성능을 보였다.

  • PDF

2단계 문장 추출 방법을 이용한 회의록 요약 (Meeting Minutes Summarization using Two-step Sentence Extraction)

  • 이재걸;박성배;이상조
    • 한국지능시스템학회논문지
    • /
    • 제20권6호
    • /
    • pp.741-747
    • /
    • 2010
  • 본 논문은 회의록의 특징을 반영한 회의록을 요약 방법을 제안한다. 회의록은 일반 문서와 달리 회의의 진행자가 전체 흐름을 주도하고, 회의 진행에 사용하는 단어들이 존재하며, 발언자들 간의 대화에 종속관계가 있다는 특징이 있다. 제안한 방법은 먼저 회의의 흐름을 찾기 위해 사전에 구축된 회의 진행에 특화된 단어사전과 TextRank 알고리즘을 사용하여 진행자의 주제 문장들을 추출한다. 다음으로 추출된 문장들을 회의록에 있는 참석자들의 문장과 유사도를 계산하여 회의의 주제 문장과 관련있는 중요 문장을 추출한다. 마지막으로 사용자가 흐름을 편히 알 수 있도록 추출된 문장들 사이에 종속 관계를 분석하여 최종적으로 회의록을 요약한다. 국회 전자회의록을 대상으로 실험한 결과, 제안한 방법이 회의록을 요약하는 비율 전 구간에서 기존의 요약 방법들보다 더 나은 성능을 보인다.

단어 빈도와 유사도 분석 기반의 회의록 요약 시스템 설계 및 구현 (Design and Implementation of Minutes Summary System Based on Word Frequency and Similarity Analysis)

  • 허강호;양진우;김동현;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제19권10호
    • /
    • pp.620-629
    • /
    • 2019
  • 의사 결정을 위한 토론이나 토의의 내용을 객관적 요약하고 분류하는 자동화된 회의록 요약 시스템이 요구되고 있다. 본 논문은 기존에 사용되었던 회의록 요약 시스템을 보완할 수 있도록 word2vec 모델을 이용한 회의록 요약 시스템을 설계하고 구현한다. 제안 시스템은 형태소 분석 과정에서 불용어를 제거하고 문서에서 공통적인 의견을 가진 대표 문장을 추출하기 위해 추가로 word2vec 모델로 학습을 수행한다. 제안 시스템은 회의 과정에서 수집되는 문서를 분석하여 자동으로 분류하고 다양한 의견들 중 안건을 대표하는 대표 문장을 추출한다. 회의 진행자는 제안 시스템을 통해 회의에서 다뤄지는 모든 안건을 보다 빠르게 확인하고 관리할 수 있다. 제안 시스템은 대규모 토론이나 토의의 여러 가지 안건을 분석하여 대표 의견이 될 수 있는 문장을 요약하여 빠른 정확한 의사 결정을 지원한다.

인공지능기반의 키워드 중심 회의록 자동 생성 시스템 (Automatic Creation of Artificial Intelligence Meeting Minutes System using Korean Keyword Extraction)

  • 강수지;유진주;이태림;이하연;임양미
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.299-300
    • /
    • 2021
  • 비대면 시대로 인한 화상 회의의 중요성이 높아졌다. 하지만 현재까지도 회의기록의 문서화 작업은 수작업으로 이루어지고 있어 시간과 인적자원이 많이 소모되고 있다. 본 논문은 기존 수작업으로 진행되는 회의 문서화 과정의 문제점을 개선하고자 한국어 키워드 추출을 활용한 인공지능 회의록 자동 생성 시스템을 제안한다. 회의 음성 파일을 기반으로 STT 기술을 활용한 회의 전문을 자동 생성하고 전문에 KR-WordRank 알고리즘을 적용해 키워드를 추출, Summary API를 사용하여 요약본을 생성한다. 최종 결과로 회의 전문과 키워드, 요약본이 담긴 PDF 형식의 회의록을 사용자에게 제공하여, 수기 회의록 작성 시 들이는 시간적, 인적 비용 절감을 돕는다.

  • PDF

단어빈도와 유사도 분석을 이용한 다중주제 회의록 요약시스템 (Design and Implementation of a Multi-Subject Minutes Summary System Based on Word Frequency and Similarity Analysis)

  • 허강호;복경수;유재수
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2019년도 춘계종합학술대회
    • /
    • pp.453-454
    • /
    • 2019
  • 현대 사회에서는 의사 결정을 위해 다양한 도구가 사용되고 있다. 대규모로 진행되는 토의나 토론에서는 데이터를 분석하는데 많은 비용과 시간이 소모되고 있다. 회의록 요약시스템은 기존 문서처리방법을 자동화하여 인건비 절감과 처리시간을 단축하는 긍정적 효과를 기대하고 있다. 본 논문은 기존에 수작업으로 진행되었던 과정을 보다 효과적으로 운영할 수 있도록 회의록 요약시스템을 설계하고 구현한다. 대규모 토론이나 토의에서도 요약시스템 통해 대표의견을 제시받아 정확한 의사결정을 하여 시간절약과 비용절감 효과를 기대한다.

  • PDF

MAS: BART 와 WebRTC 라이브러리를 이용한 실시간 회의 스크립트화 및 요약 서비스 (MAS: Real-time Meeting Scripting and Summarization Service using BART and WebRTC library)

  • 권기준;고건준;주영환;지정희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.619-621
    • /
    • 2022
  • COVID-19 사태의 지속화로 재택근무 및 화상 수업의 수요가 증가함에 따라, 화상 회의 서비스에 대한 수요 또한 증가하고 있다. 본 논문은 회의 내용의 텍스트화 및 요약 회의록 생성에 관한 연구를 통해 보다 효율적인 화상 회의 서비스를 제공하고자 한다. WebRTC를 기반으로 화상 회의 서비스를 제공하며, WebSpeech API 를 활용하여 회의 내용을 스크립트화 한다. 회의 스크립트는 BART를 통해 요약본으로 재생성되며, 회의 스크립트와 요약본은 언제든지 열람 및 다운로드가 가능하다. 본 논문은 회의 요약 기능을 제공하는 화상 회의 서비스 MAS (Meeting Auto Summarization)를 제안하며, MAS 의 설계 및 구현 방법을 소개한다.

2004년도 국정감사와 '도서관'

  • 한국도서관협회
    • 도서관문화
    • /
    • 제45권12호통권355호
    • /
    • pp.34-50
    • /
    • 2004
  • 도서관문화 12월호에서는 <2004년도 국정감사와 '도서관'>이라는 주제로 두가지 자료를 정리해 보았다. 첫째는 2004년 10월 4일(문화관광부회의실)과 10월 22일(국회 문화관광위원회회의실)에서 있었던 문화관광부 본부에 대한 2004년도 국정감사의 회의록 중 '도서관' 또는 '독서'와 관련된 발언들만 발췌하여 정리한 것이며, 둘째는 국회 문화관광위원회 위원들이 문화관광부와 국립중앙도서관에 보낸 서면질의와 이에 대한 각 기관의 답변을 요약한 것이다. 법률을 입안하고 제정하며 이에 따른 정책을 추진하는 국회와 정부가 '도서관'에 대해 어떤 인식을 가지고 있는지 알아볼 수 있는 자료가 되었으면 한다. 첫번째 자료는 국회 홈페이지 '국정감사시스템'에 공개된 회의록을 이용했으며, 두번째 자료는 문화관광부 문화정책과와 국립중앙도서관 도서관정책과에서 제공해 주었다. 자료 제공에 감사드린다. 아울러 2004년도 국정감사 자료집으로 발행된 '학교도서관정책자료집'(유기홍 의원과 학교도서관문화운동네트워크 공동)과 '장애인도서관서비스 관련 정책제안 자료집'(정병국 의원)도 참고해 볼 만하다.

  • PDF