• 제목/요약/키워드: 자동초록

검색결과 40건 처리시간 0.023초

과학 논문 초록 말뭉치 구축 및 선학습 트랜스포머 기반 초록 자동구조화 방법 (Scientific Paper Abstract Corpus and Automatic Abstract Structure Parsing using Pretrained Transformer)

  • 김서경;조윤희;허세훈;정상근
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.280-283
    • /
    • 2020
  • 논문 초록은 논문의 내용을 요약해 제시함으로써 독자들의 연구결과물에 대한 빠른 검색과 이해를 도모한다. 초록의 구성은 대부분 전형적인 경우가 많기 때문에, 초록의 구조를 자동 분석하여 색인해두면 유사구조 초록을 검색하거나 생성하는 등의 연구효율화에 기여할 수 있다. 허세훈 외 (2019)는 초록 자동구조화를 위한 말뭉치 SPA2019 및 기계학습기반의 자동구조화 방법을 제시하였다. 본 연구는, 기존 SPA2019 의 구조화 오류를 바로잡고, SPA2019 에서 추출한 1,346 개의 초록데이터와 2,385 개의 초록데이터를 추가한 SPA2020 말뭉치를 새로이 소개한다. 또한, 다양한 선학습 기반 트랜스포머들을 활용하여 초록 자동구조화를 수행하였으며, 그 결과 BERT-0.86%, RoBERTa-0.86%, ALBERT-0.84%, XLNet-0.86%, DistilBERT-0.85% 등의 자동구조화 성능을 보임을 확인하였다.

  • PDF

자동 초록을 위한 지식 기반 시스템 설계에 관한 연구 (A Study on the Knowledge-Based System for Automaic Abstracting)

  • 최인숙
    • 정보관리학회지
    • /
    • 제6권1호
    • /
    • pp.93-117
    • /
    • 1989
  • 본 연구에서는 자연언어 텍스트 분석을 통해 초록을 생성하기 위하여 특정 주제분 야의 지식에 입각하여 운영되는 지식 기반 시스템을 설계하였다. 주제 영역은 상표법 관계 대법원 판결서를 대상으로 하였으며 지식 베이스는 판결서의 내용을 담을 수 있는 틀과 상 표법 조문 지식, 상품 구분 지식을 프레임과 의미 네트워크로 표현하여 구성하였다. 초록을 생성하는 과정은 (1) 텍스트를 이해하기 위하여 필요한 주제분야지식을 미리 체계적으로 조 직하여 지식 베이스를 구성하고 주요 정보가 들어갈 자리를 괄호로 둔 채 그 정보들을 연결 하는 일반적인 내용만 기술한 예비 초록을 각 경우별로 준비한 다음 (2) 이러한 지식에 입 각하여 입력 테스트를 분석하고 초록에 필요한 주요 정보를 추출하며 (3) 입력 테스트에 해 당하는 예비 초록을 호출하여 그의 괄호 안에 필요한 정보를 채워 초록을 완성하는 3 단계 로 구성된다.

  • PDF

표제(標題)와 초록(抄錄)의 색인성(索引性)과 정보량(情報量) 분석(分析) (Indexability and Information Quantity Analysis in Title and Abstract)

  • 김재수;남영준
    • 정보관리연구
    • /
    • 제23권2호
    • /
    • pp.1-13
    • /
    • 1992
  • 본(木) 연구(硏究)에서는 자동색인(自動索引)의 색인어(索引語) 추출(抽出)에 있어 주요한 색인원(索引源)이 되는 표제(標題)와 초록(抄錄)등의 색인성을 비교 분석하였다. 결과는 표제만을 혹은 초록(抄錄)만을 색인원(索引源)으로 선정할 경우에 적절한 색인어(索引語)를 추출할 수가 없었으며, 표제(標題)와 초록(抄錄)을 동시에 색인원(索引源)으로 선정할 경우가 좀 더 적절한 색인어(索引語)를 확보할 수가 있었다.

  • PDF

학술잡지기사 초록의 비평문장 자동작성에 대한 연구 (A Study on Automatically Constructing a Critical Abstracts of the Articles in Scholar Journals)

  • 이태영
    • 정보관리학회지
    • /
    • 제25권1호
    • /
    • pp.19-41
    • /
    • 2008
  • 논문기사의 비평적 초록을 웹 환경 아래서 자동으로 생성하기 위하여 비평 단서어구, 비평 정보 범례, 비평 수록 문장 발췌규칙, 비평문장 생성규칙을 작성하였다. 비평 정보를 발췌하고 문장을 생성하는데 필요한 비평문 작성 도움 온톨로지를 만들어 비평의 단초가 되는 단서어구와 문장 간의 징후들을 관리 운영하였다. 징후들은 원문의 연구목적, 방법, 결과, 결론 문장을 중심으로 그 주변 문장들에서 상호 작용하여 표출되는 문맥적 정보를 이용하였다. 실제 비평문장의 성능을 조사한 결과, 발췌 및 생성 규칙의 개선과 온톨로지의 관계들이 보강되어야 할 것으로 판단하였다.

한국어 초록 작성의 자동화에 관한 연구 -미생물학분야 학술지의 논문을 대상으로- (A Study on the Automatic Abstracting System for Journal Articles in Korean in the Field of Microbiology)

  • 이태영
    • 정보관리학회지
    • /
    • 제9권2호
    • /
    • pp.43-79
    • /
    • 1992
  • 자연 언어 처리 문법 중 격문법, 개념 의존 문법, PATR-II, DCG를 응용하여 미생 물학 분야에 대한 한국어 자동 초록 시스템의 구축을 연구하였다. 표본으로 선택된 초록들 을 분석하여 초록의 구조가 연구 목적 문장, 방법.결과 문장, 결론 문장 의 순으로 이루어지 는 것을 알았고 이를 초록의 이상적인 구조 형식으로 정하였다. 본문에서는 문장 발췌와 발 췌된 문장들이 초록의 문장으로 정제되도록 하는 과정에서 중요한 역할을 하는 명사 역할 자질과 그 자질을 부여하는 규칙을 개발 하였다. 그리고 발췌된 문장들을 재정렬시키기 위 한 재정렬 규칙, 초록 문장을 생성하기 위한 문장 생성 규칙을 두었다. 그리고 본 시스템의 방법론으로 작성된 자동 초록들을 평가한 결과, 본 시스템의 방법론이 저자 초록과 같은 수 준에 오르려면 정밀한 역할 자질의 확립과 문장 생성 규칙에 대한 보다 깊은 연구가 필요하 다고 사려된다.

  • PDF

웹 정보자원의 색인과 초록 요소에 관한 연구 (A Study on the Elements of Indexing and Abstracting on the World Wide Web)

  • 최재황
    • 한국문헌정보학회지
    • /
    • 제33권1호
    • /
    • pp.113-128
    • /
    • 1999
  • 인쇄물의 색인과 초록은 통제어나 시소러스를 이용하여 합의된 방식으로 작성되지만, 웹 정보자원의 색인과 초록은 인간의 작업을 거치지 않고 자동으로 작성된다. 웹 환경에서의 색인과 초록은 인쇄물의 색인${\cdot}$초록과 비교하여 어떠한 과정을 거치며, 어떠한 요소들을 포함하는가에 대한 연구는 매우 의미 있는 일이라고 본다. 본 연구에서는 휑 정보자원의 수집, 색인 저장, 검색의 과정을 살펴보았고, 6개의 웹 검색 엔진을 통하여 색인과 초록작성에 영향을 미칠 수 있는 17개의 색인 요소와 11개의 초록 요소 그리고 2개의 메타 요소를 조사하였다. 전반적인 웹 정보자원의 색인과 초록에 대한 경향과 전망에 대해서도 살펴보았다.

  • PDF

An Analysis of Move Patterns in Abstracts of Social Sciences Research Articles

  • Kim, Eungi
    • 한국도서관정보학회지
    • /
    • 제45권2호
    • /
    • pp.283-309
    • /
    • 2014
  • 문장이나 문단 내에서 특정 기능을 하는 표현을 이동마디라고 하며, 여러 이동마디는 논문의 초록에서 쉽게 발견된다. 대부분의 이동마디는 보편적으로 배경-목표-방법-결과-결론(이하 BAMRC)의 순서로 많이 사용한다. 이 논문은 이러한 BAMRC 이동마디에 기초하여 사회과학분야의 논문 초록 중에서 나타나는 일정한 패턴을 분석 하여 연구한 것이다. 기존 연구와 달리 이 연구에 사용된 데이터베이스는 Scopus로 사회과학분야의 학술지 298개에서 467편의 초록을 샘플로 삼아 막대한 데이터를 사용하였다. 분석결과 이동마디가 넓은 범위에서 패턴을 나타내므로 결국 논문 초록에서 논문에 대한 정보를 얻는데 한계가 있는 것을 알 수 있다. 이 연구 결과, 기존에 있는 전통적인 사회과학 논문초록은 결국 이동마디가 없거나 다양한 이동마디의 패턴이 있어, 결국 논문초록 내에서 충분한 정보가 제공되지 않는다는 것을 보여준다. 따라서 기존 서술형식의 초록에 있는 이동마디들을 일정 양식을 따르는 초록으로 자동적으로 옮기는 것은 적합하지 않는 방법이며, 이러한 작업은 확인 절차를 밟을 것이 요구되므로 어려운 작업일 수 밖에 없다. 이 연구 결과를 토대로 추후에 진행되는 연구에서는 사회과학분야 논문 초록의 본질을 보다 구체적이고 정확하게 알아내기 위하여 사회과학 외의 다른 분야와도 비교하는 것이 도움이 될 것이다.

교통 신호등 자동 제어시스템 (Traffic Signal Automatic Control System)

  • 최덕규;윤승목;김태성
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제61차 동계학술대회논문집 28권1호
    • /
    • pp.163-164
    • /
    • 2020
  • 교통 신호등 자동 제어시스템 기술은 교통 체증 현상을 방지하고 횡단 보도를 건너는 보행자들의 안전을 목적으로 시작되었다. 이는 1가구당 2차량에 가까운 보급률을 보이고 있는 현대 사회에 불가피하게 생기는 문제인데 본 연구에서는 이러한 문제로 인한 교통 신호등 자동 제어시스템 기술을 적용하고자 한다. 사거리에서 운전을 하다 보면 차량이 많이 지나가는 차선이 있는 반면 비교적 차량이 많이 지나가지 않는 차선들을 볼 수 있다. 이런 경우 차량이 많은 차선은 신호시간 내 차량이 모두 지나가지 못해서 교통체증이 발생하게 된다. 교통 체증을 최소화하기 위해서 압력 센서를 설치하여 차량이 많이 정체 되고 있는 차선에 신호의 시간을 증가시켜주고 차량이 많이 없는 차선은 기본 신호의 시간을 주어 차량이 많이 있는 차선의 차들의 교통 체증을 해소시켜 준다. 그리고 차량이 많이 지고 스마트폰의 보급이 많아지다 보니 횡단 보도에서 스마트폰을 보고있다 횡단 보도에서 사고를 당하는 경우 증가하고 있다. 이러한 보행자들을 위해 횡단 보도의 신호가 초록불이 되었을 때 간단한 음악이 나오고 발 밑에 횡단 보도 신호등과 같은 색깔이 나오게 하는 LED를 설치한다. 이렇게 하여 초록불이 들어왔다는 것을 보행자들에 인식시켜 보행자들의 안전을 지킬 수 있다.

  • PDF

Labeled LDA를 이용한 저자 주제어 추천 (Applying Labeled LDA to Author Keywords Recommendation)

  • 봉성용;황규백
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(C)
    • /
    • pp.385-389
    • /
    • 2010
  • 논문에 부여되는 저자 주제어(author keyword)는 논문을 분류 및 검색하는데 활용될 수 있다. 이렇게 주제어를 부여할 때 자동으로 저자 주제어를 추천한다면 사용자에게 편리성을 제공하고 저자가 직접 부여한 저자 주제어 이외에 추가적으로 주제어가 있는지도 확인할 수 있어 유용하다. 본 연구에서는 논문에 달려있는 다수의 주제어 중 하나의 주제어를 선별하여 Labeled LDA를 이용해 주제어와 초록(abstract)의 관계를 학습했다. 이후 초록이 주어지면 자동으로 저자 주제어를 부여할 수 있도록 추천하는 기법을 제안하고 그에 따른 실험을 진행했다. 본 논문에서는 실험을 통하여 기계학습을 이용한 저자 주제어의 추천이 어느 정도의 성능을 보이는지 평가하고 향후 연구의 방향을 제시한다.

  • PDF

KoreaMed MeSH 체크태그 분석 (An Analysis of KoreaMed MeSH Check Tags)

  • 정소나;이춘실
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2013년도 제20회 학술대회 논문집
    • /
    • pp.105-111
    • /
    • 2013
  • KoreaMed MeSH 반자동 색인 시스템이 논문 제목, 초록 그리고 저자키워드를 활용하여 부여한 KoreaMed MeSH 체크태그와 NLM의 MeSH 색인전문가가 부여한 MEDLINE MeSH 체크태그와의 일치여부를 비교 분석하였다. KoreaMed 학술지중에서 MEDLINE에 등재된 15종 학술지의 2012년 마지막 호에 실린 논문 236편을 표본으로 선정하여 일치도를 분석한 결과 MEDLINE MeSH 체크태그와 KoreaMed MeSH 체크태그와의 일치율은 30.24%였다. 그러나 KoreaMed MeSH 체크태그를 기준으로 했을 경우 MEDLINE MeSH 체크태그와의 일치율은 84.24%에 달했다. 일치율은 종별이 가장 높았고, 동물명, 성별, 연령그룹순이었다. 연령그룹에 대하여 초록내 패턴을 발견하여 반자동색인 필터로 적용한다면 일치율을 높일 수 있다. 궁극적으로는 연구의 핵심적인 연구대상이나 재료를 특정적이고 구체적인 단어 혹은 MeSH로 표현하는 초록 작성 기술이 요청된다.

  • PDF