• 제목/요약/키워드: summary

검색결과 3,703건 처리시간 0.033초

Discontiguous Network에서 라우팅 축약 알고리즘의 효율화에 대한 방법론 (Methodology for the efficiency of routing summary algorithms in discontiguous networks)

  • 황성규
    • 한국정보통신학회논문지
    • /
    • 제23권12호
    • /
    • pp.1720-1725
    • /
    • 2019
  • 본 논문에서는 불연속 네트워크(discontiguous network)의 라우팅 축약기능(summary) 알고리즘에 대한 방식의 효율화에 대해 고찰을 한다. 서로 다른 전체의 서브넷 정보를 업데이트하여 전송하는 것보다 네트워크 정보를 축약하여 축약된 업데이트 정보만 전송하면 라우팅 테이블의 축약으로 라우터의 자원의 효율화가 이루어 지며 네트워크 안정과 성능을 향상시킬 수 있다. 그러나 네트워크 설계과정에서 불연속적인 네트워크가 구성될 경우 네트워크 축약 기능으로 문제가 발생되며 근본적인 라우터의 효율화의 결과를 가져오지 못한다. 본 논문에서 제안하는 알고리즘은 자동 축약 알고리즘의 단점을 보완한 알고리즘으로, 이로 인해 라우팅 테이블의 안정성을 높이고 그 결과 네트워크 장비의 CPU Utilization을 기존 16.5%에서 6.5%까지 낮추어 효율화가 구현됨을 확인하였다.

워드 임베딩 클러스터링을 활용한 리뷰 다중문서 요약기법 (Multi-Document Summarization Method of Reviews Using Word Embedding Clustering)

  • 이필원;황윤영;최종석;신용태
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.535-540
    • /
    • 2021
  • 다중문서는 하나의 주제가 아닌 다양한 주제로 구성된 문서를 의미하며 대표적인 예로 온라인 리뷰가 있다. 온라인 리뷰는 정보량이 방대하기 때문에 요약하기 위한 여러 시도가 있었다. 그러나 기존의 요약모델을 통해 리뷰를 일괄적으로 요약할 경우 리뷰를 구성하고 있는 다양한 주제가 소실되는 문제가 발생한다. 따라서 본 논문에서는 주제의 손실을 최소화하며 리뷰를 요약하기 위한 기법을 제시한다. 제안하는 기법은 전처리, 중요도 평가, BERT를 활용한 임베딩 치환, 임베딩 클러스터링과 같은 과정을 통해 리뷰를 분류한다. 그리고 분류된 문장은 학습된 Transformer 요약모델을 통해 최종 요약을 생성한다. 제안하는 모델의 성능 평가는 기존의 요약모델인 seq2seq 모델과 ROUGE 스코어와 코사인 유사도를 평가하여 비교하였으며 기존의 요약모델과 비교하여 뛰어난 성능의 요약을 수행하였다.

국가R&D과제정보 요약을 위한 한국어 정보요약 시스템 (Korean Information Summary System for National R&D Projcet Information Summary)

  • 이종원;김태현;신동구;조우승
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.72-74
    • /
    • 2022
  • 국가과학기술지식정보서비스(이하 NTIS)에서는 국가R&D과제정보를 제공하고 있다. 과제정보는 '과제명', '과제수행기관', '연구책임자명' 등의 메타정보와 '연구목표', '연구내용', '기대효과'와 같은 과제를 설명하는 텍스트들로 구성되어있다. 과제정보 100만건을 대상으로 검색한 결과목록에서 '연구목표' 나 '연구내용' 등을 모두 확인하여 원하는 과제정보를 찾기 위해서는 많은 시간이 필요하다는 문제가 있다. 이러한 문제점을 해소하기 위해, 본 논문에서는 국가R&D 과제정보 내에서 장문의 텍스트로 구성된 부분을 요약하는 과제정보 요약 시스템을 제안하고자 한다. 한국어의 언어학적 특징을 분석하여 전처리기를 구축하고 전처리된 텍스트 정보를 처리하기 위한 자연어 처리 기술 기반 과제정보 요약 모델을 개발하였다. 이를 통해 장문으로 구성된 과제정보를 압축 및 요약된 형태로 제공하여, 이용자들이 요약정보만으로도 전반적인 내용을 쉽고 빠르게 유추하는 데 도움이 될 것이다.

  • PDF

오류 유형에 따른 생성요약 모델의 본문-요약문 간 요약 성능평가 비교 (Empirical Study for Automatic Evaluation of Abstractive Summarization by Error-Types)

  • 이승수;강상우
    • 인지과학
    • /
    • 제34권3호
    • /
    • pp.197-226
    • /
    • 2023
  • 텍스트 생성요약은 자연어처리의 과업 중 하나로 긴 텍스트의 내용을 보존하면서 짧게 축약된 요약문을 생성한다. 생성요약 과업의 특성 상 본문의 핵심내용을 요약문에서 보존하는 것은 매우 중요하다. 기존의 생성요약 방법론은 정답요약과의 어휘 중첩도(Lexical-Overlap)를 기반으로 본문의 내용과 유창성을 측정했다. ROUGE는 생성요약 요약모델의 평가지표로 많이 사용하는 어휘 중첩도 기반의 평가지표이다. 생성요약 벤치마크에서 ROUGE가 49점대로 매우 높은 성능을 보임에도 불구하고, 생성한 요약문과 본문의 내용이 불일치하는 경우가 30% 가량 존재한다. 본 연구에서는 정답요약의 도움 없이 본문만을 활용해 생성요약 모델의 성능을 평가하는 방법론을 제안한다. 본 연구에서 제안한 평가점수를 AggreFACT의 라벨과 상관도 분석결과, 다음의 두 가지 경우 가장 높은 상관관계를 보였다. 첫 번째는 Transformer 구조의 인코더-디코더 구조에 대규모 사전학습을 진행한 BART와 PEGASUS 등을 생성요약 모델의 베이스라인으로 사용한 경우이고, 두 번째는 요약문 전체에 걸쳐 오류가 발생한 경우이다.

음악요약 생성에 관한 연구 (A Study on Music Summarization)

  • 김성탁;김상호;김회린;최지훈;이한규;홍진우
    • 방송공학회논문지
    • /
    • 제11권1호
    • /
    • pp.3-14
    • /
    • 2006
  • 음악요약이란 주어진 음악 컨텐츠에서 가장 중요하고 특징적인 한 부분이나 여러 부분들을 제공하는 것을 말한다. 음악요약 기술에는 크게 두 가지 종류의 음악요약을 위한 기술들이 연구되고 있다. 음악 컨텐츠 내에서 반복되는 구간을 음악요약으로 제공하는 기술과 특정이 다른 부분들의 일정구간을 모두 제공하는 기술이 있다. 본 논문에서는 두 가지 종류의 음악요약을 제공하는 알고리즘들을 제안하고 평가하였다. 반복되는 구간을 음악요약으로 제공하는 다중 레벨 벡터양자화를 이용한 알고리즘은 고정된 길이와 최적의 길이를 가지는 음악요약을 제공하는 알고리즘들을 객관적인 방법으로 성능을 평가하였고, 음악 내에서 특정이 다른 부분들을 일정부분씩 취합하여 제공하는 2-D 유사도 행렬과 k-mean 알고리즘을 이용하는 집단화 방법을 이용한 방법의 평가는 주관적인 평가인 MOS 테스트로 평가하였다. 다중 레벨 벡터양자화를 이용한 음악요약을 제공하는 알고리즘에서 고정된 길이의 음악요약을 제공하는 알고리즘은 사람이 직접 요약한 결과와 제안한 방법으로 구한 요약과의 중첩도 (Overlapping Ratio)를 이용한 결과 기존의 방법들이 42.2% 와 47.3% 임에 비해 제안된 방법은 67.1%로 높은 성능을 보여주었고, 최적의 길이를 가지는 음악요약을 제공하는 알고리즘은 음악에 따라 다른 길이를 가지는 반복되는 부분의 포함 정도를 나타내는 최적 중첩비율 (Optimal Overlapping Ratio) 을 측정한 결과 고정된 길이를 가지는 음악요약 보다 최적의 길이로 음악마다 다른 길이 의 반복되는 부분을 효과적으로 표현함을 알 수 있었다. 집단화 방법을 이용한 알고리즘은 두 가지 질문들 (제공된 세그먼트들 중 특정이 비슷한 것의 개수, 제공된 세그먼트들 중 같은 구조에 속하는 것의 개수)을 이용한 MOS 테스트에서 우수한 결과를 보여주었다. 환자에서 완전관해를 보였고, 원격전이와 국소재발이 각각 2명과 1명에서 관찰되었다. 결론: SMART를 사용한 IMRT를 도입하여 임상적으로나 선량측정상 이하선의 기능 보존이 가능하였으며, 또한 생물학적으로 더욱 효과적일 것으로 생각되었다 향후 정확한 종양억제 효과와 만기 독성을 알기 위해서는 추가적인 연구대상과 추적관찰이 필요하다고 생각한다.ty modulated radiation therapy, IMRT)를 이용한 최근의 결과와 비교하여 CK를 이용한 정위 방사선 치료는 생존율 측면에서 비슷하거나 나은 결과를 보였다. 또한 심각한 부작용은 관찰되지 않았으며 짧은 기간의 치료로 환자에게 편의를 제공할 수 있어 결과적으로 삶의 질을 향상시킬 수 있을 것이다. 따라서, 이 새로운 치료 방법은 국소 진행된, 절제 불가능한 췌장암 환자에서 심각한 부작용 없는 효과적인 치료가 될 것으로 생각된다. 또한 계획용 표적 체적은 CK 치료의 유용한 예후 인자로 사용될 것이다.인위적 활동에 의한 부분이 높은 것으로 추정되었다.가>에는 이 시교의 외면적인 따스함과 내면적인 정(情)과 성(性)의 부드러움이 적고. 그 반대로 풍간하여 지절사정(指切事情)함이 강하였던 모양이다. 풍간하여 사정(事情)을 매몰차게 지적하여 논평하였음을 퇴계는 '완세불공(玩迷不恭)'이라고 판단했을 것이다. 장육당은 청(淸)과 탁(濁)이 있음을 알지 못하고. 그것의 분별도 하지 못하는 세상 사람들을 완농(玩弄)하였다. 그러므로 그는 진환(塵 )에서 초연(超然)했던 것이다. 천석고황(泉石膏 )으로 태평성대(太平聖代)에 사시가흥(四時佳興)을 한가지로 하는 퇴계와는 그래서 다르다. 퇴계는 순풍(淳風)과 어진 인성(人性)을 긍정하였기에 만족하고. '고인(古人)의 녀던 길'을 끊임없이 행(行)하고자 하였다. 여기에서 '완세불공(玩世不恭)'과 '온유돈후(溫柔敦厚)'가 판별되어진다.

문헌정보학 학술지 논문의 결론 구조 분석 (The Structure of Research Article Conclusions in Library and Information Science Journals)

  • 김갑선
    • 한국도서관정보학회지
    • /
    • 제49권3호
    • /
    • pp.111-132
    • /
    • 2018
  • 본 연구는 문헌정보학 학술지 논문의 결론 부분의 구조와 유형을 밝힌 연구이다. 문헌정보학의 4개 학술지 논문의 결론 장(chapter)을 분석하여 '연구 관심 끌어내기', '요약하기', '논의하기', '적용하기', '확대하기' 의 5개 상위범주와 11개의 하위요소를 도출하여 이를 결론 구조의 분석도구로 적용하였다. 연구 결과, 문헌정보학 학술지 논문의 결론 제목은 '결론'이 절반 이상이며, 그 다음은 '결론 및 제언' 이다. 결론 장은 평균 4.2개의 구성요소로 구성되었다. 각 구성요소별 출현빈도는 '연구결과 요약'이 단연 우세하며, '연구 전체 과정 요약', '후속연구 제언', '연구 의의' 순 이었다. 서술 분량도 '연구결과 요약'이 가장 우세하며, 결론의 절반 이상을 차지하였다. 출현빈도가 가장 높은 상위범주는 '요약하기'이며, 그 다음은 '확대하기', '적용하기' 순 이었다. 결론을 시작하는 첫 번째 요소로 가장 우세한 요소는 '연구결과 요약'이며, 결론을 마무리하는 최종 요소로 가장 우세한 것은 '후속연구 제언'이다. 결론 구조의 패턴은 도입부가 '연구 전체 과정 요약-연구결과 요약'순이 가장 빈번하게 나타났다 문헌정보학 학술지 논문 결론 구조의 핵심 구성요소이자 핵심기능은 '요약하기'의 구성요소인 '연구결과 요약'과 '연구전체 과정 요약'이다. 이는 결론을 기술하는 필수요소로 밝혀졌다. '적용하기', '확대하기'에 포함된 여타의 요인은 선별적 요인으로 적용하고 있었다.

현행 즉결심판제도의 개선방안 연구 (A Study of the Summary Trial System's Reform Measures)

  • 곽영길
    • 시큐리티연구
    • /
    • 제13호
    • /
    • pp.47-70
    • /
    • 2007
  • 형사소송절차는 ‘신속한 재판 및 소송경제’ 와 ‘실체진실발견 및 인권보장’을 주요한 목적 이념으로 하고 있으며, 이들 두 가지 가치는 서로 갈등관계에 있다. 즉결심판제도는 판사가 범증이 명백하고 죄질이 경미한 범죄를 신속${\cdot}$적정한 절차를 통해 심판하는 특별간이절차로서 심판절차를 신속하게 종결하여 즉결피의자나 피고인을 형사절차로부터 조속히 해방시키는 데 주된 목적이 있다. 그러나 이러한 취지를 지나치게 강조하다보면 사건의 충분한 심리나 피의자${\cdot}$고인의 인권보장에 소홀해지기 쉬운 것도 사실이다. 따라서 즉결심판제도는 이러한 부작용을 방지할 수 있는 제도적 장치가 반드시 요구된다. 바로 이러한 시각에서 현행 즉결심판제도를 면밀히 검토할 필요가 있는 것이다. 본 연구의 주된 목적은 입법론적 관전에서 현행 제도의 문제점을 분석하여 제도자체의 폐지를 포함한 다양한 개선방안을 강구하는데 있다. 결론적으로 말하자면 즉결심판제도는 단점보다는 장점이 훨씬 많은 제도이므로 현행대로 유지하되, 즉결피의자${\cdot}$피고인 이의제도를 도입하거나 구류형을 폐지하는 등 충분한 제도적 보완이 뒤따라야 한다고 본다.

  • PDF

논의가 강조된 일반화학실험이 대학생들의 글쓰기에서 나타난 다중 표상 및 다중 표상의 내재성에 미치는 영향 (The Impact of Argumentation-based General Chemistry Laboratory Programs on Multimodal Representation and Embeddedness in University Students' Science Writing)

  • 남정희;이동원;조혜숙
    • 한국과학교육학회지
    • /
    • 제31권6호
    • /
    • pp.931-941
    • /
    • 2011
  • 이 연구의 목적은 논의가 강조된 일반화학실험이 학생들의 글쓰기에서 나타난 다중 표상 및 다중 표상의 내재성에 미치는 영향을 알아보기 위한 것이다. 이를 위해 탐구적 과학 글쓰기 전략을 바탕으로 일반화학실험 프로그램을 개발하였고, 이 프로그램을 적용한 후, 학생들의 글쓰기에서 나타나는 다중 표상의 양식과 내재성을 비교하였다. 이 연구는 일반화학실험을 수강하는 학생들을 대상으로 화학교육과 1학년 23명을 실험집단으로, 물리교육과 1학년 16명을 비교집단으로 선정하여 총 5개의 주제를 적용하였다. 학생들이 작성한 Summary Writing에서 나타난 다중 표상의 양식과 내재성을 공변량 분석으로 비교한 결과, 양식과 내재성 모두에서 실험집단의 평균이 비교집단에 비해 통계적으로 유의미하게 높은 것으로 나타났다. 이러한 결과로부터 논의가 강조된 일반화학실험은 다중 표상 및 다중 표상의 내재성의 발달에 있어서 전통적인 실험방식에 비해 더 효과적임을 알 수 있었다. 또한 논의와 글쓰기를 지속적으로 수행하는 과정이 학생들의 과학적 개념에 대한 이해에 도움이 될 것이라 보이며, 연구 결과가 대학생을 대상으로도 효과가 있다는 것에서 프로그램의 적용 범위의 확대 측면에서 의미가 있다고 본다.

완전성과 간결성을 고려한 텍스트 요약 품질의 자동 평가 기법 (Automatic Quality Evaluation with Completeness and Succinctness for Text Summarization)

  • 고은정;김남규
    • 지능정보연구
    • /
    • 제24권2호
    • /
    • pp.125-148
    • /
    • 2018
  • 다양한 스마트 기기 및 관련 서비스의 증가에 따라 텍스트 데이터가 폭발적으로 증가하고 있으며, 이로 인해 방대한 문서로부터 필요한 정보만을 추려내는 작업은 더욱 어려워졌다. 따라서 텍스트 데이터로부터 핵심 내용을 자동으로 요약하여 제공할 수 있는 텍스트 자동 요약 기술이 최근 더욱 주목을 받고 있다. 텍스트 요약 기술은 뉴스 요약 서비스, 개인정보 약관 요약 서비스 등을 통해 현업에서도 이미 활발하게 적용되고 있으며, 학계에서도 문서의 주요 요소를 선별하여 제공하는 추출(Extraction) 접근법과 문서의 요소를 발췌한 뒤 이를 조합하여 새로운 문장을 구성하는 생성(Abstraction) 접근법에 따라 많은 연구가 이루어지고 있다. 하지만 문서의 자동 요약 기술에 비해, 자동으로 요약된 문서의 품질을 평가하는 기술은 상대적으로 많은 진전을 이루지 못하였다. 요약문의 품질 평가를 다룬 기존의 대부분의 연구들은 사람이 수작업으로 요약문을 작성하여 이를 기준 문서(Reference Document)로 삼고, 자동 요약문과 기준 문서와의 유사도를 측정하는 방식으로 수행되었다. 하지만 이러한 방식은 기준 문서의 작성 과정에 막대한 시간과 비용이 소요될 뿐 아니라 요약자의 주관에 의해 평가 결과가 다르게 나타날 수 있다는 한계를 갖는다. 한편 이러한 한계를 극복하기 위한 연구도 일부 수행되었는데, 대표적으로 전문에 대해 차원 축소를 수행하고 이렇게 축소된 전문과 자동 요약문의 유사도를 측정하는 기법이 최근 고안된 바 있다. 이 방식은 원문에서 출현 빈도가 높은 어휘가 요약문에 많이 나타날수록 해당 요약문의 품질이 우수한 것으로 평가하게 된다. 하지만 요약이란 본질적으로 많은 내용을 줄여서 표현하면서도 내용의 누락을 최소화하는 것을 의미하므로, 단순히 빈도수에 기반한 "좋은 요약"이 항상 본질적 의미에서의 "좋은 요약"을 의미한다고 보는 것은 무리가 있다. 요약문 품질 평가의 이러한 기존 연구의 한계를 극복하기 위해, 본 연구에서는 요약의 본질에 기반한 자동 품질 평가 방안을 제안한다. 구체적으로 요약문의 문장 중 서로 중복되는 내용이 얼마나 적은지를 나타내는 요소로 간결성(Succinctness) 개념을 정의하고, 원문의 내용 중 요약문에 포함되지 않은 내용이 얼마나 적은지를 나타내는 요소로 완전성(Completeness)을 정의한다. 본 연구에서는 간결성과 완전성의 개념을 적용한 요약문 품질 자동 평가 방법론을 제안하고, 이를 TripAdvisor 사이트 호텔 리뷰의 요약 및 평가에 적용한 실험 결과를 소개한다.

주제 균형 지능형 텍스트 요약 기법 (Subject-Balanced Intelligent Text Summarization Scheme)

  • 윤여일;고은정;김남규
    • 지능정보연구
    • /
    • 제25권2호
    • /
    • pp.141-166
    • /
    • 2019
  • 최근 다양한 매체를 통해 생성되는 방대한 양의 텍스트 데이터를 효율적으로 관리 및 활용하기 위한 방안으로써 문서 요약에 대한 연구가 활발히 진행되고 있다. 특히 최근에는 기계 학습 및 인공 지능을 활용하여 객관적이고 효율적으로 요약문을 도출하기 위한 다양한 자동 요약 기법이(Automatic Summarization) 고안되고 있다. 하지만 현재까지 제안된 대부분의 텍스트 자동 요약 기법들은 원문에서 나타난 내용의 분포에 따라 요약문의 내용이 구성되는 방식을 따르며, 이와 같은 방식은 비중이 낮은 주제(Subject), 즉 원문 내에서 언급 빈도가 낮은 주제에 대한 내용이 요약문에 포함되기 어렵다는 한계를 갖고 있다. 본 논문에서는 이러한 한계를 극복하기 위해 저빈도 주제의 누락을 최소화하는 문서 자동 요약 기법을 제안한다. 구체적으로 본 연구에서는 (i) 원문에 포함된 다양한 주제를 식별하고 주제별 대표 용어를 선정한 뒤 워드 임베딩을 통해 주제별 용어 사전을 생성하고, (ii) 원문의 각 문장이 다양한 주제에 대응되는 정도를 파악하고, (iii) 문장을 주제별로 분할한 후 각 주제에 해당하는 문장들의 유사도를 계산한 뒤, (iv) 요약문 내 내용의 중복을 최소화하면서도 원문의 다양한 내용을 최대한 포함할 수 있는 자동적인 문서 요약 기법을 제시한다. 제안 방법론의 평가를 위해 TripAdvisor의 리뷰 50,000건으로부터 용어 사전을 구축하고, 리뷰 23,087건에 대한 요약 실험을 수행한 뒤 기존의 단순 빈도 기반의 요약문과 주제별 분포의 비교를 진행하였다. 실험 결과 제안 방법론에 따른 문서 자동 요약을 통해 원문 내각 주제의 균형을 유지하는 요약문을 도출할 수 있음을 확인하였다.