• 제목/요약/키워드: Paper Summarization

검색결과 144건 처리시간 0.03초

육하원칙 정보에 기반한 홈비디오 키프레임 추출 (Keyframe Extraction from Home Videos Using 5W and 1H Information)

  • 장철훈;조성현;이승용
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제19권2호
    • /
    • pp.9-18
    • /
    • 2013
  • 본 논문에서는 육하원칙 정보를 기반으로 홈비디오에서 키프레임을 추출하는 방법을 제시한다. 키프레임 추출방법이란 비디오에서 중요하다고 생각되는 특정 프레임만을 선출하여 비디오를 요약하는 방법이다. 홈비디오의 경우 그 주제가 다양하여 특별한 가정을 통한 정보 추출이 어렵고, 주로 인물이 비디오의 중심이 되기 때문에 인물의 행동을 중심으로 요약을 수행하여야 한다. 본 논문에서는 인물의 얼굴, 인물의 행동, 전체 배경 정보를 분석하여 인물 중심의 보편적인 요약 기준인 육하원칙의 주요 정보를 추출한다. 추가적으로 비디오의 매 프레임의 블러 크기를 측정하여 이용함으로써 프레임별로 얼마나 많은 정보를 포함하고 있는지 측정하고, 가장 많은 정보를 포함한 프레임을 키프레임으로 선출한다. 사용자 실험을 통해 사용자가 홈비디오에서 여러 개의 키프레임을 선택할 경우, 기존의 방법보다 사용자의 선택과 유사함을 확인할 수 있다.

TF-IDF의 변형을 이용한 전자뉴스에서의 키워드 추출 기법 (Keyword Extraction from News Corpus using Modified TF-IDF)

  • 이성직;김한준
    • 한국전자거래학회지
    • /
    • 제14권4호
    • /
    • pp.59-73
    • /
    • 2009
  • 키워드 추출은 정보검색, 문서 분류, 요약, 주제탐지 등의 텍스트 마이닝 분야에서 기반이 되는 기술이다. 대용량 전자문서로부터 추출된 키워드들은 텍스트 마이닝을 위한 중요 속성으로 활용되어 문서 브라우징, 주제탐지, 자동분류, 정보검색 시스템 등의 성능을 높이는데 기여한다. 본 논문에서는 인터넷 포털 사이트에 게재되는 대용량 뉴스문서집합을 대상으로 키워드 추출을 수행하여 분야별 주제를 제시할 수 있는 키워드를 추출하는 새로운 기법을 제안한다. 기본적으로 키워드 추출을 위해 기존 TF-IDF 모델을 고찰, 이것의 6가지 변형식을고안하여 이를 기반으로 각 분야별 후보 키워드를 추출한다. 또한 분야별로 추출된 단어들의 분야간 교차비교분석을 통해 불용어 수준의 의미 없는 단어를 제거함으로써 그 성능을 높인다. 제안 기법의 효용성을 입증하기 위해 한글 뉴스 기사 문서에서 추출한 키워드의 질을 비교하였으며, 또한 주제 변화를 탐지하기 위해 시간에 따른 키워드 집합의 변화를 보인다.

  • PDF

혼합형 학습 기반 스마트 이러닝 구현 (Implementation of Smart E-learning based on Blended Learning)

  • 홍유식
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권2호
    • /
    • pp.171-178
    • /
    • 2020
  • 많은나라에서 온라인교육및 오프라인교육 장점을 결합한 혼합형학습을 개설하고 운영하는 중이다. 그러나, 온라인 윈격 강의 기반 Mooc 강좌는 졸업율이 5~10%미만으로, 매우 낮은 수준이다. 그러므로, Web 기반에서 언제, 어디서나, 누구나 간편하게 강의를 수강할 수 있는 온라인 Mooc 원격 교육 강의를 수강하는 학생들의 졸업율을 높이기 위해서는, 반드시 학생들의 강의 이해도 자동분석 및 자동 학사 경고 시스템을 도입 해야만 한다. 특히, 우리나라가 교육 선진국으로 진입하기 위해서는 오답율 자동판단 SW개발, 강의 자동요약 SW, 혼합형 학습 수준별 강의 기반 취약과목 자동분석 SW 교육을 개발해야 한다. 본 논문에서는 이러한 문제점을 개선하기 위해서, 강의내용 자동요약 시스템, 오답 자동 경고 시스템, 취약과목 자동판단 알고리즘을 제안 하고 모의실험 하였다.

단백질의 세포내 위치 예측을 위한 다중레이블 분류 방법의 성능 비교 (A Performance Comparison of Multi-Label Classification Methods for Protein Subcellular Localization Prediction)

  • 지상문
    • 한국정보통신학회논문지
    • /
    • 제18권4호
    • /
    • pp.992-999
    • /
    • 2014
  • 단백질이 존재하는 세포내의 다중 위치를 정확하게 예측하기 위하여 다중레이블 학습 방법을 광범위하게 비교한다. 이를 위하여 다중레이블 분류의 접근 방법인 알고리즘 적응, 문제 변환, 메타 학습의 여러 방법을 비교 평가한다. 다양한 관점에서 다중레이블 분류 방법의 특성을 평가하기 위하여 12가지 평가 척도를 사용하였고, 최적의 성능을 보이는 방법을 찾기 위하여 새로운 요약 척도를 사용하였다. 비교 실험 결과, 흔하지 않은 다중레이블 집합을 가지치기 하는 멱집합 방법과, 관련 레이블들을 추가된 특징으로 나타내는 분류기-체인 방법의 성능이 높았다. 또한, 이들 방법들로 구성된 여러 개의 분류기를 조합하면 더욱 성능이 향상되었다. 즉, 세포내 위치간의 연관관계를 사용하는 것이 예측에 효과적인데, 특정 생물학적 기능을 수행하는 단백질의 세포내 위치들의 관계는 독립적이지 않고 서로 관련되어 있기 때문이라 판단된다.

이동객체 위치 일반화를 이용한 시공간 이동 패턴 탐사 (Spatiotemporal Moving Pattern Discovery using Location Generalization of Moving Objects)

  • 이준욱;남광우
    • 정보처리학회논문지D
    • /
    • 제10D권7호
    • /
    • pp.1103-1114
    • /
    • 2003
  • 현재의 이동객체를 기반으로 하는 다양한 시공간 응용환경에서의 서비스 지원 시스템 개발을 위하여 중요한 문제 중의 하나는 방대한 이동객체의 위치 이동 데이터로부터의 의미 있는 지식인 시공간 이동 패턴을 탐사하는 것이다. 이를 위하여 시간적 위상관계, 공간적 위상관계 그리고 시공간적 위상관계에 대한 접근이 지식 탐사를 위하여 고려되어야 한다. 이 논문에서는 효율적인 시공간 이동 패턴 탐사 기법인 MPMine 알고리즘을 제안하였다. 제안한 기법은 시간 제약조건과 공간 제약조건 등을 함께 괴려하며 또한 공간 위상 연산인 contain()을 이용한 공간 개념화를 수행할 수 있다. 제안한 기법은 기존의 일반적인 시간 패턴 탐사 기법과 달리 이동객체 데이터 집합으로부터 위치 및 일반화를 통하여 탐색 공간을 줄일 수 있어 효율적으로 유용한 이동 패턴을 탐사할 수 있다.

고체 입자와 유동방향 변환에 의한 로켓 모터 내 음향 감쇠에 대한 고찰 (Study on Acoustic Attenuation due to Particles and Flow Turning in Rocket Motors)

  • 김태진;성홍계;서성현
    • 한국항공우주학회지
    • /
    • 제43권9호
    • /
    • pp.838-844
    • /
    • 2015
  • 본 논문은 고체 로켓 모터 연소실 내의 연소과정 중 발생하는 연소 불안정 현상을 억제하는 여러 요소들 중 입자에 의한 감쇠와 유동방향 변환 감쇠에 대한 선행연구의 연구결과를 정리 분석하였다. 입자에 의한 감쇠는 연소실 내에서 발생하는 고주파 연소불안정을 억제하는데 있어 가장 효과적이며 입자의 직경과 질량 분율에 영향을 받는다. 한편 입자에 의한 감쇠에 비해 적은 감쇠량을 갖는 유동방향 변환 감쇠는 추진제의 구조에 따라 변하며, 추진제 표면에서 생성된 와도를 고려한다면 펌핑에 의한 증폭을 고려해야한다. 그러나 추진제의 형상이 원통형일 경우 유동방향 변환 감쇠와 펌핑에 의한 증폭의 크기는 같아지고 상쇄가 일어나 연소 안정성을 보다 쉽게 평가할 수 있다.

효율적인 상품평 분석을 위한 어휘 통계 정보 기반 평가 항목 추출 시스템 (Automatic Product Feature Extraction for Efficient Analysis of Product Reviews Using Term Statistics)

  • 이우철;이현아;이공주
    • 정보처리학회논문지B
    • /
    • 제16B권6호
    • /
    • pp.497-502
    • /
    • 2009
  • 본 논문에서는 상품평의 효율적인 분석을 위한 평가 항목 추출 시스템을 제안한다. 시스템은 크게 상품평 수집-보정과 평가 항목 추출의 두 단계로 구성된다. 상품평 수집-보정에서는 인터넷 쇼핑몰에서 상품평을 수집하고 상품평 특유의 구어체 표현과 맞춤법 오류 등을 처리한다. 평가 항목 추출에서는 스커트 상품 카테고리의 경우 ‘사이즈', ‘스타일'과 같이 상품을 평가하는 기준이 되는 항목을 상품평과 인터넷 상의 웹 문서를 활용하여 자동으로 추출한다. 상품평에 나타나는 명사들을 평가 항목 후보로 설정하고, 각 후보 명사의 상품평에서의 어휘 통계인 내부연관도와, 후보 명사와 상품 카테고리명의 웹 문서에서의 공기 빈도에 기반하여 계산된 외부연관도를 결합하여 상품과 평가 항목 후보의 연관도를 계산한다. 본 논문의 평가 항목 추출 방식은 평균 재현율 90%를 보여 기존 연구보다 우수한 결과를 보였다.

LDA 모델을 이용한 잠재 키워드 추출 (Latent Keyphrase Extraction Using LDA Model)

  • 조태민;이지형
    • 한국지능시스템학회논문지
    • /
    • 제25권2호
    • /
    • pp.180-185
    • /
    • 2015
  • 인터넷 미디어의 발달과 함께 온라인 문서의 양이 급격하게 증가함에 따라, 문서 요약과 정보 검색 등 다양한 분야에 활용가능한 키워드를 자동으로 찾고자하는 연구가 활발히 진행되고 있다. 하지만 기존의 키워드 추출 연구들은 문서에서 나타나는 키워드만을 대상으로 하고 있어, 문서에서 등장하지 않는 잠재 키워드를 추출하지 못하는 한계를 갖고 있다. 잠재 키워드는 실데이터 키워드의 1/4 이상을 차지하고 있으며, 문서에서 나타나지는 않지만 문서의 중요한 개념이나 내용을 함축하고 있어 문서 요약 및 정보 검색에 중요한 역할을 차지할 수 있다. 특히 SNS와 같이 내용이 적어 키워드가 명시적으로 나타나기 어려운 문서에서 유용하게 활용될 수 있다. 본 논문에서는 잠재 키워드를 추출하기 위해 주어진 문서와 유사한 문서의 키워드를 후보 키워드로 선택하고 후보 키워드를 구성하는 개별 단어들을 이용해 후보 키워드의 중요도를 평가하는 방법을 제안한다. 실험을 통해, 제안 기법이 잠재 키워드를 합리적인 수준으로 추출할 수 있음을 보였다.

KR-WordRank : WordRank를 개선한 비지도학습 기반 한국어 단어 추출 방법 (KR-WordRank : An Unsupervised Korean Word Extraction Method Based on WordRank)

  • 김현중;조성준;강필성
    • 대한산업공학회지
    • /
    • 제40권1호
    • /
    • pp.18-33
    • /
    • 2014
  • A Word is the smallest unit for text analysis, and the premise behind most text-mining algorithms is that the words in given documents can be perfectly recognized. However, the newly coined words, spelling and spacing errors, and domain adaptation problems make it difficult to recognize words correctly. To make matters worse, obtaining a sufficient amount of training data that can be used in any situation is not only unrealistic but also inefficient. Therefore, an automatical word extraction method which does not require a training process is desperately needed. WordRank, the most widely used unsupervised word extraction algorithm for Chinese and Japanese, shows a poor word extraction performance in Korean due to different language structures. In this paper, we first discuss why WordRank has a poor performance in Korean, and propose a customized WordRank algorithm for Korean, named KR-WordRank, by considering its linguistic characteristics and by improving the robustness to noise in text documents. Experiment results show that the performance of KR-WordRank is significantly better than that of the original WordRank in Korean. In addition, it is found that not only can our proposed algorithm extract proper words but also identify candidate keywords for an effective document summarization.

전통 문화 데이터를 이용한 메타 러닝 기반 전역 관계 추출 (Meta Learning based Global Relation Extraction trained by Traditional Korean data)

  • 김규경;김경민;조재춘;임희석
    • 한국융합학회논문지
    • /
    • 제9권11호
    • /
    • pp.23-28
    • /
    • 2018
  • 최근 존재하는 대부분의 관계 추출 모델은 언급 수준의 관계 추출 모델이다. 이들은 성능은 높지만, 장문의 텍스트에 존재하는 다수의 문장을 처리할 때, 문서 내에 주요 개체 및 여러 문장에 걸쳐서 표현되는 전역적 개체 관계를 파악하지 못한다. 그리고 이러한 높은 수준의 관계를 정의하지 못하는 것은 데이터의 올바른 정형화를 막는 중대한 문제이다. 이 논문에서는 이러한 문제를 해결하고 전역적 관계를 추출하기 위하여 외부 메모리 신경망 모델을 이용하는 새로운 방식의 전역관계 추출 모델을 제안한다. 제안하는 모델은 1차적으로는 단편적인 관계 추출을 실행한 뒤, 외부메모리 신경망을 이용하여 단편적인 관계들을 분석 및 종합하여 텍스트 전체로부터 전역적 관계들을 추출한다. 또한 제안된 모델은 외부 메모리를 통하여 전역적 관계 추출 외에도 주어와 목적어 생략이 잦은 한국어 관계 추출에도 뛰어난 성능을 보인다.