• 제목/요약/키워드: Sentence Importance

검색결과 59건 처리시간 0.025초

문장군집의 응집도와 의미특징을 이용한 포괄적 문서요약 (Generic Document Summarization using Coherence of Sentence Cluster and Semantic Feature)

  • 박선;이연우;심천식;이성로
    • 한국정보통신학회논문지
    • /
    • 제16권12호
    • /
    • pp.2607-2613
    • /
    • 2012
  • 지식 기반의 포괄적 문서요약은 문장집합의 구성이 요약 결과에 영향을 받는다. 이러한 문제를 해결하기 위해서 본 논문은 의미특징에 의한 군집과 문장군집의 응집도를 이용하여 포괄적 문서요약을 하는 새로운 방법을 제안한다. 제안 방법은 비음수행렬분해에서 유도되는 의미특징을 이용하여 문장을 군집하고, 문서의 내부구조를 잘 표현하는 문장군집들로 문서의 주제 그룹을 분류할 수 있다. 또한 문장군집의 응집도와 재군집에 의한 군집의 정재를 이용하여 중요한 문장을 추출함으로써 요약의 질을 향상시킬 수 있다. 실험결과 제안방법은 다른 포괄적 문서요약 방법에 비하여 좋은 성능을 보인다.

문화콘텐츠기획 모형 연구 (A Study on the Cultural Contents Planning Model)

  • 김천영
    • 문화기술의 융합
    • /
    • 제4권1호
    • /
    • pp.75-84
    • /
    • 2018
  • 본 연구는 관계적 접근으로 문화콘텐츠기획 모형을 탐구하고자 한다. 이를 위하여 문화콘텐츠의 개념적 접근틀을 설정하고, 문화콘텐츠 분석 및 기획을 통합적으로 할 수 있는 센텐스문화콘텐츠기획의 일반모형을 제시한다. 그것의 내용은 컨셉기획모형, 기표개발 선택기획모형, 기표배열 배치기획모형이다. 문화의 중요성은 문화인식의 중요성에서 찾아진다. 그것은 삶의 중요성 인식이기에 그러하다. 문화가 삶의 질서 속에서 구성되는 삶의 방식으로 드러나는 만큼, 문화인식은 문화콘텐츠 인식으로서의 삶의 인식으로 간주된다. 문화콘텐츠기획은 바로 이러한 건강한 삶의 질서를 구성하는 지점에 자리하고 있다는 점에서 그것의 필요성과 중요성을 가지며 올바른 문화콘텐츠기획의 존재의미를 부여받는다. 이러한 점에서 문화콘텐츠기획 모형 연구는 이론과 실천면에서 유용성을 가지며 연구의 정당성과 가치공헌을 꾀할 수 있는 가능성을 가질 것이다.

퍼지이론을 이용한 자동문서 요약 기술 (Automatic Document Summary Technique Using Fuzzy Theory)

  • 이상훈;문승진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권12호
    • /
    • pp.531-536
    • /
    • 2014
  • 인터넷에서 사용 가능한 수많은 정보로 인해서 대용량의 문서를 다루는 기술은 점차 그 필요성이 증가되어 왔지만, 효과적으로 문서 내 정보를 처리하기 위한 기술의 문제는 여전히 풀어야 할 과제로 남아 있다. 자동문서 요약 기술은 문서 내 중요한 부분을 유지하고, 중복된 내용을 제거함으로써 이러한 대용량의 문서를 처리하는 데 중요한 방법으로 인식되어 왔다. 본 논문에서는 이러한 요약문을 만들 때 중요도를 결정하는 문제를 해결하기 위해서 퍼지 이론을 이용한 문서 요약 기술을 제안한다. 제안된 요약 기술은 중요도를 결정하는 여러 특징들의 애매모호한 문제를 해결하고, 그 실험결과는 기존의 다른 방법과 비교해서 전반적으로 높은 결과를 보인다.

A Term Importance-based Approach to Identifying Core Citations in Computational Linguistics Articles

  • Kang, In-Su
    • 한국컴퓨터정보학회논문지
    • /
    • 제22권9호
    • /
    • pp.17-24
    • /
    • 2017
  • Core citation recognition is to identify influential ones among the prior articles that a scholarly article cite. Previous approaches have employed citing-text occurrence information, textual similarities between citing and cited article, etc. This study proposes a term-based approach to core citation recognition, which exploits the importance of individual terms appearing in in-text citation to calculate influence-strength for each cited article. Term importance is computed using various frequency information such as term frequency(tf) in in-text citation, tf in the citing article, inverse sentence frequency in the citing article, inverse document frequency in a collection of articles. Experiments using a previous test set consisting of computational linguistics articles show that the term-based approach performs comparably with the previous approaches. The proposed technique could be easily extended by employing other term units such as n-grams and phrases, or by using new term-importance formulae.

이야기의 중요성 판단에 미치는 정보의 비일관성 효과 (The Effect of Inconsistency on the Judgment of Importance in Story Comprehension)

  • 김태련;방희정;최경숙;조혜자
    • 아동학회지
    • /
    • 제12권2호
    • /
    • pp.111-129
    • /
    • 1991
  • The present study investigated how the inconsistency between episodes in a story affects judgment of the importance of a sentence. In experiment I, 120 college students read 4 stories containing 3 episodes and judged each of the sentences, one after another. The results of the importance rating showed that adult subjects were sensitive to inconsistency between episodes. The analysis of episodes revealed a significant difference between episodes in all of the 4 stories, with lowest importance ratings given to the inconsistent episodes. In experiment II, 220 children were sampled from a private school of middle S.E.S.Status. 2nd-, 4th- and 6th- graders read 2 stories, and judged the importance of the sentences. It was found that children were less sensitive to inconsistencies in a story than adults. Younger children had more difficulty in the integration of inconsistent information. Especially in the 2nd episode, the importance rating was affected by grade [F(2,2627)=195.52, p<.01], suggesting that 6th graders were more sensitive to inconsistencies than the younger children. In contrast to adults, 2nd graders gave high importance ratings to inconsistent sentences as well as to consistent sentences.

  • PDF

아동의 복문(複文) 이해의 발달 - 시간 절부사어의 '전'과 '후'를 중심으로 - (Development of the comprehension of complex sentences in Korean Children)

  • 박희숙;최경숙
    • 아동학회지
    • /
    • 제19권2호
    • /
    • pp.185-200
    • /
    • 1998
  • This research examined the development in Korean children of the comprehension of complex sentences. The relative difficulty in comprehension of the temporal conjunctions "before" and "after" was investigated. The order of mention, contextual support, and syntactic appearance was controlled. The role of cognitive strategies and developmental changes in the comprehension of these conjunction was included in this study. Subjects were 90 preschool children between 3 and 5 years of age. The task was a sentence-picture matching problem having 3 types of sentences combining temporally with "before" or "after". The results were that developmental changes in comprehension of the temporal conjunctions "before' and "after" in Korean children depended on the order of mention, contextual support, and such syntactic factors as the position of the subject of the sentence. The importance of the consistency in the occurrence of events and the order of mention in the acquisition of complex sentences among Korean children is similar to the acquisition of complex sentences in other languages.

  • PDF

영어 학습자의 발음 오류 유형과 발화 명료도의 관계 연구 (Pronunciation error types and sentence intelligibility of Korean EFL learners)

  • 김현진
    • 영어어문교육
    • /
    • 제10권3호
    • /
    • pp.159-175
    • /
    • 2004
  • This paper investigated the types of errors on English pronunciation and intelligibility of Korean EFL students, and the relationship between the pronunciation accuracy and intelligibility. Thirty one students were evaluated by six English native speakers in terms of overall intelligibility and accuracy In five areas such as nuclear stress, word stress, syllable structure, consonants and vowels. According to the findings of the study, pronunciation errors were made by the subjects more frequently In word stress than any other area of pronunciation accuracy. The Pearson correlation analysis showed that intelligibility was related with word stress, syllable structure, consonants and vowels, and the stepwise multiple regression analysis indicated that, among the above five areas of pronunciation accuracy, word stress best accounted for the intelligibility of a given sentence. In the conclusion, the importance of teaching pronunciation of in those five areas with a special focus on word stress was emphasized m terms of intelligibility.

  • PDF

문장 및 단어 중요도를 통한 한국어 문서 연관 이미지 검색 (Relevant Image Retrieval of Korean Documents based on Sentence and Word Importance)

  • 김남규;강신재
    • 한국산학기술학회논문지
    • /
    • 제20권3호
    • /
    • pp.43-48
    • /
    • 2019
  • 텍스트로만 이루어진 글에서 알지 못하는 단어가 나온다면, 글을 읽는 도중 집중이 되지 않고 내용을 이해함에 있어 어려움이 생긴다. 또한 이미 알고 있는 단어라도 아이들의 경우 경험이 적기 때문에 글에서 상황을 묘사하는 표현이 생소하거나 애매하다면 머릿속에 떠올리기 힘들다. 이에 본 논문에서는 글을 이해를 돕고 독자의 흥미를 증가시키기 위해서 글의 텍스트들을 분석하여 중요하다고 판단되는 내용을 선택하고, 이 내용과 가장 관련 있는 이미지를 웹에서 자동으로 가져와 연결하여 보여주는 시스템을 구현하고자 한다. 시스템의 구현은 글을 문단 단위로 나누어 글을 분석하고, 문단마다 중요한 문장을 선택한 후, 중요한 문장 내에서 이 문장을 가장 잘 표현할 수 있는 중요한 단어들을 선택하여 웹에서 연관 이미지를 검색하고, 검색된 이미지 결과를 이전에 나눈 각 문단마다 연결시켜준다. 실험으로 글에서 중요한 문장을 선택하는 방법과 문장 내 중요한 단어를 선택하는 방법을 제시하였다. 실험한 결과, 선택된 이미지 3개와 해당 중요 문장과의 연관 여부를 정확률로 평가하였을 때 60%의 성능을 얻을 수 있었다.

고전의서(古典醫書) 중 도인기공법(導引氣功法)에 관한 문헌(文獻) 연구(硏究) (A Documentational Study of Doinqigong in The Oriental Medicine Classics)

  • 김현태;한창현;이상남;권영규;안상우;박지하
    • 대한한의학원전학회지
    • /
    • 제22권3호
    • /
    • pp.7-29
    • /
    • 2009
  • Objectives : Because of emphasizing a side of preventive medicine in the oriental medicine, an interest in Doinqigong(導引氣功: Physical and breathing exercise) has been elated recently. But, it has a limited sphere of application in the present south korea. Therefore we would like to bring out its sphere of application and detailed method in the oriental medicine classics. Method : We have researched theory and method of Doinqigong in the Junghwauijeon(中華醫典: Oriental medicine classic collections) DB according to below the procedure. (1) Making a related words list: We have used existing study of Doinqigong to make a list. It has been connected with Doinqigong. It includes not only technical terms, but also general terms. (2) Searching sentence: We have searched sentence that contain terms related with Doinqigong in the Junghwaeujeon DB. (3) Analysis of related sentence: We have searched and classified sentence by theory and method. Conclusions : (1) The total number of oriental medicine classics connected with Doinqigong is twelve. (2) The number of oriental medicine classics connected with Doinqigong's theory is four. and the contents are the working principle of Doinqigong, the Doinqigong following to time, the control of life's cultivation, the importance of consciousness, the consciousness of the running qigong and so on.

  • PDF

Issues and Empirical Results for Improving Text Classification

  • Ko, Young-Joong;Seo, Jung-Yun
    • Journal of Computing Science and Engineering
    • /
    • 제5권2호
    • /
    • pp.150-160
    • /
    • 2011
  • Automatic text classification has a long history and many studies have been conducted in this field. In particular, many machine learning algorithms and information retrieval techniques have been applied to text classification tasks. Even though much technical progress has been made in text classification, there is still room for improvement in text classification. In this paper, we will discuss remaining issues in improving text classification. In this paper, three improvement issues are presented including automatic training data generation, noisy data treatment and term weighting and indexing, and four actual studies and their empirical results for those issues are introduced. First, the semi-supervised learning technique is applied to text classification to efficiently create training data. For effective noisy data treatment, a noisy data reduction method and a robust text classifier from noisy data are developed as a solution. Finally, the term weighting and indexing technique is revised by reflecting the importance of sentences into term weight calculation using summarization techniques.