• 제목/요약/키워드: Linguistic Analysis Features

검색결과 72건 처리시간 0.025초

Sentiment Analysis of Korean Using Effective Linguistic Features and Adjustment of Word Senses

  • Jang, Ha-Yeon;Shin, Hyo-Pil
    • 한국언어정보학회지:언어와정보
    • /
    • 제14권2호
    • /
    • pp.33-46
    • /
    • 2010
  • This paper introduces a new linguistic-focused approach for sentiment analysis (SA) of Korean. In order to overcome shortcomings of previous works that focused mainly on statistical methods, we made effective use of various linguistic features reflecting the nature of Korean. These features include contextual shifters, modal affixes, and the morphological dependency of chunk structures. Moreover, in order to eschew possible confusion caused by ambiguous words and to improve the results of SA, we also proposed simple adjustment methods of word senses using KOLON ontology mapping information. Through experiments we contend that effective use of linguistic features and ontological information can improve the results of sentiment analysis of Korean.

  • PDF

언어 분석 자질을 활용한 인공신경망 기반의 단일 문서 추출 요약 (Single Document Extractive Summarization Based on Deep Neural Networks Using Linguistic Analysis Features)

  • 이경호;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권8호
    • /
    • pp.343-348
    • /
    • 2019
  • 최근의 문서요약 시스템은 인공신경망을 이용한 End-to-End 방식이 주류를 이루고 있다. 이러한 시스템은 인간의 자질 추출 과정이 필요 없으며 데이터 중심의 접근 방법을 채택한다. 그러나 기존의 관련 연구들은 품사 정보, 개체명 정보, 단어의 빈도 정보와 같은 언어 분석 자질이 중요 문장을 선택하여 요약을 작성하는데 유용함을 보여왔다. 본 연구에서는 기존의 언어 분석 자질을 활용하여 인공신경망을 기반으로 한 단일 문서의 추출 요약 시스템을 제안한다. 언어 분석 자질의 유용성을 보이기 위해 자질을 사용하는 모델과 사용하지 않는 모델을 비교하였다. 실험 결과 자질을 사용하는 모델이 그렇지 않은 모델에 비해 약 0.5점의 Rouge-2 F1점수 향상을 보였다.

사회적 이슈 리스크 유형 분류를 위한 어휘 자질 선별 (Linguistic Features Discrimination for Social Issue Risk Classification)

  • 오효정;윤보현;김찬영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.541-548
    • /
    • 2016
  • 사용자의 다양한 의견을 수렴하고 모니터링하기 위한 정보원으로써 소셜미디어의 활용은 이미 필수가 되었다. 본 논문은 소셜미디어에 나타난 다양한 이슈 중 여론 형성에 악영향을 끼치는 부정적 사건을 이슈 '리스크'로 정의, 그 세부 유형을 자동으로 분류하는 모델을 개발하고자 한다. 이를 위해 소셜미디어에 나타난 다양한 어휘 자질을 선별, 그 효과를 규명하였다. 특히 리스크 문장의 어휘 구문 특징을 표현하기 위한 자질로 워드 임베딩 학습 결과를 활용한다. 개별 어휘 자질의 특징을 분석하기 위해 언어분석 오류를 보정한 환경에서 수행한 실험 결과, 가장 효과가 큰 자질은 개체명 자질로 분석되었으며, 기본 어휘 자질을 기반으로 주요 술부의 워드 임베딩 결과와 워드 클러스터 결과를 모두 조합한 경우가 최고 성능을 보이는 것으로 파악되었다. 실제 소셜빅데이터에 적용하는 환경과 유사하도록 자동 언어분석 결과의 오류를 포함한 조건에서 실험한 결과, 고빈도 평가셋에서는 92.08%의 성능을, 전체 58개 범주 평가셋에서는 85.84%의 성능을 얻었다.

A Corpus-Based Study on Language Features and Literary Themes in the Yellow Wall-Paper and Herland by Charlotte Perkins Gilman

  • Lu, Hui-Chuan;Liu, Kai-Ling;Yeh, Chien-Ting;Chen, Ya-Jie
    • 아시아태평양코퍼스연구
    • /
    • 제3권1호
    • /
    • pp.21-34
    • /
    • 2022
  • This study aims to apply corpus-based approach to analyze The Yellow Wall-Paper and Herland written by Charlotte Perkins Gilman, a women's rights activist in the late nineteenth-century America. Although both works have attracted feminists' attention to the woman question that concerned Gilman, discussion on her language features and their relation to the literary themes of these two works is still in need. In this corpus-based analysis, we argue that the main themes of different literary works can be revealed through linguistic patterns identified by number and gender features of nouns and pronouns in the contrast of two works and a balanced corpus. The linguistic features (number and gender) have been related with two themes, the 'group and individual' and the 'feminine and masculine', and are further interpreted in terms of mothering and feminine consciousness. By adopting linguistic approach, our study provides quantitative and qualitative evidence to verify the established themes and arguments of these literary texts.

Classification of Characters in Movie by Correlation Analysis of Genre and Linguistic Style

  • You, Eun-Soon;Song, Jae-Won;Park, Seung-Bo
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권1호
    • /
    • pp.49-55
    • /
    • 2019
  • The character dialogue created by AI is unnatural when compared with human-made dialogue, and it can not reveal the character's personality properly in spite of remarkable development of AI. The purpose of this paper is to classify characters through the linguistic style and to investigate the relation of the specific linguistic style with the personality. We analyzed the dialogues of 92 characters selected from total 60 movies categorized four movie genres, such as romantic comedy, action, comedy and horror/thriller, using Linguistic Inquiry and Word Count (LIWC), a text analysis software. As a result, we confirmed that there is a unique language style according to genre. Especially, we could find that the emotional tone than analytical thinking are two important features to classify. They were analyzed as very important features for classification as the precision and recall is over 78% for romantic comedy and action. However, the precision and recall were 66% and 50% for comedy and horror/thriller. Their impact on classification was less than romantic comedy and action genre. The characters of romantic comedy deal with the affection between men and women using a very high value of emotional tone than analytical thinking. The characters of action genre who need rational judgment to perform mission have much greater analytical thinking than emotional tone. Additionally, in the case of comedy and horror/thriller, we analyzed that they have many kinds of characters and that characters often change their personalities in the story.

Social Media Marketing Strategies for Tourism Destinations: Effects of Linguistic Features and Content Types

  • Song, Seobgyu;Park, Seunghyun Brian;Park, Kwangsoo
    • Journal of Smart Tourism
    • /
    • 제1권3호
    • /
    • pp.21-29
    • /
    • 2021
  • This study explored the relationship between post types and linguistic characteristics in marketer-generated content and social media engagement to find the optimized content to enhance social media engagement level. Post data of 23,588 marketer-generated content were collected from 50 states' destination marketing organization Facebook pages in the United States. The collected data were analyzed by employing social media analytics, linguistic analysis, multivariate analysis of variance, and discriminant analysis. The results showed that there are significant differences in both engagement indicators and linguistic scores among the three post types. Based on research findings, this research not only provided researchers with theoretical implications but also suggested practitioners the most effective content designs for travel destination marketing in Facebook.

영어교육에서 중간언어의 중요성 (The importance of interlanguage in teaching English as a foreign language)

  • 박경자
    • 영어어문교육
    • /
    • 제6호
    • /
    • pp.113-142
    • /
    • 2000
  • In order to obtain a better understanding of L2 learners, transitional knowledges, it is very important and necessary to have a better knowledge of interlanguage. According to Corder, the role of interlanguage in English education holds significance to (1) for language teachers, (2) for language learners themselves, and (3) for language textbook compilers. To me the significance of interlanguage in English education can be described in terms of not only language teachers, learners themselves, textbook writers and compilers but pure linguists, applied linguists, school authorities as well as parents. For language learners themselves a clear understanding of interlanguage results in students being receptive to language input, and the avoidance of mental block, and low levels of foreign language anxiety. Native speakers of English (NSE) reflect not only linguistic features but also psychological, socio-linguistic, and discourse features when engaged in communication activities. This means that L2 learners are introduced to these different features, especially pragmatic features which are different from their mother tongue or L1 when engaged in communication with NSE. Hence the importance of interlanguage pragmatics should be recognized. It is very important that teachers of English should have a better understanding of interlanguage and present L2 learners with their interlanguage features so they can avoid any misunderstandings such features may cause when conversing with NSS. It should also be noted that interlanguage can form the foundation of language acquisition theory and linguistic analysis.

  • PDF

초.중등 과학 교과서 화산과 지진 관련 단원 글의 언어 구조 비교 분석 (A Comparative Analysis of the Linguistic Features of Texts used in the unit of Volcano and Earthquake in Korean Elementary and Secondary School Science Textbooks)

  • 신명환;맹승호;김찬종
    • 한국지구과학회지
    • /
    • 제31권1호
    • /
    • pp.36-50
    • /
    • 2010
  • 이 연구의 목적은 초 중 고등학교 과학 교과서 글의 구조적 특징을 종합적으로 분석하여 학생들이 상급 학교로 진학하면서 경험하게 되는 과학 교과서 글의 변화 양상을 살펴보는 것이다. 연구 자료로 제 7차 교육 과정에 의해 개발된 초 중 고등학교 과학 교과서의 '화산과 지진' 관련 단원의 글을 선정하였으며, '텍스트 구성적 의미', '상호 관계적 의미', '내용과 논리 관계 의미'의 측면에서 글을 비교 분석하였다. 연구 결과, 과학 교과서의 글은 학교급에 따라 글의 구조를 비롯한 언어적 특징이 다르게 나타나며, 학생들이 상급 학교로 진학하면서 이러한 글의 구조적 특징 차이에 의해서도 과학 교과서를 읽고 이해하는 것이 어렵고 생소하다고 인식할 수 있음을 문제로 제기하였다. 또한 과학을 학습하는 과정에서 과학의 언어가 지니는 구조적 특징에 대한 과학 교사의 중재자 역할이 필요함을 제안하였다.

PROSODY IN SPEECH TECHNOLOGY - National project and some of our related works -

  • Hirose Keikichi
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 2002년도 하계학술발표대회 논문집 제21권 1호
    • /
    • pp.15-18
    • /
    • 2002
  • Prosodic features of speech are known to play an important role in the transmission of linguistic information in human conversation. Their roles in the transmission of para- and non- linguistic information are even much more. In spite of their importance in human conversation, from engineering viewpoint, research focuses are mainly placed on segmental features, and not so much on prosodic features. With the aim of promoting research works on prosody, a research project 'Prosody and Speech Processing' is now going on. A rough sketch of the project is first given in the paper. Then, the paper introduces several prosody-related research works, which are going on in our laboratory. They include, corpus-based fundamental frequency contour generation, speech rate control for dialogue-like speech synthesis, analysis of prosodic features of emotional speech, reply speech generation in spoken dialogue systems, and language modeling with prosodic boundaries.

  • PDF

언어자원 자동 구축을 위한 위키피디아 콘텐츠 활용 방안 연구 (A Study on Utilization of Wikipedia Contents for Automatic Construction of Linguistic Resources)

  • 류철중;김용;윤보현
    • 디지털융복합연구
    • /
    • 제13권5호
    • /
    • pp.187-194
    • /
    • 2015
  • 급변하는 자연언어를 기계가 이해할 수 있도록 하기 위해서는 다양한 언어지식자원(linguistic knowledge resources)의 구축이 필수적으로 수반된다. 본 논문에서는 온라인 콘텐츠의 특성을 활용해 언어지식자원을 자동으로 구축함으로써 지속적으로 확장 가능한 방법을 고안하고자 한다. 특히 언어분석 과정에서 가장 활용도가 높은 개체명(NE: Named Entity) 사전을 자동으로 구축, 확장하는데 주안점을 둔다. 이를 위해 본 논문에서는 개체명 사전 구축대상문서로 위키피디아(Wikipedia)를 선정, 그 특성을 파악하기 위해 다양한 통계 분석을 수행하였다. 이에 기반하여 위키피디아 콘텐츠가 갖는 구문적 특성과 구조 정보 등의 메타데이터를 활용하여 개체명 사전을 구축, 확장하는 방법을 제안한다.