• 제목/요약/키워드: 감정어

검색결과 115건 처리시간 0.027초

종자 어휘를 이용한 자질 추출과 지지 벡터 기계(SVM)을 이용한 문서 감정 분류 시스템의 개발 (A Sentiment Classification System Using Feature Extraction from Seed Words and Support Vector Machine)

  • 황재원;전태균;고영중
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2007년도 학술대회 1부
    • /
    • pp.938-942
    • /
    • 2007
  • 신문 기사 및 상품 평은 특정 주제나 상품을 대상으로 하여 글쓴이의 감정과 의견이 잘 나타나 있는 대표적인 문서이다. 최근 여론 조사 및 상품 의견 조사 등 다양한 측면에서 대용량의 문서의 의미적 분류 및 분석이 요구되고 있다. 본 논문에서는 문서에 나타난 내용을 기준으로 문서가 나타내고 있는 감정을 긍정과 부정의 두 가지 범주로 분류하는 시스템을 구현한다. 문서 분류의 시작은 감정을 지닌 대표적인 종자 어휘(seed word)로부터 시작하며, 자질의 선정은 한국어 특징상 감정 및 감각을 표현하는 명사, 형용사, 부사, 동사를 대상으로 한다. 가중치 부여 방법은 한글 유의어 사전을 통해 종자 어휘의 의미를 확장하여 각각의 가중치를 책정한다. 단어 벡터로 표현된 입력 문서를 이진 분류기인 지지벡터 기계를 이용하여 문서에 나타난 감정을 판단하는 시스템을 구현하고 그 성능을 평가한다.

  • PDF

소설 『こころ』에 나타난 감정표현 '경(驚)'에 관한 번역 양상 - 한국어 번역 작품과 영어 번역 작품을 중심으로 - (A study about the aspect of translation on 'Kyo(驚)' in novel 『Kokoro』 -Focusing on novels translated in Korean and English)

  • 양정순
    • 비교문화연구
    • /
    • 제51권
    • /
    • pp.329-356
    • /
    • 2018
  • 감정표현의 종류에는 감정을 묘사하는 어휘, 감탄문 수사의문 등의 감정표현을 위한 문 구성, 간투사 표현, 발상태도의 부사, 문체 등이 제시되고 있다. 본고는 이러한 감정표현 가운데서 감정을 묘사하는 어휘를 중심으로, "こころ"에 나타난 '경(驚)'의 감정 표현의 번역 양상을 분석했다. 그 결과 '경(驚)'에 관한 번역 양상을 보면 사전에 제시한 대로의 어휘로 번역되는 경우도 있었지만 꼭 그렇지만은 아니라는 것을 알 수 있었다. 일본어 문에서 사용된 '경(驚)'의 감정 어휘에 대해, 한국어 역에서는 대체로 '동사⇨동사, 형용사', '부사+동사⇨동사' '부사⇨부사'로 번역되었지만, 감정표현을 강조하기 위해 다른 어휘가 더해진 경우가 있었다. 일부 '명사'는 용언을 이용해 번역되기도 했다. 상황에 따라 번역어휘는 'Surprise류(類)' 뿐 아니라 'Fear류(類)'과 'Sadness류(類)'의 어휘까지도 다양하게 사용되었다. 영어 역의 경우, 한국어 역에서 보였던 것과 다른 양상을 보였다. 주로 '동사⇨be+동사의 과거분사', '부사+동사⇨be+동사의 과거분사' '부사⇨be+동사의 과거분사'로 번역되었으며, 'Surprise류(類)', 'Fear류(類)' 등의 감정을 표현하는 동사 외에 감정 주체의 상태를 대체 표현할 수 있는 동사로 까지도 이용되는 등 매우 다양했다. 문중에 감정주체가 있는 경우의 한국어 역은 대체로 일본어 문과 일 대 일 대응 방식을 보였다. 문중에 감정주체가 없는 경우도 유사한 성향을 보이면서도, 3인칭인 경우에는 생략된 요소가 복원 가능하도록 유도한 번역이 보였다. 영어 역을 보면, 문중에 감정주체가 있는 경우에서만 아니라, 문중에 감정주체가 없는 경우도 생략된 감정주체 및 이를 판단하는 판단주체까지도 복원시켜 번역했다. 일본어와 한국어와 달리 주어는 감정을 느끼는 사람만 온 것이 아니라, 사건, 행위, 감정을 일으키는 원인이 제시되기도 했다.

오피니언 마이닝을 활용한 블로그의 극성 분류 기법 (The Blog Polarity Classification Technique using Opinion Mining)

  • 이종혁;김원상;박제원;최재현
    • 디지털콘텐츠학회 논문지
    • /
    • 제15권4호
    • /
    • pp.559-568
    • /
    • 2014
  • 기존의 감정분석을 통한 극성 분류는 주로 평점을 기반으로 하는 상품평을 기준으로 문장규칙을 이용하여 분석해왔다. 이러한 분석방법은 평점이 없는 블로그 같은 경우 적용되기 어려움 점이 있고 댓글 아르바이트나 관리자에 의해 상품평이 조작될 가능성이 있어서 상품평 만으로는 상품, 매장에 대한 의견을 파악하기에는 어려움이 있다. 이러한 문제점을 고려할 때 개인들의 솔직한 의견이 담겨 있는 블로그를 분석하여 극성을 분류하면 상품, 매장에 대한 올바른 이해가 가능하다. 본 논문은 도메인별로 블로그 글에 대한 고빈도 단어를 추출하여 주제어를 선정하고, 선정된 주제어를 기준으로 제안하는 감정분석 기법을 적용하여 블로그 글에 대한 극성을 분류한다. 감정분석 기법의 성능을 평가하기 위하여 정보 검색 분야에서 사용되는 측정지표 Precision, Recall, F-score를 사용하여 본 연구의 극성 분류기법의 유용성을 검증한다. 평가 결과 기존의 상품평을 문장규칙을 이용하여 분석하여 극성 분류를 하는 기법들에 비해서 제안한 감정분석 기법을 적용할 경우에 우수한 성능으로 극성 분류를 하는 것으로 나타났다.

주관적 웰빙 상태 측정을 위한 비정형 데이터의 상황기반 긍부정성 분석 방법 (Analyzing Contextual Polarity of Unstructured Data for Measuring Subjective Well-Being)

  • 최석재;송영은;권오병
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.83-105
    • /
    • 2016
  • 의료IT 서비스의 유망 분야인 정신건강 증진을 위한 주관적 웰빙 서비스(subjective well-being service) 구현의 핵심은 개인의 주관적 웰빙 상태를 정확하고 무구속적이며 비용 효율적으로 측정하는 것인데 이를 위해 보편적으로 사용되는 설문지에 의한 자기보고나 신체부착형 센서 기반의 측정 방법론은 정확성은 뛰어나나 비용효율성과 무구속성에 취약하다. 비용효율성과 무구속성을 보강하기 위한 온라인 텍스트 기반의 측정 방법은 사전에 준비된 감정어 어휘만을 사용함으로써 상황에 따라 감정어로 볼 수 있는 이른바 상황적 긍부정성(contextual polarity)을 고려하지 못하여 측정 정확도가 낮다. 한편 기존의 상황적 긍부정성을 활용한 감성분석으로는 주관적 웰빙 상태인 맥락에서의 감성분석을 할 수 있는 감정어휘사전이나 온톨로지가 구축되어 있지 않다. 더구나 온톨로지 구축도 매우 노력이 소요되는 작업이다. 따라서 본 연구의 목적은 온라인상에 사용자의 의견이 표출된 비정형 텍스트로부터 주관적 웰빙과 관련한 상황감정어를 추출하고, 이를 근거로 상황적 긍부정성 파악의 정확도를 개선하는 방법을 제안하는 것이다. 기본 절차는 다음과 같다. 먼저 일반 감정어휘사전을 준비한다. 본 연구에서는 가장 대표적인 디지털 감정어휘사전인 SentiWordNet을 사용하였다. 둘째, 정신건강지수를 동적으로 추정하는데 필요한 비정형 자료인 Corpora를 온라인 서베이로 확보하였다. 셋째, Corpora로부터 세 가지 종류의 자원을 확보하였다. 넷째, 자원을 입력변수로 하고 특정 정신건강 상태의 지수값을 종속변수로 하는 추론 모형을 구축하고 추론 규칙을 추출하였다. 마지막으로, 추론 규칙으로 정신건강 상태를 추론하였다. 본 연구는 감정을 분석함에 있어, 기존의 연구들과 달리 상황적 감정어를 적용하여 특정 도메인에 따라 다양한 감정 어휘를 파악할 수 있다는 점에서 독창성이 있다.

임베딩 자질을 이용한 대화의 감정 분류 (Emotion Classification in Dialogues Using Embedding Features)

  • 신동원;이연수;장정선;임해창
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2015년도 제27회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.109-114
    • /
    • 2015
  • 대화 시스템에서 사용자 발화에 대한 감정 분석은 적절한 시스템 응답과 서비스를 제공하는데 있어 매우 중요한 정보이다. 본 연구에서는 단순한 긍, 부정이 아닌 분노, 슬픔, 공포, 기쁨 등 Plutchick의 8 분류 체계에 해당하는 상세한 감정을 분석 하는 데 있어, 임베딩 모델을 사용하여 기존의 어휘 자질을 효과적으로 사용할 수 있는 새로운 방법을 제안한다. 또한 대화 속에서 발생한 감정의 지속성을 반영하기 위하여 문장 임베딩 벡터와 문맥 임베딩 벡터를 자질로서 이용하는 방법에 대해 제안한다. 실험 결과 제안하는 임베딩 자질은 특히 내용어에 대해 기존의 어휘 자질을 대체할 수 있으며, 데이터 부족 문제를 다소 해소하여 성능 향상에 도움이 되는 것으로 나타났다.

  • PDF

모바일 환경에서의 감성 기반 지능형 챗봇 연구 (A Study on Intelligent Chatbot Based on Emotional in Mobile Environment)

  • 윤경일;양진솔;조영훈;정광식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 추계학술발표대회
    • /
    • pp.918-921
    • /
    • 2019
  • 최근 4차 산업혁명으로 인해 인공지능 기술의 발달로 인해 사람의 감정을 모델링하는 연구와 챗봇에 관한 연구가 활발히 진행되고 있다. 챗봇과의 대화 중에서 감정 모델은 중요한 요소이지만, 서로 별개로 연구되었으며, 그 수 또한 부족하다. 보다 개인적이고 전문적인 서비스를 제공하기 위해선 챗봇 사용자의 감정을 분류할 수 있어야 한다. 이에 본 연구에서는 모바일 플랫폼에서의 특징을 고려한 신조어를 포함한 사용자가 입력한 문장의 감정을 파악하고 감정에 따른 응답을 구현하는 챗봇을 구현하는 방안에 대하여 제안한다.

기쁨의 의미연구 - 러시아어와 한국어의 비교를 중심으로 - (A Comparative Study on Joy in Russian and Korean)

  • 김정일
    • 비교문화연구
    • /
    • 제41권
    • /
    • pp.113-140
    • /
    • 2015
  • 본 연구를 통해 필자는 러시아어와 한국어에서 인간의 가장 원초적이고 본원적인 감정 중 하나인 "기쁨"이 어떻게 언어적으로 구현되는지를 살펴보고자 하였다. 그 과정에서 특히 "기쁨"이라는 개념이 러시아와 한국어에서 어떻게 기술되는지, 그리고 그러한 기술이 문화적 맥락과 어떤 관련을 맺고 있는지 살펴봄으로써, 러시아어와 한국어에서 "기쁨"이 가지는 의미적, 화용적 특징들을 규명해 보고자 하였다. 기쁨은 러시아어에서 주로 радость [기쁨]과 удовольствие [즐거움(만족)] 으로 기술되며, 전자가 보다 넓은 종교적, 정신적, 지속적, 문화적 맥락과 후자는 보다 구체적, 육체적, 순간적 맥락과 관련된다. 전자가 보다 거시적 맥락에서 의미와 투영대상을 찾는다면 후자는 보다 일상적인 맥락에서 욕망이 구체적으로 투영될 대상을 찾는다는 것이 전통적인 설명방식이었다. 하지만 오늘날 이러한 대립관계는 점차 약화되고, 기쁨의 대상이 되는 존재에 보다 초점을 맞추고, 그 존재의 실존적 관계에 보다 집중하는지 아니면 일상의 디테일에서 즉각적으로 느끼는 기쁨에 보다 초점을 맞추는지의 대립으로 전환되어 감을 알 수 있었다. 반면에 한국어에서 기쁨은 주로 "기쁨"과 "즐거움"이라는 두 개의 어휘로 구현되는데, 전자가 보다 정신적인 작용과 관련을 가지며, 그 유발하는 원인과 그 결과 사이의 논리적 관계에 대한 추론이 기저에 깔려있는 반면, 후자는 화자가 참여자로서 해당 상황에 개입하는 과정에서 즉각적으로 느끼는 감정과 연관된다. "기쁨"이 화자가 사전에 가졌던 기대와 계획, 예상과의 부합 혹은 충족으로 인한 흡족함에서 오는 것이라면 "즐거움"은 상황속에서 적극적으로 참여하고 활동하는 화자에게서 즉각적으로 느껴지는 감정이다. 따라서 러시아어의 기쁨의 부차적인 개념 "즐거움(만족)(удовольствие)"과 한국어의 "즐거움"은 매우 중요한 의미적 자질을 공유하고 있다고 할 수 있다. 결국 두 언어 모두 화자가 대상에 대하여 어떠한 태도와 입장을 취하는지에 따라 기쁨에 대한 2개의 변별적인 선택지를 가지고 있다고 볼 수 있다.

문자열 커널을 이용한 인터넷 영화평의 감정 분석 (A Sentiment Analysis of Internet Movie Reviews Using String Kernels)

  • 김상도;윤희근;박성배;박세영;이상조
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2009년도 제21회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.56-60
    • /
    • 2009
  • 오늘날 인터넷은 개인의 감정, 의견을 서로 공유할 수 있는 공간이 되고 있다. 하지만 인터넷에는 너무나 방대한 문서가 존재하기 때문에 다른 사용자들의 감정, 의견 정보를 개인의 의사 결정에 활용하기가 쉽지 않다. 최근 들어 감정이나 의견을 자동으로 추출하기 위한 연구가 활발하게 진행되고 있으며, 감정 분석에 관한 기존 연구들은 대부분 어구의 극성(polarity) 정보가 있는 감정 사전을 사용하고 있다. 하지만 인터넷에는 나날이 신조어가 새로 생기고 언어 파괴 현상이 자주 일어나기 때문에 사전에 기반한 방법은 한계가 있다. 본 논문은 감정 분석 문제를 긍정과 부정으로 구분하는 이진 분류 문제로 본다. 이진 분류 문제에서 탁월한 성능을 보이는 Support Vector Machines(SVM)을 사용하며, 문서들 간의 유사도 계산을 위해 문장의 부분 문자열을 비교하는 문자열 커널을 사용한다. 실험 결과, 실제 영화평에서 제안된 모델이 비교 대상으로 삼은 Bag of Words(BOW) 모델보다 안정적인 성능을 보였다.

  • PDF

감정점수의 전파를 통한 한국어 감정사전 생성 (Generating a Korean Sentiment Lexicon Through Sentiment Score Propagation)

  • 박호민;김창현;김재훈
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권2호
    • /
    • pp.53-60
    • /
    • 2020
  • 감정분석은 문서 또는 대화상에서 주어진 주제에 대한 태도와 의견을 이해하는 과정이다. 감정분석에는 다양한 접근법이 있다. 그 중 하나는 감정사전을 이용하는 사전 기반 접근법이다. 본 논문에서는 널리 알려진 영어 감정사전인 VADER를 활용하여 한국어 감정사전을 자동으로 생성하는 방법을 제안한다. 제안된 방법은 세 단계로 구성된다. 첫 번째 단계는 한영 병렬 말뭉치를 사용하여 한영 이중언어 사전을 제작한다. 제작된 이중언어 사전은 VADER 감정어와 한국어 형태소 쌍들의 집합이다. 두 번째 단계는 그 이중언어 사전을 사용하여 한영 단어 그래프를 생성한다. 세 번째 단계는 생성된 단어 그래프 상에서 레이블 전파 알고리즘을 실행하여 새로운 감정사전을 구축한다. 이와 같은 과정으로 생성된 한국어 감정사전을 유용성을 보이려고 몇 가지 실험을 수행하였다. 본 논문에서 생성된 감정사전을 이용한 감정 분류기가 기존의 기계학습 기반 감정분류기보다 좋은 성능을 보였다. 앞으로 본 논문에서 제안된 방법을 적용하여 여러 언어의 감정사전을 생성하려고 한다.

감정형용사 유의어 결합 연구 -[[감정형용사 + '-고'] + 감정형용사] 구성- (Synonym Emotional Adjectives in Coordination: Analyzing [Emotional Adjective + '-ko(and)'] + Emotional Adjective] Structures in Korean)

  • 박진아;정용호
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.565-577
    • /
    • 2024
  • 본 논의는 [[감정형용사+-고]+감정형용사] 형식으로 감정형용사가 연결되는 양상을 살펴보았다. 이로써 한국어에서 감정을 표현할 때 두 개 이상의 감정형용사를 접속하여 표현하는 사례가 적지 않음을 확인할 수 있었다. 이는 해당 구성으로 어울려 사용하는 감정형용사를 파악함으로써 한국어 학습자가 감정형용사의 개별 어휘 의미를 보다 분명하게 이해하고 표현하는 데 도움을 줄 수 있다. 한국어 학습자가 한국어로 감정을 표현할 때 복합적인 감정을 표현하거나, 풍부한 감정 표현을 만드는 데 도움을 줄 수 있다고 보았다. 본 논의에서 보인 [[감정형용사+-고]+감정형용사] 용례 및 빈도가 한국어 감정 어휘 교수-학습에 작게나마 도움이 되기를 기대해 본다.