• 제목/요약/키워드: 정서 단어 추출

검색결과 16건 처리시간 0.024초

텍스트의 정서 단어 추출을 통한 문학 작품의 정서 분석 (Analyzing Emotions in Literature by Extracting Emotion Terms)

  • 함준석;이신영;고일주
    • 감성과학
    • /
    • 제14권2호
    • /
    • pp.257-268
    • /
    • 2011
  • 본 논문에서는 단위 시단 동안 주로 작용하는 정서를 '지배적 정서(dominant emotion)'라고 정의하고, 문학작품의 지배적 정서 흐름을 자동적으로 추출하기 위한 방법론을 제시한다. 한국어는 언어 구조적 특성상 접미어에 따라 의미가 역전되거나 달라질 수 있다. 하지만 소설이나 수필 같이 일정 이상의 분량을 가진 텍스트에서 정서 단어를 추출한다면 어느 정도 추출이 잘못되어도 지배적 정서 흐름을 판단하는 것이 가능한 것이다. 문학작품에서 지배적 정서를 추출하기 위한 절차는 다음과 같다. 먼저 문학작품의 전제 텍스트에서 형태소를 분석하여 형태소 단위의 단어를 추출한다. 추출된 단어를 정서 단어 데이터베이스와 매칭하여 정서적 의미를 담고 있는 단어를 분리해 낸다. 분리된 단어들을 정서 모델에 사상하여 해당 단어가 갖고 있는 정서를 도출한다. 도출된 정서 단어들을 통해 지배적 정서를 분석한다. 제안한 방법론에 따라 현진건의 현대소설 '운수 좋은 날'과 윤오영의 수필 '방망이 깎던 노인'을 분석한 결과, 지배적 정서의 흐름을 파악할 수 있었다.

  • PDF

소셜 미디어에서 사용되는 한국어 정서 단어의 정서가, 활성화 차원 측정 (Measuring a Valence and Activation Dimension of Korean Emotion Terms using in Social Media)

  • 이신영;고일주
    • 감성과학
    • /
    • 제16권2호
    • /
    • pp.167-176
    • /
    • 2013
  • 소셜 미디어의 급속한 발달로 인해 사용자가 생성한 텍스트 데이터가 급증하고 있다. 오피니언 마이닝에서는 이러한 사용자의 텍스트를 분석하여 사용자의 의견을 추출하고 있다. 특히 오피니언 마이닝의 세부 분야인 정서분석에서는 텍스트에서 사용자의 정서를 추출하는 것이 주된 목적인데, 이를 위해서는 정서 단어 목록 구축이 필수적이다. 본 논문에서는 소셜 미디어의 정서 분석을 위해서 대표적인 소셜 미디어인 페이스북 텍스트를 사용하여 정서 단어 목록을 구축하였다. 페이스북 텍스트로부터 데이터를 수집한 후 정서 단어를 선별하고 설문을 통하여 정서가와 활성화 차원을 측정하였다. 그 결과 정서가, 활성화 차원을 포함한 267개 정서 단어 목록을 구축하였다.

  • PDF

드라마 대본 분석을 통한 등장인물의 성격이 반영된 인공정서 캐릭터 개발 - '솔약국집 아들들'을 중심으로 (The Development of Characters with Artificial Emotion through Analyzing Drama characters - With a Korean Drama titled 'The Sons of Sol Pharmacy House')

  • 함준석;이신영;방그린;고일주
    • 감성과학
    • /
    • 제15권2호
    • /
    • pp.239-248
    • /
    • 2012
  • 본 논문은 드라마 대본으로부터 성격을 추출해 내고, 추출된 성격을 인공정서 캐릭터에 반영하는 것을 목표로 한다. 드라마 대본을 이용하여 등장인물의 성격을 인공정서 캐릭터에 반영하는 과정은 다음과 같다. 먼저 드라마 대본에서 등장인물별로 텍스트를 분리한다. 분리된 텍스트에 대하여 형태소를 분석하고, 분석된 형태소들을 정서단어 데이터베이스와 매칭하여 정서 단어를 추출한다. 추출된 정서 단어를 이용하여 지배정서를 분석한다. 분석된 지배정서를 인공정서의 성격을 결정하는 수식에 반영하여 캐릭터의 성격을 설정한다. 드라마 등장인물의 성격이 반영된 인공정서 캐릭터를 검증하기 위해 블라인드 테스트를 통해 사용자 평가를 진행하였다. 외관상 동일한 세 개의 인공정서 캐릭터에 각각 서로 다른 등장인물의 성격을 반영하였다. 그리고 사용자에게 세 개의 인공정서 캐릭터에 어떤 등장인물의 성격이 반영된 것인지 맞추도록 하였다. 평가 결과, 사용자들은 높은 비율로 정답을 맞추었고, 이를 통해 등장인물의 성격이 잘 반영되었음을 확인할 수 있었다.

  • PDF

사용자의 정서 단어 분류에 기반한 정서 분류와 선택 방법 (A Classification and Selection Method of Emotion Based on Classifying Emotion Terms by Users)

  • 이신영;함준석;고일주
    • 감성과학
    • /
    • 제15권1호
    • /
    • pp.97-104
    • /
    • 2012
  • 최근에 사용자에 의한 대량의 텍스트 데이터가 발생하면서 사용자의 정보, 의견 등을 분석하는 오피니언 마이닝이 중요하게 부각되고 있다. 오피니언 마이닝 중 특히 정서 분석은 제품, 사회적 이슈, 정치인에 대한 호감 등에 대한 개인적 의견이나 정서를 분석하여 긍정, 부정이나 행복, 슬픔 등의 정서를 분석하는 연구 분야이다. 정서 분석을 위해서 정서 차원 이론의 정서가와 각성 차원의 2차원 공간을 사용하고, 이 공간에서 정서가 분포하는 영역을 설정하여 매핑하는 방법을 사용한다. 그러나 기존에는 정서의 분포 영역을 임의로 설정하는 문제가 있었다. 본 논문에서는 이 문제를 해결하기 위해, 한국어 정서 단어 목록을 사용해 사용자 설문을 실시하여 2차원 상에 12개 정서의 분포를 구성하였다. 또한 2차원 상의 특정 정서 상태가 여러 개의 정서에 중첩되는 경우, 정서에 소속될 확률을 사용한 룰렛휠 방법을 사용하여 하나의 정서를 선택하는 방법을 제안하였다. 제안한 방법을 사용하여 텍스트에서 정서 단어를 추출하여 텍스트를 정서로 분류할 수 있다.

  • PDF

정서 차원 공간에서 소설의 지배 정서 분석 및 분류 (Analyzing and classifying emotional flow of story in emotion dimension space)

  • 이신영;함준석;고일주
    • 인지과학
    • /
    • 제22권3호
    • /
    • pp.299-326
    • /
    • 2011
  • 소설, 블로그, 채팅 메시지, 상품평 등의 텍스트는 전반적인 정서의 흐름을 가지고 있다. 텍스트 간의 정서 흐름의 유사도를 비교하면 유사한 정서 흐름을 갖는 텍스트를 분류할 수 있고, 상품 추천이나 의견 수집 등에 활용할 수 있다. 본 논문에서는 텍스트에서 정서 단어를 순차적으로 추출하고 쾌-불쾌, 활성화의 2차원으로 분석하여 텍스트의 정서 흐름을 파악하였다. 또한 텍스트의 순차적인 흐름을 시간 차원으로 설정하여 텍스트의 전반적인 정서 흐름인 '지배 정서(dominant emotion)'를 파악하기 위하여 쾌-불쾌, 활성화, 시간의 3차원 공간에서 정서 흐름을 탐색하였다. 또한 이 3차원 공간 안에서 유클리드 거리를 사용하여 지배 정서 흐름의 유사도를 계산함으로써 유사한 정서 흐름을 가지는 텍스트를 분류하는 방법을 제안하였다. 제안한 방법을 통해 한국 근대 단편 소설들을 분석하여 지배 정서를 분석하였고 유사한 지배 정서를 가지는 소설들을 분류하였다.

  • PDF

남북한 방송언어의 차이에 대한 기초 분석 (Preliminary analysis about the differences between South and North Korean Broadcasting Languages)

  • 이창환;김경일;박종민
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 2부
    • /
    • pp.622-625
    • /
    • 2010
  • 본 연구는 장기간의 남북한 분단으로 인한 언어적 이질성의 정도를 가늠해보기 위하여 남북한 방송언어 비교하였다. 연구의 주 목적은 남북한 언어간 차이에 대한 데이터가 부족한 상황에서 언어사용 실태에 대한 토대 데이터를 제공하는 것이었다. 남북한의 주요 방송사 뉴스 동영상에서 추출한 텍스트를 대상으로 한국어분석프로그램 KLIWC (Korean Linguistic Inquiry and Word Count)으로 분석하였다. 분석 결과, 북한 방송언어는 KLIWC의 각 차원에서 남한 언어와 유의미한 차이를 나타냈으며, 특히 정서적 단어, 인지적 단어, 사회적 단어 등에서 유의미한 차이가 발견되었다. 또한 북한 방송에서는 인칭대명사나 품사와 같은 언어학적 기능어에 있어서도 남한방송보다 사용빈도가 높았다. 이러한 차이에 대한 예비적인 심리학적 신문방송학적 해석을 제공하였다.

  • PDF

남북한 방송언어의 차이에 대한 기초 분석 (Preliminary Analysis of Language Styles between South and North Korean Broadcastings)

  • 이창환;김경일;박종민
    • 한국산학기술학회논문지
    • /
    • 제11권9호
    • /
    • pp.3311-3317
    • /
    • 2010
  • 본 연구는 장기간의 남북한 분단으로 인한 언어적 이질성의 정도를 가늠해보기 위하여 남북한 방송언어 비교하였다. 연구의 주목적은 남북한 언어 간 차이에 대한 데이터가 부족한 상황에서 언어사용 실태에 대한 토대 데이터를 제공하는 것이었다. 남북한의 주요 방송사 뉴스 동영상에서 추출한 텍스트를 대상으로 국어분석프로그램KLIWC (Korean Linguistic Inquiry and Word Count)으로 분석하였다. 분석 결과, 북한 방송언어는 KLIWC의 각 차원에서 남한 언어와 유의미한 차이를 나타냈으며, 특히 정서적 단어, 인지적 단어, 사회적 단어 등에서 유의미한 차이가 발견되었다. 또한 북한 방송에서는 인칭대명사나 품사와 같은 언어학적 기능어에 있어서도 남한방송보다 사용빈도가 높았다. 이러한 차이에 대한 예비적인 심리학적 해석을 논의하였다.

스마트폰 사용자의 감정분석 알고리즘 연구 (A Study on the Emotional Analysis Algorithm of Smartphone Users)

  • 백주연;신혜승;원은지;윤예슬
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.1261-1264
    • /
    • 2021
  • 현대 사회의 스트레스 문제가 심각해짐에 따라 각종 스트레스 관리 서비스가 꾸준히 개발되고 있으나, 해당 서비스들은 정서 상태 판단을 사용자가 직접 입력하는 데이터에만 의존하기 때문에 분석 결과를 완벽히 신뢰하기 어렵다. 본 연구에서 개발한 앱 S-detector는 스마트폰 사용 시간 및 빈도 정보를 자동으로 수집하고, 사용자가 작성한 일기 데이터에서는 감정 단어를 추출하여 스마트폰 사용 데이터와 일기 데이터를 각각 분석, 종합적으로 판단하는 알고리즘을 가지고 있다. 따라서 사용자가 심리·정신적 문제 가능성을 쉽게 인지하는 데 도움을 주는 앱으로서 해당 문제를 예방하거나 조기에 해결함을 목표로 한다.

감정표현불능증(Alexithymia), 신체적 호소, 정서 및 어휘의 관계 (The Relation of Alexithymia, Somatic Complaints, Emotion and Vocabulary)

  • 전현태;이귀행;김재현;김한주;유용진;소광
    • 정신신체의학
    • /
    • 제8권1호
    • /
    • pp.58-64
    • /
    • 2000
  • 연구목적 : 본 연구는 정상 성인에서 성격의 일반적인 특정으로서의 감정표현불능증과 신체적 호소, 정서상태 및 어휘와의 상관관계를 알아봄으로써 감정표현불능증에 대한 이해를 넓히고자 하였다. 방법 : 신체적 질환을 가지고 있지 않은 정상 성인에서 한국판 20항목 Toronto 감정표현불능증 척도(TAS-20K), 신체적 호소, 연상한 단어의 수, 우울과 불안을 정도를 측정하여 그 결과들간의 상관관계를 알아 보았다. 총 662명을 평가한 후 체계적 표본추출 방법을 이용하여 다시 204명을 선택하였다. 결과 : 1) 감정표현불능증의 정도는 신체적 호소, 불안, 우울의 정도와 유의한 상관관계를 보였다. 2) 신체적 호소는 불안, 우울의 정도와 유의한 상관관계를 보였다. 3) 연상한 단어의 수는 나이와 부적 상관관계를 보였다. 4) 강정표현불능증의 정도는 연상한 단어의 수와 유의한 상관관계를 보이지 않았다. 결론 : 감정표현불능증의 정도가 심할수록 신체적 호소는 더 많으며 이는 불안, 우울의 정도와 연관되어 있었으나 어휘의 양과는 유의한 관계를 발견할 수 없었다.

  • PDF

정보탐색과정(ISP)에 의한 스캐폴딩 전략 모형 개발 (Development of Scaffolding Strategies Model by Information Search Process (ISP))

  • 임정훈
    • 한국도서관정보학회지
    • /
    • 제54권1호
    • /
    • pp.143-165
    • /
    • 2023
  • 본 연구에서는 학습 과정의 중재 역할에 대한 설계 및 구현 전략을 제시한 Kuhlthau의 ISP 모형을 활용하여 정보탐색과정에 적용할 수 있는 스캐폴딩 전략을 제안하고자 하였다. 이를 위해 관련 문헌을 검토하여 스캐폴딩 전략을 범주화하고, 대전지역의 중학생 150명을 대상으로 ISP 모형 기반의 스캐폴딩 전략을 적용한 프로젝트 수업을 시행한 후, 이에 대한 소감문 텍스트를 수집하였다. 수집된 자료는 전처리 과정을 거쳐 분석에 적합한 형태로 가공한 후 단어 빈도를 추출하고, STM(Structural Topic Modeling)을 활용하여 토픽 분석을 수행하였다. 먼저, 최적의 토픽 개수를 결정하고 ISP 모형 각 단계별로 토픽을 추출한 후 추출된 토픽을 인지적 영역-거시적 관점, 인지적 영역-미시적 관점, 정서적 영역 관점의 3가지 유형으로 구분하였다. 이 과정에서 텍스트마이닝을 통해 추출한 단어 가운데 인지동사와 감정동사를 중점적으로 살펴보았으며, 대표 문서 사례를 검토하여 각 토픽과 관련된 스캐폴딩 전략 모형을 제시하였다. 본 연구의 결과를 토대로 정보탐색과정(ISP) 단계에서 적절한 스캐폴딩 전략이 제공된다면, 학습자들의 자기 주도적 과제해결에 긍정적인 영향을 기대할 수 있을 것이다.