• 제목/요약/키워드: 속성기반 감성 분석

검색결과 48건 처리시간 0.032초

BERT를 활용한 속성기반 감성분석: 속성카테고리 감성분류 모델 개발 (Aspect-Based Sentiment Analysis Using BERT: Developing Aspect Category Sentiment Classification Models)

  • 박현정;신경식
    • 지능정보연구
    • /
    • 제26권4호
    • /
    • pp.1-25
    • /
    • 2020
  • 대규모 텍스트에서 관심 대상이 가지고 있는 속성들에 대한 감성을 세부적으로 분석하는 속성기반 감성분석(Aspect-Based Sentiment Analysis)은 상당한 비즈니스 가치를 제공한다. 특히, 텍스트에 속성어가 존재하는 명시적 속성뿐만 아니라 속성어가 없는 암시적 속성까지 분석 대상으로 하는 속성카테고리 감성분류(ACSC, Aspect Category Sentiment Classification)는 속성기반 감성분석에서 중요한 의미를 지니고 있다. 본 연구는 속성카테고리 감성분류에 BERT 사전훈련 언어 모델을 적용할 때 기존 연구에서 다루지 않은 다음과 같은 주요 이슈들에 대한 답을 찾고, 이를 통해 우수한 ACSC 모델 구조를 도출하고자 한다. 첫째, [CLS] 토큰의 출력 벡터만 분류벡터로 사용하기보다는 속성카테고리에 대한 토큰들의 출력 벡터를 분류벡터에 반영하면 더 나은 성능을 달성할 수 있지 않을까? 둘째, 입력 데이터의 문장-쌍(sentence-pair) 구성에서 QA(Question Answering)와 NLI(Natural Language Inference) 타입 간 성능 차이가 존재할까? 셋째, 입력 데이터의 QA 또는 NLI 타입 문장-쌍 구성에서 속성카테고리를 포함한 문장의 순서에 따른 성능 차이가 존재할까? 이러한 연구 목적을 달성하기 위해 입력 및 출력 옵션들의 조합에 따라 12가지 ACSC 모델들을 구현하고 4종 영어 벤치마크 데이터셋에 대한 실험을 통해 기존 모델 이상의 성능을 제공하는 ACSC 모델들을 도출하였다. 그리고 [CLS] 토큰에 대한 출력 벡터를 분류벡터로 사용하기 보다는 속성카테고리 토큰의 출력 벡터를 사용하거나 두 가지를 함께 사용하는 것이 더욱 효과적이고, NLI 보다는 QA 타입의 입력이 대체적으로 더 나은 성능을 제공하며, QA 타입 안에서 속성이 포함된 문장의 순서는 성능과 무관한 점 등의 유용한 시사점들을 발견하였다. 본 연구에서 사용한 ACSC 모델 디자인을 위한 방법론은 다른 연구에도 비슷하게 응용될 수 있을 것으로 기대된다.

한국어에서 T5를 사용한 속성 기반 감성 분류 모델 (Generative-model based Aspect-Based sentiment Analysis)

  • 류상연;강상우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.586-590
    • /
    • 2023
  • 인터넷과 소셜미디어 사용량의 급증으로, 제품 리뷰, 온라인 피드백, 소셜 미디어 게시물 등을 통해 고객의 감정을 파악하는 것이 중요해졌다. 인공지능이 활용되어 고객이 제품이나 서비스의 어떤 부분에 만족하거나 불만을 가지는지를 분석하는 연구를 ABSA라고 하며 이미 해외에서는 이런 연구가 활발하게 이루어지는 반면, 국내에서는 상대적으로 부족한 상황이다. 이 연구에서는 ABSA의 두 개의 주요 작업인 ACD와 ASC에 대해 생성 모델 중 하나인 T5 모델을 사용하는 방법론을 제시한다. 이 방법론은 기존 판별 모델을 사용하는 것에 비해 시간과 성능 측면에서 크게 향상되었음을 보여준다.

  • PDF

효과적인 의사결정을 위한 다중레이블 기반 속성선택 방법에 관한 연구: 감성 분석을 중심으로 (Exploring the Performance of Multi-Label Feature Selection for Effective Decision-Making: Focusing on Sentiment Analysis)

  • 원종윤;이건창
    • 경영정보학연구
    • /
    • 제25권1호
    • /
    • pp.47-73
    • /
    • 2023
  • 본 연구는 인공지능 기법 중 다중레이블 속성선택 방법을 적용하여 복잡한 경영환경에서 의사결정의 효과성을 증대시키는 방안을 설명한다. 인공지능 기반의 의사결정 시스템은 의사결정자의 선택과 판단을 돕거나, 대신하는 중요한 역할을 한다. 더욱이 최근 인공지능을 중심으로 한 비즈니스 의사결정은 기업의 성장 동력으로 평가받는데, 이를 위해서는 효과적인 의사결정 방법이 수반되어야 한다. 이에 본 연구는 의미 있는 속성값을 선별하는 CFS-BR(이진연관성 접근 기반의 상관관계 속성선택 모델)을 제안하여, 효과적인 의사결정을 지원하는 것을 돕는다. 예시데이터와 실증데이터의 분석 결과, CFS-BR은 유의미한 속성을 최상우선선별 알고리즘 기반으로 최상의 조합을 선별하므로 효율적 의사결정을 지원할 수 있고, 기존의 다중 레이블 속성선택 방법과 비교하였을 때 정확도가 높은 것으로 보아 효과적인 의사결정을 증대시키는 데 유용하다.

동양 철학에서의 소리의 속성과 감성 유형 - 중국의 악론과 조선의 천기론을 중심으로 (Attributes of sound and emotional type in the Eastern philosophy - Focused on Chinese Akron(樂論) and Chosun Chongiron(天機論))

  • 길태숙
    • 감성과학
    • /
    • 제13권1호
    • /
    • pp.215-224
    • /
    • 2010
  • 본 논문에서는 "악기"의 성유애락론과 이를 비판적으로 논의한 혜강의 성무애락론, 조선시대의 "악학궤범"과 천기론을 주장한 일련의 학자들의 이론을 통해서 한국인 혹은 동양인의 사고에 전통적으로 내재되어 있는 소리와 감성의 속성 및 그 유형에 대해 살펴보았다. "기"를 통해서는 애심, 락심, 희심, 노심, 경심, 애심(哀心, 樂心, 喜心, 怒心, 敬心, 愛心)의 여섯 가지 감성과 관련된 각각의 소리에 대해 고찰하였다. 소리는 객관적 외물일 뿐이지 마음의 형이 아니라고 주장한 혜강의 논의를 통해서는 그가 맹정(猛靜), 단복(單複), 서질(舒疾), 고비, 선악(善惡)으로 규정한 소리의 속성이 크기(loudness), 세밀성(sharpness), 피치(pitch), 거칠기(roughness), 요동강도(fluctuation strength), 쾌적감(pleasantness) 등과 대응되고 있음을 살펴보았다. "악학궤범"을 통해서는 당시 조선 유학자들의 소리와 감성에 대한 사고가 "악기"를 기본으로 한 유가적 악론과 음률에 바탕을 두고 있음을 확인하고, 천기론을 통해서는 천기를 통해 발현된 소리와 감성의 관계에 대해 살펴보았다. 동양인의 의식에 내재된 소리와 감성의 관계에 대한 분석은 한국인 혹은 동양인의 감성에 기반한 소리 유형 분석의 기초가 됨으로써 여러 분야에서 활용될 수 있을 것으로 기대된다.

  • PDF

SNS 기반 여론 감성 분석 (Sentiment Analysis for Public Opinion in the Social Network Service)

  • 하상현;노태협
    • 문화기술의 융합
    • /
    • 제6권1호
    • /
    • pp.111-120
    • /
    • 2020
  • 본 연구는 소셜네트워크서비스(SNS)상의 빅데이터를 이용한 텍스트 분석기법의 응용으로서 설문 조사 기반의 여론 조사 방법론과 달리 비정형적 언어 기반의 감성 여론 조사 방법론을 제안한다. 기존의 설문 기반 여론 분석모형에 대한 대안적 방법으로 주관성에 기초한 감성 분류 모형을 이용하였다. 이를 위하여, 제20대 국회의원 선거운동 기간 중 선거 관련 실시간 트위터 자료를 수집하여 속성 기반 감성 분석을 이용한 여론의 극성과 강도에 대한 실증 분석을 수행하였다. 개별 SNS에서 사용된 단어의 극성을 분류하기 위해 Lasso 및 Ridge 회귀 모형을 이용하여 극성에 영향력이 큰 변수를 추출하였다. 추출된 변수가 극성에 미치는 긍정 및 부정에 대한 영향을 구분하고, 영향력의 강도를 분석하였다. 대중들이 소셜네트워크상에서 표현한 내용을 바탕으로 한 여론에 대한 긍정 및 부정의 감성 분석을 통해 여론의 향방을 예측하고 극성분석 모형의 정확도를 측정하여, 여론 조사 분야에서 감성 분석 방법론의 적용가능성을 확인하였다.

프로파일을 활용한 감성 기반 e-러닝 콘텐츠 타입 추천 (Emotion Based e-Learning Contents Type Recommendation Using Profile)

  • 신민철;정경석;최용석
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.243-246
    • /
    • 2011
  • 학습자의 감성 상태가 충분히 반영되는 오프라인 수업과 달리 지금까지 대부분의 e-러닝은 학습자의 감성 정보를 수업에 효과적으로 반영하지 못했다. 이러한 한계점은 e-러닝의 학습 효과성을 저해하는 문제 중 하나로 지적되었다. 이 문제를 해결하기 위해 학습자의 뇌파를 통해 감성을 인식하고 감성 상태에 따라 적절한 학습 콘텐츠 타입을 추천하여 학습 효과를 증대 시킬 수 있는 방법론이 주목을 받고 있다. 본 논문에서는 기 수집된 학습자들의 감성(뇌파) 데이터를 분석하여 콘텐츠 타입 선호도를 파악한 후 프로파일 데이터를 활용하여 상관계수 기반 NN-Recommendation 학습 콘텐츠 타입 추천 시스템을 제안 하고자 한다. 이 시스템은 일반적인 추천시스템에서 발생하는 Cold-start 문제를 해결할 수 있으며 특히 본 연구에서는 보다나은 추천 정확도를 위해 프로파일 각 속성에 자동적으로 가중치를 부여하는 기법을 제시하여 향상된 성능을 보이게 됨을 실험을 통해 확인 하였다.

이미지의 색채 감성속성을 이용한 대표감성크기 정량화 알고리즘 (Represented by the Color Image Emotion Emotional Attributes of Size, Quantification Algorithm)

  • 이연란
    • 만화애니메이션 연구
    • /
    • 통권39호
    • /
    • pp.393-412
    • /
    • 2015
  • 사람의 이미지를 보고 느끼는 감성인식은 환경, 개인적 성향에 따라 다양하게 변화한다. 그리하여 이미지 감성인식을 숫자로 제어하려는 감성컴퓨터 연구에 집중되고 있다. 그렇지만 기존의 감성컴퓨팅 모형은 숫자화된 객관적이고, 명확한 측정이 미흡한 상황이다. 따라서 이미지 감성인식을 감성컴퓨팅을 통해 정량화하고, 객관적인 평가 방식의 연구가 필요한 상황이다. 이에 본 논문은 이미지 감성인식을 계산 방식에 따라 숫자화한 정량화로 감성크기를 표현했다. 그리하여 이미지 감성인식의 주요한 속성인 색채를 구성인자로 적용한다. 또한 디지털 색채 감성컴퓨팅을 적용하여 계산하는데 연구의 중점을 두었다. 이미지 색채 감성컴퓨팅 연구방식은 감성속성인 색상, 명도, 채도에 중요도에 따른 가중치를 감성점수에 반영한다. 그리고 감성점수를 이미지 감성계산식에 적용하여 쾌정도(X축), 긴장도(Y축)를 숫자 방식으로 계산한다. 거기에 쾌정도(X축), 긴장도(Y축)의 교차하는 위치점을 이미지 감성좌표의 감성점으로 위치한다. 이미지 색채 감성좌표는 러셀의 핵심 효과(Core Affect)를 적용하여 16가지 주요대표감성을 기반으로 한다. 이미지 감성점은 기준의 위치에서 대표감성크기와 감성상관관계를 숫자화하고, 이미지 감성을 정량화한다. 그리하여 이미지 감성인식은 숫자 크기로 비교한다. 감성점수의 대소에 따라 감성이 변화함을 증명한다. 비교 방식은 이미지 감성인식을 16개 대표감성과 연관된 감성의 상위 5위로 구분하고, 집중된 대표감성크기를 비교 분석한다. 향후 감성컴퓨팅 방식이 사람의 감성인식과 더 유사할 수 있도록 감성계산식의 연구가 필요하다.

속성선택방법을 이용한 전기자동차 소셜미디어 데이터의 감성분석 연구 (Exploring the Sentiment Analysis of Electric Vehicles Social Media Data by Using Feature Selection Methods)

  • 프란시스 조셉 코스텔로;이건창
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.249-259
    • /
    • 2020
  • 본 연구는 전기자동차(EV)에 대한 소셜미디어 데이터를 기반으로 감성분석 (SA)과 속성선택 (FS)방법을 적용하여 전기자동차에 대한 일반 사람들의 의견을 보다 효과적이고 정확히 예측할 수 있는 새로운 방법론을 제안한다. 구체적인 방법은 다음과 같다. 첫째, 유튜브에 있는 전기자동차에 대한 일반 사람들의 의견을 추출하였다. 둘째, 분석의 효과성을 증대하기 위하여 카이 스퀘어, 정보획득량, 릴리프에프 등 세가지 속성선택 방법을 적용하였다. 그 결과 로지스틱 회귀분석 및 서포트 벡터 머신 분류 기법에서 가장 의미있는 결과를 얻을 수 있다는 것이 확인되었다.

추세분석을 통한 미래 MP3 플레이어의 감성디자인 방향 모색 (A Direction of Emotion Design for Future MP3 Players by Trend Analysis)

  • 이유리;양종열
    • 감성과학
    • /
    • 제10권4호
    • /
    • pp.511-521
    • /
    • 2007
  • 지속적으로 변화하는 소비자의 선호를 바탕으로 디자인하는 것은 매우 중요하다. 따라서 디자인이 출시될 미래시점에서 소비자가 선호할 수 있는 디자인 컨셉을 결정할 수 있는 방법이 필요하다. 이를 위한 다양한 방법들이 있을 수 있겠지만 추세분석(trend analysis)은 이를 충족시킬 수 있는 가장 적절한 방법 중의 하나이다. 본 연구는 추세분석을 통하여 미래 소비자의 감성에 부합하는 MP3 플레이어 디자인 방향을 제시하는 것을 목적으로 한다. 이를 위해 연구방법과 내용으로서 먼저, 소비자의 지속적인 선호의 변화를 파악할 수 있고 이를 바탕으로 미래시점에서 소비자가 선호할 수 있는 디자인 방향을 제시할 수 있는 추세분석방법을 모색하였다. 실증연구로서 2000년부터 2007년 7월까지 출시된 MP3 플레이어 228개를 수집하여 디자인의 속성과 그 속성의 수준을 결정하고 SPSS프로그램의 동질성분석을 이용하여 추세분석을 실시하였다. 그 결과 미래의 소비자 역시 감성경험을 중시하는 소비추세가 주류를 이룰 추세이다. 따라서 MP3 플레이어 디자인은 소비자의 감성적 욕구를 충족시키기 위한 디자인 기반으로 작용할 추세이다. 이를 기반으로 MP3 플레이어디자인을 4가지 추세로 나누어 볼 수 있다. 그것은 1. 고가격의 PMP기반 다양한 멀티미디어 기능의 MP3 플레이어디자인 개발 2. 기본기능의 MP3 플레이어디자인 개발 3. 새로운 컨버젼스 제품디자인 개발 4. 플래시 기반 제품디자인 개발이다. 디자이너들이 디자인의 추세결과를 바탕으로 미래 디자인을 추론할 수 있다면 경쟁에서 경쟁우위를 점할 수 있는 확률이 높다고 할 수 있다. 이러한 점에서 본 연구는 유용하다고 할 수 있다.

  • PDF

효과적 이모션마이닝을 위한 속성선택 방법에 관한 연구 (Exploring Feature Selection Methods for Effective Emotion Mining)

  • 어균선;이건창
    • 디지털융복합연구
    • /
    • 제17권3호
    • /
    • pp.107-117
    • /
    • 2019
  • 블로그, 소셜 미디어 등의 발달로 인해 점점 더 많은 사람들이 본인의 의견이나 감정을 표현하기 위해 온라인상에서 텍스트 문장을 작성한다. 그리고 이같은 온라인 텍스트 문장속에 숨겨져 있는 긍정 또는 부정등의 감성을 찾아내는 연구분야를 감성분석 이라고 한다. 그중에서도 이모션 마이닝은 사람들의 구체적인 이모션을 찾아내는데 초점을 맞춘 연구분야이다. 본 연구에서는 속성선택 방법과 단일 및 앙상블 분류기를 조합하여 효과적인 이모션 마이닝 예측모델을 제시하고자 한다. 이를 위해 두가지 대표적인 오픈 데이터인 Tweet와 SemEval2007 데이터를 이용하여 TF-IDF를 계산하고 백 오브 워즈(BOW: bag-of-words) 형태로 속성 셋을 구성하였다. 그리고 효과적인 이모션 마이닝이 될 수 있는 최적의 속성을 선택하기 위하여 상관관계 기반 속성선택(CFS), 정보획득 속성선택 (IG), 그리고 ReliefF 등 세가지 속성선택 방법을 적용하였다. 선택된 속성을 이용하여 아홉가지 분류기 모델로 이모션 마이닝의 정확도를 비교하였다. 실험 결과, Tweet 데이터는 의사결정나무(DT)가 CFS, IG, ReliefF에 의한 속성을 이용할 경우 정확도가 상승했고, 랜덤서브스페이스(RS)는 CFS, IG에 선택된 속성을 사용할 경우 정확도가 상승했다. SemEval2007 데이터는 ReliefF에 의해 선택된 속성으로 로지스틱 회귀분석(LR)을 적용하였을 때 정확도가 상승했고, 나이브 베이지안 네트워크(NBN)은 CFS, IG에 의한 속성을 사용할 경우 정확도가 상승하였다.