• 제목/요약/키워드: 리뷰데이터

검색결과 313건 처리시간 0.026초

Developing a Big Data Analysis Platform for Small and Medium-Sized Enterprises

  • Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권8호
    • /
    • pp.65-72
    • /
    • 2020
  • 금융, 통신 등의 응용 분야에서 빅데이터는 광범위하게 활용되고 있으며, 빅데이터 분석 시장은 해마다 크게 성장하고 있다. 이에 반해 소상공인들의 빅데이터 활용 실적은 저조하며, 이는 기존 시스템이 소상공인들의 여건을 충분히 반영하지 못하는 동시에 서비스 이용 가격 역시 높다는 점에 기인한다. 이를 해결하기 위한 노력의 일환으로, 본 논문에서는 소상공인에 특화된 빅데이터 분석 서비스를 제공하는 새로운 플랫폼을 개발, 제안한다. 먼저 소셜 빅데이터 분석과 관련한 기존 연구들을 비교하고, 소상공인의 마케팅을 돕기 위해 필요한 서비스 지표들을 추출한다. 다음으로 도출된 지표들을 구현한 프로토타입 시스템을 소개하고, 구현을 통해 얻어진 시스템 완성에 필요한 기술적인 이슈들을 논의한다.

Methodology for Identifying Key Factors in Sentiment Analysis by Customer Characteristics Using Attention Mechanism

  • Lee, Kwangho;Kim, Namgyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.207-218
    • /
    • 2020
  • 최근 온라인 리뷰의 증가와 분석 기술의 발달로 인해 온라인 리뷰 분석에 대한 관심과 수요가 지속적으로 증가하고 있다. 하지만 리뷰 분석을 다룬 기존의 연구는 동일한 어휘라도 각 어휘에 담긴 감정은 리뷰어에 따라 서로 다를 수 있다는 점을 반영하지 못했다는 한계를 갖는다. 따라서 본 연구에서는 고객의 등급에 따라 고객군을 분류하고, 각 고객군별로 리뷰 분석을 수행하여 그 차이를 분석한 결과를 제시하였다. 의류 전문 쇼핑몰인 'M'사의 리뷰에 대한 분석을 수행한 결과, 쇼핑몰 사용도가 높은 고객의 경우 가격적인 요소가, 쇼핑몰 사용도가 낮은 고객의 경우 쇼핑몰에 소개된 내용과 실제 제품의 일치 정도가 제품의 긍/부정 평가에 크게 영향을 미치는 것으로 파악되었다. 제안 방법론은 고객군별로 제품 평가에 중요하게 영향을 미치는 요소를 식별함으로써, 차별화된 마케팅 전략을 수립하는 데에 효과적으로 활용될 수 있을 것으로 기대한다.

워드 임베딩 클러스터링을 활용한 리뷰 다중문서 요약기법 (Multi-Document Summarization Method of Reviews Using Word Embedding Clustering)

  • 이필원;황윤영;최종석;신용태
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.535-540
    • /
    • 2021
  • 다중문서는 하나의 주제가 아닌 다양한 주제로 구성된 문서를 의미하며 대표적인 예로 온라인 리뷰가 있다. 온라인 리뷰는 정보량이 방대하기 때문에 요약하기 위한 여러 시도가 있었다. 그러나 기존의 요약모델을 통해 리뷰를 일괄적으로 요약할 경우 리뷰를 구성하고 있는 다양한 주제가 소실되는 문제가 발생한다. 따라서 본 논문에서는 주제의 손실을 최소화하며 리뷰를 요약하기 위한 기법을 제시한다. 제안하는 기법은 전처리, 중요도 평가, BERT를 활용한 임베딩 치환, 임베딩 클러스터링과 같은 과정을 통해 리뷰를 분류한다. 그리고 분류된 문장은 학습된 Transformer 요약모델을 통해 최종 요약을 생성한다. 제안하는 모델의 성능 평가는 기존의 요약모델인 seq2seq 모델과 ROUGE 스코어와 코사인 유사도를 평가하여 비교하였으며 기존의 요약모델과 비교하여 뛰어난 성능의 요약을 수행하였다.

레스토랑 카테고리와 온라인 소비자 리뷰를 이용한 딥러닝 기반 레스토랑 추천 시스템 개발 (Developing a Deep Learning-based Restaurant Recommender System Using Restaurant Categories and Online Consumer Review)

  • 구하은;이청용;김재경
    • 경영정보학연구
    • /
    • 제25권1호
    • /
    • pp.27-46
    • /
    • 2023
  • 최근에는 외식 산업의 발달과 레스토랑 수요의 증가로 인해 레스토랑 추천 시스템 연구가 활발하게 제안되고 있다. 기존 레스토랑 추천 시스템 연구는 정량적인 평점 정보 또는 온라인 리뷰의 감성분석을 통해 소비자의 선호도 정보를 추출하였는데 이는 소비자의 의미론적 선호도 정보는 반영하지 못한다는 한계가 존재한다. 또한, 레스토랑이 포함하는 세부적인 속성을 반영한 추천 시스템 연구는 부족한 실정이다. 이를 해결하기 위해 본 연구에서는 소비자의 선호도와 레스토랑 속성 간의 상호작용을 효과적으로 학습할 수 있는 딥러닝 기반 모델을 제안하였다. 먼저, 합성곱 신경망을 온라인 리뷰에 적용하여 소비자의 의미론적 선호도 정보를 추출했고, 레스토랑 정보에 임베딩 기법을 적용하여 레스토랑의 세부적인 속성을 추출했다. 최종적으로 요소별 연산을 통해 소비자 선호도와 레스토랑 속성 간의 상호작용을 학습하여 소비자의 선호도 평점을 예측했다. 본 연구에서 제안한 모델의 추천 성능을 평가하기 위해 Yelp.com의 온라인 리뷰를 사용한 실험 결과, 기존 연구의 다양한 모델과 비교했을때 본 연구의 제안 모델이 우수한 추천 성능을 보이는 것을 확인하였다. 본 연구는 레스토랑 산업의 빅데이터를 활용한 맞춤형 레스토랑 추천 시스템을 제안함으로써 레스토랑 연구 분야와 온라인 서비스 제공자에게 학술적 및 실무적 측면에서 다양한 시사점을 제공할 수 있을 것으로 기대한다.

감성분석 기반 호텔 리뷰의 특성별 극성 분석 및 유저의 선호도 반영 시스템 (Aspect Based Sentiment Analysis System of Hotel Review, Reflecting User's Preference)

  • 심하영;오수진;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.281-284
    • /
    • 2018
  • 인터넷을 통해 정보를 쉽게 공유하게 되면서 소비자는 제품이나 서비스를 이용하기 전 효율적인 의사 결정을 위해 먼저 작성된 다른 사람의 의견을 참고한다. 또한 기업은 이러한 소비자의 의견을 수집하여 제품의 피드백이나 마케팅 등 비즈니스적인 측면으로 활용한다. 수많은 상품평과 후기에서 특정 제품 또는 서비스에 대한 감성을 식별할 수 있다는 점에서, 감성분석은 소비자와 기업 모두에게 주목받고 있는 기술이다. 합리적인 결정을 위해, 소비자는 해당 웹사이트에서 제공하는 데이터를 참고하며, 이 데이터는 웹사이트마다의 기준에 따라 필터링된다. 하지만 제품/서비스에 따라 개인이 중시하는 부분이 다르기 때문에, 실질적으로는 다른 사용자의 의견을 참고하여 합리적인 결정을 내린다. 본 논문은 호텔의 리뷰를 여덟 가지 특성으로 구분하고, 각 특성별로 극성을 분석한다. 또한 사용자가 선호하는 특성에 가중치를 부여하여 순위를 나타내는 시스템을 제안한다. 극성분석 단계에서는 주어진 리뷰를 여덟 가지 특성으로 분류하고, 긍정/부정의 극성으로 분류하는 기계학습 알고리즘을 사용한다. 각각의 특성에 대해 가중치를 적용하여 얻을 수 있는 순서는 기존에 제공되는 순서보다 사용자의 선호도를 정확히 반영한다, 또한 본 논문의 제안을 호텔뿐만 아니라 다양한 제품/서비스에 적용하여 선호도를 반영한 순위 정보를 제공한다면 소비자의 합리적인 의사 결정에 도움을 줄 것이다.

동적 색인 스토리지 및 통합 검색 서비스 개발 (Dynamic index storage and integrated searching service development)

  • 이왕우;이석형;최호섭;윤화묵;김종환;허윤영
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2007년도 추계 종합학술대회 논문집
    • /
    • pp.346-349
    • /
    • 2007
  • 본 논문은 웹뉴스 및 리뷰 검색 서비스를 위해 만든 통합 검색 시스템을 소개한다. 검색 서비스를 위한 데이터 수집을 위해서 특정 사이트에서 수집한 뉴스와 리뷰 문서로부터 제목, 날짜, 저자, 본문처럼 특정한 영역의 데이터만 추출하는 XSLTRobot을 만들었다. XSLTRobot은 원하는 부분의 데이터만 추출하기 위해 XSLT 기술을 이용한다. 여러가지 검색 데이터 형식에 적합한 통합 검색엔진과 통합 검색엔진의 스토리지 모듈중 하나인 동적 색인 저장소(Dynamic Index Storage)를 소개한다. 동적 색인 저장소는 뉴스 데이터처럼 색인의 업데이트가 빨라야 하는 환경에 이용된다. 본 논문에서 제시하는 동적 색인 저장소는 대량의 실시간 업데이트 문서를 처리하지 않기 때문에 검색성능에 초점을 맞춰서 설계하였다.

  • PDF

문장 분류를 위한 정보 이득 및 유사도에 따른 단어 제거와 선택적 단어 임베딩 방안 (Selective Word Embedding for Sentence Classification by Considering Information Gain and Word Similarity)

  • 이민석;양석우;이홍주
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.105-122
    • /
    • 2019
  • 텍스트 데이터가 특정 범주에 속하는지 판별하는 문장 분류에서, 문장의 특징을 어떻게 표현하고 어떤 특징을 선택할 것인가는 분류기의 성능에 많은 영향을 미친다. 특징 선택의 목적은 차원을 축소하여도 데이터를 잘 설명할 수 있는 방안을 찾아내는 것이다. 다양한 방법이 제시되어 왔으며 Fisher Score나 정보 이득(Information Gain) 알고리즘 등을 통해 특징을 선택 하거나 문맥의 의미와 통사론적 정보를 가지는 Word2Vec 모델로 학습된 단어들을 벡터로 표현하여 차원을 축소하는 방안이 활발하게 연구되었다. 사전에 정의된 단어의 긍정 및 부정 점수에 따라 단어의 임베딩을 수정하는 방법 또한 시도하였다. 본 연구는 문장 분류 문제에 대해 선택적 단어 제거를 수행하고 임베딩을 적용하여 문장 분류 정확도를 향상시키는 방안을 제안한다. 텍스트 데이터에서 정보 이득 값이 낮은 단어들을 제거하고 단어 임베딩을 적용하는 방식과, 정보이득 값이 낮은 단어와 코사인 유사도가 높은 주변 단어를 추가로 선택하여 텍스트 데이터에서 제거하고 단어 임베딩을 재구성하는 방식이다. 본 연구에서 제안하는 방안을 수행함에 있어 데이터는 Amazon.com의 'Kindle' 제품에 대한 고객리뷰, IMDB의 영화리뷰, Yelp의 사용자 리뷰를 사용하였다. Amazon.com의 리뷰 데이터는 유용한 득표수가 5개 이상을 만족하고, 전체 득표 중 유용한 득표의 비율이 70% 이상인 리뷰에 대해 유용한 리뷰라고 판단하였다. Yelp의 경우는 유용한 득표수가 5개 이상인 리뷰 약 75만개 중 10만개를 무작위 추출하였다. 학습에 사용한 딥러닝 모델은 CNN, Attention-Based Bidirectional LSTM을 사용하였고, 단어 임베딩은 Word2Vec과 GloVe를 사용하였다. 단어 제거를 수행하지 않고 Word2Vec 및 GloVe 임베딩을 적용한 경우와 본 연구에서 제안하는 선택적으로 단어 제거를 수행하고 Word2Vec 임베딩을 적용한 경우를 비교하여 통계적 유의성을 검정하였다.

빅데이터 분석을 활용한 사용자 경험 평가 방법론 탐색 : 아마존 에코에 대한 온라인 리뷰 분석을 중심으로 (Exploration of User Experience Research Method with Big Data Analysis : Focusing on the Online Review Analysis of Echo)

  • 황해정;심혜린;최준호
    • 한국콘텐츠학회논문지
    • /
    • 제16권8호
    • /
    • pp.517-528
    • /
    • 2016
  • 이 연구는 이미 실생활에서 사용되고 있으나 이에 대한 실증적 사용자 경험 조사가 부족한 사물인터넷 기반 제품에 대한 새로운 사용자 경험 방법론을 탐색해보고자 진행되었다. 지금까지의 사용자 경험에 대한 연구가 주로 설문이나 관찰 방법 등을 통해 이루어져 온 것과 달리 본 연구에서는 사물인터넷 기반 제품 중 지능형 에이전트인 아마존 에코(Echo)를 대상으로 사용자들의 온라인 리뷰를 분석하는 빅데이터 분석 기법을 활용하여 사용자 경험을 살펴보았다. 토픽 모델링 분석 결과, 에코의 기능, 음성 인터랙션, 지속적인 기능 개선과 관련된 사용 경험 요인들이 도출되었다. 또한 회귀분석결과 지속적인 기능 개선이 만족도에 가장 큰 영향을 미치는 것으로 나타났다. 연구의 의의는 사용자 경험을 제고할 수 있는 지능형 사물인터넷 제품 연구방법으로서 빅데이터 분석방법론 활용 가능성을 제시한 점이다.

리뷰 데이터 감성 분류 성능 향상을 위한 Fine-tuning 방법 (Fine-tuning Method to Improve Sentiment Classification Perfoimance of Review Data)

  • 박정일;임명진;김판구
    • 스마트미디어저널
    • /
    • 제13권6호
    • /
    • pp.44-53
    • /
    • 2024
  • 현대사회의 기업들은 소셜 미디어, 제품 리뷰, 고객 피드백 등 다양한 영역에 걸쳐 소비자 의견을 정확하게 이해하는 것이 경쟁에서 성공하기 위한 주요 과제임을 강조하며 감성 분류를 점점 더 중요한 작업으로 채택하고 있다. 감성 분류는 소비자의 다양한 의견과 감성을 파악하여 제품이나 서비스 개선에 도움을 주는 이유로 많은 연구가 진행중이다. 감성 분류에서는 대규모 데이터 셋과 사전 학습된 언어 모델을 통한 미세 조정이 성능 향상에 중요한 역할을 한다. 최근 인공지능 기술의 발전으로 감성 분류 모델은 높은 성능을 보이고 있으며, 특히 ELECTRA 모델은 효율적인 학습 방법과 적은 컴퓨팅 자원을 통해 뛰어난 결과를 제공한다. 따라서 본 논문에서는 ELECTRA에서 한국어를 학습한 KoELECTRA 모델을 이용하여 다양한 데이터 셋에 대한 효율적인 미세 조정을 통해 감성 분류 성능을 향상하는 방법을 제안한다.

생성 AI 기반 감정 수레바퀴 모델을 활용한 사용자 리뷰 감정 분석 (Generative AI based Emotion Analysis of Consumer Reviews Using the Emotion Wheel)

  • 박유림;김현희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1204-1205
    • /
    • 2023
  • 본 논문은 소비자의 리뷰 데이터를 기반으로 한 새로운 감성 분석 방법을 제안한다. 긍정, 부정, 중립으로 분류하는 전통적 감성 분석방법은 텍스트에 나타난 감정의 섬세한 차이를 파악하기 어렵다. 이에 본 연구에서는 GPT 모델을 사용하여 텍스트에서 사용자의 감정을 8 가지의 카테고리로 세분화한다. 부정적 정서를 가진 리뷰에서 분노, 혐오, 실망과 같은 구체적인 감정들을 직관적으로 파악할 수 있었고, 감정의 강도까지 파악할 수 있었다. 제안된 방법을 통해 기업은 고객의 요구 사항을 정확하게 인지할 수 있으며, 고객 맞춤형 서비스 개선에 기여할 수 있다는 점이 기대된다.