• 제목/요약/키워드: 리뷰 데이터

검색결과 313건 처리시간 0.021초

온라인 리뷰 데이터의 오피니언마이닝을 통한 콘텐츠 만족도 분석 시스템 설계 (A Design of Satisfaction Analysis System For Content Using Opinion Mining of Online Review Data)

  • 김문지;송은정;김윤희
    • 인터넷정보학회논문지
    • /
    • 제17권3호
    • /
    • pp.107-113
    • /
    • 2016
  • 소셜 네트워크 서비스(SNS)의 활성화로 웹상에는 방대한 양의 온라인 리뷰들이 생산되고 있으며, 이러한 온라인 리뷰들은 다양한 콘텐츠들에 대한 의견 데이터로써 콘텐츠 이용자와 제공자들에게 가치 있는 정보로 활용되고 있다. 한편, 온라인 리뷰에 대한 중요도가 높아짐에 따라 온라인 리뷰를 분석하여 글쓴이의 의견이나 평가, 태도, 감정 등을 추출해 내는 오피니언마이닝에 대한 연구가 활발하게 진행되고 있다. 그러나 기존의 오피니언마이닝 연구들에서는 리뷰의 의견 분류에만 초점을 맞추어 감성 분석 기법을 설계하였기 때문에 리뷰 속에 내포되어있는 작성자의 자세한 만족도까지는 알 수 없었으며, 감성 분석 기법이 특정 콘텐츠에 한정되어있어 도메인이 같지 않은 다른 콘텐츠들에는 적용될 수 없다는 문제점이 있었다. 이에 본 연구에서는 기존 의견 분류 방법에 강도를 주어 좀 더 세밀한 감성 분석을 수행하고, 이 결과를 통계적 척도에 적용하여 리뷰에 내포되어 있는 작성자의 자세한 만족도를 도출 할 수 있는 감성 분석 기법을 제안한다, 그리고 제안한 기법을 바탕으로 도메인에 상관없이 다양한 콘텐츠에 적용되어 콘텐츠의 만족도를 분석 할 수 있는 시스템을 설계하였다. 또한 방대한 양의 리뷰 데이터들을 빠르고 효율적으로 처리하기 위해 빅 데이터 처리도구인 하둡을 기반으로 시스템을 구축하였다. 본 시스템을 통해 콘텐츠 이용자는 보다 효율적인 의사결정을, 제공자들은 빠른 반응분석을 할 수 있어 본 시스템은 사용자의 의견을 필요로 하는 다양한 분야에 매우 실용적으로 활용 될 것으로 기대한다.

앙상블 기법을 활용한 온라인 음식 상품 리뷰 감성 분석 (Sentiment analysis of online food product review using ensemble technique)

  • 김한민;박경보
    • 디지털융복합연구
    • /
    • 제17권4호
    • /
    • pp.115-122
    • /
    • 2019
  • 온라인 마켓에서 소비자는 다양한 상품을 접하고 이에 대한 의견을 자유롭게 기술한다. 소비자의 상품 리뷰가 다른 소비자와 온라인 마켓의 성공에 큰 영향을 주는 만큼 온라인 마켓은 판매 상품에 대한 소비자의 감성을 정확하게 분석할 필요가 있다. 데이터 분석 기법 중 하나인 텍스트 마이닝은 상품에 대한 소비자 리뷰를 분석하여 상품을 효율적으로 관리할 수 있게 해준다. 선행 연구들은 데이터 도메인과 사이즈에 따라 분석 결과의 정확도가 다르게 나타남에도 불구하고 특정 도메인과 2만개 미만의 데이터를 분석해왔다. 또한, 분석의 정확도를 향상 시킬 수 있는 추가 요인에 대한 연구는 거의 수행하지 않았다. 본 연구는 앙상블 기법을 활용하여 기존 연구에서 주로 다루지 않은 음식 상품 도메인의 72,530개 리뷰 데이터를 분석하였다. 또한, 분석 정확도 향상과 관련하여 요약 리뷰의 영향력을 살펴보았다. 연구 결과, 본 연구는 기존 연구와 다르게 부스팅 앙상블 기법이 가장 높은 분석 정확도를 보인다는 사실을 발견하였다. 또한, 요약 리뷰는 분석의 정확도 향상에 기여하는 것으로 나타났다.

밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구 (A Case Study on Text Analysis Using Meal Kit Product Review Data)

  • 최혜선;연규필
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.1-15
    • /
    • 2022
  • 본 연구에서는 밀키트 제품 평가에 영향을 미치는 요인을 파악하기 위하여 밀키트 제품 리뷰 데이터에 대한 텍스트 분석을 수행하였다. 분석에 사용된 자료는 네이버 쇼핑 사이트에서 판매되고 있는 밀키트 제품에 대한 리뷰 334,498건을 스크래핑하여 수집하였다. 텍스트 자료에 대한 전처리 과정을 거쳐 제품 리뷰에 빈번히 등장하는 단어를 추출한 후 워드클라우드 및 감성분석을 수행하였다. 감성분석시 제품 리뷰에 대한 긍정 또는 부정의 레이블은 평점을 기준으로 설정하여 반응변수로 활용하였고, 입력변수로는 단어들의 정규화 단어빈도-역문서빈도 (TF-IDF) 값을 구하여 사용하였다. 리뷰의 극성을 판별하는 모형으로는 로지스틱 회귀모형, 서포트 벡터 머신, 랜덤 포레스트 알고리즘을 적용하였으며, 분류 정확도 및 해석가능성을 고려하여 로지스틱 회귀모형을 최종 모형으로 선택한 후 제품 범주별 감성분석 모형으로 사용하였다. 각 제품 범주별로 도출된 로지스틱 회귀모형으로부터 밀키트 제품 구매 후 긍·부정의 감성을 발생시킨 주요 요인들을 밝혀내었다. 결과적으로 텍스트 분석을 통해 밀키트 제품 개발 시 특정 카테고리, 메뉴, 재료에 대한 긍정 요소를 극대화하고 부정적 위험 요소를 제거할 수 있는 기반을 제공할 수 있음을 확인하였다.

사용자 경험과 서비스 평가의 변화에 관한 연구 - 넷플릭스 앱 리뷰 토픽 모델링을 통해 (A study of changes in user experience and service evaluation - Topic modeling of Netflix app reviews)

  • 유선영;노미진;김양석;한무명초
    • 스마트미디어저널
    • /
    • 제12권6호
    • /
    • pp.27-34
    • /
    • 2023
  • 코로나19로 인해 넷플릭스 사용량이 증가하면서 사용자들의 넷플릭스 서비스 경험도 함께 증가하였다. 이에 본 연구는 코로나19 대유행 전후 넷플릭스 사용자 경험과 서비스 변화를 살펴보기 위하여, 넷플릭스 리뷰 데이터를 기반으로 토픽 모델링 분석을 수행하고자 한다. Google Play Scraper 라이브러리를 사용하여 구글 플레이 스토어 내의 넷플릭스 앱 리뷰 데이터를 수집하여, 코로나19 대유행 전후 앱 리뷰 기반의 토픽 모델링을 활용하여 키워드 차이를 살펴보았다. 분석 결과 넷플릭스 앱 기능, 넷플릭스 콘텐츠, 넷플릭스 서비스 이용, 넷플릭스 총평이라는 4가지 토픽으로 나타났다. 사용자 경험이 증가한 코로나19 대유행 이후 사용자들은 더 다양하고 세부적인 키워드를 사용하여 리뷰를 작성하는 경향을 보였다. 본 연구는 넷플릭스 리뷰 데이터를 활용하여 사용자들의 의견을 분석하여 코로나19 대유행 전·후 넷플릭스 서비스의 사용자 경험 변화를 보여주므로, 향후 치열한 OTT 서비스 시장에서의 경쟁력 강화를 위한 가이드 라인으로 활용할 수 있을 것이다.

게임 유용성 평가에 미치는 요인에 관한 연구: 스팀(STEAM) 게임 리뷰데이터 분석 (A Study of Factors Influencing Helpfulness of Game Reviews: Analyzing STEAM Game Review Data)

  • 강하나;용혜련;황현석
    • 한국게임학회 논문지
    • /
    • 제17권3호
    • /
    • pp.33-44
    • /
    • 2017
  • 인터넷 환경의 발달로 소비자들 사이에 상품정보에 대한 의견이 교환되기 시작하면서 다양한 형식의 온라인 리뷰들이 급속도로 생성되고 있다. 이러한 추세에 따라, 기업들은 온라인 리뷰들을 분석하여 마케팅, 세일즈, 제품개발 등의 다양한 기업 활동에서 그 결과를 활용하려는 노력을 진행하고 있다. 그러나 대표적인 경험재인 '게임'과 관련된 산업에서의 온라인 리뷰에 대한 연구는 매우 부족한 실정이다. 이에 본 연구는 머신러닝 모델을 활용하여 스팀(STEAM)게임의 커뮤니티 데이터를 분석하였다. 이를 통해 타 사용자의 게임 리뷰를 유용하다고 판단하는데 영향을 미치는 요인을 분석하고, 리뷰의 유용성을 예측하는데 있어 가장 우수한 성능을 보인 모델과 변수들을 도출하여 사용자의 충성도와 사용성을 증대시키기 위한 제안을 하고자 한다.

리뷰 데이터 마이닝을 이용한 하이브리드 추천시스템 개발: Amazon Kindle Store 데이터 분석사례 (Development of Hybrid Recommender System Using Review Data Mining: Kindle Store Data Analysis Case)

  • 장예화;이청용;최일영;김재경
    • 경영정보학연구
    • /
    • 제23권1호
    • /
    • pp.155-172
    • /
    • 2021
  • 최근 온라인 상품 구매의 증가로 인해 사용자의 선호에 맞는 상품을 추천해주는 시스템이 지속적으로 연구되고 있다. 추천 시스템은 사용자들에게 개인화된 상품 추천 서비스를 제공하는 시스템으로 사용자가 상품에 남긴 평점을 이용한 협업 필터링(Collaborative Filtering)이 가장 널리 쓰이는 추천 방법이다. 협업 필터링에서 상품 간의 유사도 계산은 시간이 많이 소요되는데, 특히 리뷰 데이터와 같은 빅데이터를 사용할 경우 더욱 많은 시간을 소요한다. 그래서 본 연구에서는 리뷰 데이터 마이닝을 이용하여 상품 간의 유사도 계산을 빠르게 수행할 수 있으면서 정확도를 높일 있도록 2단계(2-Phase) 방법을 이용한 하이브리드 추천시스템 방식을 제안한다. 이를 위해 온라인 전자책 상거래 상점인 아마존 킨들 스토어(Amazon Kindle Store)의 약 98만 개의 온라인 소비자 평점과 리뷰 데이터를 수집하였다. 실험 결과 본 연구에서 제안한 사용자의 평점과 리뷰를 단계적으로 반영한 하이브리드 추천 방식이 전통적인 추천 방식과 비교하여 추천 시간은 비슷하였으나 높은 정확도를 나타내는 것을 확인하였다. 따라서 제안한 방법을 사용하면 사용자가 선호하는 상품을 빠르고 정확하게 추천함으로써 고객의 만족을 높여서 기업의 매출 증대에 기여할수 있을 것으로 기대된다.

딥러닝 기반 온라인 리뷰의 언어학적 특성을 활용한 추천 시스템 성능 향상에 관한 연구 (A Study on the Enhancing Recommendation Performance Using the Linguistic Factor of Online Review based on Deep Learning Technique)

  • 장동수;이청용;김재경
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.41-63
    • /
    • 2023
  • 전자상거래 시장의 꾸준한 성장으로 인해 추천 시스템의 필요성은 점차 강조되고 있으며, 최근에는 추천 성능의 향상을 목적으로 리뷰 텍스트를 사용하는 연구가 활발히 진행되고 있다. 특히 많은 연구들은 리뷰 텍스트의 감성 점수를 활용하여 제안되고 있는데, 감성 점수만을 사용하는 방법론은 리뷰 텍스트에 존재하는 구체적인 선호도 정보의 활용 측면에 한계를 가지며 이는 결과적으로 성능 향상에 제약으로 작용하게 된다. 이를 개선하기 위해 본 연구는 딥러닝 기반 추천 모델에 온라인 리뷰 내 다양한 언어학적 요소들을 활용하여 고객의 선호도를 정교하게 학습할 수 있는 새로운 추천 방법론을 제안하였다. 이를 위해 먼저 고객과 상품 간 복잡한 상호작용을 고려할 수 있도록 딥러닝 모델을 통해 상호작용 관계를 비선형으로 학습하였다. 그리고 리뷰 텍스트를 효과적으로 활용할 수 있도록 언어학적 요소 중 고객의 구매 의사결정에 중요한 영향을 미치는 인지적 요인, 정서적 요인 그리고 언어 스타일 매칭을 사용하였다. 실험은 Amazon.com에서 수집한 온라인 리뷰 데이터를 사용하여 진행하였고, 실험 결과 제안 모델의 우수함을 검증할 수 있었다. 본 연구는 추천 시스템에서 리뷰 텍스트 내 고객 선호도에 대한 정보를 효과적으로 활용하는 방법론을 제안하여 연구의 이론적 및 방법론 측면에 기여하였다.

외국인 관광객 리뷰데이터를 활용한 토픽모델링 기반의 공간분석: 대구광역시를 사례로 (Spatial analysis based on topic modeling using foreign tourist review data: Case of Daegu)

  • 정지우;김서윤;김현유;윤주혁;장원준;김건욱
    • 디지털융복합연구
    • /
    • 제19권8호
    • /
    • pp.33-42
    • /
    • 2021
  • 스마트폰 기반의 관광 플랫폼들이 활성화되면서 리뷰 데이터를 활용한 정책 수립 및 서비스 고도화가 다양한 분야에서 이루어지고 있다. 관광 리뷰 데이터를 활용한 선행연구들의 경우 국내 관광객 중심의 연구가 대다수 수행되었으며, 외국인 관광객 연구의 경우 일부 언어로 수집된 데이터와 텍스트 마이닝 기법에 한정하여 연구가 수행되었다. 이에 본 연구에서는 온라인 리뷰 사이트를 통해 '대구 명소' 키워드를 지정하여 외국인들이 작성한 리뷰 데이터 3,515건을 수집하였다. 그리고 LDA 기반의 토픽모델링을 수행하여 관광 토픽을 도출하였으며, 각 토픽별 전역 및 국지적 공간 분석을 수행한 점이 선행연구와 차별성이라 할 수 있다. 분석 결과 전역적 공간 자기상관이 존재하며, 외국인들이 주로 방문하는 관광지들이 국지적으로 결집되어 있음을 확인하였다. 또한 대다수 토픽에서 중구를 중심으로 핫스팟이 도출되었으며, 분석 결과를 바탕으로 지자체 외국인 관광정책 수립 및 토픽모델링 기반의 공간분석 연구의 기초연구로 활용되길 기대하며, 본 연구의 한계점 또한 제시하였다.

어플리케이션 마켓에서 카노 모델을 이용한 사용자 리뷰 선별 방법 (User Review Selection Method using Kano Model in Application Market)

  • 김능회
    • 산업융합연구
    • /
    • 제18권2호
    • /
    • pp.95-100
    • /
    • 2020
  • 소비자를 파악하기 위해 활용되고 있는 사용자 중심 데이터 중 사용자 리뷰 데이터는 다량으로 상세하게 소비자의 의견을 파악할 수 있다는 장점으로 인해 주목받고 있으며 많은 소비자들이 사용자 리뷰에 의존하고 신뢰하고 있다. 많은 어플리케이션 개발사들은 중요성을 인지하고 사용자 리뷰를 관찰 및 대응하고 있지만 체계적인 방법의 부재로 고객의 만족과 관계없이 시간과 비용을 투자하고 있다. 따라서, 본 논문에서는 주어진 시간과 비용에서 고객의 만족을 최대화 시킬 수 있도록 고객 만족과 서비스 품질을 다루는 카노 모델을 이용하여 어플리케이션 마켓에서 사용자 리뷰들을 선별하는 체계적인 방법을 제안하였다. 본 방법은 어플리케이션 마켓에서 사용자 리뷰들을 수집하고 요구사항을 도출하는 사용자 리뷰 수집 및 요구사항 도출 단계, 도출된 요구사항에 카노 모델을 적용하고 품질 유형으로 선별하는 카노 모델 적용 및 선별 단계, 그리고 관련자들이 모여 내부적인 측면에서 요구사항 검토 및 재정의하는 이해관계자들과 검토 및 재정의 단계로 구성되었다.

LDA 기반 사용자 감정분석을 위한 문서 토픽 추출 시스템에 대한 연구 (A Study on the Document Topic Extraction System for LDA-based User Sentiment Analysis)

  • 안윤빈;김학영;문용현;황승연;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.195-203
    • /
    • 2021
  • 최근 IT 분야의 주요 기술인 빅데이터는 다양한 산업 분야로 확장되고 있으며 활용 방안에 대한 연구가 활발하게 진행 중이다. 대부분의 인터넷 산업 분야에서 사용자 리뷰는 이용자가 상품 구매를 결정하는 데 많은 도움을 준다. 그러나 방대한 제품 리뷰에서 긍정, 부정적 의미와 도움이 되는 리뷰를 선별하는 과정은 제품 구매 결정에 있어 많은 시간을 요구한다. 따라서 본 논문에서는 빅데이터 분석 기술인 LDA를 이용해 키워드를 분석 및 종합하여 사용자에게 의미 있는 정보를 제공하는 시스템을 설계하고 구현한다. 문서 토픽 추출을 위해 본 연구에서는 국내 도서 산업을 도메인으로 데이터를 크롤링하고, 빅데이터 분석을 실시한다. 이를 통해 사용자 리뷰의 토픽 및 감정단어를 바탕으로 상품에 대한 종합적인 정보를 제공함으로써 구매자에게 도움을 주고 나아가 리뷰 현황 분석을 통해 상품의 전망 또한 파악할 수 있다.