• 제목/요약/키워드: 리뷰데이터

검색결과 313건 처리시간 0.022초

어플리케이션 마켓에서 카노 모델을 이용한 사용자 리뷰 선별 방법 (User Review Selection Method using Kano Model in Application Market)

  • 김능회
    • 산업융합연구
    • /
    • 제18권2호
    • /
    • pp.95-100
    • /
    • 2020
  • 소비자를 파악하기 위해 활용되고 있는 사용자 중심 데이터 중 사용자 리뷰 데이터는 다량으로 상세하게 소비자의 의견을 파악할 수 있다는 장점으로 인해 주목받고 있으며 많은 소비자들이 사용자 리뷰에 의존하고 신뢰하고 있다. 많은 어플리케이션 개발사들은 중요성을 인지하고 사용자 리뷰를 관찰 및 대응하고 있지만 체계적인 방법의 부재로 고객의 만족과 관계없이 시간과 비용을 투자하고 있다. 따라서, 본 논문에서는 주어진 시간과 비용에서 고객의 만족을 최대화 시킬 수 있도록 고객 만족과 서비스 품질을 다루는 카노 모델을 이용하여 어플리케이션 마켓에서 사용자 리뷰들을 선별하는 체계적인 방법을 제안하였다. 본 방법은 어플리케이션 마켓에서 사용자 리뷰들을 수집하고 요구사항을 도출하는 사용자 리뷰 수집 및 요구사항 도출 단계, 도출된 요구사항에 카노 모델을 적용하고 품질 유형으로 선별하는 카노 모델 적용 및 선별 단계, 그리고 관련자들이 모여 내부적인 측면에서 요구사항 검토 및 재정의하는 이해관계자들과 검토 및 재정의 단계로 구성되었다.

LDA 기반 사용자 감정분석을 위한 문서 토픽 추출 시스템에 대한 연구 (A Study on the Document Topic Extraction System for LDA-based User Sentiment Analysis)

  • 안윤빈;김학영;문용현;황승연;김정준
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권2호
    • /
    • pp.195-203
    • /
    • 2021
  • 최근 IT 분야의 주요 기술인 빅데이터는 다양한 산업 분야로 확장되고 있으며 활용 방안에 대한 연구가 활발하게 진행 중이다. 대부분의 인터넷 산업 분야에서 사용자 리뷰는 이용자가 상품 구매를 결정하는 데 많은 도움을 준다. 그러나 방대한 제품 리뷰에서 긍정, 부정적 의미와 도움이 되는 리뷰를 선별하는 과정은 제품 구매 결정에 있어 많은 시간을 요구한다. 따라서 본 논문에서는 빅데이터 분석 기술인 LDA를 이용해 키워드를 분석 및 종합하여 사용자에게 의미 있는 정보를 제공하는 시스템을 설계하고 구현한다. 문서 토픽 추출을 위해 본 연구에서는 국내 도서 산업을 도메인으로 데이터를 크롤링하고, 빅데이터 분석을 실시한다. 이를 통해 사용자 리뷰의 토픽 및 감정단어를 바탕으로 상품에 대한 종합적인 정보를 제공함으로써 구매자에게 도움을 주고 나아가 리뷰 현황 분석을 통해 상품의 전망 또한 파악할 수 있다.

머신러닝 기반의 기업 리뷰 다중 분류: 부분 문법 적용을 중심으로 (Multi-Label Classification for Corporate Review Text: A Local Grammar Approach)

  • 백혜연;장영균
    • 경영정보학연구
    • /
    • 제25권3호
    • /
    • pp.27-41
    • /
    • 2023
  • 최근 많은 분야에서 기계학습에 대한 연구가 활발히 진행되고 있는데, 상당수의 연구들이 학습 모델의 성능을 개선하는 최신 방법론을 제시하고 있다. 본 연구에서는 방법론의 개발 못지않게 기계학습에 투입되는 훈련용 데이터의 '품질'을 개선하는 것 역시 중요하다는 점에 착안하여, 코퍼스 분석에서 자주 사용되는 '부분 문법' 처리 프로세스를 통해 훈련 데이터의 품질을 향상시키는 방법을 제시한다. 우리나라 100대 기업에 근무하는 재직자들이 채용플랫폼에 게시하는 방대한 양의 비정형 기업 리뷰 텍스트 데이터를 수집하고, 데이터 품질을 부분 문법 프로세스로 개선한 후, 부분 문법이 적용된 분류 모델이 적용되지 않은 모델보다 분류 성능이 우수함을 확인하였다. 분류 카테고리는 직원 몰입의 5가지 요인으로 상정하였는데, 국내 직장인들이 기업 리뷰가 각 유형별로 빈도에 차이가 있는지를 분석하였다. 추가로 리뷰 양상이 코로나 팬데믹 전후로 어떠한 변화가 있었는지도 분석하였다. 본 연구를 통해 국내 직장인들의 생생한 일터 경험들을 자동적으로 식별하고 분류하여, 이직을 포함한 주요한 조직문화 현상의 행태와 유발 원인 등을 유추해 볼 수 있는 근거를 제공한다.

제품 가격에 따른 온라인 리뷰 유익성 결정 요인에 관한 연구 (Identifying Factors Affecting Helpfulness of Online Reviews: The Moderating Role of Product Price)

  • 백현미;안중호;하상욱
    • 한국전자거래학회지
    • /
    • 제16권3호
    • /
    • pp.93-112
    • /
    • 2011
  • 최근 온라인 쇼핑 활동의 증가와 함께 소비자들은 온라인상에서의 제품에 대한 리뷰를 합리적인 구매 결정을 내리기 위한 중요한 정보로 활용하고 있다. 하지만 소비자들은 많은 양의 온라인 리뷰 중 그들의 구매 결정에 유익하게 활용될 리뷰를 선택하기가 쉽지 않다. 따라서 본 연구에서는 정교화 가능성 이론(elaboration likelihood model)을 바탕으로, 유익한 온라인 소비자 리뷰를 결정하는 요인이 무엇인지 알아보고, 구매하고자 하는 제품의 가격에 따라 유익한 리뷰를 결정짓는 요인이 어떻게 변화되는지를 분석하고자 한다. 본 분석을 위해 아마존 닷컴의 75,226개의 온라인 소비자 리뷰 데이터를 수집하고, 리뷰 메시지의 감정어 분석 (sentimental analysis)을 통해 메시지 내용에 대한 정량변수도 확보하였다. 다중회귀분석 결과, 리뷰 점수, 리뷰어에 대한 랭킹 정보를 포함하는 주변적 단서(peripheral cues)와 리뷰 메시지의 단어 수, 부정어 비율의 중심적 단서(central cues) 모두 리뷰의 유익성에 영향을 미치는 것으로 나타났다. 또한, 고가격 제품과 저가격 제품에서 유익한 리뷰를 결정하는 요인이 다르게 나타남을 확인하였다.

온라인 리뷰와 미니멀리즘 (Online Review and Minimalism)

  • 김진화;변현수;이승훈
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2008년도 연합학회학술대회
    • /
    • pp.235-252
    • /
    • 2008
  • 전통적인 상거래 영역에 정보기술을 접목한 전자상거래는 그 규모와 성장면에서 계속적으로 증가하고 있다. 특히 기업과 소비자간 전자상거래를 의미하는 B2C는 그 종류와 규모면에서 계속 성장하고 있다. 본 연구에서는 기업과 소비간의 거래에 있어서 제품 구매에 중요한 영향을 미치는 온라인 리뷰의 정보제공능력에 대해 연구하고자 한다. 온라인리뷰가 제공하는 정보의 양이 증가할수록 이는 처리해야 하는 판매자와 구매자에게는 부담이 된다. 기존의 온라인 리뷰에 대한 연구는 사용자의 구매 경험을 전달하는 방법에 주력하여 온라인 리뷰의 형태와 전달효과 등에 대한 연구가 부족하였다. 따라서 본 연구에서는 효과적으로 정보를 전달하기 위해 필요한 온라인 리뷰의 형태와 정보 전달 등에 대해 연구하고자 한다.

  • PDF

평점 예측 모델 개발을 위한 관광지 만족도 정량 지수 구축: 제주도 관광지 리뷰를 중심으로 (Development of a Tourist Satisfaction Quantitative Index for Building a Rating Prediction Model: Focusing on Jeju Island Tourist Spot Reviews)

  • 윤동규;박기태;최상현
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.185-205
    • /
    • 2023
  • 코로나19 팬데믹 이후 관광 산업이 회복되면서 많은 관광객들이 다양한 플랫폼을 활용하고 리뷰를 남기고 있지만, 대량의 데이터 속에서 유용한 정보를 찾기 어려워 아직도 여행지 선정 과정에서 많은 시간과 비용이 낭비되고 있다. 이에 따라 많은 연구들이 진행되고 있지만, 평점이 없거나 플랫폼별로 다른 형태의 평점 제공으로 인해 연구에 한계를 가지고 있으며, 평점과 리뷰 내용이 일치하지 않는 경우도 있어 추천 모델 구축에 어려움을 주고 있다. 본 연구에서는 이러한 문제를 해결하기 위해 7,104개의 제주도 지역 관광지 리뷰를 활용하여 제주도에 특화된 관광지 만족도 정량 지수를 개발하고 이를 활용하여 '평점 예측 모델'을 구축하였다. 모델의 성능을 확인하기 위해 실험 데이터 700건의 평점을 본 연구에서 개발된 모델과 LSTM을 활용하여 예측 하였으며, 제안된 모델이 LSTM 보다 약 4.67% 높은 73.87%의 가중 정확도로 성능이 더 우수한 것을 확인하였다. 본 연구의 결과를 통해 평점과 리뷰 내용 사이의 불일치 문제를 해결하고, 평점이 없는 리뷰나 다양한 형태의 평점을 정형할 수 있으며, 다른 도메인에 적용하여 여행의 모든 분야에서 신뢰할 수 있는 평점 지표를 제공할 수 있을 것으로 기대된다.

치킨 리뷰의 이면: 텍스트 마이닝을 통한 리뷰의 탐색적 분석을 중심으로 (BEHIND CHICKEN RATINGS: An Exploratory Analysis of Yogiyo Reviews Through Text Mining)

  • 김준겸;최은솔;윤수현;이유빈;김동환
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.30-40
    • /
    • 2021
  • 코로나 19의 영향으로 배달앱 시장이 빠르게 성장하며, 리뷰와 평점이 더욱 중요해지고 있다. 그러나 급격하게 늘어난 리뷰와 평점의 신뢰도에 의문이 제기되고 있다. 따라서 본 연구는 리뷰와 평점을 탐색적으로 분석하여 배달앱 리뷰의 신뢰도와 유용성을 파악하고, 이를 높일 방법을 탐구하였다. 텍스트 마이닝 기법을 사용하여 도출한 결과는 다음과 같다. 첫째, 요기요와 네이버 지도, 구글 지도의 음식점 평점을 분석한 결과, 요기요는 가장 우편향된 평점 분포를 보여주었다. 둘째, 요기요의 세부 평점 요인(맛, 양, 배달)간에는 모두 강한 양의 상관관계가 있었고, 이는 부정 리뷰의 단어 분석에서도 드러났다. 셋째, 리뷰의 극성에 따라 사용되는 품사와 형태소의 비율이 달랐다. 넷째, 전체 리뷰 데이터에서 367개의 부정어를 선별한 후, 이를 분류하여 치킨 전용 부정어 사전을 제작하였다. 본 연구는 치킨 리뷰의 탐색적 분석을 통해 앞으로 배달앱 리뷰에 대한 연구가 나아가야 할 방향을 제시하였다.

머신러닝을 활용한 가짜리뷰 탐지 연구: 사용자 행동 분석을 중심으로 (A Study on Detecting Fake Reviews Using Machine Learning: Focusing on User Behavior Analysis)

  • 이민철;윤현식
    • 지식경영연구
    • /
    • 제21권3호
    • /
    • pp.177-195
    • /
    • 2020
  • 소비자 구전은 정보통신기술의 발전과 모바일 기기의 보급 가속화로 그 영향력 또한 급속도로 커지고 있다. 그러나 과도한 마케팅 경쟁은 가짜리뷰와 같은 거짓 온라인 구전을 확산시켰고, 이로 인해 소비자들은 온라인 구전에 대한 피로감과 함께 온라인을 통해 얻게 되는 정보를 불신하는 결과를 초래하고 있으며, 이는 소비자의 합리적 구매 결정 행위에 부정적인 영향을 미치기도 한다. 이에 대한 문제 인식의 확산으로 가짜리뷰의 형태적 특성에 대한 연구를 비롯해 가짜리뷰를 효과적으로 분류하기 위한 다양한 탐지 방법에 대한 연구가 증가하고 있다. 이에 본 연구에서는 네이버 블로그에 작성된 포스트를 대상으로 데이터를 수집하고, 사용자의 무의식에 기반한 습관적 패턴을 머신러닝 모형을 통해 분석해 보았다. 게시물이 작성된 블로그와 그 게시물에서 추출한 변수를 분석하여 향후 가짜리뷰 예측에 활용하고자 하였다. 연구 결과, 광고성 리뷰 예측에 있어 해당 글 작성자의 블로그에 등록된 전체 포스트의 개수와 포스트의 등록 날짜는 매우 높은 상관관계를 보였으며, 해당 포스트가 속한 분류에 등록된 포스트의 개수, 포스트 본문에 사용된 이미지의 개수, 블로그에 포함된 메뉴 개수, 포스트 제목 및 본문의 길이, 포스트가 획득한 '좋아요'의 개수 또한 높은 상관관계를 보였다. 또한 광고성 리뷰 여부를 판단하기 위한 머신러닝 모형에 있어서 랜덤포레스트를 활용한 모형이 가장 우수한 모형으로 확인되었다. 본 연구에서는 블로그에 작성된 리뷰 내용에 대한 형태소 분석을 시행하는 대신 리뷰를 작성한 사람의 행위를 분석하기 위한 시도를 하였다. 이를 위해 블로그와 포스트의 특성 데이터를 수작업이 아닌 웹 크롤링 기법으로 수집하고 머신러닝 모형을 통해 광고성 리뷰 여부를 판별할 가능성을 확인한 점은 향후 가짜리뷰의 빠른 탐지를 위한 효율성 및 효과성 향상에 기여할 수 있을 것이다.

조작된 리뷰(Fake Review)는 무엇이 다른가? (What's Different about Fake Review?)

  • 이중원;박철
    • 경영정보학연구
    • /
    • 제23권1호
    • /
    • pp.45-68
    • /
    • 2021
  • 온라인 리뷰가 소비자 의사결정에 미치는 영향이 증가함에 따라 리뷰조작에 대한 염려도 증가하고 있다. 리뷰조작은 판매량을 증가시키기 위해, 진실 되지 않은 리뷰를 게시하는 것으로 소비자의 역 선택을 초래하며, 사회 전체에 큰 비용으로 작용한다. 선행연구는 대부분 데이터 마이닝 방법을 통해 리뷰조작을 예측하는 데 초점을 맞추었으며, 소비자 관점의 연구는 상대적으로 제한적이다. 그러나 소비자가 지각한 리뷰의 조작 가능성은 리뷰의 유용성에 영향을 미칠 수 있으므로 허위 여부와 상관없이 온라인 구전 관리에 중요한 시사점을 제공할 수 있다. 따라서 본 연구에는 소비자가 조작되었다고 평가한 리뷰와 일반적인 리뷰 간에 어떠한 차이가 있는지 분석하고, 조작된 것으로 평가된 리뷰와 리뷰 유용성 간의 관계를 분석하였다. 실증분석을 위해 LibraryThing 웹사이트의 온라인 도서 리뷰 34,711개를 다수준 로지스틱 회귀분석과 포아송 회귀분석을 활용하여 분석하였다. 분석결과 소비자가 조작되었다고 지각하는 리뷰와 그렇지 않은 리뷰 간에는 제품 수준, 리뷰어 수준, 리뷰 수준 요인들에 차이가 있는 것으로 나타났다. 또한, 조작된 리뷰는 리뷰 유용성에 부정적인 영향을 미치는 것으로 나타났다.

데이터 정제를 통한 딥러닝 기반의 유저 맞춤형 음식추천시스템 (User-specific Food Recommended System Using Data Cleaning)

  • 김균엽;강상우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2020년도 제32회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.578-581
    • /
    • 2020
  • 제품을 추천하는 기능은 사용자의 콘텐츠 또는 제품 소비량에 직결되기에 다양한 인터넷 플랫폼에서 많은 관심을 받고 있다. 이러한 제품 추천 시스템의 성능은 다양한 머신러닝 알고리즘과 딥러닝의 발전에 의해 성능을 비약적으로 개선되어왔다. 하지만 여느 딥러닝과 머신러닝 알고리즘과 마찬가지로 추천 시스템들의 성능은 빅데이터의 품질에 따라 매우 민감한 영향을 받는다. 본 논문에서는 모바일 배달 플랫폼에서 사용자들의 리뷰 데이터들을 통해 딥러닝과 빅데이터를 사용하여 음식을 추천하는 방법을 제안한다. 또한 사용자들의 리뷰 데이터들을 정제하여 데이터의 품질을 높이는 과정을 추가하여 그 결과가 성능에 얼마만큼 영향을 미치는 지를 실험을 통하여 분석한다.

  • PDF