• 제목/요약/키워드: 리뷰 속성

검색결과 64건 처리시간 0.028초

영화 리뷰의 상품 속성과 고객 속성을 통합한 지능형 추천시스템 (An Intelligent Recommendation System by Integrating the Attributes of Product and Customer in the Movie Reviews)

  • 홍태호;홍준우;김은미;김민수
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.1-18
    • /
    • 2022
  • 디지털 기술이 산업 전반의 전자상거래 시장에 융합되면서 온라인 거래의 활성화와 이용률을 증가시켰으며, 이러한 시장의 흐름은 최근 코로나와 같은 감염병이 확산함에 따라 더욱 가속화되어 다양한 상품 정보를 온라인을 통해 고객들에게 제공할 수 있게 되었다. 다양한 정보의 제공은 고객들에게 다양한 선택의 기회를 제공하지만 의사결정에 어려움을 주기도 한다. 추천시스템은 고객의 의사결정에 도움을 줄 수 있으나 기존 추천시스템 연구는 정량적 데이터만에 국한되어 있으며, 상품 및 고객의 세부적인 요인을 반영하지 못하였다. 이에 본 연구에서는 온라인 리뷰를 기반으로 정성적 데이터를 텍스트 마이닝 기법을 적용하여 상품 및 고객의 속성을 정량화하고 기존의 객관적 지표인 총평점과 감성 및 감정을 통합한 지능형 추천시스템을 제안한다. 제안된 지능형 추천모형은 총평점 위주의 추천 모형보다 우수한 추천성과를 보여주었으며, 상품 및 고객의 세부적 요소를 반영한 추천결과를 통해 새로운 비즈니스 가치를 창출할 것으로 기대한다.

텍스트 마이닝을 활용한 OTT 서비스 플랫폼별 사용자 반응 비교 연구 (Comparative Study of User Reactions in OTT Service Platforms Using Text Mining)

  • 권순찬;김지은;장백철
    • 인터넷정보학회논문지
    • /
    • 제25권3호
    • /
    • pp.43-54
    • /
    • 2024
  • 본 연구는 텍스트 마이닝 기법을 활용하여 다양한 OTT(Over-The-Top) 서비스 플랫폼에 대한 사용자 반응을 비교한다. 연구의 주요 목표는 OTT 서비스 플랫폼의 사용자 만족도를 파악하여 보다 효과적인 리뷰 전략을 수립하는 데 기여하는 것이다. 본 연구에서 다루는 주요 질문에는 다양한 OTT 서비스에 대한 사용자 리뷰에서 두드러진 토픽과 키워드를 식별하고 플랫폼별 사용자 반응을 이해하는 것이 포함된다. 이를 위해 긍정, 부정 리뷰에서 중요 단어를 추출하기 위해 Tf-idf를, 복잡한 사용자 리뷰를 보다 정교하고 포괄적으로 분석하기 위해 고급 토픽 모델링 기법인 BERTopic을 사용한다. Tf-idf 분석한 결과, 앱에 대한 긍정 리뷰는 콘텐츠와 관련된 단어들의 수치가 높았으며 부정 리뷰에서는 앱 사용 과정에서 발생할 수 있는 문제점에 관한 단어 수치가 높게 기록되었다. BERTopic을 활용한 토픽 모델링에서는 콘텐츠의 속성과 연관 지어 콘텐츠의 다양성, 앱 성능 요소, 결제, 호환성에 관한 키워드를 도출하였으며, 플랫폼 별로 두각을 보이는 속성이 다르다는 점도 확인하였다. 본 연구 결과는 사용자 행동과 선호도에 대한 중요한 인사이트를 제공하며, 이를 통해 OTT 서비스 제공업체는 사용자 경험과 만족도를 개선하는 데 활용할 수 있다. 또한, 연구자들은 사용자 리뷰 텍스트 분석에서 딥러닝 모델을 활용한 연구의 아이디어를 얻을 수 있을 것이라 기대한다.

Delete-Generate: 단어 n-gram의 삭제 및 생성에 기반한 한국어 스타일 변환 (Delete and Generate: Korean style transfer based on deleting and generating word n-grams)

  • 최형준;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.400-403
    • /
    • 2019
  • 스타일 변환(Style Transfer)은 주어진 문장의 긍정이나 부정 같은 속성을 변경하여 다른 속성을 갖는 문장으로 변환하는 과정을 의미한다. 본 연구에서는 스타일 변환을 위한 단어 n-그램 삭제의 기준을 확장하였고, 네이버 영화리뷰 데이터셋을 통해 이를 스타일 변환 이후 원래 문장의 스타일로부터 얼마나 차이가 나게 되었는지를 측정하였다. 측정은 감성분석기를 통해 이루어졌고, 기존 방법에 비해 6.28%p정도 높은 75.13%의 정확도를 보였다.

  • PDF

스마트워치 SNS 리뷰 데이터와 오피니언 마이닝을 통한 감성 분석 처리에 대한 연구 (A Study on Smartwatch review data of SNS and sentiment analytical using opinion mining)

  • 신동현;최용락
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.1047-1050
    • /
    • 2015
  • IoT(Internet of Things)에 대한 관심과 함께 웨어러블 디바이스 또한 차세대 융합 기술의 핵심으로 그 관심이 증가하고 있다. 특히, 초기 단계인 스마트워치 시장의 선점을 위하여 여러 기업들이 경쟁하고 있으며, 사용자들은 이러한 경쟁 속에서 각 기기에 대한 의견을 SNS를 통하여 공유하며 그에 대한 선호도를 표출하고 있다. 따라서 본 논문에서는 스마트워치에 관련된 속성과 감성단어들에 대한 감성사전을 먼저 구축한 뒤 이를 토대로 의견 데이터 모델을 통하여 수집된 SNS의 데이터를 속성별로 분류한다. 이후 수집된 데이터를 자연언어 처리 기법을 이용하여 전반적 극성 및 속성별 극성을 판단하고 이를 통하여 각 스마트워치 리뷰에 대한 분석을 수행하고자 한다. 그리고 수집된 자료 분석을 통하여 사용자들이 선호하는 스마트워치의 속성을 파악할 수 있도록 하고 이를 통해 각 기기별 발전방향을 판단하는데 기여하도록 한다.

  • PDF

Sentiment Analysis of Airline Satisfaction Using Social Big Data: A Pre- and Post-COVID-19 Comparison

  • Ju-Yang Lee;Phil-Sik Jang
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권6호
    • /
    • pp.201-209
    • /
    • 2024
  • COVID-19는 항공산업에 큰 영향을 주어 전 세계적인 여행 제한과 보안 강화 등의 변화를 불러 왔다. 본 연구는 COVID-19 전후 항공 서비스 만족도의 변화양상을 파악하기 위해 2016년부터 2023년까지 SKYTRAX 웹사이트에 게시된 147개 항공사에 대한 59,818개의 리뷰를 수집하고 감성 분석 기법을 활용하여 COVID-19 전후의 항공사 만족도, 리뷰 감성, 만족도에 영향을 미치는 속성을 비교 분석하였다. 분석 결과, COVID-19 이후 항공사 만족도 전반이 통계적으로 유의미하게 하락했으며 (p<0.001), 모든 항공사 선택 속성에 대한 긍정적 감성 비율이 유의미하게 감소한 반면, 부정적 감성 비율은 객실 및 기내서비스를 제외한 모든 속성에서 유의미하게 증가했다. 또한, 운항 서비스는 COVID-19 전후 기간 모두 전반적인 서비스 만족도에 가장 큰 영향을 미치는 것으로 나타났다. 이 연구는 COVID-19 전후 글로벌 주요 항공사의 만족도 속성에 대한 정량적 분석을 제공함으로써 향후 항공산업의 서비스 만족도 제고에 이바지할 것으로 기대된다.

데이터마이닝과 텍스트마이닝을 활용한 영화 흥행 예측 (Box Office Hit Prediction Using Data mining and Text mining)

  • 조효정
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.316-318
    • /
    • 2021
  • 영화 수익에 있어 영화의 흥행 여부는 중요한 영향을 끼친다. 영화 흥행 요인은 영화 산업의 규모가 커지면서 많은 제작사들 및 투자자들이 고려해야 하는 사항이 되었다. 따라서 영화의 흥행을 예측하기 위한 많은 모델이 연구되었다. 본 연구의 목적은 선행연구에서 흥행에 유의미한 영향을 끼친다고 밝혀진 스크린 수, 감독명, 제작사명 등의 내재적인 속성과 더불어 온라인 구전 변수를 사용하여 영화 흥행 예측 모델을 만드는 것이다. 이때 기사 수, 블로그 수와 같이 온라인 구전의 크기를 나타내는 변수들을 사용하는 대신 개봉 후 첫 주간의 관람객 리뷰를 텍스트마이닝을 이용하여 전체 리뷰 중 긍정 리뷰의 비율에 따라 점수를 매긴 후 독립변수로 사용한다. 그 후, 데이터 마이닝 기법을 활용하여 만든 모델에 앞서 언급한 독립변수를 입력 값으로 사용하여 영화의 흥행을 예측한다. 최종적으로 의사결정트리와 로지스틱회귀를 수행한 결과 영화 흥행에 영향을 주는 독립변수를 찾고 모델의 성능을 평가하였다. 로지스틱회귀의 결과 관객 수, 평점이 영화의 흥행에 특히 유의한 영향을 끼치는 변수로 선정되었고 리뷰 역시 유의한 변수로 선정되었다. 이때 만들어진 모델은 약 90%의 높은 수준의 정확도를 보여주었다. 의사결정트리의 결과 관객 수가 가장 중요한 변수로 선정되었다.

소셜미디어 감성분석을 위한 베이지안 속성 선택과 분류에 대한 연구 (Investigating the Performance of Bayesian-based Feature Selection and Classification Approach to Social Media Sentiment Analysis)

  • 강창민;어균선;이건창
    • 경영정보학연구
    • /
    • 제24권1호
    • /
    • pp.1-19
    • /
    • 2022
  • 온라인 사용자들이 소셜 미디어상에 올린 온라인 리뷰 속 숨겨진 감정을 분석하는 감성분석은 소셜미디어의 확산에 힘입어 많은 관심을 받고 있다. 본 연구는 기존 연구들과 차별화된 방법으로 감성분석을 시도하기 위하여 베이지안 네트워크에 기반한 감성 분석 모델을 제안한다. 모델에는 MBFS(Markov Blanket-based Feature Selection)가 속성 선택 기법으로 사용된다. MBFS의 성과를 실증적으로 증명하기 위하여 소셜미디어인 Yelp의 리뷰 데이터를 활용하였다. 벤치마킹 속성 선택 기법으로는 상관관계기반 속성 선택, 정보획득 속성 선택, 획득비율 속성 선택을 사용하였다. 한편, 해당 속성선택방법을 토대로 4개의 머신러닝 알고리즘을 이용하여 분류성과를 비교하였다. 나아가 MBFS로 선택된 속성들 간 인과관계를 확인하고자 베이지안 네트워크를 통해 What-if 분석을 실시하였다. 본 연구에서 택한 머신러닝 분류기는 베이지안 네트워크 기반의 TAN (Tree Augmented Naive Bayes), NB (Naive Bayes), S-Spouses(Sons & Spouses), A-markov (Augmented Markov Blanket)이다. 성과분석 결과 본 연구에서 제안한 MBFS 방법이 정확도, 정밀도, F1점수 측면에서 벤치마킹 방법보다 더 우수한 성과를 나타내었다.

다세대 기술의 속성 기반 고객효용도(Customer utility) 정의 및 측정에 대한 연구: 45nm 및 32nm 로직 반도체 기술 사례 (A Study on Definition and Measurement of Customer Utility based on Attributes of Multiple Generation Technology: Case of 45nm and 32nm Logic Semiconductor)

  • 박창현
    • 한국산학기술학회논문지
    • /
    • 제19권3호
    • /
    • pp.260-266
    • /
    • 2018
  • 고객의 기술 채택에 영향을 미치는 고객효용도의 개념에 대한 이해는 다세대 기술의 확산 및 대체 과정을 이해하는데 중요하다. 본 연구에서는 다세대 기술의 속성 기반 고객효용도의 개념에 대해 정의하고, 고객효용도를 측정할 수 있는 모형을 개발하였다. 문헌리뷰 및 모형화를 바탕으로 다세대 기술의 속성 기반 고객효용도에 대해 정의 및 측정 모형을 제시하였고, 도출한 모형의 정합성을 반도체 산업 사례를 바탕으로 검증하였다. 다세대 기술에서 속성 기반 고객효용도는 세대별로 또는 같은 세대 내에서 시간별 변화를 고려해야하고, 기술적 속성과 경제적 속성에 대해 가중치를 고려한 모든 효용도들의 합으로 정의된다. 또한 속성 기반 고객효용도는 효용도 변환표를 통해 속성들의 값을 효용도로 전환한 후 가중치를 고려한 모든 속성들의 효용도의 합으로 모형화 가능하다. 본 연구를 통해 다세대 기술이 확산 및 대체되는 과정에서 고객의 기술 채택의 근본 동인으로서 영향을 미치는 고객효용도에 대해 이해 가능하고, 고객효용도를 바탕으로 확산 및 대체 경로를 예측하여 기술전략을 수립하는데 유용할 것이다.

중립도 기반 선택적 단어 제거를 통한 유용 리뷰 분류 정확도 향상 방안 (Increasing Accuracy of Classifying Useful Reviews by Removing Neutral Terms)

  • 이민식;이홍주
    • 지능정보연구
    • /
    • 제22권3호
    • /
    • pp.129-142
    • /
    • 2016
  • 전자상거래에서 소비자들의 구매 의사결정에 판매 제품을 이미 구매하여 사용한 고객의 리뷰가 중요한 영향을 미치고 있다. 전자상거래 업체들은 고객들이 제품 리뷰를 남기도록 유도하고 있으며, 구매고객들도 적극적으로 자신의 경험을 공유하고 있다. 한 제품에 대한 고객 리뷰가 너무 많아져서 구매하려는 제품의 모든 리뷰를 읽고 제품의 장단점을 파악하는 것은 무척 힘든 일이 되었다. 전자상거래 업체들과 연구자들은 텍스트 마이닝을 활용하여 리뷰들 중에서 유용한 리뷰들의 속성을 파악하거나 유용한 리뷰와 유용하지 않은 리뷰를 미리 분류하는 노력을 수행하고 있다. 고객들에게 유용한 리뷰를 필터링하여 전달하는 방안이다. 본 연구에서는 문서-단어 매트릭스에서 단어의 제거 기준으로 온라인 고객 리뷰가 유용한 지, 그렇지 않은지를 구분하는 문제에서 단어들이 유용 리뷰 집합과 유용하지 않은 리뷰집합에 중복하여 등장하는 정도를 측정한 중립도를 제시한다. 제시한 중립도를 희소성과 함께 분석에 활용하여 제거할 단어를 선정한 후에 각 분류 알고리즘의 성과를 비교하였다. 최적의 성과를 보이는 중립도를 찾았으며, 희소성과 중립도에 따라 단어를 선택적으로 제거하였다. 실험은 Amazon.com의 'Cellphones & Accessories', 'Movies & TV program', 'Automotive', 'CDs & Vinyl', 'Clothing, Shoes & Jewelry' 제품 분야 고객 리뷰와 사용자들의 리뷰에 대한 평가를 활용하였다. 전체 득표의 수가 4개 이상인 리뷰 중에서 제품 카테고리 별로 유용하다고 판단되는 1,500개의 리뷰와 유용하지 않다고 판단되는 1,500개의 리뷰를 무작위로 추출하여 연구에 사용하였다. 데이터 집합에 따라 정확도 개선 정도가 상이하며, F-measure 기준으로는 두 알고리즘에서 모두 희소성과 중립도에 기반하여 단어를 제거하는 방안이 더 성과가 높았다. 하지만 Information Gain 알고리즘에서는 Recall 기준으로는 5개 제품 카테고리 데이터에서 언제나 희소성만을 기준으로 단어를 제거하는 방안의 성과가 높았으며, SVM에서는 전체 단어를 활용하는 방안이 Precision 기준으로 성과가 더 높았다. 따라서, 활용하는 알고리즘과 분석 목적에 따라서 단어 제거 방안을 고려하는 것이 필요하다.

리뷰어의 속성이 온라인 리뷰 유용성에 미치는 영향에 관한 연구 (A Study on the Effect of Reviewer's Attributes on the Usefulness of Online Review)

  • 야오즈옌;박영기;홍태호
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제29권2호
    • /
    • pp.173-195
    • /
    • 2020
  • Purpose The purpose of this study is to verify the effect of reviewer's attributes on review usefulness while exploring the variables that can moderate the relationship between reviewer's attributes and review usefulness through empirical analysis. Design/methodology/approach To understand the impact of online reviewer profiles on review usefulness and how these impacts change, this study collected more than 30,000 online reviews of restaurants through TripAdvisor.com, that is a representative OTA shares tourism information. We analyze the moderating effects of four variables such as review length, review equivocality, review uncertainty, and review readability. Findings According to the empirical analysis result, this study reveals that the reviewer's profile attribute can significantly improve the review usefulness of the reviewer, and confirmed the moderating effect of the review's attribute(Review length, Equivocality, Uncertainty, Readability).