• Title/Summary/Keyword: 리뷰 데이터

Search Result 323, Processing Time 0.05 seconds

Efficient Keyword Extraction from Social Big Data Based on Cohesion Scoring

  • Kim, Hyeon Gyu
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권10호
    • /
    • pp.87-94
    • /
    • 2020
  • 블로그나 SNS 피드 등의 소셜 리뷰는 고객 관점의 의견이나 불만 사항을 반영한 키워드를 추출하기 위한 목적으로 광범위하게 활용되고 있으며, 최근 트렌드를 반영한 신조어나 고유명사를 포함하는 경우가 많다. 이들 단어는 사전에 포함되어 있지 않아 기존 형태소 분석기가 잘 인지하지 못하는 경우가 많으며, 동시에 상당한 처리 시간이 소요되어 키워드 분석 결과를 실시간으로 제공하는데 어려움이 있다. 본 논문에서는 응집도 점수 개념을 기반으로 소셜 리뷰로부터 키워드를 효율적으로 추출하기 위한 방법을 제안한다. 응집도 점수는 단어의 빈도수를 기반으로 계산되어 별도의 사전이 필요없다는 장점이 있으나, 띄어쓰기가 되지 않은 입력 데이터에 대해서는 정확도가 떨어질 수 있다. 이와 관련하여 본 논문에서는 단어 트리 구조를 이용하여 기존의 응집도 점수 계산 방법을 개선한 알고리즘을 제시한다. 또한 실험을 통해 제안하는 방법이 15.5%의 오류율을 보이는 동시에, 1,000개의 리뷰를 처리하는데 0.008초 정도 소요됨을 확인하였다.

온라인 고객 리뷰를 활용한 제품 효과 분석 기법 (A Technique for Product Effect Analysis Using Online Customer Reviews)

  • 임영서;이소영;이지나;류보경;김현희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권9호
    • /
    • pp.259-266
    • /
    • 2020
  • 본 논문에서는 온라인 고객 리뷰를 활용하여 건강 보조제, 화장품 등 현재의 상태를 개선하기 위해 사용되는 제품을 대상으로 그 효과를 알아보기 위한 제품 효과 분석 기법을 제시하였다. 제안하는 제품 효과 분석 기법은 블로그 포스팅에 존재하는 광고를 자동 제거하고, 효과 분석을 위한 증상, 효과, 증가, 및 감소로 이루어진 단어 사전을 구축하며, 제안하는 알고리즘을 통해 제품의 효과를 측정한다. 제품 효과 분석 기법을 검증하기 위해 정답 레이블이 존재하는 네이버 쇼핑 리뷰 데이터셋을 대상으로 성능평가를 실시하였으며, 전통적인 긍부정 사전과 RNN 모델과 성능을 비교하였다. 실험 결과, 본 논문에서 제안하는 효과 분석 기법이 다른 두가지 방법보다 정확도가 뛰어남을 보여주었다. 또한, 아토피 피부염, 여드름 치료제에 제안하는 기법을 적용하여 소셜 미디어에 나타난 효과적인 치료법을 소개하였다. 본 논문에서 제시한 알고리즘은 블로그를 포함한 여러 매체의 리뷰로부터 제품의 효과를 점수화할 수 있으므로 다양한 제품군과 소셜 미디어에 적용될 수 있을 것으로 보인다.

온라인 구전과 마케팅 성과의 다이나믹스 연구 : 모바일 게임 앱 리뷰를 중심으로 (The Dynamics of Online word-of-mouth and Marketing Performance : Exploring Mobile Game Application Reviews)

  • 김인규;차성수
    • 한국콘텐츠학회논문지
    • /
    • 제20권12호
    • /
    • pp.36-48
    • /
    • 2020
  • 본 연구는 모바일앱 온라인 리뷰의 구전내용의 다이나믹스(Dynamics)를 확인하기 위해 내용분석을 실시하였다. 이를 통해 모바일앱 구전 단어 간의 관계를 알아보고 모바일앱 특성에 따라 분류하여 비교 조사하였다. 분석대상은 게임 앱 카테고리 내 10개의 앱으로 선정하였다. 수집된 해당 모바일앱 리뷰는 꾸준한 인기를 가진 Trend형 게임앱과 짧은 인기를 보인 Fad형 게임앱, 무료앱, 유료앱으로 분류하였다. 이후 형태소 분석 등 전처리 과정을 거친 데이터를 기반으로 텍스트마이닝과 Word2Vec 분석을 시도하였다. 연구결과, 앱 리뷰의 양은 순위변동과 상관관계에 있는 것으로 나타났다. 그러나 초기 10일간 변화는 상관관계가 낮거나 없는 것으로 나타났다. 이는 출시 직후 앱개발사의 단기 마케팅활동이 순위를 형성하는데 영향을 주기 때문으로 판단된다. 꾸준한 인기를 얻은 Trend형 게임앱과 짧은 인기를 얻은 Fad형 게임앱 간 리뷰내용의 다이나믹스(Dynamics)도 확인할 수 있었다.

E-커머스 사용자의 평점과 리뷰 유용성이 상품 추천 시스템의 성능 향상에 미치는 영향 분석 (Analysis of the Effects of E-commerce User Ratings and Review Helfulness on Performance Improvement of Product Recommender System)

  • ;이병현;최일영;정재호;김재경
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.311-328
    • /
    • 2022
  • 정보통신기술 발달로 스마트폰이 보급되면서, 온라인 쇼핑몰 서비스는 컴퓨터가 아닌 모바일로도 사용이 가능해졌다. 그로 인해 온라인 쇼핑몰 서비스를 이용하는 사용자는 급격히 증가하게 되고, 거래되는 제품의 종류 또한 방대해지고 있다. 따라서 기업은 이익을 최대화하기 위해서는 사용자가 관심을 가질만한 정보를 제공해주는 것이 중요하다. 이를 위해 사용자의 과거 행동 데이터나 행동 구매 기록을 기반으로 사용자에게 필요한 정보 또는 제품을 제시하는 것을 추천 시스템이라 한다. 현재 추천 서비스를 제공하는 대표적인 해외 기업으로는 Netflix, Amazon, YouTube 등이 있다. 최근 이러한 전자상거래 사이트에서는 사용자가 해당 제품에 대한 리뷰가 유용한지에 대해 투표할 수 있는 기능을 제공하고 있다. 이를 통해, 사용자는 유용하다고 판단되는 제품에 대한 리뷰와 평점을 참고하여 구매 의사결정을 내린다. 따라서 본 연구에서는 제품에 대한 평점과 리뷰의 유용성 정보 간의 상관관계를 파악하고, 리뷰의 유용성 정보를 추천 시스템에 반영하여 추천 성능을 확인하고자 한다. 또한 대부분의 사용자들은 만족한 제품에만 평점을 부여하는 경향이 있고 제품에 대한 평점이 높을수록 구매 의도가 높아지는 경향이 있다. 따라서 전통적인 협업 필터링 기법에 모든 평점을 반영한 결과와 4점과 5점 평점만을 반영한 추천 성능 결과를 비교하고자 한다. 이를 위해 본 연구에서는 Amazon에서 수집한 전자 제품 데이터를 사용하였으며, 실험 결과는 평점과 리뷰 유용성 정보 간 상관관계가 있는 것으로 확인되었다. 또한 모든 평점과 4점과 5점 평점만을 추천 시스템에 반영하여 추천 성능을 비교한 결과, 4점과 5점 평점만을 추천 시스템에 반영한 결과의 추천 성능이 더 높게 나타났다. 그리고 리뷰 유용성 정보를 추천 시스템에 반영한 결과는 리뷰가 유용할수록 추천 성능은 높게 나타나는 것으로 확인하였다. 따라서 이러한 실험 결과는 향후 개인화 추천 서비스의 성능 향상에 기여하고, 전자상거래 사이트에 시사점을 제공할 수 있을 것으로 본다.

온라인 리뷰의 감성과 독해 용이성이 리뷰 유용성에 미치는 영향: 가산형 리뷰 유용성 정보 활용 (The Effects of Sentiment and Readability on Useful Votes for Customer Reviews with Count Type Review Usefulness Index)

  • 루스 안젤리 크루즈;이홍주
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.43-61
    • /
    • 2016
  • 온라인 쇼핑몰의 상품에 대한 고객 리뷰는 구매자들의 구매 의사결정에 영향을 미치고 있으며 중요한 구전효과의 원천과 의사결정의 정보 원천의 역할을 하고 있다. 한 제품에 대한 리뷰가 무척 많기에 온라인 쇼핑몰들은 고객 리뷰 평가 방안을 도입하였고, 이를 통해 고객들에게 유용하리라고 판단되는 리뷰들을 걸러서 보여주거나 강조할 수 있게 되었다. 리뷰 평가 방안은 해당 리뷰가 도움이 되었는지 혹은 도움이 되지 않았는 지를 리뷰를 읽은 고객이 평가하게 하는 방안이다. Amazon.com은 고객 평가를 바탕으로 총 투표 수 중에서 유용하다는 투표 수의 비율을 리뷰 유용성 지표로 삼고 있으며, Yelp.com은 유용하다는 투표 수 자체를 유용성 지표로 삼고 있다. 본 연구는 고객 리뷰의 감성과 독해 용이성이 리뷰의 유용성에 미치는 영향을 파악하고자 한다. Amazon.com의 고객 리뷰 자료를 활용하여 비율형 유용성 지표를 종속변수로 하는 유사한 연구들이 수행되어 왔다. 본 연구에서는 Yelp.com의 리뷰 자료를 활용하여 가산형 리뷰 유용성 지표인 경우에도 동일한 효과가 존재하는지를 검토하고자 한다. Yelp.com의 음료와 음식 카테고리에 해당하는 업종에 대한 리뷰를 자료로 활용하였으며, 점포의 명성과 인기도 데이터를 파악할 수 있는 170,294개의 리뷰를 분석에 활용하였다. 분석결과는 리뷰의 긍정 정도는 유용 투표수를 늘리는데 음의 영향을 미쳤다. 평가가 긍정적인 리뷰에서는 음의 영향관계가 유의 하였으나, 평가가 부정적인 리뷰에서는 리뷰의 긍정 정도가 유용 투표 수에 미치는 영향은 유의하지 않았다. 독해 용이성은 리뷰가 읽기 어려울 수록 높은 값을 갖으며, 독해의 어려운 정도는 유용 투표수 획득에 음의 영향을 미쳤다. 독해 용이성은 긍정 리뷰, 부정 리뷰 관계없이 모두 음의 영향을 미치는 것으로 분석되었다. 이 결과는 유용 투표수가 0인 리뷰를 포함하여 영과잉 음이항 회귀분석을 수행한 경우와 유용 투표수가 0인 리뷰를 제외하고 음이항 회귀분석을 수행한 경우 모두 동일하게 파악되었다.

단어 임베딩 및 벡터 유사도 기반 게임 리뷰 자동 분류 시스템 개발 (Development of An Automatic Classification System for Game Reviews Based on Word Embedding and Vector Similarity)

  • 양유정;이보현;김진실;이기용
    • 한국전자거래학회지
    • /
    • 제24권2호
    • /
    • pp.1-14
    • /
    • 2019
  • 게임은 소프트웨어 특성상 출시 후 사용자들의 반응을 빠르게 파악하여 개선하는 것이 중요하다. 하지만 구글 플레이 앱 스토어 등 사용자들이 게임을 다운로드하고 리뷰를 올릴 수 있는 대부분의 사이트들은 게임 리뷰에 대한 매우 제한적이고 모호한 분류 기능만을 제공한다. 따라서 본 논문에서는 사용자들이 사이트에 올린 게임 리뷰를 보다 명확하고 운영에 유용한 주제들로 자동 분류하는 시스템을 개발한다. 본 논문에서 개발한 시스템은 리뷰에 포함된 단어들을 대표적인 단어 임베딩 모델인 word2vec을 사용하여 벡터들로 변환하고, 이 벡터들과 각 주제 간 유사도를 측정하여 해당 리뷰를 관련된 주제로 분류한다. 특히 분류 성능에 직접적인 영향을 미치는 벡터 간 유사도 측정 방법을 선택하기 위해 본 연구에서는 대표적인 벡터 간 유사도 측정 방법인 유클리디안 유사도, 코사인 유사도, 확장된 자카드 유사도의 성능을 실제 데이터를 사용하여 비교하였다. 또한 어떤 리뷰가 둘 이상의 주제에 해당하는 경우를 위해 임계값에 기반한 다중 분류 방법을 사용하였다. 구글 플레이 앱스토어의 실제 데이터를 사용한 실험 결과 본 시스템은 95%까지의 정확도를 보임을 확인하였다.

다크웹 오프체인 데이터를 이용한 다계층 비트코인 클러스터링 기법 (Multi-Layer Bitcoin Clustering through Off-Chain Data of Darkweb)

  • 이진희;김민재;허준범
    • 정보보호학회논문지
    • /
    • 제31권4호
    • /
    • pp.715-729
    • /
    • 2021
  • 비트코인은 분산되고 투명하며 강력한 암호화를 통해 데이터 수정이 불가능한 암호화폐 중 하나이다. 그러나 익명성으로 인해 다크웹 등에서 불법 거래를 위한 지불 수단으로 사용되기도 한다. 이 문제를 해결하기 위해 비트코인 트랜잭션의 특성을 기반으로 하는 클러스터링 기법이 제안되었으나 기존 휴리스틱 기법에서는 여전히 클러스터링 되지 못하고 있는 경우가 존재한다. 이러한 거짓 부정을 줄이기 위해 비트코인 트랜잭션의 특성뿐만 아니라 오프체인 데이터를 이용한 휴리스틱을 제안한다. 우리는 오프체인 데이터를 수집하고 활용하기 위해 Silk Road 4의 리뷰 데이터를 분석하여 리뷰 데이터의 31.68%가 실제 비트코인 트랜잭션으로 매치시킬 수 있음을 발견했고 수집된 데이터에 대해 91.7%까지 거짓 부정을 줄일 수 있었다.

온라인 리뷰 클러스터를 이용한 추천 시스템 성능 향상 (Enhancing the Performance of Recommender Systems Using Online Review Clusters)

  • 노기섭;오하영;이재훈
    • 정보과학회 논문지
    • /
    • 제45권2호
    • /
    • pp.126-133
    • /
    • 2018
  • 추천 시스템은 과도한 정보제공으로 인한 정보 수용자의 결정 제약을 극복하고, 정보 제공자에게는 이윤과 평판을 최대화 시킬 수 있는 해결책으로 등장하였다. 추천 시스템은 다양한 접근법으로 구현이 가능하지만, 추천 대상 객체의 리뷰에서 생성되는 다양한 소셜 정보를 적절히 활용하는 방안은 연구되지 못하였다. 본 논문에서는 기존의 접근법과는 다르게 온라인 리뷰에서 생성되는 클러스터 정보를 이용하여 추천 시스템의 성능을 향상시키는 방식을 제안하였다. 제안하는 방식을 구현하고 실제 데이터를 활용하여 실험한 결과 기존의 방식들보다 성능이 월등히 향상됨을 확인하였다.

Artificial Neural Network를 이용한 논문 저자 식별 (Author Identification Using Artificial Neural Network)

  • 정지수;윤지원
    • 정보보호학회논문지
    • /
    • 제26권5호
    • /
    • pp.1191-1199
    • /
    • 2016
  • 논문 심사는 공정성을 확보하기 위하여 누가, 누구의 논문을 리뷰하는지 알 수 없도록 블라인드 리뷰를 시행한다. 하지만 일반적으로 논문은 저자의 연구 분야뿐만 아니라 저자가 자주 사용하는 단어, 어휘 등으로 이루어지기 때문에 저자의 정보를 숨기더라도 논문의 내용을 통해 저자를 파악할 수 있다. 본 논문에서는 저자 20명의 논문 315편을 수집하고 텍스트를 추출하여 데이터 정제 작업을 수행하였다. 그리고 정제 작업을 통해 추출된 단어를 추출해내어 인공신경망(artificial neural network)을 통한 분류를 진행함으로써 블라인드 리뷰(blind review)의 우회 가능성을 보였다. 실험을 통해 기존 블라인드 리뷰 시스템의 한계점을 보임으로써 향후 더욱 안전한 블라인드 리뷰 시스템의 필요성을 강조하였다.

사용자 리뷰에서 ChatGPT를 활용한 새로운 고객의 니즈 도출 방법 (A Method for Identifying New Customer Needs from User Reviews Using ChatGPT)

  • 박재형;김능회
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권4호
    • /
    • pp.189-194
    • /
    • 2024
  • 고객의 니즈를 파악하고 그에 맞게 제품과 서비스를 개선하는 것은 현대 비즈니스에서 생존과 성장을 위한 필수 과제이다. 이는 고객 만족도의 증대와 제품의 경쟁력 확보에 직결되는 문제이기에 이를 성공적으로 이행하는 것이 중요하다. 그러나 사용자 리뷰는 비정형 데이터의 특성을 갖고 있기에 리뷰 분석에 다양한 단계의 처리가 요구되며, 리뷰를 분석하고 알맞은 솔루션을 적용하기 위해서는 전문적인 지식과 기술이 필요하다는 등의 문제로 인해 소상공인들은 고객의 니즈를 빠르게 수용하고 반영하는 것이 어려운 상황에 처해있다. 따라서 본 논문은 ChatGPT를 활용하여 사용자 리뷰에서 중요 단어 및 새로운 단어를 파악하고 새로운 고객의 니즈를 도출하는 방법을 제안한다.