• 제목/요약/키워드: 리뷰데이터

검색결과 313건 처리시간 0.022초

BERT+ 알고리즘 기반 약물 리뷰를 활용한 약물 이상 반응 탐지 (Detection of Adverse Drug Reactions Using Drug Reviews with BERT+ Algorithm)

  • 허은영;정현정;김현희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.465-472
    • /
    • 2021
  • 본 논문에서는 약물의 시판 후 이상 반응을 모니터링하기 위해 약물 리뷰 데이터로부터 약물 이상 반응을 탐지할 수 있는 방법을 제시하였다. 부정적인 약물 리뷰는 주로 약물 이상 반응을 언급하고 있다는 점을 고려하여 약물 리뷰들을 감성 분석하여 부정 리뷰를 추출하고, 부정 리뷰에 사전 기반 추출과 개체명 인식 기법을 적용하여 약물 이상 반응을 탐지하였다. 제안하는 BERT+ 알고리즘으로 부정 리뷰를 판별한 다음, MedDRA 표준 의학 용어 사전을 활용해 이상 반응 단어를 찾고, 개체명 인식 기법을 사용하여 구로 표현된 이상 반응 표현을 탐지하였다. 실험을 위해 비스테로이드성 소염진통제 세 종류의 약물 리뷰를 약물 리뷰 사이트로부터 수집하여 테스트하였으며, 실험 결과는 약물 리뷰를 통한 약물 이상 반응 탐지가 현재의 약물 감시 체계의 한계점을 보완할 수 있음을 보여준다.

금융 모바일 앱 리뷰 데이터의 UX 분석을 위한 시스템 개발 및 검증 (Development of a System for UX Analysis of Financial Mobile App Review Data and Its Verification)

  • 현지예;손영민;박재완
    • 문화기술의 융합
    • /
    • 제9권1호
    • /
    • pp.755-761
    • /
    • 2023
  • 디지털 전환이 가속화되면서 금융 서비스 또한 비대면 서비스의 비중이 높아지고 있다. 최근 모바일 서비스에서 경쟁력을 확보하기 위해 사용자 경험이 대두되고, 사용자 경험을 향상하기 위한 분석 기법이 출현하고 있다. 정량적 평가에 사용되는 데이터 중 하나인 사용자 리뷰 데이터는 불필요한 정보가 다량 포함되어 있어 개선 방향을 도출해내는 데 많은 시간과 에너지가 소요된다. 따라서 본 연구에서는 코사인 유사도 알고리듬을 활용해 사용자 경험 계층을 기준으로 UX 분석 시스템을 개발하고 검증을 위해 국민은행, 우리은행, 카카오뱅크, 토스의 사용자 리뷰 데이터를 분석하는 것을 목표로 한다. 본 연구는 개발된 UX 분석 시스템이 사용자 리뷰 데이터의 분석을 통해 효과적으로 UX 분석이 가능한 시스템이라는 것을 증명하였다. 본 연구의 시스템은 빠르게 고객의 피드백을 반영해야 하는 애자일 조직에서 사용자 경험 계층별 개선 방안을 파악하는 데 용이하게 사용될 수 있을 것으로 기대된다.

온라인 리뷰 데이터의 오피니언마이닝을 통한 콘텐츠 만족도 분석 시스템 설계 (A Design of Satisfaction Analysis System For Content Using Opinion Mining of Online Review Data)

  • 김문지;송은정;김윤희
    • 인터넷정보학회논문지
    • /
    • 제17권3호
    • /
    • pp.107-113
    • /
    • 2016
  • 소셜 네트워크 서비스(SNS)의 활성화로 웹상에는 방대한 양의 온라인 리뷰들이 생산되고 있으며, 이러한 온라인 리뷰들은 다양한 콘텐츠들에 대한 의견 데이터로써 콘텐츠 이용자와 제공자들에게 가치 있는 정보로 활용되고 있다. 한편, 온라인 리뷰에 대한 중요도가 높아짐에 따라 온라인 리뷰를 분석하여 글쓴이의 의견이나 평가, 태도, 감정 등을 추출해 내는 오피니언마이닝에 대한 연구가 활발하게 진행되고 있다. 그러나 기존의 오피니언마이닝 연구들에서는 리뷰의 의견 분류에만 초점을 맞추어 감성 분석 기법을 설계하였기 때문에 리뷰 속에 내포되어있는 작성자의 자세한 만족도까지는 알 수 없었으며, 감성 분석 기법이 특정 콘텐츠에 한정되어있어 도메인이 같지 않은 다른 콘텐츠들에는 적용될 수 없다는 문제점이 있었다. 이에 본 연구에서는 기존 의견 분류 방법에 강도를 주어 좀 더 세밀한 감성 분석을 수행하고, 이 결과를 통계적 척도에 적용하여 리뷰에 내포되어 있는 작성자의 자세한 만족도를 도출 할 수 있는 감성 분석 기법을 제안한다, 그리고 제안한 기법을 바탕으로 도메인에 상관없이 다양한 콘텐츠에 적용되어 콘텐츠의 만족도를 분석 할 수 있는 시스템을 설계하였다. 또한 방대한 양의 리뷰 데이터들을 빠르고 효율적으로 처리하기 위해 빅 데이터 처리도구인 하둡을 기반으로 시스템을 구축하였다. 본 시스템을 통해 콘텐츠 이용자는 보다 효율적인 의사결정을, 제공자들은 빠른 반응분석을 할 수 있어 본 시스템은 사용자의 의견을 필요로 하는 다양한 분야에 매우 실용적으로 활용 될 것으로 기대한다.

텍스트마이닝과 네트워크 분석을 적용한 VR 게임 사용자의 관심 요소 연구 - STEAM 사용자 리뷰 데이터를 중심으로 - (A study on the Elements of Interest for VR Game Users Using Text Mining and Text Network Analysis - Focused on STEAM User Review Data -)

  • 위민영;나지영;박영일
    • 한국게임학회 논문지
    • /
    • 제18권6호
    • /
    • pp.69-82
    • /
    • 2018
  • 최근 들어 VR 산업의 성장을 위한 양질의 VR 콘텐츠에 대한 필요성이 꾸준히 제기되고 있다. 이에 본 연구는 VR 콘텐츠 중에서 가장 큰 주목을 받고 있는 VR 게임의 사용자의 관심요소에 대해 연구하였다. 연구 수행을 위해 스팀(STEAM)의 사용자 리뷰 데이터를 활용하였고 리뷰 데이터에 텍스트마이닝과 네트워크 분석을 적용한 결과 VR 게임 사용자의 관심요소는 '현존감', '1인칭 시점 게임', '청각적 요소', '상호작용' 으로 확인되었다. 본 연구는 양질의 VR 게임 개발을 위한 사용자 관점의 연구를 수행하고 사용자 관점의 연구를 리뷰을 통해 시도한 초기 연구라는 것에 대해 그 의의가 있다.

앙상블 기법을 활용한 온라인 음식 상품 리뷰 감성 분석 (Sentiment analysis of online food product review using ensemble technique)

  • 김한민;박경보
    • 디지털융복합연구
    • /
    • 제17권4호
    • /
    • pp.115-122
    • /
    • 2019
  • 온라인 마켓에서 소비자는 다양한 상품을 접하고 이에 대한 의견을 자유롭게 기술한다. 소비자의 상품 리뷰가 다른 소비자와 온라인 마켓의 성공에 큰 영향을 주는 만큼 온라인 마켓은 판매 상품에 대한 소비자의 감성을 정확하게 분석할 필요가 있다. 데이터 분석 기법 중 하나인 텍스트 마이닝은 상품에 대한 소비자 리뷰를 분석하여 상품을 효율적으로 관리할 수 있게 해준다. 선행 연구들은 데이터 도메인과 사이즈에 따라 분석 결과의 정확도가 다르게 나타남에도 불구하고 특정 도메인과 2만개 미만의 데이터를 분석해왔다. 또한, 분석의 정확도를 향상 시킬 수 있는 추가 요인에 대한 연구는 거의 수행하지 않았다. 본 연구는 앙상블 기법을 활용하여 기존 연구에서 주로 다루지 않은 음식 상품 도메인의 72,530개 리뷰 데이터를 분석하였다. 또한, 분석 정확도 향상과 관련하여 요약 리뷰의 영향력을 살펴보았다. 연구 결과, 본 연구는 기존 연구와 다르게 부스팅 앙상블 기법이 가장 높은 분석 정확도를 보인다는 사실을 발견하였다. 또한, 요약 리뷰는 분석의 정확도 향상에 기여하는 것으로 나타났다.

밀키트 제품 리뷰 데이터를 이용한 텍스트 분석 사례 연구 (A Case Study on Text Analysis Using Meal Kit Product Review Data)

  • 최혜선;연규필
    • 한국콘텐츠학회논문지
    • /
    • 제22권5호
    • /
    • pp.1-15
    • /
    • 2022
  • 본 연구에서는 밀키트 제품 평가에 영향을 미치는 요인을 파악하기 위하여 밀키트 제품 리뷰 데이터에 대한 텍스트 분석을 수행하였다. 분석에 사용된 자료는 네이버 쇼핑 사이트에서 판매되고 있는 밀키트 제품에 대한 리뷰 334,498건을 스크래핑하여 수집하였다. 텍스트 자료에 대한 전처리 과정을 거쳐 제품 리뷰에 빈번히 등장하는 단어를 추출한 후 워드클라우드 및 감성분석을 수행하였다. 감성분석시 제품 리뷰에 대한 긍정 또는 부정의 레이블은 평점을 기준으로 설정하여 반응변수로 활용하였고, 입력변수로는 단어들의 정규화 단어빈도-역문서빈도 (TF-IDF) 값을 구하여 사용하였다. 리뷰의 극성을 판별하는 모형으로는 로지스틱 회귀모형, 서포트 벡터 머신, 랜덤 포레스트 알고리즘을 적용하였으며, 분류 정확도 및 해석가능성을 고려하여 로지스틱 회귀모형을 최종 모형으로 선택한 후 제품 범주별 감성분석 모형으로 사용하였다. 각 제품 범주별로 도출된 로지스틱 회귀모형으로부터 밀키트 제품 구매 후 긍·부정의 감성을 발생시킨 주요 요인들을 밝혀내었다. 결과적으로 텍스트 분석을 통해 밀키트 제품 개발 시 특정 카테고리, 메뉴, 재료에 대한 긍정 요소를 극대화하고 부정적 위험 요소를 제거할 수 있는 기반을 제공할 수 있음을 확인하였다.

사용자 경험과 서비스 평가의 변화에 관한 연구 - 넷플릭스 앱 리뷰 토픽 모델링을 통해 (A study of changes in user experience and service evaluation - Topic modeling of Netflix app reviews)

  • 유선영;노미진;김양석;한무명초
    • 스마트미디어저널
    • /
    • 제12권6호
    • /
    • pp.27-34
    • /
    • 2023
  • 코로나19로 인해 넷플릭스 사용량이 증가하면서 사용자들의 넷플릭스 서비스 경험도 함께 증가하였다. 이에 본 연구는 코로나19 대유행 전후 넷플릭스 사용자 경험과 서비스 변화를 살펴보기 위하여, 넷플릭스 리뷰 데이터를 기반으로 토픽 모델링 분석을 수행하고자 한다. Google Play Scraper 라이브러리를 사용하여 구글 플레이 스토어 내의 넷플릭스 앱 리뷰 데이터를 수집하여, 코로나19 대유행 전후 앱 리뷰 기반의 토픽 모델링을 활용하여 키워드 차이를 살펴보았다. 분석 결과 넷플릭스 앱 기능, 넷플릭스 콘텐츠, 넷플릭스 서비스 이용, 넷플릭스 총평이라는 4가지 토픽으로 나타났다. 사용자 경험이 증가한 코로나19 대유행 이후 사용자들은 더 다양하고 세부적인 키워드를 사용하여 리뷰를 작성하는 경향을 보였다. 본 연구는 넷플릭스 리뷰 데이터를 활용하여 사용자들의 의견을 분석하여 코로나19 대유행 전·후 넷플릭스 서비스의 사용자 경험 변화를 보여주므로, 향후 치열한 OTT 서비스 시장에서의 경쟁력 강화를 위한 가이드 라인으로 활용할 수 있을 것이다.

리뷰 데이터 마이닝을 이용한 하이브리드 추천시스템 개발: Amazon Kindle Store 데이터 분석사례 (Development of Hybrid Recommender System Using Review Data Mining: Kindle Store Data Analysis Case)

  • 장예화;이청용;최일영;김재경
    • 경영정보학연구
    • /
    • 제23권1호
    • /
    • pp.155-172
    • /
    • 2021
  • 최근 온라인 상품 구매의 증가로 인해 사용자의 선호에 맞는 상품을 추천해주는 시스템이 지속적으로 연구되고 있다. 추천 시스템은 사용자들에게 개인화된 상품 추천 서비스를 제공하는 시스템으로 사용자가 상품에 남긴 평점을 이용한 협업 필터링(Collaborative Filtering)이 가장 널리 쓰이는 추천 방법이다. 협업 필터링에서 상품 간의 유사도 계산은 시간이 많이 소요되는데, 특히 리뷰 데이터와 같은 빅데이터를 사용할 경우 더욱 많은 시간을 소요한다. 그래서 본 연구에서는 리뷰 데이터 마이닝을 이용하여 상품 간의 유사도 계산을 빠르게 수행할 수 있으면서 정확도를 높일 있도록 2단계(2-Phase) 방법을 이용한 하이브리드 추천시스템 방식을 제안한다. 이를 위해 온라인 전자책 상거래 상점인 아마존 킨들 스토어(Amazon Kindle Store)의 약 98만 개의 온라인 소비자 평점과 리뷰 데이터를 수집하였다. 실험 결과 본 연구에서 제안한 사용자의 평점과 리뷰를 단계적으로 반영한 하이브리드 추천 방식이 전통적인 추천 방식과 비교하여 추천 시간은 비슷하였으나 높은 정확도를 나타내는 것을 확인하였다. 따라서 제안한 방법을 사용하면 사용자가 선호하는 상품을 빠르고 정확하게 추천함으로써 고객의 만족을 높여서 기업의 매출 증대에 기여할수 있을 것으로 기대된다.

딥러닝 기반 온라인 리뷰의 언어학적 특성을 활용한 추천 시스템 성능 향상에 관한 연구 (A Study on the Enhancing Recommendation Performance Using the Linguistic Factor of Online Review based on Deep Learning Technique)

  • 장동수;이청용;김재경
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.41-63
    • /
    • 2023
  • 전자상거래 시장의 꾸준한 성장으로 인해 추천 시스템의 필요성은 점차 강조되고 있으며, 최근에는 추천 성능의 향상을 목적으로 리뷰 텍스트를 사용하는 연구가 활발히 진행되고 있다. 특히 많은 연구들은 리뷰 텍스트의 감성 점수를 활용하여 제안되고 있는데, 감성 점수만을 사용하는 방법론은 리뷰 텍스트에 존재하는 구체적인 선호도 정보의 활용 측면에 한계를 가지며 이는 결과적으로 성능 향상에 제약으로 작용하게 된다. 이를 개선하기 위해 본 연구는 딥러닝 기반 추천 모델에 온라인 리뷰 내 다양한 언어학적 요소들을 활용하여 고객의 선호도를 정교하게 학습할 수 있는 새로운 추천 방법론을 제안하였다. 이를 위해 먼저 고객과 상품 간 복잡한 상호작용을 고려할 수 있도록 딥러닝 모델을 통해 상호작용 관계를 비선형으로 학습하였다. 그리고 리뷰 텍스트를 효과적으로 활용할 수 있도록 언어학적 요소 중 고객의 구매 의사결정에 중요한 영향을 미치는 인지적 요인, 정서적 요인 그리고 언어 스타일 매칭을 사용하였다. 실험은 Amazon.com에서 수집한 온라인 리뷰 데이터를 사용하여 진행하였고, 실험 결과 제안 모델의 우수함을 검증할 수 있었다. 본 연구는 추천 시스템에서 리뷰 텍스트 내 고객 선호도에 대한 정보를 효과적으로 활용하는 방법론을 제안하여 연구의 이론적 및 방법론 측면에 기여하였다.

영어 리뷰데이터를 이용한 딥러닝 기반 다국어 감성분석 (Deep learning-based Multilingual Sentimental Analysis using English Review Data)

  • 성재경;김영복;김용국
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.9-15
    • /
    • 2019
  • 영어로 된 아마존과 같은 대형 글로벌 온라인 쇼핑몰은 전 세계를 대상으로 영어 또는 판매 해당국가 언어로 서비스를 하고 있다. 온라인 쇼핑몰 이용자 중, 많은 고객은 상품 리뷰평가를 참조하여 상품을 구매하고 있다. 그래서 고객들이 작성한 대량의 리뷰데이터를 이용하여 구매 상품에 대해 긍정과 부정을 판정하는 감성분석을 영어를 중심으로 활발히 연구되고 분석 결과는 고객의 타켓 마케팅에 활용되고 있다. 하지만 이와 같은 영어 중심의 감성분석 시스템을 전 세계의 다양한 언어에 그대로 적용하기는 어렵다. 따라서 본 연구에서는 영어로 된 50만개 이상의 아마존 푸드 상품 리뷰데이터를 학습과 테스트 데이터로 분리하여 딥러닝 기술 기반의 감성분석 시스템을 구현하였다. 먼저 영어 테스트데이터의 3가지 모델에 대한 감성분석 평가 실험을 한 후에, 같은 데이터를 자동번역기로 7개국(한국어, 일본어, 중국어, 베트남어, 불어, 독어, 영어) 언어로 번역 후에 다시 영어로 번역하여 실험 결과를 얻었다. 감성분석 정확성은 영어(94.35%)에 비해 각 7개국 언어의 평균(91.59%)보다 정확도가 2.77% 정도 낮게 나왔으나 번역 성능 수준에서 실용 가능성을 확인하였다.