• 제목/요약/키워드: 리뷰데이터

검색결과 320건 처리시간 0.024초

Delete-Generate: 단어 n-gram의 삭제 및 생성에 기반한 한국어 스타일 변환 (Delete and Generate: Korean style transfer based on deleting and generating word n-grams)

  • 최형준;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.400-403
    • /
    • 2019
  • 스타일 변환(Style Transfer)은 주어진 문장의 긍정이나 부정 같은 속성을 변경하여 다른 속성을 갖는 문장으로 변환하는 과정을 의미한다. 본 연구에서는 스타일 변환을 위한 단어 n-그램 삭제의 기준을 확장하였고, 네이버 영화리뷰 데이터셋을 통해 이를 스타일 변환 이후 원래 문장의 스타일로부터 얼마나 차이가 나게 되었는지를 측정하였다. 측정은 감성분석기를 통해 이루어졌고, 기존 방법에 비해 6.28%p정도 높은 75.13%의 정확도를 보였다.

  • PDF

빅데이터 분석을 활용한 가짜 리뷰 필터링 시스템 ADDAVICHI (Development of Filtering System ADDAVICHI for Fake Reviews using Big Data Analysis)

  • 정다비치;노영주
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.1-8
    • /
    • 2019
  • 최근 '바이럴 마케팅' 으로 인해서 홍보에만 치중하는 블로그 게시물 등으로 인해 소비자의 불신이 깊어졌다. 또한, 이용후기를 거짓으로 작성하거나, 과장 확대하는 등의 마케팅 사업은 신문이나 TV 광고에 비해 가격이 저렴하면서도 효과가 커 각광받는 사업 중 하나로서 광고비 규모는 2016년 기준 '3조 3941억'으로 주요 광고수단으로 자리잡고 있다. 이러한 '바이럴 마케팅'으로부터 정보를 걸러주는 도구가 필요한 인터넷 환경이 되었다. 본 논문에서 제시하는 가짜 리뷰 필터링 어플리케이션 ADDAVICHI는 사용자가 '이벤트', '맛집' 등의 컨텐츠를 검색하면 블로그 키워등, 총 검색수, 신뢰도, 만족도 등을 추출하고 분석하여 제시한다. 신뢰도는 블로그에 있는 광고게시물 수와, 전체 게시물 수를 보여주고, 만족도는 신뢰도에서 걸러진 청정 게시물을 긍정 게시물과 부정게시물로 나눠서 보여준다. 마지막으로 키워드는 긍정 게시물에서 나온 리뷰 상위 세 단어 리스트를 보여준다. 이러한 방법으로 사용자가 광고 글로부터 벗어나서 정보를 해석할 수 있도록 지원한다.

언택트 시대 라이브 커머스 이용 활성화 영향요인 고찰: 다차원적 상호작용성, 현장감, 리뷰 신뢰도를 중심으로 (Investigating the Factors Influencing the Use of Live Commerce in the Un-tact Era: Focusing on Multidimensional Interactivity, Presence, and Review Credibility)

  • 이애리
    • 지식경영연구
    • /
    • 제22권1호
    • /
    • pp.269-286
    • /
    • 2021
  • 최근 코로나19 여파로 언택트 및 온택트 소비 문화가 확산되면서, 커머스 및 유통 산업에서는 실시간 스트리밍 방송 형태로 고객들과 소통하며 쇼핑이 이뤄지는 '라이브 커머스'가 부상하고 있다. 라이브 커머스는 온라인 쇼핑의 편의성을 누리는 동시에 마치 오프라인 매장에서 직접 구매하듯이 방송진행자와 실시간 소통하며 언택트 쇼핑을 보다 현실감 있게 즐길 수 있는 환경을 제공하여 앞으로 그 이용이 더욱 확대될 것으로 예상된다. 본 연구에서는 라이브 커머스의 특징을 기반으로 라이브 커머스를 통한 구매의도 증가에 영향을 미치는 주요 요인을 도출하고 그 영향력을 검증하였다. 특히 본 연구에서는 라이브 커머스의 특징으로 강력한 상호작용성, 리얼한 현장감, 상품에 대한 신뢰도 높은 상세한 리뷰 제공에 초점을 두고 이들 요인들을 다차원적으로 고찰하였다. 본 연구는 라이브 커머스 실 사용자를 대상으로 데이터를 수집하여 라이브 커머스의 이용 활성화 요인을 실증적으로 분석함으로써, 언택트 시대 새롭게 변화된 커머스 환경에서의 지식경영을 위한 시사점을 제공할 수 있을 것이다.

머신러닝과 감성분석을 활용한 고객 리뷰 기반 항공 서비스 품질 평가 (Airline Service Quality Evaluation Based on Customer Review Using Machine Learning Approach and Sentiment Analysis)

  • 전우진;이예빈;금영정
    • 한국전자거래학회지
    • /
    • 제26권4호
    • /
    • pp.15-36
    • /
    • 2021
  • 국제 항공 시장이 꾸준히 성장함에 따라 항공업계의 경쟁이 더욱 심화되고 있다. 경쟁 우위의 원천을 얻기 위해 서비스의 품질 평가는 필수적이며, 이에 다양한 연구에서 고객 리뷰를 바탕으로 서비스 품질을 측정하는 시도를 지속해 왔다. 그러나 고객 리뷰 데이터를 기반으로 기대와 지각 수준의 차이를 파악하고 전략적 방향을 제시하는 연구는 미흡한 실정이다. 본 연구에서는 항공사 서비스를 대상으로 차원별 중요도를 머신러닝을 통해 측정하고, 차원별 지각 수준을 감성분석을 통해 분석한다. 차원별 중요도와 지각 수준의 결과를 활용하여 항공사별 서비스의 성과를 측정하기 위한 전략 매트릭스를 제시하고, 이를 통해 각 항공사의 품질 분석을 수행한다. 본 연구는 항공사의 고객만족을 결정하는 중요한 요인을 파악하는 동시에, 각 항공사의 현재 서비스 수준을 파악하는 틀을 제시함으로써 서비스 품질 평가의 중요한 도구로 활용될 수 있다.

Improvement of recommendation system using attribute-based opinion mining of online customer reviews

  • Misun Lee;Hyunchul Ahn
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권12호
    • /
    • pp.259-266
    • /
    • 2023
  • 본 논문에서는 속성기반 오피니언 마이닝(ABOM)을 적용한 협업 필터링의 정확도 성능을 개선할 수 있는 알고리즘을 제안한다. 실험을 위해 국내 스마트폰 사용자의 스마트폰 앱에 대한 총 1,227건의 온라인 소비자 리뷰 데이터가 분석에 사용되었다. KKMA(꼬꼬마)분석기를 이용하여 형태소 분석 및 KOSAC를 사용하여 감성어 분석 후 LDA 토픽 모델링을 사용하여 속성 추출한 가중치 값을 부여한 리뷰별로 토픽 모델링 결과를 이용하여 협업필터링의 평점과 감성스코어의 평점을 합산한 평균값 정확도 오차를 계산한 통계모형 성능 평가인 MAE, MAPE, RMSE를 사용하였다. 실험을 통해 추천 알고리즘 중 전통적인 협업필터링과 LDA 속성 추출과 감성분석을 결합한 속성기반 오피니언 마이닝(Aspect-Based Opinion Mining, ABOM) 기법을 결합하여 온라인 고객의 앱 평점(APP_Score) 대한 정확도를 예측하였다. 분석 결과 전통적인 협업필터링을 구현한 평점의 정확도 보다 속성기반 오피니언 마이닝 CF를 적용한 평점의 예측 정확도가 더 우수한 것으로 나타났다.

SNS 리뷰데이터의 활용 : 저가항공사와 대형항공사를 중심으로 (Utilization of SNS Review Data for a Comparison between Low Cost Carrier and Full Service Carrier)

  • 우미나
    • 한국IT서비스학회지
    • /
    • 제17권3호
    • /
    • pp.1-16
    • /
    • 2018
  • There exist a number of studies pertaining to the determinants of customer satisfaction between low-cost and full-service carriers in the airline industry. Most studies measured service quality using SERVQUAL based on a survey method. This study offers a new perspective by employing a big data analytic approach using SNS data, which reflects the immediate response of customers as well as trends in real time. This study chose eight factors from TripAdvisor's customer review site as determinants of customer satisfaction and compared the differences between low-cost and full-service airlines. The factors analyzed were seat comfort, customer service, cleanliness, food and beverage, legroom, entertainment, value for money, and check-in and boarding. Additionally, ratings from domestic and foreign customers were compared. The findings show that customer service and value for money are significant factors in satisfaction with low-cost airlines while all variables except legroom and entertainment are significant for full-service airlines. The results show that SNS-based data and analysis of big data are important for improving decision-making effectiveness and increasing customer satisfaction in the airline industry.

IOCP 서버 모델을 이용한 세미나 보조시스템 (A Seminar Assistant System using IOCP Server Model)

  • 안현주;허다정;박동규;어윤
    • 한국정보통신학회논문지
    • /
    • 제13권4호
    • /
    • pp.821-827
    • /
    • 2009
  • 웹 2.0의 발전과 함께 같이 참여와 공유를 통한 지식 기반 시스템은 오늘날 그 중요성이 더해지고 있다. 본 논문에서는 여러 대중을 상대로 이루어진 세미나 내용을 데이터베이스를 통하여 체계적으로 관리하고 이를 지식 공유시스템으로 발전시키는 세미나 보조 시스템에 관한 연구와 구현 결과를 다룬다. 이를 위하여 세미나 데이터베이스에 세미나 음성과 프레젠테이션 파일로 녹화된 내용을 저장하고, 추후에 세미나 수강자가 리뷰시스템을 통하여 수강할 수 있도록 제작하였다. 시스템을 위한 데이터 베이스는 마이크로소프트사의 MS SQL, 서버 측 네트워크를 위한 소켓은 소켓 모델 중에서 확장성이 뛰어난 IOCP 모델을 사용하였다. 강연자가 강연을 위하여 녹화하게 될 프리젠터 소프트웨어는 DirectShow와 WPF(Windows Presentation Foundation) 라이브러리를 사용하였으며, 사용자가 이용하는 리뷰시스템은 WPF와 C# 언어를 사용하여 개발하였다.

연관성 모델에 기반한 오피년마이닝 시스템의 설계 및 구현 (Design and Implementation of Opinion Mining System based on Association Model)

  • 김근형
    • 한국정보통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.133-140
    • /
    • 2011
  • 특정 제품이나 서비스에 대한 네티즌의 의견들은 고객들의 구매 행위에서의 참고대상일 뿐만 아니라 기업 입장에서도 마케팅이나 경영전략을 수립하기 위한 중요한 자료가 될 수 있기 때문에 온라인 고객리뷰를 분석하는 것은 매우 중요하다. 본 논문에서는 비정형(unformatted) 데이터형인 자연어(natural language) 형태로 웹상에 게시된 고객 의견들을 분석할 수 있는 새로운 오피년마이닝 기법을 제안한다. 기존 데이터마이닝 기법 중의 하나인 연관규칙탐사 기법을 수정하여 오피년마이닝 과정에 보다 효율적이고 효과적으로 적용하기 위한 방안을 고찰하고 이를 기반으로 실제 시스템을 설계하고 구현하였다.

CNN-LSTM 모델 기반의 감성분석을 이용한 상품기획 모델 (Product Planning using Sentiment Analysis Technique Based on CNN-LSTM Model)

  • 김도연;정진영;박원철;박구락
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.427-428
    • /
    • 2021
  • 정보통신기술의 발달로 전자상거래의 증가와 소비자들의 제품에 대한 경험과 지식의 공유가 활발하게 진행됨에 따라 소비자는 제품을 구매하기 위한 자료수집, 활용을 진행하고 있다. 따라서 기업은 다양한 기능들을 반영한 제품이 치열하게 경쟁하고 있는 현 시장에서 우위를 점하고자 소비자 리뷰를 분석하여 소비자의 정확한 소비자의 요구사항을 분석하여 제품기획 프로세스에 반영하고자 텍스트마이닝(Text Mining) 기술과 딥러닝(Deep Learning) 기술을 통한 연구가 이루어지고 있다. 본 논문의 기초자료가 되는 데이터셋은 포털사이트의 구매사이트와 오픈마켓 사이트의 소비자 리뷰를 웹크롤링하고 자연어처리하여 진행한다. 감성분석은 딥러닝기술 중 CNN(Convolutional Neural Network), LSTM(Long Short Term Memory) 조합의 모델을 구현한다. 이는 딥러닝을 이용한 제품기획 프로세스로 소비자 요구사항 반영, 경제적인 측면, 제품기획 시간단축 등 긍정적인 영향을 미칠 것으로 기대한다.

  • PDF

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.