• 제목/요약/키워드: 리뷰데이터

검색결과 313건 처리시간 0.022초

사용자 리뷰 데이터를 활용한 모바일 어플리케이션 서비스 평가 척도 개선 (Improving evaluation metric of mobile application service with user review data)

  • 이범국;손창호
    • 한국산학기술학회논문지
    • /
    • 제21권1호
    • /
    • pp.380-386
    • /
    • 2020
  • 모바일 어플리케이션 시장은 스마트폰의 등장 이후로 지난 10여 년의 성장을 통해 전자기기 소프트웨어 시장에서 가장 큰 시장을 보유하게 되었다. 모바일 어플리케이션 시장의 경쟁이 심화됨에 따라, 사용자의 소비와 사용 양태에 어플리케이션 평가가 끼치는 영향력 역시 큰 폭으로 상승하였다. 이에 따라 모바일 어플리케이션을 평가하기 위한 척도에 관한 연구들이 진행됐으나, 대부분의 연구가 전문가 중심의 인터뷰 또는 설문조사와 같은 정성적인 방법에 의존하였다. 또한, 서비스 사용자의 관점이 아닌 서비스 제공자의 관점에서 평가 척도가 구성되고 있다. 하지만 최근에는 대량의 사용자 리뷰(User Review) 데이터를 통해 실제 사용자들의 어플리케이션 평가의 정량적 분석이 가능해짐에 따라, 연구자의 주관성을 최소화하는 어플리케이션 영역별 분석의 가능성이 커지고 있다. 따라서 본 연구에서는 사용자 리뷰 데이터를 활용하여 모바일 어플리케이션들에 대한 기존의 품질 평가에 대한 문제점을 보완할 수 있는 방법론을 제시하고자 한다. 이를 위해 토픽모델링 기법인 LDA(Latent Dirichlet allocation)을 적용하여, 기존의 평가 척도를 사용자 관점에서 개선하는 방법을 제안한다. 본 연구를 통해 서비스 제공자 및 연구자의 주관성으로 인한 서비스 평가의 편향을 줄이고, 소비자 관점의 모바일 어플리케이션 영역별 평가 척도를 제공할 것으로 예상된다.

한국어 언어모델 파인튜닝을 통한 협찬 블로그 텍스트 생성 (Generating Sponsored Blog Texts through Fine-Tuning of Korean LLMs)

  • 김보경;변재연;차경애
    • 한국산업정보학회논문지
    • /
    • 제29권3호
    • /
    • pp.1-12
    • /
    • 2024
  • 본 논문에서는 대규모 한국어 언어모델인 KoAlpaca를 파인튜닝하고 이를 이용한 블로그 텍스트 생성 시스템을 구현하였다. 소셜 미디어 플랫폼의 블로그는 기업 마케팅 수단으로 널리 활용된다. 수집된 협찬 블로그 텍스트의 감정 분석과 정제를 통한 긍정 리뷰의 학습 데이터를 구축하고 KoAlpaca 학습의 경량화를 위한 QLoRA를 적용하였다. QLoRA는 학습에 필요한 메모리 사용량을 크게 줄이는 파인튜닝 접근법으로 파라미터 크기 12.8B 경우의 실험 환경에서 LoRA 대비 최대 약 58.8%의 메모리 사용량 감소를 확인하였다. 파인튜닝 모델의 생성 성능 평가를 위해서 학습 데이터에 포함되지 않은 100개의 입력으로 생성한 텍스트는 사전학습 모델에 비해서 평균적으로 두배 이상의 단어 수를 생성하였으며 긍정 감정의 텍스트 역시 두 배 이상으로 나타났다. 정성적 생성 성능 평가를 위한 설문조사에서 파인튜닝 모델의 생성 결과가 제시된 주제에 더 잘 부합한다는 응답이 평균 77.5%로 나타났다. 이를 통해서 본 논문의 협찬물에 대한 긍정 리뷰 생성 언어모델은 콘텐츠 제작을 위한 시간 관리의 효율성을 높이고 일관된 마케팅 효과를 보장하는 콘텐츠 제작이 가능함을 보였다. 향후 사전학습 모델의 생성 요소에 의해서 긍정 리뷰의 범주에서 벗어나는 생성 결과를 감소시키기 위해서 학습 데이터의 증강을 활용한 파인튜닝을 진행할 예정이다.

한국어 장소 리뷰를 이용한 공간 감성어 사전 구축 방법 (Method for Spatial Sentiment Lexicon Construction using Korean Place Reviews)

  • 이영민;권필;유기윤;김지영
    • 대한공간정보학회지
    • /
    • 제25권2호
    • /
    • pp.3-12
    • /
    • 2017
  • 위치 기반 서비스를 이용하여 자신이 방문한 장소에 대한 긍정 혹은 부정적 의견을 리뷰로 남기는 것이 일상화되고 있다. 실제 방문자가 작성한 장소 리뷰에 대한 감성분석 결과는 잠재적 소비자뿐 아니라 기업에게도 유용한 정보를 제공할 수 있다. 장소에 대한 감성분석을 실시하기 위해서는 감성분석의 기준이 되는 어휘에 대한 사전이 필요하다. 그러나 현재까지 장소를 표현하는 공간 감성어에 대한 사전이 구축된 바 없다. 이에 본 연구는 실제 방문자가 한국어로 작성한 장소 리뷰 데이터를 분석하여 공간 감성어 사전을 구축하는 방법을 제안하며, 여러 장소 카테고리 중 테마공원을 대상으로 공간 감성어 사전을 구축하였다. 이를 위해 자연어 처리 기법과 통계적 기법을 활용하였으며, 사전에 포함되는 공간 감성어는 감성의 극성에 대한 정보와 극성의 정도에 대한 확률점수를 포함하고 있다. 본 연구에서 구축한 공간 감성어 사전은 3개의 테이블(SSLex_SS, SSLex_single, SSLex_combi)로 구성되며, 총 219개의 어휘를 포함한다. 이를 바탕으로 트위터에서 테마공원에 대해 작성된 글을 대상으로 감성분석을 실시하였으며, 감성의 극성 분류에 대한 전체 정확도가 0.714로 산출됨에 따라 사전의 유효성을 확인할 수 있었다.

GDPR이 디지털 경제에 미치는 영향: 문헌 자료에 근거하여 (The Effects of GDPR on the Digital Economy: Evidence from the Literature)

  • 아랴말라 프라사드;다니엘 페레즈
    • 정보화정책
    • /
    • 제27권3호
    • /
    • pp.3-18
    • /
    • 2020
  • 전세계적으로 디지털 전환이 확산됨에 따라 유럽연합(EU)은 회원국 간의 포괄적인 데이터 보호 프레임워크를 구축하기 위해 GDPR(General Data Protection Regulation)을 시행하였다. GDPR의 헌법적 뿌리를 고려할 때, EU의 규제 접근법은 다른 데이터 보호 규정들과는 차이가 있다. GDPR은 데이터 보호에 대한 개인의 권리를 강화하였다. 하지만 개인의 데이터를 수집하고 처리하는 기업에 대한 몇 가지 의무 또한 도입하였다. 본 연구에서는 정책적 관점에서 프라이버시, 특히 GDPR에 관한 기존의 문헌을 고찰하였으며, 이를 통해 데이터 규제가 경쟁, 혁신, 마케팅 활동 및 국경을 초월한 데이터 흐름에 미치는 영향을 개략적으로 리뷰 하였다. 그리고 본 연구는 프라이버시와 GDPR이 시장에 미치는 영향 사이의 절충안을 강조한다.

Transformer기반의 언어모델 Bert와 GPT-2 성능 비교 연구 (Transformer-based Language model Bert And GPT-2 Performance Comparison Study)

  • 유연준;홍석민;이협건;김영운
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.381-383
    • /
    • 2022
  • 최근 자연어처리 분야에서는 Bert, GPT 등 Transformer기반의 언어모델 연구가 활발히 이뤄지고 있다. 이러한 언어모델은 대용량의 말뭉치 데이터와 많은 파라미터를 이용하여 사전학습을 진행하여 다양한 자연어처리 테스트에서 높은 성능을 보여주고 있다. 이에 본 논문에서는 Transformer기반의 언어모델인 Bert와 GPT-2의 성능평가를 진행한다. 성능평가는 '네이버 영화 리뷰' 데이터 셋을 통해 긍정 부정의 정확도와 학습시간을 측정한다. 측정결과 정확도에서는 GPT-2가 Bert보다 최소 4.16%에서 최대 5.32% 높은 정확도를 나타내었지만 학습시간에서는 Bert가 GPT-2보다 최소 104초에서 116초 빠르게 나타났다. 향후 성능 비교는 더 많은 데이터와 다양한 조건을 통해 구체적인 성능 비교가 필요하다.

영역별 맞춤형 감성사전 구축을 통한 영화리뷰 감성분석 (Sentiment analysis on movie review through building modified sentiment dictionary by movie genre)

  • 이상훈;최정;김종우
    • 지능정보연구
    • /
    • 제22권2호
    • /
    • pp.97-113
    • /
    • 2016
  • 인터넷상의 데이터가 급속하게 증가함에 따라 막대한 양의 데이터를 목적에 맞게 적절히 활용하는 빅데이터 분석이 활발하게 진행되고 있다. 최근에는 기존의 정형 데이터분석이 가진 한계점을 보완하는 방법으로 비정형 데이터 분석 분야 중 하나인 텍스트마이닝 기법에 대한 연구들이 다수 이루어지고 있으며, 특히 텍스트를 기반으로 문장의 긍정, 부정을 판별하고 분류하는 감성분석과 관련된 연구들이 활발하게 이루어지고 있다. 이러한 연구의 연장선 상에서, 본 연구는 감성분석에 사용되는 감성사전을 데이터의 특성에 맞게 적절하게 변형하여 구축하는 방법을 시도하였다. 데이터가 속한 영역의 특성을 고려하지 않은 기존의 범용 감성사전을 감성분석에 사용할 경우, 해당 영역에서 쓰이는 단어 또는 감정 표현을 반영하지 못하므로 감성분석의 정확성이 떨어질 수 있다. 따라서 감성분석에 있어서 영역 맞춤형 감성사전의 사용 시 데이터 영역의 특성을 정확하게 반영해 분석의 정확성을 높여줄 것으로 기대할 수 있다. 본 연구에서는 영화 리뷰 데이터를 분석 대상으로 선정하였으며, 대표적 영화정보 사이트 IMDb에서 발생된 약 2년간의 영화리뷰 데이터를 수집 분석하였다. 분석에 앞서 영화 장르별 사용되는 단어의 의미가 각각 다를 것을 고려하여 영화를 '액션', '애니메이션', '코메디', '드라마', '공포', '과학공상' 6개 장르로 분류했다. 맞춤형 감성사전 구축을 위한 핵심 기법으로 SO-PMI(Semantic Orientation from Point-wise Mutual Information)를 활용하였으며, 어휘 간 극성이 뚜렷하게 구분되는 형용사에 한정하여 연구를 진행했다. 분석결과 맞춤형사전을 활용한 감성분석 예측정확도는 영화 장르별로 상이했다. '애니메이션'을 제외한 5개 장르에서 기존의 범용 감성사전대비 맞춤형 감성사전의 예측정확도가 통계적으로 유의한 수준의 성능 향상을 보였다. 본 연구에서는 데이터 영역의 특성에 맞는 맞춤형 사전 구축을 통한 감성분석의 예측의 성능 향상을 확인하였다. 향후 감성사전 구축 시 동사, 부사 등 다양한 품사의 어휘를 추가하여 감성분석 예측정확도를 높이는 방안을 모색할 수 있을 것이다.

Delete-Generate: 단어 n-gram의 삭제 및 생성에 기반한 한국어 스타일 변환 (Delete and Generate: Korean style transfer based on deleting and generating word n-grams)

  • 최형준;나승훈
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.400-403
    • /
    • 2019
  • 스타일 변환(Style Transfer)은 주어진 문장의 긍정이나 부정 같은 속성을 변경하여 다른 속성을 갖는 문장으로 변환하는 과정을 의미한다. 본 연구에서는 스타일 변환을 위한 단어 n-그램 삭제의 기준을 확장하였고, 네이버 영화리뷰 데이터셋을 통해 이를 스타일 변환 이후 원래 문장의 스타일로부터 얼마나 차이가 나게 되었는지를 측정하였다. 측정은 감성분석기를 통해 이루어졌고, 기존 방법에 비해 6.28%p정도 높은 75.13%의 정확도를 보였다.

  • PDF

빅데이터 분석을 활용한 가짜 리뷰 필터링 시스템 ADDAVICHI (Development of Filtering System ADDAVICHI for Fake Reviews using Big Data Analysis)

  • 정다비치;노영주
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권6호
    • /
    • pp.1-8
    • /
    • 2019
  • 최근 '바이럴 마케팅' 으로 인해서 홍보에만 치중하는 블로그 게시물 등으로 인해 소비자의 불신이 깊어졌다. 또한, 이용후기를 거짓으로 작성하거나, 과장 확대하는 등의 마케팅 사업은 신문이나 TV 광고에 비해 가격이 저렴하면서도 효과가 커 각광받는 사업 중 하나로서 광고비 규모는 2016년 기준 '3조 3941억'으로 주요 광고수단으로 자리잡고 있다. 이러한 '바이럴 마케팅'으로부터 정보를 걸러주는 도구가 필요한 인터넷 환경이 되었다. 본 논문에서 제시하는 가짜 리뷰 필터링 어플리케이션 ADDAVICHI는 사용자가 '이벤트', '맛집' 등의 컨텐츠를 검색하면 블로그 키워등, 총 검색수, 신뢰도, 만족도 등을 추출하고 분석하여 제시한다. 신뢰도는 블로그에 있는 광고게시물 수와, 전체 게시물 수를 보여주고, 만족도는 신뢰도에서 걸러진 청정 게시물을 긍정 게시물과 부정게시물로 나눠서 보여준다. 마지막으로 키워드는 긍정 게시물에서 나온 리뷰 상위 세 단어 리스트를 보여준다. 이러한 방법으로 사용자가 광고 글로부터 벗어나서 정보를 해석할 수 있도록 지원한다.

언택트 시대 라이브 커머스 이용 활성화 영향요인 고찰: 다차원적 상호작용성, 현장감, 리뷰 신뢰도를 중심으로 (Investigating the Factors Influencing the Use of Live Commerce in the Un-tact Era: Focusing on Multidimensional Interactivity, Presence, and Review Credibility)

  • 이애리
    • 지식경영연구
    • /
    • 제22권1호
    • /
    • pp.269-286
    • /
    • 2021
  • 최근 코로나19 여파로 언택트 및 온택트 소비 문화가 확산되면서, 커머스 및 유통 산업에서는 실시간 스트리밍 방송 형태로 고객들과 소통하며 쇼핑이 이뤄지는 '라이브 커머스'가 부상하고 있다. 라이브 커머스는 온라인 쇼핑의 편의성을 누리는 동시에 마치 오프라인 매장에서 직접 구매하듯이 방송진행자와 실시간 소통하며 언택트 쇼핑을 보다 현실감 있게 즐길 수 있는 환경을 제공하여 앞으로 그 이용이 더욱 확대될 것으로 예상된다. 본 연구에서는 라이브 커머스의 특징을 기반으로 라이브 커머스를 통한 구매의도 증가에 영향을 미치는 주요 요인을 도출하고 그 영향력을 검증하였다. 특히 본 연구에서는 라이브 커머스의 특징으로 강력한 상호작용성, 리얼한 현장감, 상품에 대한 신뢰도 높은 상세한 리뷰 제공에 초점을 두고 이들 요인들을 다차원적으로 고찰하였다. 본 연구는 라이브 커머스 실 사용자를 대상으로 데이터를 수집하여 라이브 커머스의 이용 활성화 요인을 실증적으로 분석함으로써, 언택트 시대 새롭게 변화된 커머스 환경에서의 지식경영을 위한 시사점을 제공할 수 있을 것이다.

머신러닝과 감성분석을 활용한 고객 리뷰 기반 항공 서비스 품질 평가 (Airline Service Quality Evaluation Based on Customer Review Using Machine Learning Approach and Sentiment Analysis)

  • 전우진;이예빈;금영정
    • 한국전자거래학회지
    • /
    • 제26권4호
    • /
    • pp.15-36
    • /
    • 2021
  • 국제 항공 시장이 꾸준히 성장함에 따라 항공업계의 경쟁이 더욱 심화되고 있다. 경쟁 우위의 원천을 얻기 위해 서비스의 품질 평가는 필수적이며, 이에 다양한 연구에서 고객 리뷰를 바탕으로 서비스 품질을 측정하는 시도를 지속해 왔다. 그러나 고객 리뷰 데이터를 기반으로 기대와 지각 수준의 차이를 파악하고 전략적 방향을 제시하는 연구는 미흡한 실정이다. 본 연구에서는 항공사 서비스를 대상으로 차원별 중요도를 머신러닝을 통해 측정하고, 차원별 지각 수준을 감성분석을 통해 분석한다. 차원별 중요도와 지각 수준의 결과를 활용하여 항공사별 서비스의 성과를 측정하기 위한 전략 매트릭스를 제시하고, 이를 통해 각 항공사의 품질 분석을 수행한다. 본 연구는 항공사의 고객만족을 결정하는 중요한 요인을 파악하는 동시에, 각 항공사의 현재 서비스 수준을 파악하는 틀을 제시함으로써 서비스 품질 평가의 중요한 도구로 활용될 수 있다.