• 제목/요약/키워드: LDA topic model

검색결과 111건 처리시간 0.026초

코로나 이전과 이후의 4차 산업혁명과 광고의 뉴스기사 분석 : LDA와 Word2vec을 중심으로 (News Article Analysis of the 4th Industrial Revolution and Advertising before and after COVID-19: Focusing on LDA and Word2vec)

  • 차영란
    • 한국콘텐츠학회논문지
    • /
    • 제21권9호
    • /
    • pp.149-163
    • /
    • 2021
  • 4차 산업혁명이란 인공지능(AI), 사물인터넷(IoT), 로봇기술, 드론, 자율주행과 가상현실(VR) 등 정보통신 기술이 주도하는 차세대 산업혁명을 말하는 것으로, 광고 산업 발전에도 큰 영향을 미쳤다. 그러나 지금 전세계는 코로나 확산 방지를 위하여, 비접촉, 비대면 생활환경으로 급속도로 빠르게 변화하고 있다. 이에 따라 4차 산업혁명과 광고의 역할도 변화하고 있다. 따라서 본 연구에서는 코로나 19 이전과 이후의 4차산업 혁명과 광고의 변화를 살펴보기 위해 빅카인즈를 활용해서 텍스트 분석을 하였다. 코로나 19 이전인 2019년과 코로나 19 이후인 2020년을 비교하였다. LDA토픽 모형 분석과 딥러닝 기법인 Word2vec을 통해 주요 토픽과 문서분류를 하였다. 연구결과 코로나19 이전에는 정책, 콘텐츠, AI 등이 나타났으나, 코로나 이후에는 데이터를 활용한 금융, 광고, 배달 등으로 점차 영역이 확장되며, 더불어 인재양성 교육이 중요한 이슈로 나타난 것을 알 수 있었다. 또한, 코로나 19 이전에는 4차 산업혁명 기술과 관련된 광고를 활용하는 것이 주류를 이루었다면, 코로나 19 이후에는 참여, 협력, 일상 필요 등 좀 더 적극적으로 첨단기술 자체에 대한 교육과 인재양성 등에 대한 키워드가 두드러지게 나타나고 있다. 따라서 이러한 연구결과는 코로나 19 이후에 4차 산업혁명에서 광고의 나아갈 방향을 제시하면서, 이에 필요한 이론적, 실무적으로 적용할 수 있는 다각적인 전략을 제시하는 데 의의가 있다.

Classifying Temporal Topics with Similar Patterns on Twitter

  • Yun, Hong-Won
    • Journal of information and communication convergence engineering
    • /
    • 제9권3호
    • /
    • pp.295-300
    • /
    • 2011
  • Twitter is a popular microblogging service that enables the users to send and read short text messages. These messages are becoming source to analyze topic trends and identify relations among temporal topics. In this paper, we propose a method to classify the temporal topics on Twitter as a problem of grouping the similar patterns. To provide a starting point for a classification under the same topics, we identify the content word weighting scheme based on Latent Dirichlet Allocation (LDA). And we formulate how the temporal topics in the time window can be classified like peaky topics, constant topics, and periodic topics. We provide different real case studies which show the validity of the proposed method. Evaluations show that the proposed method is useful as a classifying model in the analysis of the temporal topics.

Analysis of Research Topics and Trends on COVID-19 in Korea Using Latent Dirichlet Allocation (LDA)

  • Heo, Seong-Min;Yang, Ji-Yeon
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권12호
    • /
    • pp.83-91
    • /
    • 2020
  • 본 연구에서는 DBpia에 등록된 코로나19 관련 논문을 대상으로 연구 토픽을 밝히고 연구 변화 추세를 검토한다. 잠재 디리슐레 할당(Latent Dirichlet Allocation) 알고리즘을 적용한 결과, 7개의 연구 토픽을 도출하였고, 각 토픽은 "International Dynamics", "Technology & Security", "Psychological Impact", "Biomedical-Related", "Economic Impact", "Online Education", "Religion-Related"에 관한 내용이었다. 또한 다범주 로짓모형을 사용하여 연구 토픽의 추세 변화를 살펴본 결과, 2020년 6월 전에는 국제적 역학관계 및 생물 의학 관련 논문이 주를 이루었다면, 이후에는 다양한 분야로 연구 주제가 확대되었다. 특히 경제적인 영향, 온라인 교육, 심리적인 영향에 관한 연구가 꾸준히 증가함을 확인할 수 있었다. 이러한 결과는 향후 코로나19 관련 공동 연구의 가이드 라인을 제시하고, 활발한 연구 활동을 위한 기초자료로 활용될 수 있을 것이다.

웹 애플리케이션 기반의 텍스트 데이터 분석 모델 (Text Data Analysis Model Based on Web Application)

  • 진고환
    • 한국콘텐츠학회논문지
    • /
    • 제21권11호
    • /
    • pp.785-792
    • /
    • 2021
  • 4차 산업혁명 이후 인공지능, 빅 데이터와 같은 기술들의 발전으로 사회 전반에 다양한 변화가 일어나고 있으며, 핵심적인 기술 적용 과정에서 수집할 수 있는 데이터의 양도 급속하게 증가하고 있는 추세이다. 특히 학계에서는 연구 동향을 파악하기 위하여 기존에 생성된 문헌 데이터에 대한 분석이 이루어지고 있으며, 이러한 문헌 분석은 연구의 흐름을 정리하고, 어떤 연구 방법론이나 주제, 또는 현재 학계에서 화두가 되고 있는 대상에 대한 파악을 통하여 향후 연구 방향 설정에 많은 기여를 하고 있는 상황이다. 그러나 문서 데이터의 분석을 위하여 데이터 수집이 필요하나, 일반적으로 프로그램에 대한 전문 지식이 없는 경우 접근하기 어렵다. 본 논문에서는 텍스트 마이닝 기반의 토픽 모델링 웹 애플리케이션 모델을 제안한다. 제안 모델을 통하여 데이터 분석 기법에 대한 전문적인 지식이 부족하더라도, 연구 논문의 수집, 저장, 텍스트 분석과 같은 다양한 작업을 진행할 수 있으며, 연구자들이 선행 연구 분석과 연구 동향을 파악하기 위하여 데이터 분석에 투입되는 시간 및 노력을 단축시킬 수 있을 것으로 기대된다.

공유숙박업에서 고객 충성도에 영향을 미치는 요인: 구조 방정식 모형과 토픽 모델링 분석 (Antecedents of Customer Loyalty in the Context of Sharing Accommodation: Analysis of Structural Equation Modelling and Topic Modelling)

  • 김선주;김병수
    • 지식경영연구
    • /
    • 제22권3호
    • /
    • pp.55-73
    • /
    • 2021
  • 공유 경제는 쓰지 않은 자원을 다른 사람들과 나누어 쓰는 협력적 소비로 인식되고 있다. 본 연구에서는 공유 숙박업 이용 고객들의 충성도에 영향을 미치는 요인들을 살펴보고자 하였다. 고객들이 공유 숙박업 경험에서 느낀 감정과 자아 이미지 일치성, 인지된 가치를 고객 충성도에 영향을 주는 선행요인으로 고려하였다. 그리고 진정한 경험, 숙소 시설, 가격 공정성을 공유 숙박업의 선택속성으로 고려하였다. Airbnb가 공유 숙박업에서 가장 큰 업체이기 때문에 설문 대상으로 선정하였다. 294명의 Airbnb 이용 고객 데이터를 바탕으로 구조 방정식 모형을 활용하여 요인들 간 관계를 분석하였다. 또한, Airbnb를 이용한 고객이 작성한 리뷰를 통해 고객이 어떤 사항을 중요하게 고려하였는지 살펴보았다. 이를 위해 네이버 블로그에서 Airbnb 리뷰를 수집하여 LDA기반 토픽모델링을 실시하였다. 본 연구 결과를 통해 공유 숙박업에 대한 고객들의 충성도에 영향을 미치는 요인들에 대한 이해를 바탕으로, 효과적인 마케팅 전략과 운영 관리 전략을 수립하는데 도움을 줄 수 있을 것으로 기대된다.

텍스트 분석을 이용한 코로나19 관련 국내 논문의 주제 및 감성에 관한 융합 연구 (A Convergence Study on the Topic and Sentiment of COVID19 Research in Korea Using Text Analysis)

  • 허성민;양지연
    • 한국융합학회논문지
    • /
    • 제12권4호
    • /
    • pp.31-42
    • /
    • 2021
  • 본 연구에서는 코로나19 관련 연구논문의 연구주제를 탐색하고 동향을 검토하고 있다. 또한 감성분석을 통해 부정적인 어조가 강한 경고가 되는 주제들을 알아본다. 잠재 디리슐레 할당(LDA)를 이용하여 총 8개의 토픽을 발견하였고, 이를 구조적 토픽 모델링(STM)과 비교하여 비교적 안정적인 결과임을 확인하였다. 또한 k-means 군집 알고리즘을 통해 각 토픽별로 세부 연구주제를 발견하였고 주성분 분석을 이용하여 이를 시각적으로 표현하였다. 감성분석을 통해 각 토픽별 긍정적, 부정적인 단어들을 살펴보고 감성점수를 계산하여 연구논문의 주된 어조를 파악하였는데, 특히 생물 의학 관련, 국제적 역학관계, 심리적 영향과 관련된 연구에서 부정적인 어조가 강한 것으로 나타나 해당 부문에 대해서 주의와 관심이 요구된다. 향후 연구자들이 연구의 방향성을 탐색하고 정책결정자들이 연구지원 사업을 결정하는데 기초자료로 활용될 수 있을 것이다.

토픽모델링을 활용한 주요국의 스마트제조 기술 동향 분석 (Analysis of global trends on smart manufacturing technology using topic modeling)

  • 오윤환;문형빈
    • 한국산업정보학회논문지
    • /
    • 제27권4호
    • /
    • pp.65-79
    • /
    • 2022
  • 본 연구는 스마트제조 관련 국내·외 특허 데이터와 토픽모델링 방법을 활용하여 스마트 제조 관련 기술의 세부 영역을 식별하고 해당 영역에서 미국, 일본, 독일, 중국, 한국 등 주요국의 기술 개발 동향을 비교하였다. 이를 위해 1991년부터 2020년 사이에 미국과 유럽에서 출원된 특허를 수집하고 특허 초록을 가공한 후, LDA 모형을 적용해 토픽을 식별하였다. 연구 결과, 스마트제조 관련 기술의 세부 영역은 크게 7개로 구분되며 글로벌 차원에서는 최근 '데이터 처리 시스템 관련 기술'과 '열·유체 관리 기술'의 기술 개발 비중이 상당히 높아지고 있는 것으로 나타났다. 주요국과 한국의 기술 개발 동향을 비교한 결과, '열·유체 관리 기술' 분야에서 상대적인 강점이 있다는 점을 고려하면 국내 주력산업인 중화학 제조업과 연계한 스마트제조 관련 연구개발 및 관련 산업의 육성 추진 전략이 효과적일 것으로 보인다. 본 연구는 기존 정성적 기술 수준 평가의 한계를 극복하고, 텍스트마이닝 기법을 적용한 기술 역량 평가 방법론을 제안하였다는 측면에서 의의가 있다.

인공지능 활용 교육의 토픽모델링 분석을 통한 수학교육 연구 방향의 함의 (An Analysis of the International Trends of Research on Artificial Intelligence in Education Using Topic Modeling)

  • 노지화;고호경;김병수;허난
    • 한국학교수학회논문집
    • /
    • 제26권1호
    • /
    • pp.1-19
    • /
    • 2023
  • 본 연구는 최근 교육 분야에서 인공지능을 활용한 연구 동향을 파악하기 위해 관련 연구 논문을 대상으로 텍스트 마이닝 기법 중 토픽모델링과 시계열 기반 트렌드 분석 기법을 활용하여 분석을 실시하였다. 분석 대상으로는 다양한 학문 영역에서 컴퓨터 활용 교육 연구에 초점을 두는 '교육에서의 인공지능 국제학회(International Society of Artificial Intelligence in Education)'에서 발행하는 SCOPUS 저널에 2003년부터 2020년까지 게재된 총 352편의 논문을 사용하였다. 분석 결과 빈도수가 높은 단어들을 조합하여 8개의 토픽을 추출하였으며, 이를 통해 인공지능을 활용한 교육 연구에서 중요시 여기는 관점을 파악해 나감과 동시에 교과별로 인공지능을 교육에서 활용하는 내용과 목적에 차이점이 있음을 알 수 있었다. 또, 학습 시스템에서 학생 행동 모델을 분석하고 학생 응답 및 반응에 대한 피드백을 개발하는 연구는 점차 증가한 반면, 데이터 처리 방법에 대한 연구는 최근 들어 감소하는 경향이 나타났다. 연구 결과를 토대로 향후 교육에서 인공지능을 활용한 연구에 필요한 주제 및 방향에 대한 시사점을 제공하였다.

Sentiment Analysis on 'HelloTalk' App Reviews Using NRC Emotion Lexicon and GoEmotions Dataset

  • Simay Akar;Yang Sok Kim;Mi Jin Noh
    • 스마트미디어저널
    • /
    • 제13권6호
    • /
    • pp.35-43
    • /
    • 2024
  • During the post-pandemic period, the interest in foreign language learning surged, leading to increased usage of language-learning apps. With the rising demand for these apps, analyzing app reviews becomes essential, as they provide valuable insights into user experiences and suggestions for improvement. This research focuses on extracting insights into users' opinions, sentiments, and overall satisfaction from reviews of HelloTalk, one of the most renowned language-learning apps. We employed topic modeling and emotion analysis approaches to analyze reviews collected from the Google Play Store. Several experiments were conducted to evaluate the performance of sentiment classification models with different settings. In addition, we identified dominant emotions and topics within the app reviews using feature importance analysis. The experimental results show that the Random Forest model with topics and emotions outperforms other approaches in accuracy, recall, and F1 score. The findings reveal that topics emphasizing language learning and community interactions, as well as the use of language learning tools and the learning experience, are prominent. Moreover, the emotions of 'admiration' and 'annoyance' emerge as significant factors across all models. This research highlights that incorporating emotion scores into the model and utilizing a broader range of emotion labels enhances model performance.

사용자 리뷰를 통한 소셜커머스와 오픈마켓의 이용경험 비교분석 (A Comparative Analysis of Social Commerce and Open Market Using User Reviews in Korean Mobile Commerce)

  • 채승훈;임재익;강주영
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.53-77
    • /
    • 2015
  • 국내 모바일 커머스 시장은 현재 소셜커머스가 이용자 수 측면에서 오픈마켓을 압도하고 있는 상황이다. 산업계에서는 모바일 시장에서 소셜커머스의 성장에 대해 빠른 모바일 시장진입, 큐레이션 모델 등을 주요 성공요인으로 제시하고 있지만, 이에 대한 학계의 실증적인 연구 및 분석은 아직 미미한 상황이다. 본 연구에서는 사용자 리뷰를 바탕으로 모바일 소셜커머스와 오픈마켓의 사용자 이용경험을 비교 분석하는 탐험적인 연구를 수행하였다. 먼저 본 연구는 구글 플레이에 등록된 국내 소셜커머스 주요 3개 업체와 오픈마켓 주요 3개 업체의 모바일 앱 리뷰를 수집하였다. 본 연구는 LDA 토픽모델링을 통해 1만여건에 달하는 모바일 소셜커머스와 오픈마켓 사용자 리뷰를 지각된 유용성과 지각된 편리성 토픽으로 분류한 뒤 감정분석과 동시출현단어분석을 수행하였다. 이를 통해 본 연구는 국내 모바일 커머스 상에서 오픈마켓 이용자들에 비해 소셜커머스 이용자들이 서비스와 이용편리성 측면에서 더 긍정적인 경험을 하고 있음을 증명하였다. 소셜커머스는 '배송', '쿠폰', '할인'을 중심으로 서비스 측면에서 이용자들에게 긍정적인 이용경험을 이끌어내고 있는 반면, 오픈마켓의 경우 '로그인 안됨', '상세보기 불편', '멈춤'과 같은 기술적 문제 및 불편으로 인한 이용자 불만이 높았다. 이와 같이 본 연구는 사용자 리뷰를 통해 서비스 이용경험을 효과적으로 비교 분석할 수 있는 탐험적인 실증연구법을 제시하였다. 구체적으로 본 연구는 LDA 토픽모델링과 기술수용모형을 통해 사용자 리뷰를 서비스와 기술 토픽으로 분류하여 효과적으로 분석할 수 있는 새로운 방법을 제시하였다는 점에서 의의가 있다. 또한 본 연구의 결과는 향후 소셜커머스와 오픈마켓의 경쟁 및 벤치마킹 전략에 중요하게 활용될 수 있을 것으로 기대된다.