• Title/Summary/Keyword: LDA Topic Modeling

검색결과 297건 처리시간 0.023초

Analysis of Secondary Battery Trends Using Topic Modeling: Focusing on Solid-State Batteries

  • Chunghyun Do;Yong Jin Kim
    • Asian Journal of Innovation and Policy
    • /
    • 제12권3호
    • /
    • pp.345-362
    • /
    • 2023
  • As the widespread adoption and proliferation of electric vehicles continue, the secondary battery market is experiencing rapid growth. However, lithium-ion batteries, which constitute a majority of secondary batteries, present high risks of fire and explosion. Solid-state batteries are thus garnering attention as the next-generation batteries since they eliminate fire hazards and significantly reduce the risk of explosions. Against this background, the study aimed to analyze research trends and provide insights by examining 2,927 domestic papers related to solid-state batteries over the past decade (2013-2022). Specifically, we used topic modeling to extract major keywords associated with solid-state batteries research and to explore the network characteristics across major topics. The changes in research on solid-state batteries were analyzed in-depth by calculating topic dominance by year. The findings provide an overview of the emerging trends in domestic solid-state battery research, and might serve as a valuable reference in shaping long-term research directions.

토픽모델링을 활용한 대학생의 중도탈락 데이터 분석 (Data Analysis of Dropouts of University Students Using Topic Modeling)

  • 정도헌;박주연
    • 한국정보통신학회논문지
    • /
    • 제25권1호
    • /
    • pp.88-95
    • /
    • 2021
  • 본 연구의 목적은 대학생의 중도탈락 현상 데이터를 실증적으로 분석하여 대학의 학생지원정책을 수립하기 위한 시사점을 제공하는 데 있다. 이를 위해 D대학의 2017~2019년 입학생 데이터를 토픽모델링 LDA(Latent Dirichlet Allocation)를 활용하여 재학생과 제적생으로 나누어 분석하였다. 연구결과 제적생에서 특징있게 나타난 토픽은 '학적'관련하여 '학기등록 1회', '전공'관련하여 '어문계열학과', '학점'관련하여 '학사경고'이고, '대학생활'관련하여 '비교과 프로그램'에 대한 토픽은 나타나지 않았다. 다음으로 '재학생 토픽'과 '제적생 토픽'의 상호 식별 성능을 측정한 결과, SVM(Support Vector Machines)이 가장 우수한 식별 성능을 보여주었다. 이러한 실험을 통해 기계학습을 활용한 인공지능 기반의 학생 데이터 분류 기법 연구의 가능성을 확인할 수 있었다.

토픽모델링을 통한 북한의 경제정책 동향 분석 (The Analysis of North Korea's Economic Policy Trends through Topic Modeling)

  • 강경화
    • 스마트미디어저널
    • /
    • 제9권4호
    • /
    • pp.44-51
    • /
    • 2020
  • 1990년대 중후반 이래 북한경제에 많은 변화가 나타나는 것은 분명하다. 2012년 김정은 집권 이후 그 변화는 더욱 뚜렷하게 나타나고 있기 때문에 시기별 경제정책 흐름을 추적하여 변화추이를 파악하는 데 논문의 목적이 있다. 본 논문에서는 텍스트마이닝 분석기법인 LDA 토픽모델링을 활용하여 북한에서 발간되는 경제 분야 대표문헌인 경제학술지 『경제연구』 논문을 분석한다. 『경제연구』에 게재된 논문을 기본 텍스트로 활용하여 북한 경제 전략과 정책변화를 파악한다. 북한에서 생산되는 경제 관련 학술지로 독보적 위치를 차지하고 있는 『경제 연구』에 대한 심층 분석은 북한 당국이 경제 관련 인식하고 있는 현실, 직면 하고 있는 한계, 대안 등을 추적하는데 필수적인 작업이라고 할 수 있다. 다양한 북한 경제 관련 논쟁 주제가 숨어있는 『경제연구』를 빅데이터를 통해 분석하여 북한 지도자의 경제정책 흐름을 살펴보고, 현 김정은 체제가 의도하는 '변화'의 내용을 분석한다.

뉴스 데이터 토픽 모델링을 활용한 COVID-19 대유행 전후의 클라우드 보안 동향 파악 (Topic Modeling to Identify Cloud Security Trends using news Data Before and After the COVID-19 Pandemic)

  • 이선우;이재우
    • 융합보안논문지
    • /
    • 제22권2호
    • /
    • pp.67-75
    • /
    • 2022
  • COVID-19 대유행으로 인해 많은 기업에서 재택근무를 도입했다. 하지만 재택근무 도입으로 기업의 민감한 정보에 접근하려는 공격 시도가 증가했고, 보안위협에 대응하기 위해 많은 기업에서 클라우드 서비스를 이용하기 시작했다. 본 연구는 COVID-19 대유행 전후의 국내 클라우드 보안 동향의 변화를 분석하기 위해 '클라우드 보안' 키워드로 뉴스 데이터를 수집하여 LDA 토픽 모델링 기법을 사용했다. COVID-19 대유행 전에는 국내 클라우드 보안에 대한 관심이 낮아 추출한 토픽에서 대표성이나 연관성을 찾을 수 없었다. 다만, 현재 많은 연구가 이뤄지는 IT기술인 AI, IoT, 블록체인을 위해서는 높은 컴퓨팅 성능을 위해 클라우드의 도입이 필요하다는 것을 분석할 수 있었다. 반면, COVID-19 대유행 이후 추출된 토픽을 보면 국내에서 클라우드에 대한 관심이 증가했고, 이에 따라 클라우드 보안에 대한 관심이 향상된 것을 확인했다. 따라서 앞으로 계속 증가할 클라우스 서비스 사용량에 대비한 보안 대책을 수립해야 할 것이다.

한국도로공사 VOC 데이터를 이용한 토픽 모형 적용 방안 (Application of a Topic Model on the Korea Expressway Corporation's VOC Data)

  • 김지원;박상민;박성호;정하림;윤일수
    • 한국IT서비스학회지
    • /
    • 제19권6호
    • /
    • pp.1-13
    • /
    • 2020
  • Recently, 80% of big data consists of unstructured text data. In particular, various types of documents are stored in the form of large-scale unstructured documents through social network services (SNS), blogs, news, etc., and the importance of unstructured data is highlighted. As the possibility of using unstructured data increases, various analysis techniques such as text mining have recently appeared. Therefore, in this study, topic modeling technique was applied to the Korea Highway Corporation's voice of customer (VOC) data that includes customer opinions and complaints. Currently, VOC data is divided into the business areas of Korea Expressway Corporation. However, the classified categories are often not accurate, and the ambiguous ones are classified as "other". Therefore, in order to use VOC data for efficient service improvement and the like, a more systematic and efficient classification method of VOC data is required. To this end, this study proposed two approaches, including method using only the latent dirichlet allocation (LDA), the most representative topic modeling technique, and a new method combining the LDA and the word embedding technique, Word2vec. As a result, it was confirmed that the categories of VOC data are relatively well classified when using the new method. Through these results, it is judged that it will be possible to derive the implications of the Korea Expressway Corporation and utilize it for service improvement.

토픽 모델링에 기반한 온라인 상품 평점 예측을 위한 온라인 사용 후기 분석 (Online Reviews Analysis for Prediction of Product Ratings based on Topic Modeling)

  • 박상현;문현실;김재경
    • 한국IT서비스학회지
    • /
    • 제16권3호
    • /
    • pp.113-125
    • /
    • 2017
  • Customers have been affected by others' opinions when they make a purchase. Thanks to the development of technologies, people are sharing their experiences such as reviews or ratings through online or social network services, However, although ratings are intuitive information for others, many reviews include only texts without ratings. Also, because of huge amount of reviews, customers and companies can't read all of them so they are hard to evaluate to a product without ratings. Therefore, in this study, we propose a methodology to predict ratings based on reviews for a product. In a methodology, we first estimate the topic-review matrix using the Latent Dirichlet Allocation technic which is widely used in topic modeling. Next, we predict ratings based on the topic-review matrix using the artificial neural network model which is based on the backpropagation algorithm. Through experiments with actual reviews, we find that our methodology can predict ratings based on customers' reviews. And our methodology performs better with reviews which include certain opinions. As a result, our study can be used for customers and companies that want to know exactly a product with ratings. Moreover, we hope that our study leads to the implementation of future studies that combine machine learning and topic modeling.

키워드 기반 주제중심 분석을 이용한 비정형데이터 처리 (Unstructured Data Processing Using Keyword-Based Topic-Oriented Analysis)

  • 고명숙
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권11호
    • /
    • pp.521-526
    • /
    • 2017
  • 데이터는 데이터 형식이 다양하고 방대할 뿐만 아니라 그 생성 속도가 매우 빨라 기존의 데이터 처리 방식이 아닌 새로운 관리 및 분석 방법이 요구된다. 소셜 네트워크 상의 온라인 문서에서 인간의 언어로 쓰여진 비정형 텍스트에서 Text Mining기법을 사용하여 유용한 정보를 추출할 수 있다. 소셜미디어에 남긴 정치, 경제, 문화에 대한 메시지에 대한 경향을 파악하는 것이 어떤 주제에 관심을 가지고 있는지를 파악할 수 있는 요소가 된다. 본 연구에서는 주제 중심 분석 기법을 이용하여 주어진 키워드에 관한 온라인 뉴스를 대상으로 텍스트 마이닝을 수행하였다. LDA(Latent Dirichiet Allocation)를 이용하여 웹문서로부터 정보를 추출하고 이로부터 사람들이 실제로 주어진 키워드에 대하여 어떤 주제에 관심이 있고 관련된 핵심 가치 중 어떤 주제를 중심으로 전파되고 있는지를 분석하였다.

토픽모델링을 활용한 4차 산업혁명 분야의 국내 연구 동향 분석 (A Study on the Research Trends in the Fourth Industrial Revolution in Korea Using Topic Modeling)

  • 김지영;노동조
    • 한국비블리아학회지
    • /
    • 제34권4호
    • /
    • pp.207-234
    • /
    • 2023
  • 4차 산업혁명이 등장한 이래로 산업 분야를 비롯한 다양한 분야에서 관련 연구들이 수행되었다. 본 연구에서는 4차 산업혁명에 대한 국내의 연구 동향을 분석하기 위하여 2016년 1월부터 2023년 8월까지 KCI에 수록된 2,115건의 논문을 대상으로 핵심어 분석 및 LDA 알고리즘에 기반한 토픽모델링 분석을 실시하였다. 본 연구의 결과 첫째, 4차 산업혁명 관련 학술 논문이 많이 게재된 학술지는 디지털융복합연구, 인문사회 21, e-비즈니스연구, 학습자중심교과교육연구 등의 순이었다. 둘째, 토픽모델링 분석 결과, '인간과 인공지능', '데이터와 개인정보 관리', '교육과정의 변화', '기업의 변화와 혁신', '교육의 변화와 일자리', '문화예술과 콘텐츠', '정보와 기업의 정책과 대응'의 7개 토픽이 선정되었다. 셋째, 4차 산업혁명과 관련한 공통 연구주제는 '교육과정의 변화', '인간과 인공지능', '문화예술과 콘텐츠'이며, 공통 키워드는 '기업', '정보', '보호', '스마트', '시스템' 등이 있다. 넷째, 연구 전반기(2016-2019)에는 교육 분야의 주제가 상위에 등장했으나 후반기(2020-2023)에는 기업과 스마트, 디지털, 서비스 혁신에 관한 주제들이 상위로 나타났다. 다섯째, 연구 후반기로 가면서 연구 주제들이 보다 구체화되거나 세분화되는 경향을 보였다. 이러한 동향은 코로나 팬데믹 이후 4차 산업혁명 분야의 핵심 기술들이 다양한 산업 분야에 활용됨에 따라 발생하는 사회경제적 변화에 따른 것으로 해석된다. 본 연구의 결과는 4차 산업혁명 분야의 연구 동향 파악과 전략 수립 및 후속 연구에 유용한 정보를 제공할 수 있을 것으로 기대한다.

LDA 토픽모델링 기법을 활용한 부산시 민원 빅데이터 분석 (Big Data Analysis of Busan Civil Affairs Using the LDA Topic Modeling Technique)

  • 박주섭;이새미
    • 정보화정책
    • /
    • 제27권2호
    • /
    • pp.66-83
    • /
    • 2020
  • 시민들은 도시 내 발생되고 있는 지역문제에 대해 큰 관심을 가지고 있다. 지방정부는 이러한 지역문제들을 해결하기 위해 노력하고 있지만 시민들의 생활 불편을 줄여주기는 쉽지 않고 이로 인한 시민들의 불만은 민원으로 이어지고 있다. 이를 해소할 수 있는 대안으로 빅데이터 활용을 통해 민원의 특성을 파악하고, 시민들에게 선제적 편의성을 제공하기 위한 노력이 절실하다. 본 논문에서는 LDA 토픽모델링 기법을 활용하여 전자민원의 동향 분석에 관한 연구를 실시한다. 이를 위해 2015~2017년 9,625건의 부산시 전자민원을 대상으로 20개의 민원토픽을 추출하였다. 도출된 민원토픽을 통해 핵심민원을 파악하고, 분기별 비중 추이 분석을 통하여 4개의 Hot 민원(버스정차, 택시기사, 칭찬, 민원처리)과 4개의 Cold 민원(cctv설치, 버스노선, 공원주차장, 축제 불만)을 도출하였다. 본 연구는 민원동향을 파악하기 위해 빅데이터 분석 방법을 제시하였고, 후속 연구를 유발하였다는 학문적 기여도가 있다. 또한 민원분석을 위해 사용한 텍스트마이닝 기법은 빅데이터 처리가 필요한 다른 행정업무에도 활용될 수 있다.

LDA토픽 모델링을 활용한 생성형 AI 챗봇의 탐색적 연구 : 기존 AI 챗봇 서비스 품질 요인과의 비교 (An Exploratory Study of Generative AI Service Quality using LDA Topic Modeling and Comparison with Existing Dimensions)

  • 안예은;오정석
    • 서비스연구
    • /
    • 제13권4호
    • /
    • pp.191-205
    • /
    • 2023
  • 인공 지능 (AI), 특히 텍스트 생성 서비스 분야에서의 발전은 두드러지게 나타나고 있으며, AI-as-a-Service (AIaaS) 시장은 2028년까지 550억 달러에 달할 것으로 예상된다. 본 연구는 합성 텍스트 미디어 소프트웨어의 품질 요소를 탐구하였으며, 이를 위해 ChatGPT, Writesonic, Jasper, 그리고 Anyword와 같은 산업의 주요 서비스에 주목하였다. 소프트웨어 평가 플랫폼에서 수집된 4,000개 이상의 리뷰를 바탕으로, Gensim 라이브러리를 활용한 잠재 디리클레 할당 (LDA) 주제 모델링 기법을 적용하였다. 이 분석을 통해 11개의 주제가 도출되었다. 이후 이 주제들을 AICSQ 및 AISAQUAL과 같은 기존 논문에서 다루었던 AI 서비스 품질 차원과 비교 분석하였다. 리뷰에서는 가용성 및 효율성과 같은 차원이 주로 강조되었으며, 이전 연구에서 중요하게 여겨졌던 사람다움과 같은 요소는 본 연구에서 강조되지 않았다. 이러한 결과는 AI 서비스의 본질적 특성, 즉 사용자와의 직접적인 상호작용보다 의미론적 이해에 더 중점을 둔다는 특성 때문으로 해석된다. 본 연구는 단일 리뷰 원천 및 평가자들의 인구 통계의 특정성과 같은 잠재적 편향을 인정하며, 향후 연구 방향으로는 이러한 품질 차원이 사용자 만족도에 어떻게 영향을 미치는지, 그리고 개별 차원이 전체 평점에 어떻게 영향을 미치는지에 대한 깊은 분석을 제안한다.