• 제목/요약/키워드: Topic Modeling(LDA)

검색결과 296건 처리시간 0.029초

텍스트마이닝과 ChatGPT 분석을 활용한 기업과 대중의 ESG 인식 비교: 지속가능경영보고서와 소셜미디어를 기반으로 (Comparing Corporate and Public ESG Perceptions Using Text Mining and ChatGPT Analysis: Based on Sustainability Reports and Social Media)

  • 최재훈;양성병;윤상혁
    • 지능정보연구
    • /
    • 제29권4호
    • /
    • pp.347-373
    • /
    • 2023
  • 최근 기업의 지속가능한 성장을 이끄는 ESG(Environmental, Social, and Governance) 관리의 중요성이 강조되고 있다. 이에, 본 연구는 기업과 일반 대중 간의 ESG에 대한 인식 차이를 실증적으로 밝히고, ESG 정책의 시행을 방해하는 부정적인 여론과 그 배경을 규명하는 것을 목표로 한다. 이를 위해, LDA(Latent Dirichlet Allocation) 토픽모델링, JST(Joint Sentiment Topic Modeling) 및 의미연결망분석 기법을 사용하여 지속가능경영보고서와 소셜미디어에서의 주요 키워드와 토픽, 그리고 그 연결관계를 분석하였다. 또한, ChatGPT를 활용하여, 텍스트마이닝 분석의 결과를 보완하였다. 분석 결과, 기업과 일반 대중 간 ESG에 대한 인식과 중요도에 상당한 차이가 있음을 확인하였다. 구체적으로, 기업들은 위기 관리, 투명한 지배구조, 윤리적 경영 등에 집중하여 신뢰를 구축하려 했으나, '그린워싱', '중대재해', '불매운동' 등과 같은 부정적 키워드가 자주 소셜네트워크에서 등장하여, 많은 대중들이 기업의 ESG 이슈 처리에 대해 의심하고 있음을 확인하였다. 본 연구는 기업, 정부 기관, 고객 및 투자자를 위한 ESG 전략수립에 도움이 될 수 있는 가이드라인을 제공한다는 점에서 의의가 있다.

미래 자동차 분야 국가연구개발사업의 주요 연구 토픽과 투자 동향 분석: LDA 토픽모델링을 중심으로 (Exploring Key Topics and Trends of Government-sponsored R&D Projects in Future Automotive Fields: LDA Topic Modeling Approach)

  • 마형렬;이철주
    • 한국산업정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.31-48
    • /
    • 2024
  • 글로벌 자동차 산업은 연결, 자율주행, 공유, 전동화 등의 주요 방향 아래 지속적으로 발전하고 있으며, 국내 자동차 산업 또한 기존의 전통적인 자동차 부품 제조로부터 미래 트렌드에 부합하는 전략적인 업의 전환을 꾀하고 있다. 본 연구에서는 2013년부터 2021년까지 산업통상자원부에서 지원한 미래 자동차 분야 연구개발 과제를 대상으로 토픽 모델링을 수행하였다. 해당 기간을 3개 기간으로 구분하여 주요 토픽의 변화를 분석하였다. 센서와 통신, 운전자 보조 기술, 배터리 및 전력 기술은 전 기간 동안 지속적인 주요 토픽으로 나타났으며, 고강도 경량 차체와 같은 주제는 1기에서만 관찰되었다. 한편, AI, 빅데이터, 수소 연료전지와 같은 주제는 2기와 3기에 점점 더 중요한 토픽으로 부상하였다. 또한, 토픽별 정부 투자액과 투자 증가율을 기준으로 각 기수별 집중 투자 분야를 분석하였다. 이러한 연구 결과는 향후 자동차 분야의 정책 수립 및 연구개발 전략 마련 시 기초 자료로 활용될 것으로 예상되며, 증거 기반의 정책 수립과 결정에 기여할 것으로 기대된다.

토픽 모델링을 이용한 전기차 연구 동향 분석 (The Analysis of Research Trends in Electric Vehicle using Topic Modeling)

  • 천위안;조석수
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권4호
    • /
    • pp.255-265
    • /
    • 2024
  • 환경 문제와 에너지 효율성을 향상시키기 위하여 전기자동차를 도입함으로서 이에 따른 연구가 급증하고 있다. 그러나 전기 자동차 분야의 연구 동향을 전체적으로 파악기 위해서는 방대한 데이터를 체계적으로 분석할 필요가 있다. 본 연구에서는 SCIE 데이터베이스에서 수집한 36,519편의 전기 자동차 관련 논문을 바탕으로 LDA주제 모델링을 수행하여 전기 자동차 분야의 연구 동향을 체계적으로 분석하고 주요 연구 주제를 파악하였다. 데이터 분석 결과, 총 10개의 주요 주제가 도출되었으며, 이 중 3개 주제는 상승 추세를 보이는 핫 토픽으로 확인되었으며 그 분야는 Electric Vehicle Charging Infrastructure, Energy and Environmental Policy, Optimization and Algorithms이었다. 그러나, 5개 주제는 하락 추세를 보이는 콜드 토픽으로 분류되었으며 그 분야는 Battery Temperature and Cooling, Battery Materials and Chemistry, Motor and Mechanical Design, Control Strategies and Systems, Battery Components and Materials이었다. 본 연구에서는 전기 자동차 분야의 최신 연구 동향을 이해하는 데 중요한 기초 자료를 제공하였으며, 전기자동차 관련 연구자가 연구 주제 선정에 필요한 유용한 정보를 제공하였다.

LDA 토픽 모델링을 활용한 SNS 분석 (SNS Analysis Using LDA Topic Modeling)

  • 장민수;임선영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.402-403
    • /
    • 2023
  • 본 연구의 목적은 LDA 토픽 모델링을 활용하여 한국어 SNS데이터에 분석을 통해 우리나라의 여가활동, 일과 직업, 주거와 생활의 동향을 살펴보는 것이다. AI Hub에서 제공하는 한국어 SNS데이터를 수집하고 형태소 분석, 전처리 과정을 거친 후 coherence score을 토대로 최적의 토픽 수를 결정하여 토픽을 추출하였다. 도출한 트렌드를 바탕으로 경영, 마케팅 분야에 미치는 영향을 예측할 수 있을 것으로 기대한다.

기업근로자 경력성공 인식의 다차원성과 차이: 토픽모델링의 적용 (Differences and Multi-dimensionality of the Perception of Career Success among Korean Employees: A Topic Modeling Approach)

  • 이재은;채충일
    • 한국콘텐츠학회논문지
    • /
    • 제19권6호
    • /
    • pp.58-71
    • /
    • 2019
  • 이 연구는 우리나라 기업근로자가 인식하는 경력성공의 다차원성과 개인특성에 따른 차이를 토픽모델링 방법을 적용하여 탐색하고자 하는 목적으로 수행되었다. 연구목적을 달성하기 위해 경력성공에 대한 인식을 개방형 설문을 통해 수집하였으며 126명의 기업근로자들의 응답자료를 바탕으로 R 프로그램을 활용하여 분석하였다. 분석결과 한국 근로자의 경력성공 인식에 대한 5가지 토픽이 도출되었다. 구체적으로, 토픽1은 사회적으로 인정받는 직장에 다니는 것(사회적 인정), 토픽 2는 조직 내에서 자신의 업무에 충실하며 견디는 것(조직 내 근속), 토픽 3은 자기 분야에 지식과 노하우를 갖고 전문성을 갖는 것(전문성), 토픽 4는 일한 만큼 경제적 보상과 성과를 얻는 것(경제적 보상), 토픽 5는 일을 통해 보람과 성취감 같은 개인적 의미를 추구하는 것(개인적 의미 추구)으로 나타났다. 또한, 성별, 연령, 학력에 따른 각 토픽별 발현비율 차이가 확인되었다. 이 연구를 통해 경력성공 인식의 다차원성과 개인특성에 따른 경력성공 인식 차이를 확인하였으며, 개방형 설문자료와 같은 비정형 데이터 분석에서 토픽모델링 방법을 활용가능성을 제시하였다.

토픽모델링을 활용한 COVID-19 학술 연구 기반 연구 주제 분류에 관한 연구 (A study on the classification of research topics based on COVID-19 academic research using Topic modeling)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.155-174
    • /
    • 2022
  • 2020년 1월부터 2021년 10월 현재까지 COVID-19(치명적인 호흡기 증후군인 코로나바이러스-2)와 관련된 학술 연구가 500,000편 이상 발표되었다. COVID-19와 관련된 논문의 수가 급격하게 증가함에 따라 의료 전문가와 정책 담당자들이 중요한 연구를 신속하게 찾는 것에 시간적·기술적 제약이 따르고 있다. 따라서 본 연구에서는 LDA와 Word2vec 알고리즘을 사용하여 방대한 문헌의 텍스트 자료로부터 유용한 정보를 추출하는 방안을 제시한다. COVID-19와 관련된 논문에서 검색하고자 하는 키워드와 관련된 논문을 추출하고, 이를 대상으로 세부 주제를 파악하였다. 자료는 Kaggle에 있는 CORD-19 데이터 세트를 활용하였는데, COVID-19 전염병에 대응하기 위해 주요 연구 그룹과 백악관이 준비한 무료 학술 자료로서 매주 자료가 업데이트되고 있다. 연구 방법은 크게 두 가지로 나뉜다. 먼저, 47,110편의 학술 논문의 초록을 대상으로 LDA 토픽 모델링과 Word2vec 연관어 분석을 수행한 후, 도출된 토픽 중 'vaccine'과 관련된 논문 4,555편, 'treatment'와 관련된 논문 5,791편을 추출한다. 두 번째로 추출된 논문을 대상으로 LDA, PCA 차원 축소 후 t-SNE 기법을 사용하여 비슷한 주제를 가진 논문을 군집화하고 산점도로 시각화하였다. 전체 논문을 대상으로 찾을 수 없었던 숨겨진 주제를 키워드에 따라 문헌을 분류하여 토픽 모델링을 수행한 결과 세부 주제를 찾을 수 있었다. 본 연구의 목표는 대량의 문헌에서 키워드를 입력하여 특정 정보에 대한 문헌을 분류할 수 있는 방안을 제시하는 것이다. 본 연구의 목표는 의료 전문가와 정책 담당자들의 소중한 시간과 노력을 줄이고, 신속하게 정보를 얻을 수 있는 방법을 제안하는 것이다. 학술 논문의 초록에서 COVID-19와 관련된 토픽을 발견하고, COVID-19에 대한 새로운 연구 방향을 탐구하도록 도움을 주는 기초자료로 활용될 것으로 기대한다.

토픽 모델링 및 바이그램 네트워크 분석 기법을 통한 여대생의 건강관리 및 웨어러블 디바이스 인식에 관한 연구 (Analyzing Female College Student's Recognition of Health Monitoring and Wearable Device Using Topic Modeling and Bi-gram Network Analysis)

  • 정우경;신동희
    • 정보관리학회지
    • /
    • 제38권4호
    • /
    • pp.129-152
    • /
    • 2021
  • 본 연구는 토픽 모델링 및 네트워크 분석 기법을 활용하여 여대생들의 웨어러블 디바이스에 대한 인식 및 선호도 분석, 건강관리에 대한 요구를 분석함으로써 여대생에게 맞는 웨어러블 디바이스 개발 방안을 제시하였다. 이를 위하여 S여자대학교 재학생들이 사용하는 커뮤니티에서 건강관리 및 웨어러블 디바이스와 관련된 게시글 2,457건을 수집하였고. 수집된 게시글과 댓글 데이터를 전처리한 뒤 LDA 기반의 토픽 모델링을 실시하였다. 토픽 모델링 기법을 통해 건강관리 및 웨어러블 디바이스와 관련하여 여대생들의 주요 쟁점들을 도출하고, 관련 키워드가 포함된 포스팅에 대해 바이그램 분석과 네트워크 분석을 수행하여 여대생들이 웨어러블 기기에 대해 가지고 있는 견해를 파악하고자 한다.

Analyzing Technological Trends of Smart Factory using Topic Modeling

  • Hussain, Adnan;Kim, Chulhyun;Battsengel, Ganchimeg;Jeon, Jeonghwan
    • Asian Journal of Innovation and Policy
    • /
    • 제10권3호
    • /
    • pp.380-403
    • /
    • 2021
  • Recently, smart factories have gained significant importance since the development of the fourth industrial revolution and the rise of global industrial competition. Therefore, the industries' survival to meet the global market trends requires accurate technological planning. Although, different works are available to investigate forecasting technologies and their influence on the smart factory. However, little significant work is available yet on the analysis of technological trends concerning the smart factory, which is the core focus herein. This work was performed to analyze the technological trends of the smart factory, followed by a detailed investigation of recent research hotspots/frontiers in the field. A well-known topic modeling technique, namely Latent Dirichlet Allocation (LDA), was employed for this study described above. The technological trends were further strengthened with the in-depth analysis of a smart factory-based case study. The findings produced the technological trends which possess significant potential in determining the technological strategies. Moreover, the results of this work may be helpful for researchers and enterprises in forecasting and planning future technological evolution.

Latent Dirichlet Allocation 토픽모델링을 이용한 한방 의료 서비스 분석에 관한 연구 : 의료 소비자의 온라인 리뷰를 중심으로 (A Study on the Analysis of Korean Medical Services using Latent Dirichlet Allocation Topic Modeling : Focusing on online reviews by medical consumers)

  • 손채연;송연우;이승호
    • 대한예방한의학회지
    • /
    • 제26권1호
    • /
    • pp.43-57
    • /
    • 2022
  • Objective : This study aims to understand the consumer's needs for Korean medicine medical service using online review analysis of medical consumers. Methods : We analyzed the purpose and satisfaction factors of medical service use using LDA (Latent Dirichlet Allocation) topic modeling. The data used in the study was 120,727 screened reviews written by medical consumers registered on Naver. The analyzed results were compared with the "2020 Korean Medicine Utilization Survey". Results : From 2018 to 2021, the five most frequently used terms were "kindness", "treatment", "doctor", "Korean medicine", and "acupuncture". The main purpose of visiting Korean medicine medical clinic and hospital was to treat "traffic accidents" in 2018, "waist(back) pain" in 2019, "musculoskeletal pain" in 2020 & 2021. Based on the rating, reviewers were satisfied with "explanation of treatment" and "treatment attitude", and dissatisfied with "accessibility to the institution". Conclusion : We concluded that the main purpose of use of Korean medicine institution was to treat musculoskeletal disorders. Based on the results of this study, it is expected that it will be used to improve Korean medicine medical service in the future.

코로나19 관련 키워드 분석: 토픽 모델링과 의미 연결망 네트워크 분석을 중심으로 (COVID19 Related Keyword Analysis: Based on Topic Modeling and Semantic Network Analysis)

  • 김동욱;이민상;정재영;김현철
    • 반도체디스플레이기술학회지
    • /
    • 제21권2호
    • /
    • pp.127-132
    • /
    • 2022
  • In the era of COVID-19 pandemic, COVID related keywords, news and SNS data are pouring out. With the help of the data and LDA topic modeling, we can check out what media reports about COVID-19 and vaccines. Also, we can be clear how the public reacts to the vaccine on social media and how this is related with the increasing number of COVID-19 patients. By using sentimental analysis methodology, we can get to know about the different kinds of reports that Korea media send out and get to know what kind of emotions that each media company uses in majority. Through this procedure, we can know the difference between the Korean media and the foreign ones. Ultimately, we can find and analyze the keyword that suddenly rose during the COVID-19 period throughout this research.