• 제목/요약/키워드: Topic Modeling(LDA)

검색결과 289건 처리시간 0.026초

텍스트 분석을 이용한 코로나19 관련 국내 논문의 주제 및 감성에 관한 융합 연구 (A Convergence Study on the Topic and Sentiment of COVID19 Research in Korea Using Text Analysis)

  • 허성민;양지연
    • 한국융합학회논문지
    • /
    • 제12권4호
    • /
    • pp.31-42
    • /
    • 2021
  • 본 연구에서는 코로나19 관련 연구논문의 연구주제를 탐색하고 동향을 검토하고 있다. 또한 감성분석을 통해 부정적인 어조가 강한 경고가 되는 주제들을 알아본다. 잠재 디리슐레 할당(LDA)를 이용하여 총 8개의 토픽을 발견하였고, 이를 구조적 토픽 모델링(STM)과 비교하여 비교적 안정적인 결과임을 확인하였다. 또한 k-means 군집 알고리즘을 통해 각 토픽별로 세부 연구주제를 발견하였고 주성분 분석을 이용하여 이를 시각적으로 표현하였다. 감성분석을 통해 각 토픽별 긍정적, 부정적인 단어들을 살펴보고 감성점수를 계산하여 연구논문의 주된 어조를 파악하였는데, 특히 생물 의학 관련, 국제적 역학관계, 심리적 영향과 관련된 연구에서 부정적인 어조가 강한 것으로 나타나 해당 부문에 대해서 주의와 관심이 요구된다. 향후 연구자들이 연구의 방향성을 탐색하고 정책결정자들이 연구지원 사업을 결정하는데 기초자료로 활용될 수 있을 것이다.

사용자 리뷰를 통한 소셜커머스와 오픈마켓의 이용경험 비교분석 (A Comparative Analysis of Social Commerce and Open Market Using User Reviews in Korean Mobile Commerce)

  • 채승훈;임재익;강주영
    • 지능정보연구
    • /
    • 제21권4호
    • /
    • pp.53-77
    • /
    • 2015
  • 국내 모바일 커머스 시장은 현재 소셜커머스가 이용자 수 측면에서 오픈마켓을 압도하고 있는 상황이다. 산업계에서는 모바일 시장에서 소셜커머스의 성장에 대해 빠른 모바일 시장진입, 큐레이션 모델 등을 주요 성공요인으로 제시하고 있지만, 이에 대한 학계의 실증적인 연구 및 분석은 아직 미미한 상황이다. 본 연구에서는 사용자 리뷰를 바탕으로 모바일 소셜커머스와 오픈마켓의 사용자 이용경험을 비교 분석하는 탐험적인 연구를 수행하였다. 먼저 본 연구는 구글 플레이에 등록된 국내 소셜커머스 주요 3개 업체와 오픈마켓 주요 3개 업체의 모바일 앱 리뷰를 수집하였다. 본 연구는 LDA 토픽모델링을 통해 1만여건에 달하는 모바일 소셜커머스와 오픈마켓 사용자 리뷰를 지각된 유용성과 지각된 편리성 토픽으로 분류한 뒤 감정분석과 동시출현단어분석을 수행하였다. 이를 통해 본 연구는 국내 모바일 커머스 상에서 오픈마켓 이용자들에 비해 소셜커머스 이용자들이 서비스와 이용편리성 측면에서 더 긍정적인 경험을 하고 있음을 증명하였다. 소셜커머스는 '배송', '쿠폰', '할인'을 중심으로 서비스 측면에서 이용자들에게 긍정적인 이용경험을 이끌어내고 있는 반면, 오픈마켓의 경우 '로그인 안됨', '상세보기 불편', '멈춤'과 같은 기술적 문제 및 불편으로 인한 이용자 불만이 높았다. 이와 같이 본 연구는 사용자 리뷰를 통해 서비스 이용경험을 효과적으로 비교 분석할 수 있는 탐험적인 실증연구법을 제시하였다. 구체적으로 본 연구는 LDA 토픽모델링과 기술수용모형을 통해 사용자 리뷰를 서비스와 기술 토픽으로 분류하여 효과적으로 분석할 수 있는 새로운 방법을 제시하였다는 점에서 의의가 있다. 또한 본 연구의 결과는 향후 소셜커머스와 오픈마켓의 경쟁 및 벤치마킹 전략에 중요하게 활용될 수 있을 것으로 기대된다.

텍스트마이닝을 활용한 공개데이터 기반 기업 및 산업 토픽추이분석 모델 제안 (Development of Topic Trend Analysis Model for Industrial Intelligence using Public Data)

  • 박선영;이진무;김유일;서진이
    • 기술혁신연구
    • /
    • 제26권4호
    • /
    • pp.199-232
    • /
    • 2018
  • 빅데이터 분석을 통한 기업 경영환경에 대한 이해와 통찰을 구하고자 하는 요구가 산업 및 기업 경영 전반에 증가하고 있다. 이러한 사회적 요구에 따라 산업의 이해와 기업 경영의 이해를 위하여 기업의 경영실적 및 향후 계획을 포괄적으로 담고 있는 기업공시정보를 활용한 연구가 주목을 받고 있다. 이러한 기업공시정보는 대표적인 비정형 데이터로써 텍스트마이닝 방법론을 적용하여 그 범위와 수준에 대한 다양한 접근을 통하여 산업 수준 및 기업 수준에서 다양한 활용이 가능하다. 그러나 아직은 이러한 기업공시자료를 활용한 산업 및 기업 레벨에서 적용가능한 수준의 분석모델이 부족한 것으로 파악된다. 따라서 본 연구에서는 실제 활용 가능한 공개데이터를 활용한 산업 및 기업 수준의 분석모델을 제안하고자 한다. 미국상장기업의 공시자료인 미국 SEC EDGAR 자료를 기반으로 텍스트마이닝 알고리즘을 적용하여 산업 및 기업 수준의 경영주제(토픽)에 대한 추이분석이 가능한 모델을 제안하고자한다. SEC EDGAR의 10-K 문서를 대상으로 LDA 토픽 모델링을 통하여 산업 수준에서 전체 산업의 주제분야 분류를 파악하였고, 산업간 비교 측면에서 소프트웨어 산업과 하드웨어 산업 분야의 사례를 통해 최근 20년간의 토픽추이를 비교분석 하였다. 또한 최근 20년간의 기업의 경영주제 변화를 소프트웨어 산업에 속한 2개 기업을 중심으로 살펴보았다. 이를 통해 산업 및 기업 수준에서의 경영주제의 추이 변화를 파악하여 쇠퇴 및 성장 추세에 있는 경영주제를 확인 할 수 있었다. 한편 word2vec 워드 임베딩 모델과 주성분분석을 통한 차원 축약을 통해 소프트웨어 산업분야의 기업 및 특정 제품(혹은 서비스)에 대한 매핑을 통해 유사한 경영주제(토픽)를 가지는 기업 및 제품(서비스)을 사례를 통해 파악하였으며, 이를 시간적 흐름에 따른 변화 양상도 관찰할 수 있었다. 본 연구의 목적이 공개데이터를 활용한 산업 및 기업 수준의 분석모델을 개발하기 위한 방법론을 제안한 측면에서, 해외 데이터를 사용하여 산업의 경영주제 변화 추이, 기업의 경영주제 변화 추이를 거시적으로 조망할 수 있는 실무적인 방법론의 제안에서 의의가 있을 수 있다. 한편 기업의 기술경영전략 측면에서 기업의 경영토픽의 잦은 변화, 경영주제의 변화의 속도 등 다양한 변화 양상의 차이에 따른 기업의 매출 등의 경영성과와의 연관성 분석, 실제 기업의 제품포트폴리오의 구성에 따른 기업 간의 경쟁상황 등을 파악하는 미시적 모델 제안을 위한 추가 연구가 요구된다.

텍스트 마이닝을 활용한 자율운항선박 분야 주요 이슈 분석 : 국내 뉴스 데이터를 중심으로 (Analysis of major issues in the field of Maritime Autonomous Surface Ships using text mining: focusing on S.Korea news data)

  • 이혜영;김진식;구병수;남문주;장국진;한성원;이주연;정명석
    • 시스템엔지니어링학술지
    • /
    • 제20권spc1호
    • /
    • pp.12-29
    • /
    • 2024
  • The purpose of this study is to identify the social issues discussed in Korea regarding Maritime Autonomous Surface Ships (MASS), the most advanced ICT field in the shipbuilding industry, and to suggest policy implications. In recent years, it has become important to reflect social issues of public interest in the policymaking process. For this reason, an increasing number of studies use media data and social media to identify public opinion. In this study, we collected 2,843 domestic media articles related to MASS from 2017 to 2022, when MASS was officially discussed at the International Maritime Organization, and analyzed them using text mining techniques. Through term frequency-inverse document frequency (TF-IDF) analysis, major keywords such as 'shipbuilding,' 'shipping,' 'US,' and 'HD Hyundai' were derived. For LDA topic modeling, we selected eight topics with the highest coherence score (-2.2) and analyzed the main news for each topic. According to the combined analysis of five years, the topics '1. Technology integration of the shipbuilding industry' and '3. Shipping industry in the post-COVID-19 era' received the most media attention, each accounting for 16%. Conversely, the topic '5. MASS pilotage areas' received the least media attention, accounting for 8 percent. Based on the results of the study, the implications for policy, society, and international security are as follows. First, from a policy perspective, the government should consider the current situation of each industry sector and introduce MASS in stages and carefully, as they will affect the shipbuilding, port, and shipping industries, and a radical introduction may cause various adverse effects. Second, from a social perspective, while the positive aspects of MASS are often reported, there are also negative issues such as cybersecurity issues and the loss of seafarer jobs, which require institutional development and strategic commercialization timing. Third, from a security perspective, MASS are expected to change the paradigm of future maritime warfare, and South Korea is promoting the construction of a maritime unmanned system-based power, but it emphasizes the need for a clear plan and military leadership to secure and develop the technology. This study has academic and policy implications by shedding light on the multidimensional political and social issues of MASS through news data analysis, and suggesting implications from national, regional, strategic, and security perspectives beyond legal and institutional discussions.

토픽모델링을 활용한 소프트웨어 분야 대학 교과과정 분석 (A Comparative Analysis of Curriculums for Software-related Departments based on Topic Modeling)

  • 최재원;이호;김정민;송주호
    • 한국전자거래학회지
    • /
    • 제22권4호
    • /
    • pp.193-214
    • /
    • 2017
  • 소프트웨어 직무의 특성과 대학교의 SW 학과가 개발한 커리큘럼 간의 차이가 존재하는 현재에서, 실제로 SW 관련 교과과정 편성이 어떻게 구성되어 있는지, 그리고 현실적으로 SW 인력의 실무 요구사항과 부적합한 부분을 확인하는 것이 매우 중요한 시기이다. 해외 사례를 보면 이미 실무 요구사항 중심의 SW 교육을 바탕으로 SW 인력을 양성하려는 노력이 진행되어 오고 있다. 그 결과 실제 관련 실무 기업들의 채용에 대한 긍정적인 반응이 나타나고 있다. 국내에서도 정부 주도하에 이러한 시도가 시도되고 있으며 특히 SW 중심대학 사업을 바탕으로 관련 분야의 선도대학의 역할을 부여하고 있다. 그러나 SW 분야의 인력 공급 문제는 여전히 실무분야와 교육 분야의 이슈가 되고 있다. 교과과정 구성에 대한 실무 기업들의 관점의 환경적 요소가 확실히 반영되지 못하고 있다는 기존의 한계에 따라 본 연구에서는 교육 내용의 구성과 실무의 차이를 줄일 수 있는 방법을 진단하고자 하였다. 그에 따라 실제 활용중인 대학의 교과과정과 강의계획서 자료를 바탕으로 토픽모델링을 실시함으로서 교과과정과 강의계획서에 대한 키워드를 도출하였다. 분석 결과 분석에 활용된 관련 대학 학과의 실습 비율이 상대적으로 낮은 수준을 보였으며 교과목 중첩비율, 강의계획서 키워드 중첩비율도 일반 수준으로 보여짐에 따라서 체계적인 교과과정 확립과 실무 능력 배양을 위한 강의계획 수립이 중요하다는 것을 확인하였다.

'우주 위험' 관련 뉴스 기사의 텍스트 마이닝 분석 연구 (Text Mining Analysis of News Articles Related to 'Space Hazard')

  • 조훈;손정주
    • 한국지구과학회지
    • /
    • 제43권1호
    • /
    • pp.224-235
    • /
    • 2022
  • 본 연구는 지난 12년간의 우주위험 관련 언론기사의 토픽모델링 분석을 통해 우주위험별 언론 보도 현황을 알아보기 위한 목적으로 수행되었다. 빅카인즈(BIGKinds)의 뉴스 플랫폼에서 2010년부터 2021년까지의 태양폭풍, 인공우주물체, 자연우주물체에 대한 우주위험 기사를 각각 1200여건 이상 수집하였으며, 키워드 분석, 잠재적 디리클레 할당모형(LDA) 분석을 수행하였다. 그 결과 태양폭풍 관련 기사는 3개의 토픽인 태양폭발이 인공위성에 미치는 영향, 우주전파센터를 중심으로 태양폭발이 우리나라 전파 통신에 미치는 영향, 항공종사자와 우주방사선의 관계로 요약되었다. 인공우주물체 관련 기사의 경우 3개의 토픽으로 인공위성과 우주정거장이 우주쓰레기로부터 위협을 받거나 그 자체가 우주쓰레기가 될 수 있다는 토픽, 영화를 통한 우주쓰레기와 인류의 관계에 대한 토픽, 우주쓰레기 추적·감시 및 처리를 위한 우주강국들의 노력이라는 토픽으로 요약되었다. 자연우주물체 관련 기사는 2개의 토픽으로 국제 우주기관의 근지구소행성에 대한 추적·감시와 충돌 대책과 소행성과 혜성 충돌을 중심으로 공룡과 포유류의 진화 및 멸종 원인으로 요약되었다. 이로부터 2010년부터 현재까지 국내 언론은 우주위험을 사회, 문화 등 다양한 영역에서 총 8개의 주제로 대중들에게 그 위험성과 경각심을 전하는 역할을 하고 있음을 확인하였으며, 이러한 결과를 기반으로 우주위험에 대한 교육방법과 교육정책의 필요성을 제언하였다.

텍스트 마이닝을 이용한 혁신 분야의 국외 연구 동향 분석 (Research Dynamics in Innovation Studies Using Text Mining)

  • 정효정
    • 기술혁신연구
    • /
    • 제24권4호
    • /
    • pp.249-275
    • /
    • 2016
  • 지난 50년 동안 혁신 분야는 학문의 정착과 진화의 시기를 지나왔다. 시간이 흐름에 따라 연구 주제의 범위가 확장되고 다양해지고 있으며, 양적 측면에서도 증가 추세를 보이고 있다. 혁신 분야와 같이 다학제적인 분야에서 새로운 연구 주제를 탐색하고, 기존 연구의 흐름을 파악하는데 있어 연구 현황 및 동향에 대한 포괄적인 이해는 필수적이다. 본 연구에서는 텍스트 마이닝 기법을 이용해 2000년부터 2015년까지의 국외 혁신 분야의 연구 현황 및 동향을 거시적인 관점에서 분석하였다. 분석 결과, 혁신 분야에서는 전통적인 주제와 최근에 주목받고 있는 주제를 중심으로 연구가 이루어지고 있었으며, 일부 전통적인 주제에서 학문의 분화 현상이 나타났다. 연구 결과는 지난 16년 동안 혁신 분야에서 나타난 연구 주제의 현황 및 동향에 대한 이해를 도모할 것이며, 연구자들에게 새로운 패러다임이 정착하고 진화해가는 과정을 학술적 관점에서 통찰할 수 있는 기회를 제공할 것이다.

트윗 텍스트 마이닝 기법을 이용한 구제역의 감성분석 (Sentiment Analysis of Foot-and-Mouth Disease Using Tweet Text-Mining Technique)

  • 채희찬;이종욱;최윤아;박대희;정용화
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제7권11호
    • /
    • pp.419-426
    • /
    • 2018
  • 구제역으로 인하여 국내 축산업계 및 관련 산업분야는 매년 막대한 피해를 입고 있다. 구제역과 관련한 다양한 학술적 연구들이 현재 진행되고는 있으나, 구제역의 발병에 따른 사회적 파급효과에 관한 공학적 분석 연구는 매우 제한적이다. 본 연구에서는 구제역에 관한 일반 시민들의 감성적 반응을 텍스트 마이닝 방법론을 사용하여 분석하는 체계적인 방법론을 제안한다. 제안하는 시스템은 먼저, 트위터에 게시된 트윗 중 구제역과 관련된 데이터를 수집한 후, 딥러닝 기법을 사용하여 극성 분류 과정을 거친다. 둘째, 토픽 모델링의 대표적인 기법 중 하나인 LDA를 활용하여 트윗으로 부터 키워드들을 추출하고, 추출된 키워드들로부터 극성별 동시출현 키워드 네트워크를 구성한다. 셋째, 키워드 네트워크을 통해 구제역의 위기단계 구간별 사회적 파급효과를 분석한다. 사례 분석으로써, 2010년 7월부터 2011년 12월까지 국내에서 발생한 구제역에 관한 일반 시민들의 감성적 변화를 분석하였다.

텍스트 마이닝 방법론과 메신저UI를 활용한 융합연구 촉진을 위한 연구자 및 연구 분야 추천 시스템의 제안 (Researcher and Research Area Recommendation System for Promoting Convergence Research Using Text Mining and Messenger UI)

  • 양낙영;김성근;강주영
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제27권4호
    • /
    • pp.71-96
    • /
    • 2018
  • Purpose Recently, social interest in the convergence research is at its peak. However, contrary to the keen interest in convergence research, an infrastructure that makes it easier to recruit researchers from other fields is not yet well established, which is why researchers are having considerable difficulty in carrying out real convergence research. In this study, we implemented a researcher recommendation system that helps researchers who want to collaborate easily recruit researchers from other fields, and we expect it to serve as a springboard for growth in the convergence research field. Design/methodology/approach In this study, we implemented a system that recommends proper researchers when users enter keyword in the field of research that they want to collaborate using word embedding techniques, word2vec. In addition, we also implemented function of keyword suggestions by using keywords drawn from LDA Topicmodeling Algorithm. Finally, the UI of the researcher recommendation system was completed by utilizing the collaborative messenger Slack to facilitate immediate exchange of information with the recommended researchers and to accommodate various applications for collaboration. Findings In this study, we validated the completed researcher recommendation system by ensuring that the list of researchers recommended by entering a specific keyword is accurate and that words learned as a similar word with a particular researcher match the researcher's field of research. The results showed 85.89% accuracy in the former, and in the latter case, mostly, the words drawn as similar words were found to match the researcher's field of research, leading to excellent performance of the researcher recommendation system.

메타버스 앱 시장과 여가: 오큘러스 앱 분석 (Metaverse App Market and Leisure: Analysis on Oculus Apps)

  • 김태경;김성수
    • 지식경영연구
    • /
    • 제23권2호
    • /
    • pp.37-60
    • /
    • 2022
  • 가상현실 게임의 성장과 블록체인 기술의 대중화는 메타버스(metaverse) 산업 생태계 형성에 유의미한 변화를 가져오고 있다. 메타(Meta)가 VR 기기 제조 및 관련 콘텐츠 개발사인 오큘러스(Oculus)를 인수한 이후, 가상현실 콘텐츠 시장의 성장이 가속화되고 있다. 본 연구를 통해 우리는 가상현실 앱 마켓의 콘텐츠를 탐색적으로 분석하여 여가(leisure)가 어떻게 기존의 모바일 앱과 가상현실 앱을 구분 짓고 있는지 탐색적으로 알아보았다. 이를 위해 오큘러스 한국 스토어에 등록된 241개 앱의 장르와 설명을 텍스트 마이닝으로 분석하였다. 그 결과, 앱 카테고리 키워드를 기초로 앱에 대한 준네트워크(quasi-network)를 생성하여 키워드 장르 간 암묵적 지식 네트워크를 시각화하였다. 또한 G&F 역할 프레임워크를 활용하여 여가가 차지하는 상대적 역할을 조명하였다. 추가적으로, 사용자의 리뷰 데이터를 LDA 토픽 모델링 방법으로 분석하였다. 본 연구는 가상현실 하의 메타버스 앱 생태계의 특징을 규명하기 위한 이론 개발의 기초 자료를 제공한다는 점에서 의의가 있다.