• 제목/요약/키워드: Latent Dirichlet Allocation (LDA) analysis

검색결과 145건 처리시간 0.024초

국내 산업공학 연구 주제 2001~2015 (Research Topics in Industrial Engineering 2001~2015)

  • 정보권;이학연
    • 대한산업공학회지
    • /
    • 제42권6호
    • /
    • pp.421-431
    • /
    • 2016
  • Over the last four decades, industrial engineering (IE) research in Korea has continued to evolve and expand to respond to social needs. This paper aims to identify research topics in IE research and explore their dynamic changes over time. The topic modeling approach, which automatically discovers topics that pervade a large and unstructured collection of documents, is adopted to identify research topics in domestic IE research. 1,242 articles published from 2001 to 2015 in two IE journals issued by the Korean Institute of Industrial Engineers were collected and their English abstracts were analyzed. Applying the Latent Dirichlet Allocation model led us to uncover 50 topics of domestic IE research. The top 10 most popular topics are revealed, and topic trends are explored by examining the dynamic changes over time. The four topics, technology management, financial engineering, data mining (supervised learning), efficiency analysis, are selected as hot topics while several traditional topics related with manufacturing are revealed as cold topics. The findings are expected to provide fruitful implications for IE researchers.

감시 영상에서의 장면 분석을 통한 이상행위 검출 (Detection of Abnormal Behavior by Scene Analysis in Surveillance Video)

  • 배건태;어영정;곽수영;변혜란
    • 한국통신학회논문지
    • /
    • 제36권12C호
    • /
    • pp.744-752
    • /
    • 2011
  • 지능형 감시 분야에서 이상행위를 검출하는 것은 오랫동안 연구되어온 주제로 다양한 방법들이 제안되어 왔다. 그러나 많은 연구가 움직이는 객체의 개별적인 추적이 가능하다는 것을 전제로 하여 찾은 가려짐이 발생하는 실생활에 적용하는데 한계가 있다. 본 논문에서는 객체 추적이 어려운 복잡한 환경에서 장면의 주된 움직임을 분석하여 비정상적인 행위를 검출하는 방법을 제안한다. 먼저, 입력영상에서 움직임 정보를 추출하여 Visual Word와 Visual Document를 생성하고, 문서 분석 기법 중 하나인 LDA(Latent Dirichlet Allocation 알고리즘을 이용하여 장면의 주요한 움직임 정보j위치, 크기, 방향, 분포)를 추출한다. 이렇게 분석된 장면의 주요한 움직임과 입력영상에서 발생한 움직임과의 유사도를 분석하여 주요한 움직임에서 벗어나는 움직임을 비정상적인 움직임으로 간주하고 이를 이상행위로 검출하는 방법을 제안한다.

빅데이터분석을 통한 체육계 병역특례제도의 사회적 현상 및 인식분석 (An Analysis of the Social Phenomena and Perceptions of the Special Case of Military Service System in Korean Sports Field Using Big Data)

  • 이현정;한혜원
    • 한국융합학회논문지
    • /
    • 제10권4호
    • /
    • pp.229-236
    • /
    • 2019
  • 본 논문은 한국언론진흥재단이 운영하는 빅카인즈(Big KINDS)를 통하여 2018년 1월1일부터 12월 31일까지 언론 보도자료를 중십으로 체육계 병역특례와 관련된 여론, 관점과 흐름에 대한 자료를 수집 분석하여 사회적 현상 및 인식을 분석하려는 데에 그 목적이 있다. 이를 위하여 빅데이터 분석을 기반으로 사회적 현상에서 속에서 발견되는 문제점을 도출하기 위해 관련 키워드를 잠재 디리클레 할당 기법을 실행하여 토픽을 도출하고 시각화 하였다. 도출된 토픽은 '병역특례 재조명', '병역비리 논란', '체육분야 병역특례', '예술분야 대체복무 제도', '국정감사'의 5개이다. 이는 체육계 병역특혜와 관련된 사회적 논란에 대한 정확한 정보를 파악하여 정의롭고 평등부담원칙에 부합되면서도 스포츠선수의 특성이 고려된 현실적 방안을 마련할 기초자료로 사용될 수 있을 것이다.

An Analysis of Artificial Intelligence Education Research Trends Based on Topic Modeling

  • You-Jung Ko
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권2호
    • /
    • pp.197-209
    • /
    • 2024
  • 본 연구의 목적은 국내 인공지능 교육의 최근 연구 동향을 분석하여 향후 인공지능 교육의 방향성을 모색하는 것이다. 2016년부터 2023년 11월까지 RISS(Research Information Sharing Service)에 게재된 논문 중 인공지능 교육 관련 논문 697편을 대상으로 워드 클라우드(Word Cloud)와 LDA 토픽 모델링(Latent Dirichlet Allocation Topic Modeling) 기법을 활용하여 분석하였다. 분석결과, 주요 토픽으로는 생성형 인공지능 활용 교육, 인공지능 윤리 교육, 인공지능 융합 교육, 인공지능 활용에 대한 교사 인식과 역할, 대학 교육에서 인공지능 리터러시(Literacy) 개발, 인공지능 기반 교육과 연구 방향으로 여섯 가지가 도출되었다. 분석결과를 토대로, (1) 다양한 교과목에 생성형 인공지능 활용 확대, (2) 인공지능 사용을 위한 윤리적 지침, (3) 인공지능 교육의 장기적 영향 평가, (4) 고등교육에서 교사의 인공지능 활용 역량, (5) 대학의 인공지능 교육과정 다양화, (6) 인공지능 연구 추이 분석 및 교육 플랫폼(Platform) 개발 등을 제안하였다.

기계학습 기반 토픽모델링을 이용한 학술지 "자원환경지질"의 연구주제 분류 및 연구동향 분석 (Topic Model Analysis of Research Themes and Trends in the Journal of Economic and Environmental Geology)

  • 김태용;박혜민;허준용;양민준
    • 자원환경지질
    • /
    • 제54권3호
    • /
    • pp.353-364
    • /
    • 2021
  • 국내 지질학의 연구 분야는 20세기 중반 이후부터 꾸준하게 발전되어왔다. 학술지 "자원환경지질"은 국내 지질학을 대표하는 역사가 긴 학술지로 지질학을 바탕으로 하는 융복합연구 논문이 게재되고 있다. 본 연구는 학술지 "자원환경지질"에 게재된 논문을 대상으로 문헌 고찰(literature review)을 수행하여 지질학의 역사와 발전에 대해 논의하고자 한다. 1968년부터 2020년까지 총 2,571편의 논문 제목, 주제어, 다국어 초록을 수집하였으며, Latent Dirichlet Allocation (LDA) 기반 토픽모델링을 실시하여 연구 주제를 분류하고 연구 동향과 주제간 연관성을 확인하였다. 학술지 "자원환경지질"은 총 8개의 연구주제('암석학 및 지구화학', '수문학 및 수리지질학', '광상학', '화산학', '토양오염 및 복원학', '기초지질 및 구조지질학', '지구물리 및 물리탐사', '점토광물')로 분류할 수 있었다. 1994년 이전에는 '광상학', '화산학', '기초지질 및 구조지질학'의 연구주제들이 활발하게 연구되었으며, 이후 '수문학 및 수리지질학', '토양오염 및 복원학', '지구물리 및 물리탐사', '점토광물'의 연구주제들이 성행하였다. 연관성분석(network analysis)결과, 학술지 "자원환경지질"은 '광상학'을 기반으로 융복합적 연구 논문들이 게재되었다는 것을 확인하였다. 본 연구의 결과는 지질학을 다루는 연구자들에게 문헌 고찰의 새로운 방법론을 제시하여 지질학의 역사에 대한 이해를 제공했음에 의의가 있다.

Modeling Topic Extraction-based Sentiment Analysis Based on User Reviews

  • Kim, Tae-Yeun
    • 통합자연과학논문집
    • /
    • 제14권2호
    • /
    • pp.35-40
    • /
    • 2021
  • In this paper, we proposed a multi-subject-level sentiment analysis model for user reviews using the Latent Dirichlet Allocation (LDA) method targeting user-generated content (UGC). Data were collected from users' online reviews of hotels in major tourist cities in the world, and 30 hotel-related topics were extracted using the entire user reviews through the LDA technique. Six major hotel-related themes (Cleanliness, Location, Rooms, Service, Sleep Quality, and Value) were selected from the extracted themes, and emotions were evaluated for sentences corresponding to six themes in each user review in the proposed sentiment analysis model. Sentiment was analyzed using a dictionary. In addition, the performance of the proposed sentiment analysis model was evaluated by comparing the emotional values for each subject in the user reviews and the detailed scores evaluated by the user directly for each hotel attribute. As a result of analyzing the values of accuracy and recall of the proposed sentiment analysis model, it was analyzed that the efficiency was high.

토픽 모델링을 이용한 개방형 혁신 연구동향 분석 및 정책 방향 모색 (A Study on the Research Trends on Open Innovation using Topic Modeling)

  • 조성배;신신애;강동석
    • 정보화정책
    • /
    • 제25권3호
    • /
    • pp.52-74
    • /
    • 2018
  • 2018년 2월, 우리나라 정부는 '국민이 주인인 정부'를 실현하고자 정부혁신 종합추진계획을 수립하였다. 종합계획의 핵심은 국민 참여이며, 정부 내부의 역량만을 통해 가치를 창출하는 것이 아닌 시민, 기업의 아이디어와 역량을 함께 모아 정부가 해결할 수 없는 사회 현안을 해결한다는 관점에서 개방형 혁신(Open Innovation)과 매우 유사하다. 이에 따라 본 연구에서는 개방형 혁신이 처음 발표된 2003년부터 2018년 4월까지의 영문 초록 데이터로 LDA(Latent Dirichlet Allocation) 기반의 토픽모델링을 이용하여 개방형 혁신 연구 주제들을 도출하고, 도출된 주제간 토픽 네트워크 분석을 실시하였다. 도출된 결과를 바탕으로 정부혁신 종합추진계획의 추진과제와 비교 분석하였다. 본 연구의 시사점은 개방형 혁신에 대한 연구 주제와 주제간 관계를 도출하고, 그 결과를 정부혁신 종합추진계획과의 비교를 통해 개방형 혁신 관련 우리나라 정책의 향후 발전방향을 제시하였다는 점에서 의의가 있다.

소셜 네트워크 서비스의 단어 빈도와 범죄 발생과의 관계 분석 (An Analysis of Relationship Between Word Frequency in Social Network Service Data and Crime Occurences)

  • 김용우;강행봉
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권9호
    • /
    • pp.229-236
    • /
    • 2016
  • 기존의 범죄 예측 방법들은 범죄 발생을 예측하기 위해 기존 기록을 이용하였다. 그러나 이러한 범죄 예측 모델은 데이터를 갱신하는데 어려움이 있다. 범죄 예측을 향상시키기 위해서 소셜 네트워크 서비스(SNS)를 이용하여 범죄를 예측하는 연구들이 진행되었지만, SNS 데이터와 범죄 기록 사이의 관계에 대한 연구는 미흡하다. 따라서, 본 논문에서는 SNS 데이터와 범죄 발생 사이의 관계를 범죄 예측의 관점에서 분석하였다. 잠재 디리클레 할당(LDA)을 이용하여 범죄 발생과 관련된 단어를 포함하는 트윗을 추출하였고, 범죄 기록에 따른 트윗 빈도의 변화를 분석하였다. 범죄 관련 단어를 포함하는 트윗의 빈도를 계산하고, 범죄 발생에 따라서 트윗 빈도를 분석하였다. 범죄가 발생하였을 때, 범죄와 관련된 트윗의 빈도가 변화하였다. 게다가, 범죄 발생 전후에 트윗 빈도가 특정 패턴을 보이기 때문에 SNS 데이터가 범죄 예측 모델에 도움이 될 것이다.

스토킹 관련 언론기사에 대한 텍스트네트워크분석 (Text Network Analysis on Stalking-Related News Articles )

  • 지은선;정상희
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.579-585
    • /
    • 2023
  • 본 연구의 목적은 텍스트네트워트분석을 통해 스토킹에 대한 정치성향의 언론기사 내에 핵심 단어를 탐색하고 내재된 의도를 살펴보는 것이다. 2018년 1월 1일부터 2022년 12월 31일까지 보도된 보수언론기사(조선일보, 중앙일보) 824건, 진보언론기사(한겨레신문, 경향신문) 783건으로 총 1,607건을 선정하여 LDA(Latent Dirichlet Allocation) 기반의 토픽모델링 기법으로 도출된 주제범주의 양상을 탐색하였다. 연구결과는 보수언론과 진보언론의 공통된 토픽은 젠더폭력의 인식개선, 신변보호 및 처벌강도, 스토커 신상공개 도출되었고 두 언론의 상이한 토픽은 보수언론에서는 스토커의 가해행위, '신당역 살인사건'의 개요와 진보언론은 '신당역 살인사건'의 가중처벌요구, (사이버공간의) 성착취 범죄 근절로 구성되었다. 본 연구는 스토킹에 대한 언론기사 간의 이념적 의견에 따라 보도형태에 변화가 있음을 시사한다.

토픽모델링을 활용한 무역분야 연구동향 분석 (A Study on the Research Trends in Int'l Trade Using Topic modeling)

  • 이지훈;김정숙
    • 무역학회지
    • /
    • 제45권3호
    • /
    • pp.55-69
    • /
    • 2020
  • This study examines the research trends and knowledge structure of international trade studies using topic modeling method, which is one of the main methodologies of text mining. We collected and analyzed English abstracts of 1,868 papers of three Korean major journals in the area of international trade from 2003 to 2019. We used the Latent Dirichlet Allocation(LDA), an unsupervised machine learning algorithm to extract the latent topics from the large quantity of research abstracts. 20 topics are identified without any prior human judgement. The topics reveal topographical maps of research in international trade and are representative and meaningful in the sense that most of them correspond to previously established sub-topics in trade studies. Then we conducted a regression analysis on the document-topic distributions generated by LDA to identify hot and cold topics. We discovered 2 hot topics(internationalization capacity and performance of export companies, economic effect of trade) and 2 cold topics(exchange rate and current account, trade finance). Trade studies are characterized as a interdisciplinary study of three agendas(i.e. international economy, International Business, trade practice), and 20 topics identified can be grouped into these 3 agendas. From the estimated results of the study, we find that the Korean government's active pursuit of FTA and consequent necessity of capacity building in Korean export firms lie behind the popularity of topic selection by the Korean researchers in the area of int'l trade.