• 제목/요약/키워드: Research topic

검색결과 2,410건 처리시간 0.029초

전역 토픽의 지역 매핑을 통한 효율적 토픽 모델링 방안 (Efficient Topic Modeling by Mapping Global and Local Topics)

  • 최호창;김남규
    • 지능정보연구
    • /
    • 제23권3호
    • /
    • pp.69-94
    • /
    • 2017
  • 최근 빅데이터 분석 수요의 지속적 증가와 함께 관련 기법 및 도구의 비약적 발전이 이루어지고 있으며, 이에 따라 빅데이터 분석은 소수 전문가에 의한 독점이 아닌 개별 사용자의 자가 수행 형태로 변모하고 있다. 또한 전통적 방법으로는 분석이 어려웠던 비정형 데이터의 활용 방안에 대한 관심이 증가하고 있으며, 대표적으로 방대한 양의 텍스트에서 주제를 도출해내는 토픽 모델링(Topic Modeling)에 대한 연구가 활발히 진행되고 있다. 전통적인 토픽 모델링은 전체 문서에 걸친 주요 용어의 분포에 기반을 두고 수행되기 때문에, 각 문서의 토픽 식별에는 전체 문서에 대한 일괄 분석이 필요하다. 이로 인해 대용량 문서의 토픽 모델링에는 오랜 시간이 소요되며, 이 문제는 특히 분석 대상 문서가 복수의 시스템 또는 지역에 분산 저장되어 있는 경우 더욱 크게 작용한다. 따라서 이를 극복하기 위해 대량의 문서를 하위 군집으로 분할하고, 각 군집별 분석을 통해 토픽을 도출하는 방법을 생각할 수 있다. 하지만 이 경우 각 군집에서 도출한 지역 토픽은 전체 문서로부터 도출한 전역 토픽과 상이하게 나타나므로, 각 문서와 전역 토픽의 대응 관계를 식별할 수 없다. 따라서 본 연구에서는 전체 문서를 하위 군집으로 분할하고, 각 하위 군집에서 대표 문서를 추출하여 축소된 전역 문서 집합을 구성하고, 대표 문서를 매개로 하위 군집에서 도출한 지역 토픽으로부터 전역 토픽의 성분을 도출하는 방안을 제시한다. 또한 뉴스 기사 24,000건에 대한 실험을 통해 제안 방법론의 실무 적용 가능성을 평가하였으며, 이와 함께 제안 방법론에 따른 분할 정복(Divide and Conquer) 방식과 전체 문서에 대한 일괄 수행 방식의 토픽 분석 결과를 비교하였다.

토픽모델링을 활용한 간호리더십 관련 국내 연구동향 분석 (Analysis of Research Trends in Korea on Nursing Leadership Research Using Topic Modeling)

  • 윤희장
    • 문화기술의 융합
    • /
    • 제9권2호
    • /
    • pp.451-457
    • /
    • 2023
  • 이 연구의 목적은 간호리더십에 관한 국내 연구 동향을 파악하고, 이를 바탕으로 국내 간호리더십 관련 연구 및 중재 개발에 활용할 수 있는 기초 자료를 제공하기 위함이다. 연구에서는 2012년 1월부터 2021년 12월까지 국내 학술지에서 게재된 335편의 논문에서 간호리더십에 대한 토픽을 추출하기 위해 토픽모델링 기법을 사용하였다. 키워드는 초록에서 추출되었으며, DBpia, KISS, RISS, KM base, Nanet 등 5개의 국내 데이터베이스에서 문헌 검색이 수행되었다. 연구 결과, 간호리더십에 대한 학술 논문은 꾸준히 증가하고 있으며, 셀프리더십, 자기 효능, 교육 등이 주요 토픽으로 확인되었다. 또한, 리더십의 종류 중 셀프리더십이 가장 빈번하게 출현한 키워드로 확인되었기 때문에 다양한 형태의 리더십에 대한 연구가 더욱 활발히 이루어져야 한다는 결론을 얻을 수 있었다. 이러한 연구결과는 국내 간호리더십 분야에 대한 이해를 높이는 데 기여할 것으로 기대한다. 간호리더십에 대한 연구동향을 파악하는데 있어서 이 연구는 새로운 관점을 제공하고, 국내 간호리더십 연구의 지식구조를 분석하였다는데 의의가 있다.

텍스트 마이닝을 이용한 시대별 청소년 문제 토픽 분석 (Topic Analysis on the Adolescent Problem Using Text Mining)

  • 조경원;조주연
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.203-204
    • /
    • 2018
  • This research was conducted to identify adolescent problems in internet articles. This research defines adolescent problems as diverse issues related to adolescents and examine how it was dealt in the media to find out how different categories and the aspect of adolescent problems are changing by time. The result of the research was that in 1990's, education policy and family were mainly dealt with when it came to adolescent problems. As the era is changing, adolescent problems were far diversified compared to the past, and each problems are dealt with similar importance. This research is significant in that it does not only examine the social trend adolescent problems but also expand the range of adolescent counselling and utilizes quantitative analysis in considering diversity to provide new information.

  • PDF

머신러닝 및 딥러닝 연구동향 분석: 토픽모델링을 중심으로 (Research Trends Analysis of Machine Learning and Deep Learning: Focused on the Topic Modeling)

  • 김창식;김남규;곽기영
    • 디지털산업정보학회논문지
    • /
    • 제15권2호
    • /
    • pp.19-28
    • /
    • 2019
  • The purpose of this study is to examine the trends on machine learning and deep learning research in the published journals from the Web of Science Database. To achieve the study purpose, we used the abstracts of 20,664 articles published between 1990 and 2017, which include the word 'machine learning', 'deep learning', and 'artificial neural network' in their titles. Twenty major research topics were identified from topic modeling analysis and they were inclusive of classification accuracy, machine learning, optimization problem, time series model, temperature flow, engine variable, neuron layer, spectrum sample, image feature, strength property, extreme machine learning, control system, energy power, cancer patient, descriptor compound, fault diagnosis, soil map, concentration removal, protein gene, and job problem. The analysis of the time-series linear regression showed that all identified topics in machine learning research were 'hot' ones.

공원 이슈에 대한 주요 언론의 담론변화분석 - 1995년부터 2019년까지 신문 기사를 중심으로 - (Analysis of Changes in Discourse of Major Media on Park Issues - Focusing on Newspaper Articles Published from 1995 to 2019 -)

  • 고하정
    • 한국조경학회지
    • /
    • 제49권5호
    • /
    • pp.46-58
    • /
    • 2021
  • 국내에 근대식 공원이 도입된 이후, 공원은 우리에게 필수적인 존재가 되었다. 민선시기 이후, 공원조성 등 공원을 둘러싼 이슈가 생산되고 언론을 통해 확산되어 담론을 형성하는 과정을 거쳤다. 이에 본 연구는 민선시장 체제인 1995년 이후의 '공원' 관련 이슈를 다룬 국내 중앙지의 보도기사를 수집하여 토픽분석과 의미연결망 분석을 통해 공원에 대한 시계열적 담론 변화 추이를 분석하였다. LDA 토픽모델링 분석결과, 5개의 토픽-도시공원확충(토픽1), 역사문화공원(토픽2), 이용프로그램(토픽3), 동물원 사건사고(토픽4), 공원조성과정갈등(토픽5)-으로 분류되었다. 언론에서 다룬 주요 공원담론은 다음과 같다. 첫째, 공원의 양적 확장에 대한 조성과정과 갈등이 주요 담론으로 다뤄지고 있다. 둘째, 신규 공원 조성시마다 공원명이 신규 단어로 출현하고 이후 지속적으로 언급되면서 담론형성에 한 축을 담당하고 있다. 셋째, 민선시대 공원 관련 언론에서 '주민'은 주요 주체로 '도시', '환경'과 함께 언급되며, 공원의 공공성에 대한 담론을 형성하고 있다. 본 연구는 공원이 언론을 통해 어떻게 해석되는지 담론변화를 살펴보았다는 점에서 의의를 가진다. 추후 본 연구에서 다룬 중앙지 외에 지역지, 전문지 등 다른 매체에 대한 연구를 통해 공원에 대한 다양한 관점의 담론이 다뤄지길 기대한다.

빅데이터 기반한 미세플라스틱 지적네트워크 분석 (Microplastics Intellectual Network Analysis based on Bigdata)

  • 김영희;장관종
    • 융합정보논문지
    • /
    • 제12권4호
    • /
    • pp.239-259
    • /
    • 2022
  • 2019년 이후부터 전 세계적으로 미세플라스틱(Microplastics)에 관한 연구가 활발하게 진행되고 있어 국내·외 미세플라스틱 연구에 대한 차이점을 분석하는 것은 국내연구 방향 수립에 이정표가 될 수 있다. 본 연구에서는 KCI와 WoS에서 미세플라스틱 논문들을 발췌하여 저자 키워드동시출현단어분석, 논문동시인용분석, 저자동시인용분석 등 빅데이터를 기반으로 한 네트워크 분석방법론으로 국내외 연구 차이점을 분석했다. 분석결과, 연구주제 분석은 인간의 생체에 영향을 미칠 수 있는 연구와 일상에서의 미세플라스틱의 처리에 관한 연구가 국내에서 추가로 필요함을 확인하였다. 연구 품질을 살펴보는 논문 인용 깊이 분석에서는 국외 2.25와 국내 1.39로 국내가 아직 부족함을 보였고, 다양한 연구자들이 참여하고 정보를 공유하는 공동연구전선 구성형태 분석은 국내는 22개 군집 중에서는 3개가 Star형 구조가 있고, 국외의 경우는 19개 군집 모두가 Mesh 구조로 되어 있어 국내는 특정 연구 분야에서는 정보의 흐름과 공유가 부족함도 확인할 수 있었다. 이런 연구 결과는 미세플라스틱의 연구주제 확장과 연구 질의 향상, 더불어 다양한 연구자들이 참여하는 연구 추진체계 개선 등이 필요함을 확인하였다. 추가로 주제 모델링(Topic Modeling)을 기반으로 자동화 프로그램 개발을 한다면 실시간 분석이 가능한 시스템 구축도 가능할 것이다.

토픽모델링을 활용한 4차 산업혁명 분야의 국내 연구 동향 분석 (A Study on the Research Trends in the Fourth Industrial Revolution in Korea Using Topic Modeling)

  • 김지영;노동조
    • 한국비블리아학회지
    • /
    • 제34권4호
    • /
    • pp.207-234
    • /
    • 2023
  • 4차 산업혁명이 등장한 이래로 산업 분야를 비롯한 다양한 분야에서 관련 연구들이 수행되었다. 본 연구에서는 4차 산업혁명에 대한 국내의 연구 동향을 분석하기 위하여 2016년 1월부터 2023년 8월까지 KCI에 수록된 2,115건의 논문을 대상으로 핵심어 분석 및 LDA 알고리즘에 기반한 토픽모델링 분석을 실시하였다. 본 연구의 결과 첫째, 4차 산업혁명 관련 학술 논문이 많이 게재된 학술지는 디지털융복합연구, 인문사회 21, e-비즈니스연구, 학습자중심교과교육연구 등의 순이었다. 둘째, 토픽모델링 분석 결과, '인간과 인공지능', '데이터와 개인정보 관리', '교육과정의 변화', '기업의 변화와 혁신', '교육의 변화와 일자리', '문화예술과 콘텐츠', '정보와 기업의 정책과 대응'의 7개 토픽이 선정되었다. 셋째, 4차 산업혁명과 관련한 공통 연구주제는 '교육과정의 변화', '인간과 인공지능', '문화예술과 콘텐츠'이며, 공통 키워드는 '기업', '정보', '보호', '스마트', '시스템' 등이 있다. 넷째, 연구 전반기(2016-2019)에는 교육 분야의 주제가 상위에 등장했으나 후반기(2020-2023)에는 기업과 스마트, 디지털, 서비스 혁신에 관한 주제들이 상위로 나타났다. 다섯째, 연구 후반기로 가면서 연구 주제들이 보다 구체화되거나 세분화되는 경향을 보였다. 이러한 동향은 코로나 팬데믹 이후 4차 산업혁명 분야의 핵심 기술들이 다양한 산업 분야에 활용됨에 따라 발생하는 사회경제적 변화에 따른 것으로 해석된다. 본 연구의 결과는 4차 산업혁명 분야의 연구 동향 파악과 전략 수립 및 후속 연구에 유용한 정보를 제공할 수 있을 것으로 기대한다.

인접한 단어와 키워드 주제어 정보에 기반한 유사 문헌 검색 시스템 개발 (Development of Similar Bibliographic Retrieval System based on Neighboring Words and Keyword Topic Information)

  • 김광영;곽승진
    • 한국도서관정보학회지
    • /
    • 제40권3호
    • /
    • pp.367-387
    • /
    • 2009
  • 유사 문헌 검색 시스템은 추출된 색인어 중에서 어떤 것을 선택하는가에 따라 검색 결과에 많은 차이점이 발생한다. 본 연구에서는 추출된 후보 색인어의 선정의 오류를 최소한으로 하는 방법을 제공한다. 본 연구에서는 유사문헌에서 추출된 후보 색인어들을 이용하여 인접한 단어들의 정보와 추출된 키워드 주제어 정보를 이용하였다. 그리고 관련 저자들 정보와 검색 결과의 재순위화 방법을 이용하여 보다 정확도가 높은 유사 문헌 검색 시스템을 개발하였다. 본 논문에서는 과학기술 학회마을 데이터베이스를 이용하여 실험하였다. 실험과 사용자 평가를 통해서 유사 문헌 검색 시스템의 성능을 입증하였다.

  • PDF

토픽모델링 기반 행복과 불행 이슈 분석 및 행복 증진 방안 연구 (A Topic Modeling Approach to the Analysis of Happiness and Unhappiness)

  • 양승준;이보연;김희웅
    • 지식경영연구
    • /
    • 제17권2호
    • /
    • pp.165-185
    • /
    • 2016
  • Though Korea has received attention through an exceptional economic growth and the big K-POP fever all over the world, its happiness level is not so high. Therefore, this research aims to find not only the Korean' s condition of the happiness and unhappiness, but also the way to enhance their happiness. We collected various web data(89,127 cases from 2013/01 to 2014/12) through searching our own 26 keywords based on Alderfer's ERG Theory. Also, we tried to analyze the subjects related to happiness and unhappiness by using LDA topic modeling. As the result, the condition of happiness and unhappiness were the top topics extracted from each field. We conducted the second detailed analysis based on the data of condition of the happiness and unhappiness which are the top topics of the previous analysis. From the second analysis result, we proposed several ways to enhance happiness from the perspective of government, corporate, family, education, social welfare.This paper is meaningful because it catches the condition of happiness and unhappiness based on a real web data as well as transform the data into the knowledge. Also, this paper provides the practical methods from the view from all walks of life that may enhance happiness and relieve unhappiness.

A Survey on Automatic Twitter Event Summarization

  • Rudrapal, Dwijen;Das, Amitava;Bhattacharya, Baby
    • Journal of Information Processing Systems
    • /
    • 제14권1호
    • /
    • pp.79-100
    • /
    • 2018
  • Twitter is one of the most popular social platforms for online users to share trendy information and views on any event. Twitter reports an event faster than any other medium and contains enormous information and views regarding an event. Consequently, Twitter topic summarization is one of the most convenient ways to get instant gist of any event. However, the information shared on Twitter is often full of nonstandard abbreviations, acronyms, out of vocabulary (OOV) words and with grammatical mistakes which create challenges to find reliable and useful information related to any event. Undoubtedly, Twitter event summarization is a challenging task where traditional text summarization methods do not work well. In last decade, various research works introduced different approaches for automatic Twitter topic summarization. The main aim of this survey work is to make a broad overview of promising summarization approaches on a Twitter topic. We also focus on automatic evaluation of summarization techniques by surveying recent evaluation methodologies. At the end of the survey, we emphasize on both current and future research challenges in this domain through a level of depth analysis of the most recent summarization approaches.