• 제목/요약/키워드: 구조적 토픽 모델링

검색결과 48건 처리시간 0.023초

주제어 토픽모델링을 통한 IT 인문학 개념의 정립 (Conceptualization of IT Humanities through Keyword Topic Modeling)

  • 최영미;박남제
    • 정보교육학회논문지
    • /
    • 제26권5호
    • /
    • pp.467-480
    • /
    • 2022
  • 이 논문은 IT 인문학 관련 연구의 동향을 탐색함으로써 IT 인문학이 어떤 개념으로 활용되고 있는지 알아보고자 하였다. 디지털 과학기술 IT과 인문학 조합의 가능성에 주목하여 꾸준히 수행되어온 국내외의 문헌을 통해, IT 인문학의 기원과 배경, 유사 개념을 바탕으로 연구 동향을 알아보고 IT 인문학의 의미에 대해서 고찰하였다. 그리고 'IT 인문학' 및 'IT humanities' 검색어를 활용하여, 2001년 이후 발간 된 학술논문 중 주제어 정보를 제공하는 KCI급 1,566편, SCI급 64편을 대상으로 주제어의 네트워크 토픽 분석을 실시하였다. IT 인문학이라는 용어가 등장한 논문에서의 IT 인문학의 의미는 다양한 분야의 IT 정보기술이 인문학의 관점에서 생각할 수 있는 역량과 관련이 있었다. 토픽모델링 결과는 IT 인문학과 융합하는 분야 대상, 적용되는 형태, 문학·문화와의 연관, IT 인문학의 창출의 네 가지 군집으로 형성되었다. IT와 인문학의 융합은 한 쪽이 다른 한쪽을 도구화하거나 일방적으로 수렴하는 구조가 아닌, 상호 존중에 기초한 협업의 자세로 새로운 사유를 창출하도록 해야할 것이다.

유튜브에서 다루어지는 갈등은 무엇인가?: 갈등 관련 유튜브 콘텐츠에 대한 토픽모델링 (What are the Conflicts Covered on YouTube?: Topic Modeling of Conflict-related YouTube Contents)

  • 임연수
    • 한국인터넷방송통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.23-28
    • /
    • 2023
  • 이 연구는 갈등 관련 유튜브 콘텐츠를 중심으로 유튜브 공간의 특성을 규명하는 데 목적이 있다. 2012년부터 2022년까지 유튜브에 게재된 갈등 관련 콘텐츠를 수집하고 토픽모델링 분석을 통해 주요 내용과 특성을 파악했다. 분석 결과, 갈등 관련 유튜브 콘텐츠는 사회 구조적 갈등에 대한 뉴스 보도와 가족 내 갈등을 다룬 방송 프로그램 위주로 구성되어 있었다. 이러한 결과는 유튜브 공간이 갈등 관련 문제에 대한 공론장으로 활용될 수 있다는 기대보다는 기존 방송 콘텐츠의 수익 창출 수단으로 기능하리라는 우려를 하게 만든다. 앞으로 우리 사회가 유튜브를 어떻게 활용할지에 대한 깊이 있는 논의가 필요한 시점이다.

팬데믹에 따른 소비자의 피부 관련 관심 영역 변화 분석: 구조적 토픽모델링을 중심으로 (Analyzing Changes in Consumers' Interest Areas Related to Skin under the Pandemic: Focusing on Structural Topic Modeling)

  • 김나경;박지원;문형빈
    • 지식경영연구
    • /
    • 제25권1호
    • /
    • pp.173-192
    • /
    • 2024
  • 최근 뷰티 산업은 급격한 성장과 혁신으로 빠르게 발전하였으며, 코로나19 팬데믹으로 인한 마스크 착용 및 비대면 생활의 증가와 같은 생활 양식 변화에 따라 새로운 전환을 겪고 있다. 본 연구는 온라인상에 나타난 소비자의 피부에 대한 의견을 분석하여 코로나19 팬데믹 이후 뷰티 산업의 변화를 수요 측면에서 이해하고자 하였다. 이를 위해 2017년부터 2022년까지 소셜 미디어에 게재된 게시글 중 '피부 고민'을 포함한 96,908개의 게시글을 수집하고 이를 구조적 토픽모델에 적용하여 피부 관련 주제를 도출하였다. 분석 결과, 소비자가 고민하고 있는 피부 관련 주제는 총 22개로 구분될 수 있음을 확인하였으며, 이들 주제는 크게 뷰티 제조업, 뷰티 서비스업·연관산업, 피부고민, 기타 등 4가지 유형으로 구분될 수 있었다. 또한 본 연구는 분석 기간을 코로나19 팬데믹의 확산 양상을 기준으로 7개 단계로 나누고 각 토픽의 비중이 어떻게 변화하는지를 상승, 하강, 일정, 진동으로 구분하여 보았다. 코로나19 팬데믹 전과 후 시점에 대하여 주제별 비중의 변화 양상을 분석한 결과, 피부 고민 중 피부 트러블(여드름)과 이와 관련된 제품(스팟패치)은 상승 분야로, 뷰티 연관산업 중 성형외과와 한의원은 하강 분야로, 뷰티 제조업 중 수분 마스크팩, 메이크업 제품은 큰 변화가 없는 일정 분야로 나타났다. 또한 코로나 발생기간 내에서 팬데믹이 최고조에 달한 시기에는 바디케어 제품과 관련된 토픽이 급증하는 것을 확인할 수 있었다. 본 연구의 결과는 뷰티 산업의 수요 변화에 대응하여 기업이 제품 개발, 마케팅 전략을 수립하는 데에 활용될 수 있으며, 팬데믹 발생 시 정부가 경제적 지원 정책을 수립하는 경우 정책 추진의 근거로서도 활용될 수 있을 것으로 기대된다.

Spark 프레임워크 기반 비정형 빅데이터 토픽 추출 시스템 설계 (A Design on Informal Big Data Topic Extraction System Based on Spark Framework)

  • 박기진
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권11호
    • /
    • pp.521-526
    • /
    • 2016
  • 온라인상에서 다루어지는 비정형 텍스트 데이터는 대용량이면서 비구조적 형태의 특성을 가지고 있기 때문에, 기존 관계형 데이터 모델의 저장 방식과 분석 방법만으로는 한계가 있다. 더군다나, 동적으로 발생하는 대량의 소셜 데이터를 활용하여 이용자의 반응을 실시간으로 분석하기란 어려운 상황이다. 이에 본 논문에서는 대용량 비정형 데이터(문서)의 의미를 빠르고, 용이하게 파악하기 위하여 데이터 셋에 대한 사전학습 없이, 문서 내 단어 비중에 따라 자동으로 토픽(주제)이 추출되는 시스템을 설계 및 구현하였다. 제안된 시스템의 토픽 모델링에 사용될 입력 단어는 N-gram 알고리즘에 의하여 도출되어 복수 개의 단어도 묶음 처리할 수 있게 했으며, 또한, 대용량 비정형 데이터 저장 및 연산을 위하여 Hadoop과 분산 인메모리 처리 프레임워크인 Spark 기반 클러스터를 구성하여, 토픽 모델 연산을 수행하였다. 성능 실험에서는 TB급의 소셜 댓글 데이터를 읽어 들여, 전체 데이터에 대한 전처리 과정과 특정 항목의 토픽 추출 작업을 수행하였으며, 대용량 데이터를 클러스터의 디스크가 아닌 메모리에 바로 적재 후, 처리함으로써 토픽 추출 성능의 우수성을 확인할 수 있었다.

텍스트 분석 기술 및 활용 동향 (Investigations on Techniques and Applications of Text Analytics)

  • 김남규;이동훈;최호창
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.471-492
    • /
    • 2017
  • 최근 데이터의 양 자체가 해결해야 할 문제의 일부분이 되는 빅데이터(Big Data) 분석에 대한 수요와 관심이 급증하고 있다. 빅데이터는 기존의 정형 데이터 뿐 아니라 이미지, 동영상, 로그 등 다양한 형태의 비정형 데이터 또한 포함하는 개념으로 사용되고 있으며, 다양한 유형의 데이터 중 특히 정보의 표현 및 전달을 위한 대표적 수단인 텍스트(Text) 분석에 대한 연구가 활발하게 이루어지고 있다. 텍스트 분석은 일반적으로 문서 수집, 파싱(Parsing) 및 필터링(Filtering), 구조화, 빈도 분석 및 유사도 분석의 순서로 수행되며, 분석의 결과는 워드 클라우드(Word Cloud), 워드 네트워크(Word Network), 토픽 모델링(Topic Modeling), 문서 분류, 감성 분석 등의 형태로 나타나게 된다. 특히 최근 다양한 소셜미디어(Social Media)를 통해 급증하고 있는 텍스트 데이터로부터 주요 토픽을 파악하기 위한 수요가 증가함에 따라, 방대한 양의 비정형 텍스트 문서로부터 주요 토픽을 추출하고 각 토픽별 해당 문서를 묶어서 제공하는 토픽 모델링에 대한 연구 및 적용 사례가 다양한 분야에서 생성되고 있다. 이에 본 논문에서는 텍스트 분석 관련 주요 기술 및 연구 동향을 살펴보고, 토픽 모델링을 활용하여 다양한 분야의 문제를 해결한 연구 사례를 소개한다.

토픽 모델링을 활용한 상담 성과 연구동향 분석 - 「상담학연구」 학술지를 중심으로 (Counseling Outcomes Research Trend Analysis Using Topic Modeling - Focus on 「Korean Journal of Counseling」)

  • 박귀화;이은영;윤소정
    • 디지털융복합연구
    • /
    • 제19권11호
    • /
    • pp.517-523
    • /
    • 2021
  • 상담의 성과는 상담자와 연구자 모두에게 중요하다. 지금까지 진행되어온 상담의 성과에 대한 연구의 동향을 분석하는 것은 상담의 성과를 종합적으로 구조화하는데 도움을 준다. 본 연구의 목적은 2011~2021년에 국내 상담분야의 저명 학회지 중 하나인 「상담학연구」에 게재된 상담 성과 관련 연구를 중심으로 연구 동향을 분석하여, 국내 상담성과 연구의 지식 구조를 탐색하고 향후 연구방향을 모색하는 것이다. 텍스트 마이닝 기법 중 중심성분석과 토픽 모델링을 활용하였다. 분석에 활용된 연구는 197개로 노드 추출 과정을 거쳐 최종 339개의 키워드가 분석에 활용되었다. LDA 알고리즘을 활용하여 잠재 토픽을 추출한 결과 '상담 성과의 측정과 평가', '대인관계에 영향을 주는 정서와 매개요인', '진로에 대한 스트레스와 대처'가 주요 토픽으로 나타났다. 상담학 연구에 게재된 상담성과 연구의 동향 분석을 통해 주요 토픽을 밝힌 것은 상담성과 연구를 보다 구조화하는 데 기여하였으며, 이후에도 이러한 주제들에 대한 심층적 연구가 지속되어야 할 필요가 있다.

A Study on the News Frame of COVID-19 Vaccine through Structural Topic Modeling and Semantic Network Analysis

  • Eun-Ji Yun;Bo-Young Kang
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권5호
    • /
    • pp.129-153
    • /
    • 2023
  • 본 연구는 코로나19 팬데믹 상황이 심각하였을 때, 대중들의 관심도가 높은 코로나19 백신과 관련한 대량의 언론 보도 프레임을 분석하여, 위기커뮤니케이션의 핵심 요소로서 바람직한 언론의 역할과 방향성을 모색하기 위해 수행되었다. 본 연구의 기간은 코로나19 백신 개발이 가시화되기 시작한 2020년 11월부터 2021년 6월까지 8개월이며, 연구 대상은 대중 신뢰도 및 이용도 순위에 따라 조선일보, 중앙일보, 동아일보, 한겨레로 설정하였다. 결과의 정확성 및 효율성을 제고하기 위해 최신 빅데이터 연구 기법인 구조적 토픽 모델링(STM) 및 의미연결망 분석 기법을 활용하였다. 연구결과, 구성 단어들의 명확한 군집도 및 중심성 분석값을 기반으로 각 언론사 당 16개 프레임, 총 64개의 유의미한 프레임이 도출되었다. 또한 프레임의 구성 정도 및 내용에 대한 차이를 확인하기 위해 4개 언론사를 비교 분석하였으며, 모든 언론사마다 유의미한 차이가 없음을 확인하였다.

대선 관련 인터넷 뉴스의 댓글과 대댓글 간 비교를 통해 살펴본 온라인 토론의 진행 가능성 (The Comparison Between the Comments and the Replies on Korean President Election News: using Topic Modeling)

  • 이정
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.33-55
    • /
    • 2022
  • 본 연구는 온라인에서 토론이 제대로 이루어지는 지 알아보기 위해 대선 관련 인터넷 뉴스에 달린 댓글과 대댓글을 비교 분석하였다. 하버마스의 공론장 이론에 따르면 토론이란 참여자들이 자유로운 의사소통을 통해 숙의 과정을 거쳐 사회적 합의를 이루고자 하는 노력이다. 만약 인터넷 공간에서 댓글을 작성하는 행위를 통해 서로 상호작용과 토론이 일어난다면 댓글과 대댓글은 토론의 진행과정에 따라 구조적, 내용적 측면에서 일정한 차이를 보일 것이다. 본 연구는 그 차이를 가설로 설정하고 검증을 위해 다음뉴스 포털에서 4만여개의 댓글을 수집하였다. 관련 뉴스의 주제는 대통령 선거로 하였는데 이는 전국민이 관심을 갖고 있고 따라서 댓글이 활발하게 달리는 주제이기 때문이다. t검정과 토픽모델링을 이용하여 분석한 결과, 가설은 모두 채택되었으며 댓글을 통해 온라인 토론이 진행된다는 것을 보여주었다. 본 연구는 온라인 댓글이 사람들의 스트레스 해소를 위한 서로 연결성 없는 무질서한 발언들이 아니라, 일정한 방향성을 가지고 사회적 합의를 향해 나아가는 숙의과정이라는 것을 이론적, 실질적으로 보여주었다.

AI 스피커!, 감정을 담아 말해봐 - SNS 댓글 분석을 중심으로 (AI speakers!, Speak with feelings - Focusing on Analysis of SNS Comments)

  • 김준환;이남연
    • 디지털융복합연구
    • /
    • 제18권7호
    • /
    • pp.101-110
    • /
    • 2020
  • AI 스피커를 비롯한 관련 디바이스에 감정 맞춤형 서비스나 다양한 기능들이 부가된 기기들이 등장하고 있다. 이에 본 연구는 AI 스피커 사용자들이 작성한 구매 후기 텍스트들의 주제를 확인하고, 실제 설문조사를 통한 실증분석 결과와 비교하기 위해서 LDA(Latent Dirichlet Allocation) 기반의 토픽모델링 분석을 수행하였다. 더 나아가 AI 스피커 사용 경험이 있는 이용자 600명을 대상으로 사용자가 지각한 스피커의 감성지능과 관계품질을 조사하고 서로 유의한 관계가 있는지 구조방정식모형을 통해 검증하였다. 본 연구결과는 첫째, 토픽모델링 분석결과는 대부분의 글에서 주로 AI 스피커의 기능적인 측면에 대해 언급하고 있는 것으로 나타났다. 둘째, 소비자가 인식하는 AI 스피커의 감성지능은 관계품질에 영향을 미치며, 관계품질은 고객만족에 긍정적인 영향을 미쳤다. 따라서 본 연구는 AI 관련 기존 연구를 확장시켜 감성지능 및 관계품질의 개념을 새롭게 접목하여 분석함으로써 이론적 및 실무적으로 시사점을 제공하고 있다.

기계학습 기반 토픽모델링을 이용한 학술지 "자원환경지질"의 연구주제 분류 및 연구동향 분석 (Topic Model Analysis of Research Themes and Trends in the Journal of Economic and Environmental Geology)

  • 김태용;박혜민;허준용;양민준
    • 자원환경지질
    • /
    • 제54권3호
    • /
    • pp.353-364
    • /
    • 2021
  • 국내 지질학의 연구 분야는 20세기 중반 이후부터 꾸준하게 발전되어왔다. 학술지 "자원환경지질"은 국내 지질학을 대표하는 역사가 긴 학술지로 지질학을 바탕으로 하는 융복합연구 논문이 게재되고 있다. 본 연구는 학술지 "자원환경지질"에 게재된 논문을 대상으로 문헌 고찰(literature review)을 수행하여 지질학의 역사와 발전에 대해 논의하고자 한다. 1968년부터 2020년까지 총 2,571편의 논문 제목, 주제어, 다국어 초록을 수집하였으며, Latent Dirichlet Allocation (LDA) 기반 토픽모델링을 실시하여 연구 주제를 분류하고 연구 동향과 주제간 연관성을 확인하였다. 학술지 "자원환경지질"은 총 8개의 연구주제('암석학 및 지구화학', '수문학 및 수리지질학', '광상학', '화산학', '토양오염 및 복원학', '기초지질 및 구조지질학', '지구물리 및 물리탐사', '점토광물')로 분류할 수 있었다. 1994년 이전에는 '광상학', '화산학', '기초지질 및 구조지질학'의 연구주제들이 활발하게 연구되었으며, 이후 '수문학 및 수리지질학', '토양오염 및 복원학', '지구물리 및 물리탐사', '점토광물'의 연구주제들이 성행하였다. 연관성분석(network analysis)결과, 학술지 "자원환경지질"은 '광상학'을 기반으로 융복합적 연구 논문들이 게재되었다는 것을 확인하였다. 본 연구의 결과는 지질학을 다루는 연구자들에게 문헌 고찰의 새로운 방법론을 제시하여 지질학의 역사에 대한 이해를 제공했음에 의의가 있다.