• 제목/요약/키워드: 소셜 네트워크 텍스트 분석

검색결과 107건 처리시간 0.024초

문화권 클러스터링 기반 SNS 빅데이터 및 사용자 선호도 분석 (Cultural Region-based Clustering of SNS Big Data and Users Preferences Analysis)

  • 노승민
    • 한국항행학회논문지
    • /
    • 제22권6호
    • /
    • pp.670-674
    • /
    • 2018
  • 최근 댓글 / 텍스트, 이미지, 비디오, 블로그 및 사용자 경험을 포함한 소셜네트워크서비스(SNS) 데이터에는 다양한 고객의 추천 시스템을 구축하고 비즈니스 분석가에게 통찰력 있는 데이터 / 결과를 제공하는데 사용할 수 있는 많은 정보가 포함되어 있다. 멀티미디어 데이터, 특히 이미지 및 비디오와 같은 시각적 데이터는 SNS 데이터 중에서도 특정(문화권) 지역을 반영할 수 있는 가장 풍부한 데이터이며, 문화적 가치 및 관심사는 전반적으로 데이터의 많은 부분을 차지하고 있다. 이러한 방대한 데이터로부터 원하는 데이터를 지능적으로 추출하고, 엄청난 양의 데이터를 마이닝 하려면 보다 효율적이고 지능적인 데이터 분석 방법이 필요하다. 따라서 본 논문의 목적은 이러한 데이터를 모델링하고, 색인하고, 검색하는 방법에 대해 제안하고자 한다.

텍스트마이닝을 활용한 아동, 청소년 대상 소비관련 연구 키워드 분석 (Keyword Analysis of Research on Consumption of Children and Adolescents Using Text Mining)

  • 진현정
    • 한국가정과교육학회지
    • /
    • 제33권4호
    • /
    • pp.1-13
    • /
    • 2021
  • 본 연구는 텍스트마이닝 기법으로 최근 20년간 아동, 청소년 대상 소비 관련 연구의 주요어를 분석하여 소비 관련 연구의 동향을 파악하고자 하였다. 이를 위하여 KCI 등재/등재후보 학술지에 게재된 아동, 청소년의 소비관련 연구 869편의 주요어를 분석하였다. 빈도분석 결과 가장 빈도가 높은 주요어는 청소년, 청소년소비자, 소비자교육, 과시소비, 소비행동, 캐릭터, 경제교육, 윤리적소비 순으로 나타났다. 5년 단위로 주요어의 빈도를 분석한 결과, 2006년~2010년에는 소비자교육의 빈도가 월등하게 높아 이 시기에 소비자교육에 관한 연구가 많이 이루어졌음을 확인할 수 있었다. 2011년 이후 윤리적소비에 관한 연구가 활발해졌으며, 최근 5년 동안은 두드러지는 주요어가 없는 대신 다양한 주제로 연구가 이루어졌음을 알 수 있었다. TF-IDF 기준으로 주요어를 살펴보면 2001년~2005년 사이에는 환경과 인터넷 관련 단어가 주요 키워드였다. 2006년~2010년에는 미디어이용, 광고 교육, 인터넷아이템, 2011년~2015년에는 공정무역, 녹색성장, 녹색소비, 북한이탈청소년, 소셜미디어, 2016~2020년에는 텍스트마이닝, 지속가능발전교육, 메이커교육, 2015개정교육과정이 중요한 용어로 등장하였다. 토픽모델링 결과, 소비자교육, 대중매체/또래문화, 합리적 소비, 한류/문화산업, 소비자역량, 경제교육, 교수학습방법, 친환경/윤리적소비의 8개의 토픽이 도출되었다. 동시 출현 빈도를 활용한 네트워크 분석을 통해 아동, 청소년 관련 소비 연구에서 과시소비와 소비자교육이 중요한 연구주제임을 알 수 있었다.

다계층 이원 네트워크를 활용한 사용자 관점의 이슈 클러스터링 (User-Perspective Issue Clustering Using Multi-Layered Two-Mode Network Analysis)

  • 김지은;김남규;조윤호
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.93-107
    • /
    • 2014
  • 대부분의 인터넷 쇼핑몰은 자사 고객의 관심 분야를 파악하고 이를 상품 추천에 효과적으로 활용하기 위해 많은 노력을 기울이고 있다. 하지만 고객이 회원 가입 시 직접 입력한 개인 정보는 신뢰하기가 어렵고, 고객의 구매 패턴을 통해 파악한 관심 분야 정보는 자사 사이트 내에 진입한 이후에만 보인 한정된 패턴이라는 측면에서 해당 고객의 다양한 관심분야를 제대로 나타낸다고 보기 어렵다. 이러한 한계를 극복하기 위해 본 연구에서는 고객의 평소 인터넷 사용 기록을 통해 최근 방문 사이트들의 주제를 분석함으로써, 고객의 실제 관심 분야를 파악할 수 있는 방안을 제시하였다. 또한 토픽 분석을 통해 각 사이트의 주제를 도출하고 도출된 주제를 다시 동시 방문자 관점에서 군집화 함으로써, 고객 관점에서 의미가 있는 상위 수준의 새로운 테마를 발굴하기 위한 방법론을 제안하였다. 연구의 특징은 유사주제 중심의 군집화라는 기존 연구와는 달리 사용자 관점의 관심주제 중심 군집화라 할 수 있다. 향후 사용자 중심의 카테고리 설계를 비롯한 새로운 관점의 고객군 정의 등 보다 높은 차원의 마케팅 전략 수립에 활용이 가능할 것으로 기대된다. 사용자 관점의 이슈 군집화 과정은 크롤링, 토픽 분석, 액세스 패턴 분석, 네트워크 병합, 네트워크 변환 및 군집화와 같은 여섯 가지 주요단계로 구성되어있다. 이를 위해 텍스트 마이닝과 소셜 네트워크 분석 기법을 활용한 비정형 텍스트를 기반으로한 빅데이터의 활용 방법을 모색하였다. 제안 방법론의 실무 적용 가능성을 평가하기 위해, 국내 최대 포털 뉴스 사이트의 방문자 2,177명의 1년간 방문 기록과 뉴스기사 대한 분석을 수행하고 그 결과를 요약하여 제시하였다.

텍스트 마이닝과 의미 네트워크 분석을 활용한 뉴스 의제 분석: 코로나 19 관련 감정을 중심으로 (Analysis of News Agenda Using Text mining and Semantic Network Analysis: Focused on COVID-19 Emotions)

  • 유소연;임규건
    • 지능정보연구
    • /
    • 제27권1호
    • /
    • pp.47-64
    • /
    • 2021
  • 전 세계적으로 퍼진 코로나 19 상황은 우리의 일상생활의 많은 부분에 영향을 끼쳤을 뿐만 아니라, 경제·사회 등 많은 부분에 걸쳐 막대한 영향력을 미치고 있다. 확진자와 사망자 수가 증가함에 따라 의료진과 대중은 불안, 우울, 스트레스 등 심리적인 문제를 겪고 있다고 한다. 장기적인 부정적인 감정은 사람들의 면역력을 감소시키고 신체적인 균형을 파괴할 수도 있으므로 코로나 19로 인한 심리적인 상태를 이해하는 것이 필수적인 상황이다. 본 연구에서는 코로나 19 감정과 관련된 뉴스 데이터를 수집하여, 텍스트 마이닝을 통해 키워드를 분류하고, 키워드 사이의 의미 네트워크 분석을 통해 단어들의 관계를 시각화하였다. 코로나 감정과 관련된 기사의 키워드에 나타난 단어들의 빈도수를 확인하고 이를 워드 클라우드로 분석하였다. 키워드 빈도 분석 결과 코로나 19 감정과 관련하여 '중국', '불안', '상황', '마음', '사회', '건강'과 같은 단어의 빈도가 높게 나타난 것을 확인할 수 있었다. 각 데이터 간 연결 중심성을 분석한 결과 키워드 중심성 네트워크에서 가장 중심적인 핵심어는 '심리'와 '코로나 19', '블루', '불안'이라는 단어가 높은 연결 중심성을 가지는 것을 확인할 수 있었다. 기사의 헤드라인에 나타난 주요 핵심어 사이의 동시 출현 빈도 네트워크를 그래프로 시각화한 결과, '코로나-블루' 쌍이 가장 굵게 표시되었고, '코로나-감정', '코로나-불안' 쌍이 비교적 굵은 선으로 표시된 것을 알 수 있었다. 코로나와 관련된 '블루'는 우울증을 의미하는 단어로, 코로나와 우울증은 이제 관심을 가져야 할 키워드임을 확인할 수 있었다. 본 연구에서는 장기화한 코로나 19 상황에서 신체적인 방역뿐만 아니라 심리적인 방역에도 힘써야 할 이 시기에 보건 정책담당자가 빠르고 복잡한 의사결정 과정에 도움이 되고자 미디어 뉴스를 모니터링 함으로써, 더욱더 쉬운 소셜 미디어 네트워크 분석 방법을 제시하고자 한다.

보전문화체학 접근방식을 통한 생태계교란 생물인 담수 외래종의 대중인식 평가 (Assessment of Public Awareness on Invasive Alien Species of Freshwater Ecosystem Using Conservation Culturomics)

  • 박웅배;도윤호
    • 한국습지학회지
    • /
    • 제23권4호
    • /
    • pp.364-371
    • /
    • 2021
  • 담수 외래종에 대한 대중의 인식은 시대나 외래종과 관련된 특정 사건에 따라 달라진다. 인식차이는 관리계획을 수립하고 이해하는데 영향을 미쳐 외래종을 관리하는데 대중들의 인식을 이해하는 것이 중요하다. 본 연구에서는 보전문화체학 (Conservation culturomics)에서 사용하는 소셜 네트워크 플렛폼의 디지털 텍스트, 언론보도, 인터넷 검색량을 분석하여 담수 외래종에 대한 대중의 관심도와 감성을 파악하고자 하였다. 11종의 담수 외래종을 대상으로 트위터 게시글 수와, 언론보도량, 검색량을 추출하여 대중의 관심도를 파악하였다. 또한 이 자료들의 시간에 따른 추세와 계절 변동성여부, 자료의 반복 주기를 확인하였다. 수집된 자료를 텍스트마이닝 기법 기반의 감성분석을 통해 감성지수(sentiment score)로 산출해 각 종에 대한 대중들의 감성을 분석하였다. 연구결과 황소개구리와 뉴트리아, 파랑볼우럭, 큰입우럭은 다른 종들보다 상대적으로 많은 대중의 관심을 받는 것으로 확인되었다. 일부 종에서는 특정 시기에 따라 반복되고 변화하는 트윗량과, 언론보도량, 검색량을 나타냈다. 한편 텍스트마이닝 분석 결과, 대부분의 사람들이 담수 외래종에 대해 부정적인 감성을 가지고 있었다. 특히 생태계교란 생물이 지정된 이후 연도가 갈수록 부정적인 감성은 증가하였다. 하지만 과학적 근거가 없는 정보가 확산되거나 혐오를 증대시켜 담수 외래종을 관리하는 것은 한계가 있다. 따라서 외래종에 대한 대중들의 인식을 과학적으로 파악하여 관리방안이 수립되어야 한다.

텍스트 마이닝 기법을 활용한 SNS 상에서 우울감을 언급한 도시공원 이용자의 이용행태 분석 (Analysis of Use Behavior of Urban Park Users Expressing Depression on Social Media Using Text Mining Technique)

  • 오지연;남성우;이상훈
    • 한국콘텐츠학회논문지
    • /
    • 제22권6호
    • /
    • pp.319-328
    • /
    • 2022
  • 본 연구는 COVID-19 대유행에 의한 우울감과 공원 이용행태의 관계를 온라인상에 게시된 공원 이용에 대한 게시물을 이용하여 분석하고자 하였다. COVID-19 방역이 활발해진 기간 동안 네이버와 다음의 블로그 및 카페에서 '공원'과 '우울'을 포함한 텍스트 데이터를 수집하여 텍스트 마이닝(Text Mining)과 소셜 네트워크(Social Network)분석을 하였다. 연구결과, 우울감을 언급한 공원 이용자는 '보다', '산책/걷다', '먹다'의 이용행태를 주로 보였고, 소통 행태인 '보다'를 중심으로 다른 이용행태들이 연결되는 것으로 나타났다. CONCOR 분석 결과, 소통 행태 및 동적 행태의 군집의 경우, 단일 행태 유형으로 군집이 형성되어, 우울감을 언급한 이용자는 공원을 소통활동과 신체활동을 위한 공간으로 인식하는 경향이 나타났다. COVID-19의 대유행으로 소통활동과 신체활동의 결핍이 증가되었고 공원에서 이를 해소하려는 것으로 해석되었다. 또한 우울감의 발생으로 상대적으로 소극적인 이용행태가 주요한 이용행태로 나타났다. 본 연구결과는 도시민에게 효과적인 공원의 조성 및 관리 계획에 유용할 것으로 판단되었다. 후속 연구에서 COVID-19 대유행과 우울감의 유무를 연계한 공원 이용자의 이용행태 분석이 필요한 것으로 판단되었다.

빅데이터 분석을 통한 문학치료의 대중적 인지도 분석 - 국문학과 통계학의 융합적 측면 (The Analysis of Public Awareness about Literary Therapy by Utilizing Big Data Analysis - The aspects of convergence literature and statistics)

  • 최경호;박정혜
    • 디지털융복합연구
    • /
    • 제13권4호
    • /
    • pp.395-404
    • /
    • 2015
  • 본 연구에서는 빅데이터(big data)를 활용한 분석을 통해 문학치료에 대한 일반인들의 인식을 고찰하는 것으로 문학치료의 객관적인 인지도를 탐색하였다. '문학치료'에 대한 온라인상의 소셜 네트워크 서비스(SNS)자료에 대해 빅데이터 관점에서의 분석을 통한 의미정보 도출을 목적으로 텍스트 마이닝과 관련된 오피니언 마이닝 기법을 활용하여 문학치료와 관계된 키워드의 내용분석을 주요 연구방법으로 하였다. '문학치료'를 중점적으로 파악하면서,'독서치료'를 함께 비교 분석하였다. 연구 조사 기간은 2014년 10월 10일부터 2014년 11월 10일까지 30일 동안 블로그와 트위터 등의 소셜 네트워크 서비스(SNS)자료를 검색대상으로 하였다. 연구 분석 결과에 따라 문학치료 지평의 확산과 문학치료 지형의 구조적 조화, 문학치료 인식의 축을 견고하게 하는 것이 필요하다는 결론을 내릴 수 있다. 본 연구는 문학치료에 대한 일반인들의 인지도를 탐색하고 이에 관련한 문학치료의 활성화를 위한 대안을 제시할 수 있다는 점에서 의의를 찾을 수 있다.

간호관련 국민청원 분석: 텍스트네트워크 분석 및 토픽모델링 (National Petition Analysis Related to Nursing: Text Network Analysis and Topic Modeling)

  • 고현정;정석희;이은지;김희선
    • 대한간호학회지
    • /
    • 제53권6호
    • /
    • pp.635-651
    • /
    • 2023
  • Purpose: This study aimed to identify the main keyword, network structure, and main topics of the national petition related to "nursing" in South Korea. Methods: Data were gathered from petitions related to the national petition in Korea Blue House related to the topic "nursing" or "nurse" from August 17, 2017, to May 9, 2022. A total of 5,154 petitions were searched, and 995 were selected for the final analysis. Text network analysis and topic modeling were analyzed using the Netminer 4.5.0 program. Results: Regarding network characteristics, a density of 0.03, an average degree of 144.483, and an average distance of 1.943 were found. Compared to results of degree centrality and betweenness centrality, keywords such as "work environment," "nursing university," "license," and "education" appeared typically in the eigenvector centrality analysis. Topic modeling derived four topics: (1) "Improving the working environment and dealing with nursing professionals," (2) "requesting investigation and punishment related to medical accidents," (3) "requiring clear role regulation and legislation of medical and nonmedical professions," and (4) "demanding improvement of healthcare-related systems and services." Conclusion: This is the first study to analyze Korea's national petitions in the field of nursing. This study's results confirmed both the internal needs and external demands for nurses in South Korea. Policies and laws that reflect these results should be developed.

ESG 보고서의 텍스트 분석을 이용한 ESG 활동 탐색 -중국 상장 제조 기업을 대상으로- (Exploring ESG Activities Using Text Analysis of ESG Reports -A Case of Chinese Listed Manufacturing Companies-)

  • 진웅철;백승익;손유봉;김향단
    • 서비스연구
    • /
    • 제14권2호
    • /
    • pp.18-36
    • /
    • 2024
  • 본 연구는 글로벌 경제 시장에서 중국의 제조 기업들이 동적역량을 기반으로 어떠한 ESG 활동을 수행하고 있으며 그 활동에는 어떠한 차이가 있는가를 분석하였다. 상하이와 선전 증권 거래소 (Shanghai & Shenzhen Stock Exchange)에서 151개 중국 상장 제조 기업들의 ESG 연례 보고서와 상하이 화정 지표 정보 회사(CSI, China Securities Index Company)의 ESG 지표를 데이터로 사용하였다. 연구 분석에는 TensorFlow-BERT 모델과 코사인 유사도를 사용하여 환경, 사회, 지배구조로 구분된 ESG 키워드를 분류하였고 이를 기반으로 다음 세가지의 연구 질문을 구성하였다. 첫번째는 ESG 점수가 높은 기업(TOP-25)과 낮은 기업(BOT-25)을 구분하여 이 기업들 사이의 ESG 활동에는 어떠한 차이가 있는지를 확인하였으며, 두 번째는 ESG 점수가 높은 기업만을 중심으로 10년간(2010~2019년)의 ESG 활동에는 어떠한 변화가 있는지도 확인하였다. 그 결과 ESG 점수가 높은 기업과 낮은 기업간의 ESG 활동에는 유의한 차이를 보였으며, TOP-25기업의 연도별 활동 변화 추적에서는 ESG 활동의 모든 부분에서 차이를 보이지 않은 것으로 나타났다. 세번째 연구에서는 연도별로 작성된 각 항목별 E, S, G 키워드에 대하여 소셜 네트워크 분석을 진행하였다. 동시발생행렬(Co-occurance matrix) 기법을 통해 기업들의 ESG활동을 4사분면 그래프로 시각화하였으며 이를 바탕으로 ESG활동에 대한 향후 방향을 제시하였다.

소셜미디어 데이터를 활용한 태안해안국립공원 방문객의 경관인식 파악 - 꽃지해수욕장·신두리해안사구·만리포해수욕장을 대상으로 - (Identifying Landscape Perceptions of Visitors' to the Taean Coast National Park Using Social Media Data - Focused on Kkotji Beach, Sinduri Coastal Sand Dune, and Manlipo Beach -)

  • 이성희;손용훈
    • 한국조경학회지
    • /
    • 제46권5호
    • /
    • pp.10-21
    • /
    • 2018
  • 실제 이용자의 경험을 파악하는 것은 경관관리에 있어서 중요한 관점 중 하나이다. 본 연구는 이점에서 착안하여 블로그 글을 대상으로 텍스트마이닝을 활용하여 이용자들이 자발적으로 올린 글을 바탕으로 그 안에 담긴 경관인식을 파악하였다. 연구 대상지는 태안해안국립공원으로 하였다. '태안 여행'으로 검색하여 나타난 장소는 대부분 태안해안국립공원에 해당되는 곳이었고, 도출된 장소 중 상위 세 곳을 대상으로 에고네트워크 분석을 실시하고, 각 장소 명칭과 연결된 경관인식에 관련한 키워드(장소, 이미지, 활동, 경관대상물)를 추출하였다. 마지막으로, 중심성 분석과 응집성 분석을 통해 각 장소에 대한 사람들의 경관인식과 주요이슈를 도출하고 의미를 해석하였다. 연구결과로 태안 여행에서 인지되는 주요 장소, 그리고 구체적인 장소에서의 개별적인 경관체험과 경관인식을 파악할 수 있었다. 꽃지해수욕장은 장소 관련 키워드가, 신두리해안사구는 경관이미지에 대한 키워드가, 그리고 만리포해수욕장은 경관요소와 관련된 키워드가 주로 나타나고 있어, 방문객이 인식하는 세 장소의 경관 특성이 상이함을 유추할 수 있다. 구체적으로는 꽃지해수욕장은 일몰경관 감상의 명소이자 태안해안국립공원 트래킹 코스의 거점으로서 인식되고 있으며, 신두리해안사구는 비일상적 경관을 보유한 곳이자 생태적으로 가치가 높은 공간으로 보존의 대상으로 인식되고 있는 것으로 나타났다. 마지막으로 만리포해수욕장은 천리포수목원과 인접하고 있어 높은 방문이 이루어지며, 해변 자체의 모습이 인상적인 곳으로 인식되고 있었다. 소셜미디어 데이터는 이용자 관점에서의 분석자료이므로, 전문가의 관점에서 미처 보지 못했던 다양한 내용을 분석할 수 있어서 매우 유용한 자료이다. 본 연구에서는 경관인식 연구에 소셜미디어 데이터를 활용하여 경관대상, 경관이미지, 활동 등의 여러 내용을 종합하여 사람들이 어떻게 경관을 인식하고 향유하는지를 다각적으로 분석하였다. 다만 소셜미디어 데이터는 작성자의 기억과 인식이 증폭되거나 왜곡될 가능성이 있기 때문에, 보다 정확한 분석을 위해서는 추후 현장에서 설문조사 등을 실시하여 본 연구의 결과와 비교, 검증하는 후속 연구가 필요하다.