• 제목/요약/키워드: Word Cloud Analysis

검색결과 149건 처리시간 0.032초

텍스트 마이닝을 활용한 매스 미디어와 소셜 미디어 의제 분석 : '마스크 5부제'를 중심으로 (Mass Media and Social Media Agenda Analysis Using Text Mining : focused on '5-day Rotation Mask Distribution System')

  • 이새미;유승의;안순재
    • 한국콘텐츠학회논문지
    • /
    • 제20권6호
    • /
    • pp.460-469
    • /
    • 2020
  • 본 연구는 코로나19 사태로 인하여 최근 이슈로 떠오르는 '마스크 5부제'에 대한 온라인 뉴스 기사와 카페글을 분석하여 언론과 대중들의 반응을 담고 있는 매스 미디어와 소셜 미디어 의제를 파악하고, 그 차이점을 알아보았다. 분석을 위해 네이버 뉴스 기사 전문 2,096건과 카페글 1,840건을 수집하고 데이터 전처리 과정과 정제과정을 거쳐 단어 빈도분석, 워드 클라우드, LDA 토픽모델링 분석을 실시하였다. 분석 결과, 매스 미디어에 비해 소셜 미디어는 '대리 구매', '개학 연기', '마스크 사용', '마스크 구입'과 같이 실생활 관련 토픽이 나타나 개인 미디어의 특성이 반영되어 정보 전달의 기능 보다는 개인의 의견, 감정, 정보를 교류하는 역할을 하는 것으로 나타났다. 본 연구에 적용된 연구방법의 적용으로 다양한 미디어 분석을 통해 사회이슈가 공중의제화되고, 정부의제로 진화하는 정책의제설정 과정에서 참고자료로 활용될 수 있을 것이다.

빅데이터 분석을 통한 메타버스에 대한 인식 변화 분석 - 코로나19 발생 전후 비교를 중심으로 - (An Analysis of Changes in Perception of Metaverse through Big Data - Comparing Before and After COVID-19 -)

  • 강유림;김문영
    • 한국의류산업학회지
    • /
    • 제24권5호
    • /
    • pp.593-604
    • /
    • 2022
  • The purpose of this study is to analyze the flow of change in perception of metaverse before and after COVID-19 through big data analysis. This research method used Textom to collect all data, including metaverse for two years before COVID-19 (2018.1.1~2019.11.30) and after COVID-19 outbreak (2020.1.11~2021.12.31), and the collection channels were selected by Naver and Google. The collected data were text mining, and word frequency, TF-IDF, word cloud, network analysis, and emotional analysis were conducted. As a result of the analysis, first, hotels, weddings, and glades were commonly extracted as social issues related to metaverse before and after COVID-19, and keywords such as robots and launches were derived, so the frequency of keywords related to hotels and weddings was high. Second, the association of the pre-COVID-19 metaverse keywords was platform-oriented, content-oriented, economic-oriented, and online promotion-oriented, and post-COVID-19 clusters were event-oriented, ontact sales-oriented, stock-oriented, and new businesses. Third, positive keywords such as likes, interest, and joy before COVID-19 were high, and positive keywords such as likes, joy, and interest after COVID-19. In conclusion, through this study, it was found that metaverse has firmly established itself as a new platform business model that can be used in various fields such as tourism, travel, festivals, and education using smart technology and metaverse.

Topic Modeling을 이용한 Twitter상에서 스모그 리스크에 관한 대중 인식 분류 연구 (Classification of Public Perceptions toward Smog Risks on Twitter Using Topic Modeling)

  • 김윤기
    • 지적과 국토정보
    • /
    • 제47권1호
    • /
    • pp.53-79
    • /
    • 2017
  • 본 연구의 주된 목적은 토픽 모델링(topic modeling)을 이용하여 트위터 상에서 스모그 리스크(smog risks)에 관한 대중 인식(public perceptions)을 측정하고 분류하는 것이다. 선행연구에 있어서 연구 갭(research gap)을 확인하기 위하여 본 연구는 스모그 리스크와 토픽 모델링에 대한 선행연구를 검토하였다. 그 결과 본 저자는 기존의 연구에서 상당한 연구 갭이 존재하고 있음을 확인하였으며, 이러한 연구 갭을 메우기 위해 다섯 개의 연구 질문을 설정하였다. 연구 질문들에 답을 구하기 위하여 본 연구는 10,000개의 트위터 자료를 추출하였고, 이에 대하여 워드 클라우드 분석(word cloud analysis), 상관분석, LDA를 이용한 토픽 모델링, 스트림그래프(stream graph), 위계적 집락분석(hierarchical cluster analysis)을 실시하였다. 분석 결과 자주 언급되는 단어들(the most frequent terms), 단어네트워크(terms network)의 형태, 상관관계의 유형, 스모그 관련 주제의 변동패턴에 있어서 뉴욕과 런던 사이에 큰 차이가 있음을 확인하였다. 그리하여 본 저자는 다섯 개의 연구 질문 중 네 개에 대하여 긍정적인 답을 구할 수 있었고, 이를 토대로 몇 가지 정책적 시사점을 제시하고, 향후 연구를 위한 제안들을 하였다.

언어 네트워크 분석을 이용한 과학의 본성에 관한 국내연구 동향 (Research Trends of Studies Related to the Nature of Science in Korea Using Semantic Network Analysis)

  • 이상균
    • 대한지구과학교육학회지
    • /
    • 제9권1호
    • /
    • pp.65-87
    • /
    • 2016
  • The purpose of this study is to examine Korean journals related to science education in order to analyze research trends into Nature of science in Korea. The subject of the study is the level of Korean Citation Index (KCI-listed, KCI listing candidates), that can be searched by the key phrase, "Nature of science" in Korean language through the RISS service. In this study, the Descriptive Statistical Analysis Method is utilized to discover the number of research articles, classifying them by year and by journal. Also, the Sementic Network Analysis was conducted to Word Cloud Analysis the frequency of key words, Centrality Analysis, co-occurrence and Cluster Dendrogram Analysis throughout a variety of research articles. The results show that 91 research papers were published in 25 journals from 1991 to 2015. Specifically, the 2 major journals published more than 50% of the total papers. In relation to research fields., In addition, key phrases, such as 'Analysis', 'recognition', 'lessons', 'science textbook', 'History of Science' and 'influence' are the most frequently used among the research studies. Finally, there are small language networks that appear concurrently as below: [Nature of science - high school student - recognize], [Explicit - lesson - effect], [elementary school - science textbook - analysis]. Research topic have been gradually diversified. However, many studies still put their focus on analysis and research aspects, and there have been little research on the Teaching and learning methods.

빅데이터 텍스트 마이닝 분석을 활용한 아메카지 패션 트렌드 특징 고찰 (A Study on the Characteristics of Amekaji Fashion Trends Using Big Data Text Mining Analysis)

  • 김지형
    • 패션비즈니스
    • /
    • 제26권3호
    • /
    • pp.138-154
    • /
    • 2022
  • The purpose of this study is to identify the characteristics of domestic American casual fashion trends using big data text mining analysis. 108,524 posts and 2,038,999 extracted keywords from Naver and Daum related to American casual fashion in the past 5 years were collected and refined by the Textom program, and frequency analysis, word cloud, N-gram, centrality analysis, and CONCOR analysis were performed. The frequency analysis, 'vintage', 'style', 'daily look', 'coordination', 'workwear', 'men's wear' appeared as the main keywords. The main nationality of the representative brands was Japanese, followed by American, Korean, and others. As a result of the CONCOR analysis, four clusters were derived: "general American casual trend", "vintage taste", "direct sales mania", and "American styling". This study results showed that Japanese American casual clothes are influenced by American casual clothes, and American casual fashion in Korea, which has been reinterpreted, is completed with various coordination and creative styles such as workwear, street, military, classic, etc., focusing on items and brands. Looks were worn and shared on social networks, and the existence of an active consumer group and market potential to obtain genuine products, ranging from second-hand transactions for limited edition vintages to individual transactions were also confirmed. The significance of this study is that it presented the characteristics of American casual fashion trends academically based on online text data that the public actually uses because it has been spread by the public.

맵리듀스를 이용한 통계적 접근의 감성 분류 (Statistical Approach to Sentiment Classification using MapReduce)

  • 강문수;백승희;최영식
    • 감성과학
    • /
    • 제15권4호
    • /
    • pp.425-440
    • /
    • 2012
  • 인터넷의 규모가 커지면서 주관적인 데이터가 증가하였다. 이에 주관적인 데이터를 자동으로 분류할 필요가 생겼다. 감성 분류는 데이터를 여러 감성 종류에 따라 나누는 것을 말한다. 감성 분류 연구는 크게 자연어 처리와 감성어 사전 구축을 중심으로 이루어져 왔다. 이전의 감성 분류 연구는 자연어 처리 과정에서 형태소 분석이 제대로 이루어지지 않는 문제와 감성어 사전구축 시 등록할 단어를 선별하고 단어의 감성 정도를 정하는 데에 명확한 기준을 정하기 힘든 문제가 있다. 이러한 어려움을 해결하기 위하여 감성 분류에 대용량 데이터와 통계적 접근의 조합을 제안한다. 본 논문에서 제안하는 방법은 단어의 의미를 찾는 대신 수많은 데이터에서 등장하는 표현들의 통계치를 이용하여 감성 판단을 하는 것이다. 이러한 접근은 자연어 처리 알고리즘에 의존하던 이전 연구와 달리 데이터에 집중한다. 대용량 데이터 처리를 위해 하둡과 맵리듀스를 이용한다.

  • PDF

고등학교 '기술·가정' 교과 식생활 영역의 교육내용 분석: 제7차 교육과정부터 2015 개정 교육과정까지의 교과서 내용을 중심으로 (Content Analysis of Food and Nutrition Unit in High School Textbooks of Home Economics: Focus on the National Curriculums from 7th to 2015 Revised)

  • 박채은;김유경
    • 한국가정과교육학회지
    • /
    • 제31권4호
    • /
    • pp.97-113
    • /
    • 2019
  • 본 연구는 제7차부터 2015개정 교육과정까지 식생활 영역의 교육과정별 변화를 살펴보기 위해 교육과정과 기술·가정 교과서 8권을 조사하여 분석하였다. 교과서 내 식생활 영역에 해당하는 그림, 그래프, 표, 사진에 있는 단어를 포함한 모든 텍스트를 파일로 전환하여 불용어를 제거하고 텍스트 마이닝 기법으로 상위 15개의 단어를 추출하였다. 이를 한눈에 파악할 수 있도록 워드클라우드(word cloud)와 언어네트워크 분석법으로 시각화하였다. 연구 결과는 다음과 같다. 제7차부터 2015개정 교육과정까지 고등학교 '기술·가정' 교과서에서 식생활 영역의 비율은 평균 10.97%였고, 교육과정이 개정을 거듭함에 따라 식생활 영역이 차지하는 비중은 대폭 감소되었다. 고등학교 '기술·가정' 교과의 교육과정에 나타난 식생활영역의 내용체계는 1개의 소영역이 독립적으로 구성되어 있고 일부 내용이 가족생활영역에 포함되어 있었다. 언어네트워크를 종합적으로 살펴보면 초대, 한식·재료, 영양·섭취·아기를 중심으로 3개의 큰 묶음이 형성되어 연결되어 있었다. 결론적으로 제7차부터 2015개정 교육과정까지 고등학교 '기술·가정' 교과서의 식생활 영역의 비율은 계속 줄어들었고, 고등학교과정에서 식생활을 통한 소통과 사회적 의미를 강조하고 있음을 알 수 있었으며, 시대적 요구에 따라 교육과정별 내용변화가 크다는 것을 확인할 수 있었다.

한국농수산대학 재학생의 학교생활 감성 분석 및 영농의지에 관한 연구 (A Study on the Sensibility Analysis of School Life and the Will to Farming of Students at Korea National College of Agricultural and Fisheries)

  • 주진수;이소영;김종숙;신용광;박노복
    • 현장농수산연구지
    • /
    • 제21권2호
    • /
    • pp.103-114
    • /
    • 2019
  • 본 연구에서는 한농대에 재학 중인 3학년 학생을 대상으로 대학생활 선호도 및 졸업 후 영농의지를 파악하기 위하여 설문조사를 실시하였다. 연구 분석에는 구조화되지 않은 데이터의 분석 기법으로 오피니언 마이닝과 텍스트 마이닝 기법을 이용하였으며, 텍스트 마이닝의 결과는 워드 클라우드로 시각화하여 정보를 추출하였다. 또한 감성분석 결과를 이용하여 졸업 후 농사일을 하려는 학생들의 영농의지에 대한 통계적 분석을 하였다. 대학생활 호감도 조사는 대학 이미지, 자기 역량, 기숙사, 교육시스템, 미래 비전 등 5개 분야에 전체 10개 항목에 대하여 이루어졌다. 감성 분석을 위한 긍·부정 사전은 수집된 응답지에서 긍정과 부정의 감정을 분류하여 긍정어 사전과 부정어 사전을 각각 만들어 분석에 이용하였다. 분석 결과 10개 평가항목 가운데 대학 지원 당시의 '대학 이미지', 10년 후의 '자기 모습' 항목은 70% 이상, '자기 역량'과 '현재의 한농대' 항목은 60% 이상의 긍정적 감정을 나타냈다. 반면 '대학 기숙사' '교육과정' '장기현장실습' '한국 농업의 미래' 항목에 대해서는 긍정적 감성보다 부정적 감성이 높게 나타났다. 성별, 영농기반, 입학 동기에 따른 영농의지 차이의 교차 분석에서는 성별, 입학 동기에 따른 영농의지는 통계적으로 유의미한 결과가 나타났으나, 영농기반에서는 유의미하지 않은 결과가 나타났다. 또한 영농의지에 대한 이항 로지스틱 회귀분석에서는 통계적으로 유의미한 변수는 '입학 동기'로 파악되었으며, 본인의 의지로 입학한 학생일수록 영농의지가 형성될 확률이 높게 나타났다.

빅데이터 분석을 이용한 디지털 패션 테크에 대한 인식 연구 (Perceptions and Trends of Digital Fashion Technology - A Big Data Analysis -)

  • 송은영;임호선
    • 한국의류산업학회지
    • /
    • 제23권3호
    • /
    • pp.380-389
    • /
    • 2021
  • This study aimed to reveal the perceptions and trends of digital fashion technology through an informational approach. A big data analysis was conducted after collecting the text shown in a web environment from April 2019 to April 2021. Key words were derived through text mining analysis and network analysis, and the structure of perception of digital fashion technology was identified. Using textoms, we collected 8144 texts after data refinement, conducted a frequency of emergence and central component analysis, and visualized the results with word cloud and N-gram. The frequency of appearance also generated matrices with the top 70 words, and a structural equivalent analysis was performed. The results were presented with network visualizations and dendrograms. Fashion, digital, and technology were the most frequently mentioned topics, and the frequencies of platform, digital transformation, and start-ups were also high. Through clustering, four clusters of marketing were formed using fashion, digital technology, startups, and augmented reality/virtual reality technology. Future research on startups and smart factories with technologies based on stable platforms is needed. The results of this study contribute to increasing the fashion industry's knowledge on digital fashion technology and can be used as a foundational study for the development of research on related topics.

개인의 감성 분석 기반 향 추천 미러 설계 (Design of a Mirror for Fragrance Recommendation based on Personal Emotion Analysis)

  • 김현지;오유수
    • 한국산업정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.11-19
    • /
    • 2023
  • 본 논문에서는 사용자의 감정 분석에 따른 향을 추천하는 스마트 미러 시스템을 제안한다. 본 논문은 자연어 처리 중 임베딩 기법(CounterVectorizer와 TF-IDF 기법), 머신러닝 분류 기법 중 최적의 모델(DecisionTree, SVM, RandomForest, SGD Classifier)을 융합하여 시스템을 구축하고 그 결과를 비교한다. 실험 결과, 가장 높은 성능을 보이는 SVM과 워드 임베딩을 파이프라인 기법으로 감정 분류기 모델에 적용한다. 제안된 시스템은 Flask 웹 프레임워크를 이용하여 웹 서비스를 제공하는 개인감정 분석 기반 향 추천 미러를 구현한다. 본 논문은 Google Speech Cloud API를 이용하여 사용자의 음성을 인식하고 STT(Speech To Text)로 음성 변환된 텍스트 데이터를 사용한다. 제안된 시스템은 날씨, 습도, 위치, 명언, 시간, 일정 관리에 대한 정보를 사용자에게 제공한다.