• 제목/요약/키워드: social media mining

검색결과 244건 처리시간 0.024초

텍스트 마이닝과 네트워크 분석을 이용한 지역 이미지 변화 분석 (Regional Image Change Analysis using Text Mining and Network Analysis)

  • 정은희
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권2호
    • /
    • pp.79-88
    • /
    • 2022
  • 소셜미디어 빅데이터는 소비자의 소비형태 뿐만 아니라 지역의 이미지를 파악할 수 있는 많은 정보가 포함되어 있다. 본 논문에서는 국내 포털 사이트인 네이버와 다음의 Blog와 Cafe로부터 '삼척'이 포함된 데이터를 2015년부터 2019년까지 1년 단위로 수집하였고, 텍스트 마이닝과 네트워크 분석을 실시하여 지역 이미지를 형성하는 키워드를 추출하고 지역 이미지 변화를 분석하였다. 연구 결과에 따르면, 2015년 지역 이미지는 '장호항', '동해', '해수욕장' 등 인근 지명이나 장소 등의 이미지 인지적 요소들로 표현되고 있는데, 2016년과 2019년은 지역 내의 특정 장소인 삼척쏠비치로 이미지 인지적 요소가 변한 것을 알 수 있다. 그리고 지역 이미지와 연관된 키워드들이 삼척을 대표하는 명소인 '장호항', 리조트가 포함하고 있는 것을 보아 지역 이미지 형성에 인프라 시설 요소가 큰 역할을 한다고 볼 수 있다. 네트워크 데이터에 대한 유의성 검증은 부트스트랩 기법을 이용하였고, 2015년, 2016년, 2019년 p-value가 각각 0.0002, 0.0006, 0.0002로 유의수준 5%에서 통계적으로 유의한 것으로 나타났다.

Measuring Hotel Service Quality Using Social Media Analytics: The Moderating Effects of Brand of Origin

  • Byounggu Choi;Shin-Hyeok Kang
    • Asia pacific journal of information systems
    • /
    • 제33권3호
    • /
    • pp.677-701
    • /
    • 2023
  • With the rapid advancement of social media analytics and artificial intelligence, many studies have used online customer reviews as an important source to measure service quality in many industries, including the hotel industry. However, these studies have failed to identify the relative importance of different dimensions of service quality and their role in customer satisfaction. To fill this research gap, this study aims to identify the effects of service quality on hotel customer satisfaction from the multidimensional perspectives using sentiment analysis with self-training on online reviews. Additionally, the moderating role of the brand of origin for each service quality dimension is also investigated. Drawing on the SERVQUAL model and brand of origin concept, this study develops 12 hypotheses and empirically tests them using 30,070 online customer hotel reviews collected from TripAdvisor.com. The results indicated that overall service quality and each dimension of SERVQUAL significantly influenced customer satisfaction of hotels. The results also confirmed the moderating effects of brand of origin on overall service quality. However, the moderating effects of brand of origin for the tangible, reliability, and empathy dimensions of service quality were significant, whereas the effects for responsiveness and assurance were not. This study sheds new light on service quality measurement by analyzing the multidimensional features of service quality and the role of brand of origin in the hotel service context.

텍스트마이닝을 이용한 약물유해반응 보고자료 분석 (Analysis of Adverse Drug Reaction Reports using Text Mining)

  • 김현희;유기연
    • 한국임상약학회지
    • /
    • 제27권4호
    • /
    • pp.221-227
    • /
    • 2017
  • Background: As personalized healthcare industry has attracted much attention, big data analysis of healthcare data is essential. Lots of healthcare data such as product labeling, biomedical literature and social media data are unstructured, extracting meaningful information from the unstructured text data are becoming important. In particular, text mining for adverse drug reactions (ADRs) reports is able to provide signal information to predict and detect adverse drug reactions. There has been no study on text analysis of expert opinion on Korea Adverse Event Reporting System (KAERS) databases in Korea. Methods: Expert opinion text of KAERS database provided by Korea Institute of Drug Safety & Risk Management (KIDS-KD) are analyzed. To understand the whole text, word frequency analysis are performed, and to look for important keywords from the text TF-IDF weight analysis are performed. Also, related keywords with the important keywords are presented by calculating correlation coefficient. Results: Among total 90,522 reports, 120 insulin ADR report and 858 tramadol ADR report were analyzed. The ADRs such as dizziness, headache, vomiting, dyspepsia, and shock were ranked in order in the insulin data, while the ADR symptoms such as vomiting, 어지러움, dizziness, dyspepsia and constipation were ranked in order in the tramadol data as the most frequently used keywords. Conclusion: Using text mining of the expert opinion in KIDS-KD, frequently mentioned ADRs and medications are easily recovered. Text mining in ADRs research is able to play an important role in detecting signal information and prediction of ADRs.

사회연결망 분석을 활용한 대구의 관광지 이미지 분석: 온라인 빅데이터를 중심으로 (Destination Image Analysis of Daegu Using Social Network Analysis: Social Media Big Data)

  • 서정아;오익근
    • 한국콘텐츠학회논문지
    • /
    • 제17권7호
    • /
    • pp.443-454
    • /
    • 2017
  • 온라인에서 생성되는 관광지 관련 정보들을 활용한 관광지 이미지 분석은 관광소비자들의 관광목적지에 대한 인식을 설명할 수 있는 유의미한 정보를 도출할 수 있으며, 관광소비자들의 특정 관광지에 대한 이미지를 더욱 심층적으로 이해할 수 있다. 본 연구는 온라인 빅데이터를 활용한 대구의 관광지 이미지 실례연구를 실시하여 대구의 관광지 이미지를 분석하고 시사점을 도출하고자 하였다. 국내 포털 사이트를 대상으로 텍스트 마이닝과 사회연결망 분석을 실시하여, 대구의 관광지 이미지를 형성하는 관광지 이미지 요소들을 추출하고 영향 정도를 분석하였다. 연구 결과에 따르면 관광객 인프라시설과 문화와 예술, 역사 등의 관광지 이미지 형성 요소들이 대구의 관광지 이미지를 형성하는 주요한 요소들로 파악되었으며, 특히, '대구중구골목투어'가 전체적인 대구의 관광지 이미지 형성에 핵심적인 역할을 하는 것으로 파악되었다.

키워드 분석 기반 '전통' 용어의 트렌드 분석 (1920~2017) (Exploring 'Tradition' Terminology Trends based on Keyword Analysis (1920~2017))

  • 김민정;김철주
    • 한국콘텐츠학회논문지
    • /
    • 제18권12호
    • /
    • pp.421-431
    • /
    • 2018
  • 본 연구는 우리나라에서 '전통' 용어의 트렌드를 분석하기 위해 과거 신문기사를 수집하여 텍스트 마이닝 기법과 소셜네트워크분석 기법을 수행하였다. 이러한 문헌을 분석하는데 있어서 과거의 해석적 연구 방법을 사용하지 않고 비정형 텍스트 자료에 근거한 정량적 분석을 통해 '전통' 논의들이 신문기사에서는 어떻게 보도되어 왔는지를 분석해봄으로써 우리사회 '전통' 용어의 동향을 파악하였다. 분석 대상은 1920년대부터 2017년까지 미디어에 등장한 '전통' 관련 신문기사 2,481,143건을 수집하였다. 다음으로 시대별 신문기사에 대한 빈도분석을 통해 '전통' 관련 어떤 키워드들이 자주 나타나고 있는지에 대해 파악하였다. 또한 '전통' 관련 키워드들간 연관어 분석을 통해 '전통' 키워드의 연결 맥락을 파악하였다. 마지막으로 소셜네트 워크분석을 통해 키워드들간에 유기적인 관계를 분석하고 군집화하였다. 이러한 텍스트 마이닝 기법을 적용함으로써 객관적이고 가치 중립적인 입장으로 '전통' 관련 사회문화현상에 대한 의미를 포착하고 시대별 '전통'이 담고 있는 사회적 상징성을 파악할 수 있다.

속성선택방법을 이용한 전기자동차 소셜미디어 데이터의 감성분석 연구 (Exploring the Sentiment Analysis of Electric Vehicles Social Media Data by Using Feature Selection Methods)

  • 프란시스 조셉 코스텔로;이건창
    • 디지털융복합연구
    • /
    • 제18권2호
    • /
    • pp.249-259
    • /
    • 2020
  • 본 연구는 전기자동차(EV)에 대한 소셜미디어 데이터를 기반으로 감성분석 (SA)과 속성선택 (FS)방법을 적용하여 전기자동차에 대한 일반 사람들의 의견을 보다 효과적이고 정확히 예측할 수 있는 새로운 방법론을 제안한다. 구체적인 방법은 다음과 같다. 첫째, 유튜브에 있는 전기자동차에 대한 일반 사람들의 의견을 추출하였다. 둘째, 분석의 효과성을 증대하기 위하여 카이 스퀘어, 정보획득량, 릴리프에프 등 세가지 속성선택 방법을 적용하였다. 그 결과 로지스틱 회귀분석 및 서포트 벡터 머신 분류 기법에서 가장 의미있는 결과를 얻을 수 있다는 것이 확인되었다.

4차 산업혁명에 대한 인식 변화 비교 분석: 소셜 미디어 데이터 분석을 중심으로 (A Comparative Analysis of the Changes in Perception of the Fourth Industrial Revolution: Focusing on Analyzing Social Media Data)

  • 유재은;최종우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권11호
    • /
    • pp.367-376
    • /
    • 2020
  • 4차 산업혁명은 빅데이터, 인공지능 등의 기술을 통해 사물들이 지능화 사회로 진입하는데 크게 기여한다. 혁명을 통해 인간의 행태와 인지를 파악할 수 있게 되었고, 인공지능의 활용을 통해 의료, 과학 등 다양한 분야에서 핵심 도구로서 자리매김하였다. 그러나 4차 산업혁명에는 긍정적인 미래와 함께 부정적인 이면이 자리 잡고 있다는 점에 주목하여, 본 연구에서는 소셜 미디어를 통해 수집된 비정형적인 빅데이터를 기반으로 텍스트 마이닝 기법을 활용한 분석을 실시하였다. 연도별(2016년, 2017년, 2018년) 4차 산업혁명과 관련된 키워드를 살펴보고, 각 키워드가 가지고 있는 의미에 대해 파악하고자 하였다. 또한, 연도의 변화에 따라 4차 산업혁명과 관련된 키워드가 어떻게 변화하는지 파악하였으며, R을 활용하여 키워드 연관 분석(Association Analysis)을 실시함으로써 4차 산업혁명과 연관된 키워드 흐름을 통해 4차 산업혁명과 밀접하게 연관된 인식 흐름을 알아보고자 하였다. 마지막으로 연도별 4차 산업혁명과 관련한 긍정적, 부정적인 감정을 살펴봄으로써 4차 산업혁명에 대한 사람들의 인식을 파악하였다. 분석결과, 부정적인 의견은 연마다 감소하고 있었으며 긍정적인 전망과 미래가 더 많아지는 것으로 나타났다.

텍스트마이닝을 활용한 아동, 청소년 대상 소비관련 연구 키워드 분석 (Keyword Analysis of Research on Consumption of Children and Adolescents Using Text Mining)

  • 진현정
    • 한국가정과교육학회지
    • /
    • 제33권4호
    • /
    • pp.1-13
    • /
    • 2021
  • 본 연구는 텍스트마이닝 기법으로 최근 20년간 아동, 청소년 대상 소비 관련 연구의 주요어를 분석하여 소비 관련 연구의 동향을 파악하고자 하였다. 이를 위하여 KCI 등재/등재후보 학술지에 게재된 아동, 청소년의 소비관련 연구 869편의 주요어를 분석하였다. 빈도분석 결과 가장 빈도가 높은 주요어는 청소년, 청소년소비자, 소비자교육, 과시소비, 소비행동, 캐릭터, 경제교육, 윤리적소비 순으로 나타났다. 5년 단위로 주요어의 빈도를 분석한 결과, 2006년~2010년에는 소비자교육의 빈도가 월등하게 높아 이 시기에 소비자교육에 관한 연구가 많이 이루어졌음을 확인할 수 있었다. 2011년 이후 윤리적소비에 관한 연구가 활발해졌으며, 최근 5년 동안은 두드러지는 주요어가 없는 대신 다양한 주제로 연구가 이루어졌음을 알 수 있었다. TF-IDF 기준으로 주요어를 살펴보면 2001년~2005년 사이에는 환경과 인터넷 관련 단어가 주요 키워드였다. 2006년~2010년에는 미디어이용, 광고 교육, 인터넷아이템, 2011년~2015년에는 공정무역, 녹색성장, 녹색소비, 북한이탈청소년, 소셜미디어, 2016~2020년에는 텍스트마이닝, 지속가능발전교육, 메이커교육, 2015개정교육과정이 중요한 용어로 등장하였다. 토픽모델링 결과, 소비자교육, 대중매체/또래문화, 합리적 소비, 한류/문화산업, 소비자역량, 경제교육, 교수학습방법, 친환경/윤리적소비의 8개의 토픽이 도출되었다. 동시 출현 빈도를 활용한 네트워크 분석을 통해 아동, 청소년 관련 소비 연구에서 과시소비와 소비자교육이 중요한 연구주제임을 알 수 있었다.

텍스트 마이닝을 이용한 감정 유발 요인 'Emotion Trigger'에 관한 연구 (A Study of 'Emotion Trigger' by Text Mining Techniques)

  • 안주영;배정환;한남기;송민
    • 지능정보연구
    • /
    • 제21권2호
    • /
    • pp.69-92
    • /
    • 2015
  • 최근 소셜 미디어의 사용이 폭발적으로 증가함에 따라 이용자가 직접 생성하는 방대한 데이터를 분석하기 위한 다양한 텍스트 마이닝(text mining) 기법들에 대한 연구가 활발히 이루어지고 있다. 이에 따라 텍스트 분석을 위한 알고리듬(algorithm)의 정확도와 수준 역시 높아지고 있으나, 특히 감성 분석(sentimental analysis)의 영역에서 언어의 문법적 요소만을 적용하는데 그쳐 화용론적 의미론적 요소를 고려하지 못한다는 한계를 지닌다. 본 연구는 이러한 한계를 보완하기 위해 기존의 알고리듬 보다 의미 자질을 폭 넓게 고려할 수 있는 Word2Vec 기법을 적용하였다. 또한 한국어 품사 중 형용사를 감정을 표현하는 '감정어휘'로 분류하고, Word2Vec 모델을 통해 추출된 감정어휘의 연관어 중 명사를 해당 감정을 유발하는 요인이라고 정의하여 이 전체 과정을 'Emotion Trigger'라 명명하였다. 본 연구는 사례 연구(case study)로 사회적 이슈가 된 세 직업군(교수, 검사, 의사)의 특정 사건들을 연구 대상으로 선정하고, 이 사건들에 대한 대중들의 인식에 대해 분석하고자 한다. 특정 사건들에 대한 일반 여론과 직접적으로 표출된 개인 의견 모두를 고려하기 위하여 뉴스(news), 블로그(blog), 트위터(twitter)를 데이터 수집 대상으로 선정하였고, 수집된 데이터는 유의미한 연구 결과를 보여줄 수 있을 정도로 그 규모가 크며, 추후 다양한 연구가 가능한 시계열(time series) 데이터이다. 본 연구의 의의는 키워드(keyword)간의 관계를 밝힘에 있어, 기존 감성 분석의 한계를 극복하기 위해 Word2Vec 기법을 적용하여 의미론적 요소를 결합했다는 점이다. 그 과정에서 감정을 유발하는 Emotion Trigger를 찾아낼 수 있었으며, 이는 사회적 이슈에 대한 일반 대중의 반응을 파악하고, 그 원인을 찾아 사회적 문제를 해결하는데 도움이 될 수 있을 것이다.

포스트 코로나19 시대의 패션 소비문화에 대한 빅데이터 분석 -중국 패션 네트워크인 LADYMAX.cn의 기사를 중심으로- (Fashion Consumption Culture in the Post-COVID-19 Era Identified through Big Data Analysis -Focusing on Articles in the Chinese Fashion Network LADYMAX.cn-)

  • 빈삼;염혜정;심수인
    • 패션비즈니스
    • /
    • 제25권2호
    • /
    • pp.80-97
    • /
    • 2021
  • In this study, the changes in fashion consumption culture in the post-COVID-19 era were examined through big data analysis. Considering that the Chinese market plays a pivotal role in the global fashion industry, big data was collected in the most famous and professional fashion network in China, LADYMAX.cn. As a result of text mining and social network analysis, three major changes were identified as the emerging fashion consumption culture in the post-COVID-19 era. First, as a trend in new media consumption, COVID-19 disease and the development of digital technology tended to encourage consumers to put more importance on the relationship between bloggers and fans than previously. Second, as a trend in reward consumption, consumers tended to be rewarded for their hard work to relieve and comfort their high stress caused by spending a long time worrying about the prolonged COVID-19 situation. Third, as a trend in home-economy consumption, consumers tended to prefer homewear and sportswear more because they were spending longer times at home as the social distancing period was prolonged.