• 제목/요약/키워드: twitter data

검색결과 302건 처리시간 0.026초

소셜 네트워크에서 사용자의 영향력을 고려한 핫 토픽 예측 기법 (Hot Topic Prediction Scheme Considering User Influences in Social Networks)

  • 노연우;김대윤;한지은;육미선;임종태;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제15권8호
    • /
    • pp.24-36
    • /
    • 2015
  • 최근 실시간으로 생성되는 대용량의 SNS 데이터로부터 유의미한 정보를 찾아내고 분석하는 것이 중요해지면서 핫 토픽 검출에 대한 관심도 크게 증가하고 있다. SNS 특성상 사전 확인이 이루어지지 않은 불특정 다수의 글들을 대상으로 하기 때문에 이 글들을 대상으로 핫 토픽을 예측했을 때 결과의 신뢰성이 저하된다는 문제점이 있다. 이를 해결하기 위하여 본 논문에서는 소셜 네트워크에서 사용자의 영향력을 고려한 신뢰성 높은 핫 토픽 예측 기법을 제안한다. 트위터를 기반으로 변형된 TF-IDF 알고리즘을 통하여 순간적으로 많이 이슈화되는 키워드 후보 집합을 추출하고, 트윗에 사용자 영향력을 가중치로 부여함으로써 핫 토픽 예측 결과의 신뢰성을 높인다. 제안하는 기법의 우수성을 보이기 위해 기존 기법과 제안하는 기법의 성능평가를 수행한다. 성능평가 결과, 제안하는 기법은 기존 기법에 비해 정확도, 재현율 모두 향상됨을 확인하였다.

북한 급변사태 시나리오 I : 재스민혁명 국가들과 북한의 비교를 중심으로 (Scenario for sudden change in North Korea! : Comparing North Korea with countries of Jasmine Revolution)

  • 이대성
    • 융합보안논문지
    • /
    • 제17권1호
    • /
    • pp.63-68
    • /
    • 2017
  • 2011년 1월 튀니지에서 시작된 재스민혁명은 북아프리카와 중동지역 국가들에 많은 변화를 가져왔으며, 우리는 그 원인을 살펴볼 필요가 있다. 우선, 이 지역의 왕정과 독재체제 국가들은 장기집권을 위하여 야당, 언론 등을 탄압하였고, 특권계층에 집중된 권력은 부정부패를 양산하였다. 다음으로, 이 지역 국가들의 국가수입 대부분은 왕실과 독재자에게 귀속되었고, 이를 배분하는 과정에서 문제가 발생하기 시작하였다. 특히, 1990년대 유가하락과 2000년대 생필품 가격 상승은 정부에 대한 불신을 초래하는 계기가 되었다. 마지막으로, 2000년부터 2010년까지 이 지역 국가들의 인터넷 사용자가 평균 4,863% 증가하였고, 페이스북(Facebook), 트위터(Twitter) 등과 같은 소셜 네트워크 서비스(SNS)의 증대도 국가차원의 정보 통제를 어렵게 한 요인이 되었다. 그렇다면, 과연 북한의 급변사태 가능성은 어떠한가에 대한 고민을 해야 한다고 본다. 이를 위해 재스민혁명이 발생 국가들과 북한의 정치, 경제, 사회적 특성 등을 비교 분석할 필요가 있으며, 그 시사점을 도출하고자 한다.

한국어 극성 사전 구축을 위한 크라우드소싱 기반 감성 단어 극성 태깅 게임 (A Crowdsourcing-based Emotional Words Tagging Game for Building a Polarity Lexicon in Korean)

  • 김준기;강신진;배병철
    • 한국게임학회 논문지
    • /
    • 제17권2호
    • /
    • pp.135-144
    • /
    • 2017
  • 감성 분석은 글을 통해 작성자의 주관적인 생각이나 느낌을 분석하는 방법으로 효과적인 감성 분석을 위해서는 감성 단어 극성 사전 구축이 필수적이다. 본 논문은 효율적인 한국어 극성 사전 구축을 위해 우리가 개발한 크라우드소싱 기반 게임을 소개한다. 먼저, 크롤러를 이용해 인터넷 커뮤니티에서 말뭉치들을 수집했고, Twitter 형태소를 이용해 수집한 말뭉치를 형태소별로 분류하고 단어화했다. 이 단어들은 모바일 플랫폼 기반 태깅 게임 형태로 제공되어 게임플레이를 통해 플레이어들이 자발적으로 단어들의 극성을 선택하고 결과가 데이터 베이스에 축적되도록 게임이 설계되었다. 현재까지 약 1200여개의 단어들의 극성을 태깅하였으며, 향후 좀 더 많은 감성 단어 데이터들을 축적함으로써 특히 게임 도메인에서 한국어 감성 분석 연구에 기여할 것으로 기대한다.

대학스포츠팀 SNS의 영향력 있는 사용자의 분석 (Identifying Influential Users of College Sports Teams' Social Media Accounts)

  • 김석규;박재암;스테판 W. 디트모어
    • 한국산학기술학회논문지
    • /
    • 제16권2호
    • /
    • pp.1016-1025
    • /
    • 2015
  • 이 연구의 목적은 대학 스포츠팀의 SNS의 사용자를 분석하여 어떠한 사용자가 온라인상에서 정보공유와 전달에 있어서 영향력이 있는지를 규명하는 것에 있다. 이를 위하여 영향력 있는 사용자는 대학의 공식 계정, 미디어 계정, 비전문가 일반인 계정으로 구분되었다. 이를 위해 NCAA Division 1에 속해있는 대학교들을 대상으로, 편의표본추출법을 이용하여 총 14개의 공식 트위터 계정이 선정되었다. 분석결과, 남자 스포츠에서는 비전문가 일반인 계정이 영향력 있는 사용자 중 가장 높은 비율을 차지하였으며, 미디어계정과 대학공식 계정이 뒤를 이었다. 여자 스포츠에서는 비전문가 일반인 계정이 영향력 있는 사용자 중에 가장 높은 비율을 차지하였으며, 대학의 공식계정과 미디어계정이 뒤를 이었다. 이 연구의 결과는 스포츠시장에서 점차 중요도가 높아지고 있는 SNS를 활용한 다양한 마케팅 전략과 후속연구를 위한 기초자료를 제공한다.

동적 토픽 모델링과 감성 분석을 이용한 COVID-19 구간별 비대면 근무 부정요인 검출에 관한 연구 (Detection of Complaints of Non-Face-to-Face Work before and during COVID-19 by Using Topic Modeling and Sentiment Analysis)

  • 이선민;천세진;박상언;이태욱;김우주
    • 한국정보시스템학회지:정보시스템연구
    • /
    • 제30권4호
    • /
    • pp.277-301
    • /
    • 2021
  • Purpose The purpose of this study is to analyze the sentiment responses of the general public to non-face-to-face work using text mining methodology. As the number of non-face-to-face complaints is increasing over time, it is difficult to review and analyze in traditional methods such as surveys, and there is a limit to reflect real-time issues. Approach This study has proposed a method of the research model, first by collecting and cleansing the data related to non-face-to-face work among tweets posted on Twitter. Second, topics and keywords are extracted from tweets using LDA(Latent Dirichlet Allocation), a topic modeling technique, and changes for each section are analyzed through DTM(Dynamic Topic Modeling). Third, the complaints of non-face-to-face work are analyzed through the classification of positive and negative polarity in the COVID-19 section. Findings As a result of analyzing 1.54 million tweets related to non-face-to-face work, the number of IDs using non-face-to-face work-related words increased 7.2 times and the number of tweets increased 4.8 times after COVID-19. The top frequently used words related to non-face-to-face work appeared in the order of remote jobs, cybersecurity, technical jobs, productivity, and software. The words that have increased after the COVID-19 were concerned about lockdown and dismissal, and business transformation and also mentioned as to secure business continuity and virtual workplace. New Normal was newly mentioned as a new standard. Negative opinions found to be increased in the early stages of COVID-19 from 34% to 43%, and then stabilized again to 36% through non-face-to-face work sentiment analysis. The complaints were, policies such as strengthening cybersecurity, activating communication to improve work productivity, and diversifying work spaces.

Analyzing Gifted Students' Social Behavior on Social Media at COVID-19 Quarantine

  • Khayyat, Mashael;Sulaimani, Mona;Bukhri, Hanan;Alamiri, Faisal
    • International Journal of Computer Science & Network Security
    • /
    • 제22권9호
    • /
    • pp.7-14
    • /
    • 2022
  • COVID-19 has caused a global disturbance, increased anxiety, and panic, eliciting diverse reactions. While its cure has not been discovered, new infection cases and fatalities are being recorded daily. The focus of the present study was to analyze the reaction of gifted undergraduate students on social media during the quarantine period of the COVID-19. A special group of gifted students, who joined the program of attracting and nurturing talents at the University of Jeddah, University students as were the target sample of this study. To analyze online reactions during the pandemic; the choice of university students was arrived at as they are perceived to be gifted academically. Hence, the analysis of the impacts on their behavior on social media use is imperative. This study presented accurate and consistent data on the effects of social media using Twitter platforms on gifted students during the quarantine occasioned by the COVID-19 pandemic. The behavior of learners due to during the use of social media was extensively explored and results analyzed. The study was carried out between April and May 2020 (quarantine period in Saudi Arabia) to establish whether the online behavior of gifted students reflects positive or negative feelings. The methods used in conducting this study the research were online interviews and scraping participants' Twitter accounts (where most of the online activities and studies take place). The study employed the Activity theory to analyze the behavior of gifted students on social media. The sample size used was 60 students, and the analysis of their behavior was based on Activity theory Overall, the results showed proactive, positive behavior for coping with a challenging situation, educating society, and entertaining. Finally, this study recommends investing in gifted students due to their valuable problem-solving skills that can help handle global pandemics efficiently.

지오트윗을 이용한 거주자와 방문자의 공간 이동성 연구 (Comparing the Spatial Mobility of Residents and Tourists by using Geotagged Tweets)

  • 조재희;서일정
    • 한국IT서비스학회지
    • /
    • 제15권3호
    • /
    • pp.211-221
    • /
    • 2016
  • The human spatial mobility information is in high demand in various businesses; however, there are only few studies on human mobility because spatio-temporal data is insufficient and difficult to collect. Now with the spread of smartphones and the advent of social networking services, the spatio-temporal data began to occur on a large scale, and the data is available to the public. In this work, we compared the movement behavior of residents and tourists by using geo-tagged tweets which contain location information. We chose Seoul to be the target area for analysis. Various creative concepts and analytical methods are used: grid map concept, cells visited concept, reverse geocoding concept, average activity index, spatial mobility index, and determination of residents and visitors based on the number of days in residence. Conducting a series of analysis, we found significant differences of the movement behavior between local residents and tourists. We also discovered differences in visiting activity according to residential countries and used applications. We expect that findings of this research can provide useful information on tourist development and urban development.

빅 데이터를 이용한 호텔기업 CRM 및 보안에 관한 연구 (A Study on Hotel CRM(Customer Relationship Management) using Big Data and Security)

  • 공효순;송은지
    • 융합보안논문지
    • /
    • 제13권4호
    • /
    • pp.69-75
    • /
    • 2013
  • 기업에 있어 고객은 수입의 원천으로 기업의 발전을 위해서는 효과적인 고객관계관리(CRM: Customer Relationship Management)가 매우 중요하다. 이를 위해서는 고객의 요구를 파악하고 실제 고객이 필요로 하는 제품이나 서비스를 제공해야 한다. 그러나 점점 고객의 요구가 다양해지고 복합적인 형태를 갖게 되어 이를 파악하는 것이 어려워지고 있다. 최근 스마트 폰의 출현과 트위터, 페이스북과 같은 SNS의 발달로 실시간으로 다양한 고객의 목소리가 증가하고 있는 가운데 효율적인 CRM을 위해 이러한 빅 데이터를 이용 하는 것이 매우 효율적인 방법으로 부상하고 있다. 본 연구에서는 고객자체가 기업의 자산이며 서비스 산업의 대표라 할 수 있는 호텔기업의 CRM을 위해 빅 데이터를 활용하는 방법을 제안한다. 또한 빅 데이터 서비스를 이용하는데 있어 보안에 대한 문제점을 논의하고 대책을 강구한다.

TV 시청률과 마이크로블로그 내용어와의 시간대별 관계 분석 (Analysis of the Time-dependent Relation between TV Ratings and the Content of Microblogs)

  • 최준연;백혜득;최진호
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.163-176
    • /
    • 2014
  • 소셜미디어 확산으로 많은 사용자들이 SNS를 통해 자신의 생각과 의견을 표출하며 다른 사용자들과 상호작용하고 있다. 특히 트위터와 같은 마이크로블로그는 짧은 문장을 통해 영화, TV, 사회 현상 등과 같은 공통의 주제에 대해 많은 사람이 즉각적으로 의견을 표출하고 교환하는 플랫폼의 역할을 수행하고 있다. TV방송 프로그램에 대해서도 의견과 감정을 마이크로블로그를 통해 표출하고 있는데, 본 연구에서는 마이크로블로그의 내용과 시청률과의 관계를 살펴보기 위해, 지난 공중파 방송 프로그램에 대한 트윗을 수집하고 부적절한 트윗들을 제거한 후 형태소 분석을 수행하였다. 추출된 형태소뿐 아니라 이모티콘, 신조어 등 사용자가 입력한 모든 단어들을 후보 자질로 삼아 시청률과의 상관관계를 분석하였다. 실험을 위해 2013년 1월부터 10개월간의 예능프로그램 트윗의 데이터를 수집하여 전국 시청률 데이터와 비교 분석을 수행하였다. 트윗의 발생량은 일주일 중 방송된 요일에 가장 많았으며, 특히 방송시간 부근에서 급격히 증가하는 모습을 보였다. 이것은 전국에 동시간에 방송되는 공중파 프로그램의 특성상 공통된 관심 주제를 제공하기 때문에 나타나는 현상으로 여겨진다. 횟수 기반 자질로 방송 일의 총 트윗 수와 리트윗 수, 방송시간 중의 트윗 수와 리트윗 수와 시청률과의 상관 관계를 분석하였으나 모두 낮은 상관 계수를 나타냈다. 이것은 단순한 트윗 발생 빈도는 방송 프로그램의 만족도 또는 시청률을 제대로 반영하고 있지 못함을 의미한다. 내용 기반 자질로 추출한 단어들 중에는 높은 상관관계를 보여주는 단어들이 발견되었으며, 표준어가 아닌 이모티콘과 신조어 중에도 높은 상관관계를 보여주는 자질이 나타났다. 또한 방송시작 전과 후에 따라 상관계수가 높은 단어가 상이함을 발견하였다. 매주 같은 시간에 방송되는 TV 프로그램의 특성상, 방송을 기다리고 기대하는 내용의 트윗과 방송 후 소감을 표현하는 트윗의 내용에 차이가 존재하였다. 이러한 분석결과는 단어에 따라 시청률과 연관성이 높은 시간대가 달라짐을 의미하며, 시청률을 측정하고자 할 때 각 단어들의 시간대를 고려해서 사용해야 함을 의미한다. 본 연구에서 제안한 방법은 기존의 표본 추출을 통해 이루어지는 TV 시청률 측정을 보완할 수 있는 방법에 활용할 수 있으리라 기대된다.

해양공간계획 수립을 위한 방문밀집도 및 중점관리지역 규명: 소셜 빅데이터를 활용하여 (Identification of Visitation Density and Critical Management Area Regarding Marine Spatial Planning: Applying Social Big Data)

  • 김윤정;김충기;김강선
    • 환경영향평가
    • /
    • 제29권2호
    • /
    • pp.122-131
    • /
    • 2020
  • 해양공간계획은 생태계서비스 개념에 기초하며 최근 연안 및 해양지역의 지속가능한 개발을 촉진하기 위한 방안으로 주목받고 있다. 정책개발자는 해양공간계획 개념에 기반을 둔 의사결정을 위해 각 해역별 자원의 이용현황과 그 특성을 규명할 필요가 있다. 특히, 해변관광은 연안에서 이루어지는 자원 이용활동 중 가장 빠르게 성장하는 활동이며 다수의 문화서비스 수혜를 유도하여 중요하다. 그러나 해변관광의 규모와 방문현황의 공간적 특성을 광역단위로 평가할 수 있는 정보가 부재하며, 현장조사의 경우 높은 비용과 노동력이 요구되어 적용이 어렵다. 그러므로 본 연구는 신규 대안으로 소셜 빅데이터의 해양공간계획 적용방안을 제안하고 트위터, 플리커 정보에 기초한 중점관리지역 도출 방안을 제시하였다. 본 연구는 남해 연안육역 일대를 대상으로 수행되었으며 소셜미디어에서 추출한 플리커, 트위터 정보를 대상으로 과다추정 방지 전처리, 적합 격자단위 규명 과정을 통해 광역단위 방문밀집도를 도출하였다. 더불어 공간통계분석 및 밀도분석을 통해 남해 일대의 집중관리가 필요한 연안육역 구역을 제시하였다. 본 연구는 중점관리구역, 보전구역 지정 등 해양공간계획의 수립과정에서 해변관광 및 문화서비스 규모의 고려를 위한 시사점을 제공한다.