• 제목/요약/키워드: twitter data

검색결과 301건 처리시간 0.029초

트위터 데이터를 이용한 연구자들의 비공식 커뮤니케이션 활동 및 대중이용 내용분석: 국내 사회과학 분야 연구자들을 중심으로 (Content Analysis on Twitter for Identifying Scholarly Activities and Public Use in Informal Communication: With a Focus on Domestic Scholars in Social Sciences)

  • 심지영;송성전
    • 정보관리학회지
    • /
    • 제36권2호
    • /
    • pp.133-152
    • /
    • 2019
  • 본 연구는 사회과학 연구자의 비공식 커뮤니케이션 활동 및 대중이용 패턴을 파악하고 범주화하는 데 초점을 맞춘다. 트위터 데이터를 이용하여 대중과의 커뮤니케이션 활동에 참여한 국내 사회과학 연구자 736명을 식별하고, 이 연구자들의 비공식 커뮤니케이션 활동이 드러난 트윗 4,548개를 내용분석하였다. 본 연구는 지금까지 학술커뮤니케이션 연구에서 밝혀지지 않았던 사회과학자와 일반대중 간의 비공식적인 커뮤니케이션을 탐색하고, 구체적인 비공식 커뮤니케이션 활동 내용, 커뮤니케이션 매체 및 협업 분야의 유형을 식별했다는 점에서 의미가 있다.

Real-time Knowledge Structure Mapping from Twitter for Damage Information Retrieval during a Disaster

  • Sohn, Jiu;Kim, Yohan;Park, Somin;Kim, Hyoungkwan
    • 국제학술발표논문집
    • /
    • The 8th International Conference on Construction Engineering and Project Management
    • /
    • pp.505-509
    • /
    • 2020
  • Twitter is a useful medium to grasp various damage situations that have occurred in society. However, it is a laborious task to spot damage-related topics according to time in the environment where information is constantly produced. This paper proposes a methodology of constructing a knowledge structure by combining the BERT-based classifier and the community detection techniques to discover the topics underlain in the damage information. The methodology consists of two steps. In the first step, the tweets are classified into the classes that are related to human damage, infrastructure damage, and industrial activity damage by a BERT-based transfer learning approach. In the second step, networks of the words that appear in the damage-related tweets are constructed based on the co-occurrence matrix. The derived networks are partitioned by maximizing the modularity to reveal the hidden topics. Five keywords with high values of degree centrality are selected to interpret the topics. The proposed methodology is validated with the Hurricane Harvey test data.

  • PDF

Using Support Vector Machine to Predict Political Affiliations on Twitter: Machine Learning approach

  • Muhammad Javed;Kiran Hanif;Arslan Ali Raza;Syeda Maryum Batool;Syed Muhammad Ali Haider
    • International Journal of Computer Science & Network Security
    • /
    • 제24권5호
    • /
    • pp.217-223
    • /
    • 2024
  • The current study aimed to evaluate the effectiveness of using Support Vector Machine (SVM) for political affiliation classification. The system was designed to analyze the political tweets collected from Twitter and classify them as positive, negative, and neutral. The performance analysis of the SVM classifier was based on the calculation of metrics such as accuracy, precision, recall, and f1-score. The results showed that the classifier had high accuracy and f1-score, indicating its effectiveness in classifying the political tweets. The implementation of SVM in this study is based on the principle of Structural Risk Minimization (SRM), which endeavors to identify the maximum margin hyperplane between two classes of data. The results indicate that SVM can be a reliable classification approach for the analysis of political affiliations, possessing the capability to accurately categorize both linear and non-linear information using linear, polynomial or radial basis kernels. This paper provides a comprehensive overview of using SVM for political affiliation analysis and highlights the importance of using accurate classification methods in the field of political analysis.

키워드를 위한 시퀀셜 패턴 평가 지표와 SNS 팔로워의 관계를 이용한 사용자 관심사항 추출방법 (Extracting Method of User's Interests by Using SNS Follower's Relationship and Sequential Pattern Evaluation Indices for Keyword)

  • 신봉희;전혜경
    • 한국융합학회논문지
    • /
    • 제8권8호
    • /
    • pp.71-75
    • /
    • 2017
  • SNS 등의 보급으로 인해 Web 기반의 소비자 생성 데이터는 기하급수적으로 늘어나는 추세이다. 수많은 데이터 속에서 사용자의 관심에 맞는 콘텐츠를 정확히 추출하는 것은 여러 분야에서 중요하다. 특히 비즈니스 분야에서는 많은 사용자들 속에서 자신들에게 적합한 고객을 찾아 마케팅 정책을 수립하는 것이 중요하다. 본 논문에서는 트위터의 팔로우-팔로잉 관계를 통해 각 계정에 관심이 있는 고객들을 중심으로 중요한 정보를 얻고자 한다. 현재 트위터의 팔로워 간의 관계는 사용자의 세부 관심 사항을 반영하지 않는다. 그러므로 본 연구에서는 팔로우들의 트윗에 대한 키워드 추출 방법을 사용하여 세부 관심 사항을 파악하려고 한다. 이를 위해 국내 상업 트위터 계정 2곳을 선정하여 팔로워로부터 수집한 텍스트 데이터의 마이닝 핵심 문구에 대한 순차 패턴 평가 지표를 적용한다.

SNS 기반 여론 감성 분석 (Sentiment Analysis for Public Opinion in the Social Network Service)

  • 하상현;노태협
    • 문화기술의 융합
    • /
    • 제6권1호
    • /
    • pp.111-120
    • /
    • 2020
  • 본 연구는 소셜네트워크서비스(SNS)상의 빅데이터를 이용한 텍스트 분석기법의 응용으로서 설문 조사 기반의 여론 조사 방법론과 달리 비정형적 언어 기반의 감성 여론 조사 방법론을 제안한다. 기존의 설문 기반 여론 분석모형에 대한 대안적 방법으로 주관성에 기초한 감성 분류 모형을 이용하였다. 이를 위하여, 제20대 국회의원 선거운동 기간 중 선거 관련 실시간 트위터 자료를 수집하여 속성 기반 감성 분석을 이용한 여론의 극성과 강도에 대한 실증 분석을 수행하였다. 개별 SNS에서 사용된 단어의 극성을 분류하기 위해 Lasso 및 Ridge 회귀 모형을 이용하여 극성에 영향력이 큰 변수를 추출하였다. 추출된 변수가 극성에 미치는 긍정 및 부정에 대한 영향을 구분하고, 영향력의 강도를 분석하였다. 대중들이 소셜네트워크상에서 표현한 내용을 바탕으로 한 여론에 대한 긍정 및 부정의 감성 분석을 통해 여론의 향방을 예측하고 극성분석 모형의 정확도를 측정하여, 여론 조사 분야에서 감성 분석 방법론의 적용가능성을 확인하였다.

B2C 마이크로블로깅을 통한 고객참여 메커니즘의 이해 (Understanding Customer Participation Behavior via B2C Microblogging)

  • 박종필;손재열
    • Asia pacific journal of information systems
    • /
    • 제22권4호
    • /
    • pp.51-73
    • /
    • 2012
  • Social network services based on openness, connectedness, and mass participation are reshaping many aspects of how companies conduct business and create value for their customers. For instance, Facebook and Twitter are expected to play a pivotal role as a new communication channel through which companies-forge close relationships with their customers for co-creation of value for mutual benefits. Given the potential of social network services, it is not surprising that many companies have strategically invested in social network services to reach out to customers. Despite the growing interest in social network services as a platform to connect companies and their customers, few guidelines exist about how managers can effectively utilize social network services in forging relationships with their customers. As such, scholars should pay greater attention to how firms can successfully develop relationships with their customers on social network services. In particular, this study employs the S-O-R (stimulus-organism-response) framework as a theoretical lens to develop a research model that explains customers' participation in the value co-creation platform that companies opened on Twitter. According to the S-O-R framework, certain types of individuals' behaviors can be best understood based on a causal link from environmental stimulus to organism, and response. We apply the S-O-R framework to understand how ubiquitous connectivity (stimuli) can influence customers' experience (organism) with companies on Twitter, which in turn influence their participation behavior (response). Two steps have been undertaken to empirically test the research model. First, we conducted a content analysis of tweets written by customers who follow companies on Twitter. As a result, we found event/promotion participation, company support, and giving feedback as three specific types of customer participation behavior. Second, we conducted a web-based survey to test research hypotheses in the research model. Participations in the survey were solicited to customers who followed companies on Twitter. As a result, a total of 115 respondents have completed the survey. Data were analyzed using the partial least square (PLS) technique. The results of data analysis suggest that ubiquitous connectivity (stimuli) had strong positive effects on perceive usefulness, perceived enjoyment, and perceived intimacy (organism). Perceived intimacy showed positive effects on customer participation behavior (response), such as event participation, company support, and giving feedback. Perceived enjoyment was found to have strong positive effects on company support and giving feedback. On the other hand, perceived usefulness did not have significant impacts on the three types of customer participation behavior.

  • PDF

토픽 모델링을 이용한 트위터 이슈 트래킹 시스템 (Twitter Issue Tracking System by Topic Modeling Techniques)

  • 배정환;한남기;송민
    • 지능정보연구
    • /
    • 제20권2호
    • /
    • pp.109-122
    • /
    • 2014
  • 현재 우리는 소셜 네트워크 서비스(Social Network Service, 이하 SNS) 상에서 수많은 데이터를 만들어 내고 있다. 특히, 모바일 기기와 SNS의 결합은 과거와는 비교할 수 없는 대량의 데이터를 생성하면서 사회적으로도 큰 영향을 미치고 있다. 이렇게 방대한 SNS 데이터 안에서 사람들이 많이 이야기하는 이슈를 찾아낼 수 있다면 이 정보는 사회 전반에 걸쳐 새로운 가치 창출을 위한 중요한 원천으로 활용될 수 있다. 본 연구는 이러한 SNS 빅데이터 분석에 대한 요구에 부응하기 위해, 트위터 데이터를 활용하여 트위터 상에서 어떤 이슈가 있었는지 추출하고 이를 웹 상에서 시각화 하는 트위터이슈 트래킹 시스템 TITS(Twitter Issue Tracking System)를 설계하고 구축 하였다. TITS는 1) 일별 순위에 따른 토픽 키워드 집합 제공 2) 토픽의 한달 간 일별 시계열 그래프 시각화 3) 토픽으로서의 중요도를 점수와 빈도수에 따라 Treemap으로 제공 4) 키워드 검색을 통한 키워드의 한달 간 일별 시계열 그래프 시각화의 기능을 갖는다. 본 연구는 SNS 상에서 실시간으로 발생하는 빅데이터를 Open Source인 Hadoop과 MongoDB를 활용하여 분석하였고, 이는 빅데이터의 실시간 처리가 점점 중요해지고 있는 현재 매우 주요한 방법론을 제시한다. 둘째, 문헌정보학 분야뿐만 아니라 다양한 연구 영역에서 사용하고 있는 토픽 모델링 기법을 실제 트위터 데이터에 적용하여 스토리텔링과 시계열 분석 측면에서 유용성을 확인할 수 있었다. 셋째, 연구 실험을 바탕으로 시각화와 웹 시스템 구축을 통해 실제 사용 가능한 시스템으로 구현하였다. 이를 통해 소셜미디어에서 생성되는 사회적 트렌드를 마이닝하여 데이터 분석을 통한 의미 있는 정보를 제공하는 실제적인 방법을 제시할 수 있었다는 점에서 주요한 의의를 갖는다. 본 연구는 JSON(JavaScript Object Notation) 파일 포맷의 1억 5천만개 가량의 2013년 3월 한국어 트위터 데이터를 실험 대상으로 한다.

소셜미디어 선거캠페인 연구 동향과 쟁점 (A Critical Review on Social Media Campaign Studies: Trends and Issues)

  • 장우영
    • 정보화정책
    • /
    • 제26권1호
    • /
    • pp.3-24
    • /
    • 2019
  • 이 연구는 소셜미디어 캠페인 연구의 동향과 쟁점을 세 측면에서 고찰하였다. 즉 '소셜미디어 캠페인 전략의 양상, 소셜미디어를 규율하는 제도적 환경 및 소셜미디어 캠페인의 정치적 효과'는 웹 확산 이래 웹블로그를 거쳐 소셜미디어 단계에 이르기까지 각국의 선거캠페인에서 지속적으로 제기되고 있는 논제이다. 분석 결과 소셜미디어 캠페인 전략은 대표중심론 대시민중심론을 축으로 쟁점이 제기되어왔으며, 제도적 환경은 공정선거를 위한 동원형 규제론 대 시민참여를 위한 정보기본권 강화가 핵심 논제로 고찰되었다. 이어서 이 연구는 세 주제 중 가장 분석이 취약한 정치적 효과를 실증적으로 논구하기 위하여 20대 총선을 사례로 경험적 분석을 수행하였다. 구체적으로 '후보(정당)들의 트위터 캠페인 참가 동향, 당파적 동원과 유권자 반응 및 선거 결과에 대한 플랫폼 효과'를 경험적으로 고찰하였으며 분석 결과는 다음과 같다. 첫째, 19대 총선에 비해서 트위터 캠페인 참가자가 크게 증가하였다. 그리고 트위터 캠페인은 자원동원능력에서 우위에 있는 양당 주도로 진행되었다. 둘째, 트위터가 당파적 공간이라는 점이 명료하게 확인되었다. 특히 수도권의 진보 후보들이 훨씬 더 크게 지지층을 동원하였다. 마지막으로 트위터 캠페인은 득표율 상승과 당선에 영향을 미치는 것으로 나타났다. 특히 팔로어수와 활동기간이 통계적으로 유의하게 나타나, 선거운동에서 네트워킹과 사회자본을 촉진하는 기능이 더욱 중요하다는 것을 입증하였다.

소셜네트워크 분석을 통한 마케팅 전략 : 트위터의 검색네트워크 (Marketing Strategies using Social Network Analysis : Twitter's Search Network)

  • 유병국;김순홍
    • 한국콘텐츠학회논문지
    • /
    • 제13권5호
    • /
    • pp.396-407
    • /
    • 2013
  • 입소문효과의 극대화를 위한 유력자의 역할은 트위터 네트워크에서도 매우 중요하다고 볼 수 있다. 본 논문에서는 기업 마케팅의 관점에서 트위터 유력자를 파악하고자 하였다. 기업의 마케팅 메시지가 가능한 한 많은 사람들에게 노출되기 위해서는 특정인의 팔로어 수뿐만 아니라 계속적인 리트윗을 통해 입소문이 많이 확산되어야 할 것이다. 즉, 팔로어 수는 많은데 리트윗되지 않거나 리트윗은 많이 되는데 소수자에게 주로 리트윗된다면 전체적인 노출의 정도는 미약하게 될 것이다. 트위터의 특정 검색네트워크 데이터를 이용한 그래프 비교를 통해 다음과 같은 사실을 확인할 수 있었다. 첫째, 리트윗이 없는 팔로어 유력자에 비하여 팔로어 유력자의 리트윗을 받는 상대적인 소수자들의 노출도가 크다는 것을 알 수 있었다. 둘째, 리트윗 유력자중에서도 팔로어 유력자에 의하여 리트윗을 받지 못하는 사용자의 노출도는 매우 미미하다는 것을 알 수 있었다. 위와 같은 사실은 노출도를 높이기 위해서는 실제 유력자도 중요하지만 그런 유력자의 리트윗을 유도하는 사용자의 파악이 더 중요하다는 점을 시사해준다고 볼 수 있다. 이와 함께 노출도의 경우 대부분의 중앙성 척도와 고른 상관관계를 유지하고 있어 노출도가 높은 이용자일수록 네트워크구조상에서도 중심적인 위상을 차지한다는 점도 살펴볼 수 있었다.

트위터를 이용한 기계학습 기반의 영화흥행 예측 (Predicting Movie Success based on Machine Learning Using Twitter)

  • 임준엽;황병연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제3권7호
    • /
    • pp.263-270
    • /
    • 2014
  • 본 논문에서는 영화의 흥행을 예측하기 위한 방법을 제안한다. 최근 영화시장이 성장함에 따라 시장의 수요를 예측하기 위한 다양한 연구들이 수행되고 있다. 영화는 비교적 수명주기가 짧은 문화상품이다. 따라서 안정적인 수익을 창출하기 위해 개봉 전 마케팅비용 및 개봉 후 스크린 수 등에 대한 설계가 필요하다. 이를 위해서는 상품의 수요와 경제적인 수익규모에 대한 계산이 선행되어야 한다. 기존 관련 연구들의 경우 예측을 위한 변수로서 주로 영화 자체의 속성들이나 시장에서의 경쟁요인 등을 이용한다. 그러나 정작 상품을 구매하는 주체인 잠재관객들에 대한 비중은 비교적 미비하다. 따라서 본 논문에서는 사람들이 가진 영화에 대한 인지도를 고려하기 위해 트위터를 하나의 설문표본으로서 활용했다. 기존에 사용된 변수들과 트위터에서 추출한 정보를 오프라인 요소와 온라인 요소로 정의하고, 두 요소를 취합하여 기계학습을 적용했다. 실험을 통해 본 논문에서 제시하는 예측기법을 검증했으며, 실험결과 약 95%의 정확도로 영화의 흥행을 예측했다.