• 제목/요약/키워드: 트위터 데이터

검색결과 229건 처리시간 0.032초

트위터에서 팔로워의 행태분석 모델 (Modeling Twitter Follower's Behavior Analysis)

  • 정광용;설재욱;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.604-607
    • /
    • 2012
  • 소셜 네트워크 서비스의 하나인 트위터는 팔로우를 통하여 사용자 간의 관계를 맺을 수 있다. 트위터 사용자들은 다양한 팔로워들이 존재한다. 이 팔로워들은 사용자에 대한 호감을 가지고 팔로우 하거나, 맹목적으로 추종하거나, 부정적인 의견을 지니고 사용자의 행동과 글을 관찰하기 위해 팔로우할 수도 있다. 본 논문에서 사용자에게 팔로워들이 어떠한 목적으로 그 사용자를 팔로워의 행태를 분석하는 모델을 제안한다. 대상사용자의 영향력 있는 팔로워를 추출하고, 팔로워의 리트윗 정보, 프로파일, 최신 트윗의 감정분석을 통해 지지자, 중립, 비지지자로 분류한다. 제안 방법의 유효성을 검증하기 위해 트윗 데이터에서 정치인과 언론인 5 명의 팔로워들 중 무작위로 3 만명을 추출하여 실험하였다. 실험 결과 영향력 있는 사용자 추출을 통한 지지 팔로워 추출이 효과적임을 알 수 있다.

세월호 참사에 대한 트위터와 포털뉴스의 의제 순위 상관관계 연구 (A Study on the Agenda Rank-Order Correlation between Twitter and Portal News about Sewol Ferry Catastrophe)

  • 김신구;최은경
    • 인터넷정보학회논문지
    • /
    • 제16권3호
    • /
    • pp.105-116
    • /
    • 2015
  • 2014년 4월 16일 발생한 세월호 침몰 사건은 그 동안의 어떤 사건, 사고 그리고 재난보다 한국 정치 사회 그리고 언론에 상당한 영향을 미쳤다. 이에 본 연구는 세월호 사건이라는 특수성을 고려해, 사건 발생 직후 드러난 트위터와 포털뉴스에서 나타난 의제의 현저성과 두 매체 간의 속성의제들이 어떠한 상관관계를 나타내고 있는가를 의제 순위 상관관계를 통해 탐구해 보았다. 빅데이터 수집을 통해 분석해 본 결과, 첫째 세월호라는 키워드와 연관된 트위터의 의제와 포털뉴스의 의제에 현저성에 차이가 없을 것이라는 가설은 기각되었지만, 두 매체의 의제들의 순위 상관관계는 높은 것으로 나타났다. 연구 결과 두 매체의 의제들은 대부분 서로 공유됨을 알 수 있다. 둘째, 세월호와 연관된 다섯 가지 대상의제들의 트위터와 포털뉴스에서의 속성의제들은 현저성에서 차이가 있었으며, 세 가지 의제들은 순위 상관관계가 높게 나타났고, 나머지 두 의제들은 순위 상관관계가 낮게 나타났다. 이 결과를 통해, 특정 주제에 관해서는 트위터가 포털뉴스와 전혀 다른 의제를 형성, 매체 내에서 공유하였다는 것을 알 수 있다.

트위터 기반 이벤트 탐지에서의 기계학습을 통한 지명 노이즈제거 (Geographical Name Denoising by Machine Learning of Event Detection Based on Twitter)

  • 우승민;황병연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제4권10호
    • /
    • pp.447-454
    • /
    • 2015
  • 본 논문에서는 트위터 기반 이벤트 탐지에서의 기계학습을 통한 지명 노이즈제거 방식을 제안한다. 최근 스마트폰 이용자의 증가로 소셜 네트워크 서비스(SNS) 이용자가 증가하고 있는 추세이다. 그중 트위터는 140자 이내의 단문서비스와 팔로우 기능으로 정보의 빠른 전달력과 확산성을 가지고 있다. 이러한 특성과 모바일에 최적화된 트위터의 특성상 정보 전달 속도가 매우 빠르기 때문에 재난 상황이나 이벤트 전달의 매개체 역할을 하고 있다. 이와 관련된 연구로는 트위터 사용자 개개인을 이벤트 탐지의 센서로 사용하여 현실에서 발생하는 이벤트를 탐지하였는데 이벤트가 특정 장소에서 발생한다는 특성을 이용해서 지명 키워드를 사용하였다. 그러나 지명과 동형이의어 관계에 관한 노이즈제거에 대한 부분이 누락되어있어서 이벤트 탐지의 정확도를 낮추는 요인이 된다. 이에 본 논문에서는 제거와 예측 두 가지 방식으로 노이즈제거 기법을 적용하였다. 먼저 노이즈 관련 데이터베이스 구축을 이용하여 제거 필터링을 진행한 후에 나이브 베이지안 분류를 이용해서 지명 유무를 결정하였다. 실험 데이터를 이용해서 기계학습을 위한 확률값을 구했으며, 지명마다 본 논문에서 제시하는 예측기법을 검증했을 때 89.6%의 신뢰도로 노이즈제거 기법의 필요성을 보였다.

식품안전 관련 트위터 정보의 연관 관계 분석 및 시각화 (Coocurrence Relation Analysis and Visualization in Tweet for Food Safety Domain)

  • 소현수;강승식;오세욱
    • 한국어정보학회:학술대회논문집
    • /
    • 한국어정보학회 2016년도 제28회 한글및한국어정보처리학술대회
    • /
    • pp.305-306
    • /
    • 2016
  • 식품안전 사고가 발생했을 때 뉴스, 인터넷 기사를 통해 정보를 인지하기 전에 그 음식을 섭취하는 경우가 발생하는 문제점 최소화하기 위하여 실시간 트윗 분석으로 현재 발생한 식품안전 키워드와 어느 지역에서 발생했는지를 신속하게 파악하고, 키워드 연관관계 분석 프로그램을 활용하여 정확한 정보를 추출한다. 이와 더불어, SNS 등 다양한 정보 소스로부터 추출한 정보를 간단명료하게 파악하기 위해서 워드 클라우드 등 데이터 시각화 기법을 활용하여 시각화로 정보를 제공한다. 이 기법은 식품안전 뿐만 아니라 최근 발생한 콜레라 감염 발생과 같은 문제를 해결하기 위한 방법으로 활용될 수 있을 것이다.

  • PDF

식품안전 관련 트위터 정보의 연관 관계 분석 및 시각화 (Coocurrence Relation Analysis and Visualization in Tweet for Food Safety Domain)

  • 소현수;강승식;오세욱
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2016년도 제28회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.305-306
    • /
    • 2016
  • 식품안전 사고가 발생했을 때 뉴스, 인터넷 기사를 통해 정보를 인지하기 전에 그 음식을 섭취하는 경우가 발생하는 문제점 최소화하기 위하여 실시간 트윗 분석으로 현재 발생한 식품안전 키워드와 어느 지역에서 발생했는지를 신속하게 파악하고, 키워드 연관관계 분석 프로그램을 활용하여 정확한 정보를 추출한다. 이와 더불어, SNS 등 다양한 정보 소스로부터 추출한 정보를 간단명료하게 파악하기 위해서 워드 클라우드 등 데이터 시각화 기법을 활용하여 시각화로 정보를 제공한다. 이 기법은 식품안전 뿐만 아니라 최근 발생한 콜레라 감염 발생과 같은 문제를 해결하기 위한 방법으로 활용될 수 있을 것이다.

  • PDF

소셜 사건에 대한 사용자의 행동 분석에 기반한 신뢰성 높은 사용자의 트윗 추출 (Extracting Reliable User's Tweet for Social Events Based on User Behavior in Twitter)

  • 촐몽 바야르;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.608-611
    • /
    • 2012
  • 소셜 사건이 일어나면 그 사건과 관련된 트윗이 폭발적으로 증가하는데 트윗 일부 내용을 살펴보면 스팸, 광고와 같은 트윗이 많이 포함되어 있다. 수 많은 트위터 데이터에서 사용자가 사건과 직접 관련된 신뢰성 높은 트윗을 찾아 읽는데 시간이 많이 걸릴 수 있다. 이러한 문제를 해결하기 위해 본 논문에서 트위터의 리트윗 정보, 사용자 신뢰도 측정 및 활동 분석, 팔로잉과 팔로워간의 정보 등 사용자의 행동 분석을 이용하여 소셜 사건과 직접 관련된 신뢰성 높은 사용자의 트윗을 추출하는 방법을 제안한다. 제안 방법의 유효성을 검증하기 위해 소셜 이슈 4 개에 대한 트윗 데이터에서의 실험을 통하여 상위 100 개의 결과에서의 정확률(P@100) 76.6%의 성능을 보였다. 실험을 통해 제안 방법이 신뢰성 높은 사용자의 트윗을 추출하는데 효과적인 방법임을 알 수 있다.

트위터에서 이슈가 되고 있는 중국어-한국어 교차언어 뉴스 탐지 (Chinese and Korean Cross Lingual News Detection in Twitter)

  • 조승남;촐몽 바야르;이경순;이용석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.658-661
    • /
    • 2012
  • 국제적으로 이슈가 되고있는 사건들의 뉴스는 보도당국의 입장차이에 따라 동일 이슈에 대한 관점의 차이를 나타낸다. 교차언어 연구에서는 번역하는 과정이 중요하다. 본 논문에서는 중-한 어휘번역에서 발생하는 오류 및 모호성을 해결하기 위해 키워드를 중심으로 문맥 어휘를 이용해서 번역한 후 번역결과에서 빈도가 높은 한국어 어휘를 선택하는 방법을 제안한다. 제안 방법의 유효성을 검증하기 위해 소셜 이슈 3 개에 대한 트윗 데이터에서 실험하여 추출된 중-한 이슈 뉴스 결과에서의 정확도 85.8%의 성능을 보였다. 실험을 통해 제안 방법이 중-한 교차언어 트위터 데이터에서 동일한 이슈와 관련된 뉴스를 찾는데 효과적인 방법임을 알 수 있다.

Naïve Bayes와 SVM을 이용한 트위터 데이터의 긍정/부정 의견 자동분류 결과 분석 (Initial Analysis of Positive/Negative Opinion Classification of Twitter Data Using Naïve Bayes and SVM)

  • 조희련;김성국
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.406-409
    • /
    • 2012
  • '나꼼수 비키니 시위'에 대 긍정적(지지), 부정적(비판) 의견을 담은 트위터 데이터를, 단어의 출현에 주목하여 Naïve Bayes (NB)와 Support Vector Machine (SVM)을 적용하여 자동분류 한 결과, NB가 75.98%로, 73.65%인 SVM 보다 약간 더 나은 성능을 보였다. 본 실험을 통해, 기계학습을 이용한 대중의견(opinion) 자동분류 시스템을 실용화할 때의 고려사항에 대해 살펴 본다.

자연어 처리를 위한 트위터 감정 분석 (Twitter Sentiment Analysis for Natural Language Processing)

  • 이앙;조인휘
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.457-458
    • /
    • 2022
  • 인터넷 시대에 소셜 미디어는 사람들의 삶에 완전히 침투했다. 많은 사용자 기반을 보유한 성숙한 온라인 플랫폼 중 하나인 Twitter를 통해 사용자는 최신 뉴스, 삶의 경험 및 흥미로운 삶의 이야기를 독립적으로 게시할 수 있다. 하지만 때론 부정적인 뉘앙스를 풍기며 기업이나 개인의 브랜드에 영향을 미치며 이익을 훼손하는 경우가 있기 때문에 욕설을 식별해 트위터 발신을 차단할 필요가 있다. 이 기사의 가장 큰 혁신은 Twitter 데이터를 사용하여 다양한 방법을 동시에 비교한다는 것입니다. 더 많은 데이터를 처리할수록 딥 러닝을 시도하면 좋은 결과를 얻을 수 있다. Transformer 분류기를 통합하여 최상의 결과를 얻었다

오피니언 마이닝을 통한 스마트 워치 출시 전후 소비자 반응 분석 (Comparing Customer Reactions Before and After of a Smart Watch Release through Opinion Mining)

  • 이종호;박희준
    • 한국빅데이터학회지
    • /
    • 제1권1호
    • /
    • pp.1-7
    • /
    • 2016
  • 인터넷의 확산으로 트위터와 같은 SNS가 확산되었고, 컴퓨터 처리 능력의 발달로 빅 데이터 처리가 가능해졌다. 본 연구에서는 현재 주목 받고 있는 기술인 스마트 워치에 대해 다루고 있으며 최근 출시되었던 삼성 갤럭시 기어 S2를 대상으로 연구를 진행하고 있다. 스마트 워치의 출시 전, 후에 게시되었던 트위터 데이터를 수집하여 실제 SNS 사용자들이 신제품 출시에 어떻게 반응하고 있으며 어떠한 다른 양상을 보이는지 분석한다. 분석을 통해 기업 실무자들에게 출시 전, 출시 후 각각에 마케팅에 대응하는 방법에 관한 가이드라인을 제공하며 본 연구에서 사용된 분석 프레임워크는 다른 분야 및 제품에서도 사용 가능한 연구 가이드라인이 된다.

  • PDF