• 제목/요약/키워드: 트윗 봇

검색결과 3건 처리시간 0.017초

시공간 정보를 사용한 개선된 트윗 봇 검출 (Improved Tweet Bot Detection Using Spatio-Temporal Information)

  • 김효상;신원용;김동건;조재희
    • 한국정보통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2885-2891
    • /
    • 2015
  • 온라인 소셜 네트워크 서비스 중 하나인 트위터는 가장 보편적으로 사용되는 마이크로 블로그인데, 트위터의 개방적 구조로 인해 자동화 프로그램인 트윗 봇이 많이 생성되고 있다. 이 트윗 봇은 적법한 봇과 악성 봇으로 분류되는데, 이 중 악성 봇은 일반 사용자들에게 많은 양의 스팸 정보나 유해한 컨텐츠를 배포하기 때문에 트윗 봇을 검출하는 작업은 반드시 필요하다. 기존 연구에서는 시간적 정보를 활용하여 사람과 트윗 봇을 분류하였다. 본 논문에서는 사용자들의 고 정밀 위치 정보를 알려주는 공간 태그된 트윗 정보를 활용하여 트위터 사용자들의 정확한 위치와 트윗 전송시각을 알아낸 후, 각 사용자의 시공간 엔트로피를 계산하여 트윗 봇을 검출하는 개선된 두 단계 알고리즘을 제안한다. 주요 결과로써, 시간 정보만을 이용한 기존 연구결과보다 각 신뢰도별 봇 검출 확률 및 거짓 경보 확률이 모두 우수하게 나타난다.

지리적 공간과 장치 정보를 사용한 개선된 트윗 봇 검출 (Improved Tweet Bot Detection Using Geo-Location and Device Information)

  • 이알찬;서고은;신원용;김동건;조재희
    • 한국정보통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2878-2884
    • /
    • 2015
  • 온라인 소셜 네트워크 서비스 중 하나인 트위터는 가장 보편적으로 사용되는 마이크로 블로그인데, 트위터의 개방적 구조로 인해 자동화 프로그램인 트윗 봇이 많이 생성되고 있다. 이 트윗 봇은 적법한 봇과 악성 봇으로 분류되는데, 이 중 악성 봇은 일반 사용자들에게 많은 양의 스팸 정보나 유해한 컨텐츠를 배포하기 때문에 트윗 봇을 검출하는 작업은 반드시 필요하다. 기존 연구에서는 시간적 정보를 활용하여 사람과 트윗 봇을 분류하였다. 본 논문에서는 먼저 사용자들의 고 정밀 위치 정보를 알려주는 공간 태그된 트윗 정보를 활용하여 트위터 사용자들의 정확한 위치를 알아낸다. 그리고, 각 사용자의 공간 변수에 대한 엔트로피 값 및 사용자의 장치 정보를 사용하여 새로운 봇 검출 알고리즘을 제안한다. 주요 결과로써, 시간 정보만을 이용한 기존 연구결과보다 각 신뢰도별 봇 검출 확률 및 거짓 경보 확률이 모두 우수하게 나타난다.

트위터 사용자의 도시 내 활동반경과 거주지역의 탐색: 라스베이거스 사례 (Investigation of Twitter Users' Activity Radius and Home Region in the City: The Case of Las Vegas)

  • 조재희;서일정
    • 한국통신학회논문지
    • /
    • 제42권2호
    • /
    • pp.505-513
    • /
    • 2017
  • 본 연구는 전 세계에서 발생한 200,578,703건의 지오트윗을 수집하여 트윗 봇을 제거한 후, 인간의 도시 내 이동패턴을 분석하였다. 활동반경(Activity Radius)이라는 개념을 이용하여 트위터 사용자를 구분하였으며, 거주지역을 국내와 국외로 구분하고 국내는 다시 시내와 시외로 구분하였다. 그리고 활동반경과 거주지역에 따라 트위터 사용자의 활동성과 활동지역에 대한 통계적 특성을 기술하였고 지리적 분포를 시각적으로 표현하였다. 라스베이거스를 대상으로 하는 사례 분석을 통해, 거주지역에 따른 활동성과 활동지역의 차이를 확인하였다. 향후 본 연구의 방법에 따라 다양한 도시를 대상으로 분석을 수행하면, 인간의 이동성에 대한 다양한 이론을 도출할 수 있을 것이다.