• 제목/요약/키워드: 트윗

검색결과 169건 처리시간 0.026초

트위터 상의 이미지 이용에 관한 분석 (An Analysis of Image Use in Twitter Message)

  • 정은경;윤정원
    • 한국비블리아학회지
    • /
    • 제24권4호
    • /
    • pp.75-90
    • /
    • 2013
  • 이용자들은 최근 소셜 미디어를 활발하게 이용하고 있으며, 소셜 미디어는 이미지와 같은 멀티미디어 정보의 배태가 주요한 특징이다. 본 연구는 트위터 상에서 이미지 이용 행태를 규명하고자 하였다. 이를 위하여 2013년 4월에 발생한 "보스턴 마라톤 대회 테러" 사건과 관련된 1,589건의 이미지 포함 트윗 메시지를 수집하여 이 중에서 영향력 있는 트윗 메시지 200건과 선호하는(favorite) 트윗 메시지 200건, 무작위로 선택된 일반 트윗 메시지 200건을 각각 선정하여 데이터 분석을 실시하였다. 데이터 분석은 두 단계의 분석과정과 세 그룹의 데이터 셋을 대상으로 수행하였다. 첫 번째 단계에서는 기존 선행연구를 바탕으로 개발된 코딩 체계를 활용하여 세 그룹의 데이터에 대해서 트윗 메시지, 이미지 이용, 이용자에 관하여 각각 수행되었다. 두 번째 단계는 세 그룹의 데이터 셋(일반 트윗, 영향력 있는 트윗, 선호하는 트윗)의 코딩 결과를 비교 분석하였다. 이러한 분석과정을 통해서, 의견을 표현하는 트윗이 가장 선호되었으며, 정보를 공유하는 트윗이 가장 영향력이 있는 것으로 나타났다. 이미지 이용 관점에서는 정보배포, 일러스트레이션, 감정적/설득적, 정보처리 이용목적이 가장 두드러지게 나타났다. 이러한 이미지 이용은 기존의 이미지 이용 패턴과 달리 이미지를 데이터로서 이용하는 목적이 객체 중심으로 이용하는 목적보다 높은 것으로 나타났다. 이용자 분석에서는 정부기관, 유명인, 이미지 사이트가 가장 선호되고 영향력 있는 것으로 나타났다. 이러한 연구결과는 이용 맥락 관점의 차세대 이미지 정보 검색 패러다임을 위한 이용자 관점의 이해 증진에 기여할 수 있을 것으로 기대한다.

트위터의 감정 분석을 통한 실시간 장소 추천 시스템 (Real-time Spatial Recommendation System based on Sentiment Analysis of Twitter)

  • 오평화;황병연
    • 한국전자거래학회지
    • /
    • 제21권3호
    • /
    • pp.15-28
    • /
    • 2016
  • 본 논문에서는 모바일에서 획득한 GPS(Global Positioning System)를 활용하여 사용자의 위치 주변에서 발생한 SNS 데이터를 수집하고 분석을 통해 사용자가 원하는 장소를 추천하는 시스템을 제안한다. 이를 위해 트위터에서 위치정보를 포함하는 게시글을 표본 집합으로 정하고 모바일의 위치정보와 함께 활용했을 때, 사용자의 검색의도에 부합하는 양질의 정보를 제공할 수 있음을 실험을 통해 증명하였다. 이를 위해 2015년 11월부터 12월까지 수집한 트윗(Tweet)을 대상으로 임의의 위치정보와 검색어로 구성된 질의를 구성하고 형태소 분석을 거쳐 분석에 적합한 형태의 데이터로 변환하였다. 또한 장소 추천을 위해 감정사전을 구축하여 긍정 및 부정을 의미하는 극성 키워드들을 정의하고 레이블을 구성한 후, 감정사전과 극성키워드를 이용해 개별 트윗의 추천 점수를 도출하였다. 논문은 추천 점수와 사용자의 현재 위치, 트윗이 작성된 위치와 사용자 위치 사이의 거리 계산을 통해 가까운 거리 순으로 10개의 장소 정보를 정렬하여 결과를 보인다. 또한 성능평가를 위해 감정 분석된 트윗에 대한 정밀도와 재현율을 도출하여 시스템의 성능을 확인한다. 실험은 '맛집', '공연' 2개의 키워드와 10개 지역을 기준으로 수행하였다. 실험 결과 키워드 1개당 수집된 트윗은 평균 10.5개였으며, 총 10번의 실험에 사용된 평균 210개의 트윗 중 긍정 또는 부정의 단어를 포함한 트윗의 개수는 평균 122개였다. 또한 감정 분석을 통해 긍정 또는 부정으로 분류된 트윗은 평균 65개였으며 그 중 실제로 긍정 또는 부정의 의미를 담은 트윗은 평균 46개였다. 이를 통해 시스템은 38%의 재현율로 감정요소를 담은 트윗을 탐지하고, 71%의 정밀도로 감정 분석을 수행했음을 확인했다.

트레이닝 데이터가 제한된 환경에서 N-Gram 사전을 이용한 트위터 스팸 탐지 방법 (A Method for Twitter Spam Detection Using N-Gram Dictionary Under Limited Labeling)

  • 최혁준;박정희
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제6권9호
    • /
    • pp.445-456
    • /
    • 2017
  • 본 논문에서는 트레이닝 데이터가 제한된 환경에서 n-gram 사전을 이용하여 불건전 정보를 포함하는 스팸 트윗을 탐지하는 방법을 제안한다. 불건전 정보를 포함하는 스팸 트윗은 유사한 단어와 문장을 사용하는 경향이 있다. 이러한 특성을 이용하여 스팸 트윗과 정상 트윗에 대한 n-gram 사전을 구축하고 나이브 베이스 분류기를 적용하여 효과적으로 스팸 트윗을 탐지할 수 있음을 보인다. 반면에, 실시간으로 대용량의 데이터가 유입되는 트위터의 특성은 초기 트레이닝 집합 구성에 매우 큰 비용을 요구 한다. 따라서, 초기 트레이닝 집합이 매우 작거나 존재하지 않는 환경에서 적용할 수 있는 스팸 트윗 탐지 방법이 필요하다. 이를 위해 트위터의 리트윗 기능을 활용하여 의사 라벨을 생성하고 초기 트레이닝 집합의 구성과 n-gram 사전 업데이트에 활용하는 방법을 제안한다. 2016년 12월 1일부터 2016년 12월 7일까지 수집된 한국어 트윗 130만 건을 사용한 다양한 실험 결과는 비교 방법들보다 제안하는 방법의 성능이 우수함을 입증한다.

소셜 네트워크 서비스의 단어 빈도와 범죄 발생과의 관계 분석 (An Analysis of Relationship Between Word Frequency in Social Network Service Data and Crime Occurences)

  • 김용우;강행봉
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제5권9호
    • /
    • pp.229-236
    • /
    • 2016
  • 기존의 범죄 예측 방법들은 범죄 발생을 예측하기 위해 기존 기록을 이용하였다. 그러나 이러한 범죄 예측 모델은 데이터를 갱신하는데 어려움이 있다. 범죄 예측을 향상시키기 위해서 소셜 네트워크 서비스(SNS)를 이용하여 범죄를 예측하는 연구들이 진행되었지만, SNS 데이터와 범죄 기록 사이의 관계에 대한 연구는 미흡하다. 따라서, 본 논문에서는 SNS 데이터와 범죄 발생 사이의 관계를 범죄 예측의 관점에서 분석하였다. 잠재 디리클레 할당(LDA)을 이용하여 범죄 발생과 관련된 단어를 포함하는 트윗을 추출하였고, 범죄 기록에 따른 트윗 빈도의 변화를 분석하였다. 범죄 관련 단어를 포함하는 트윗의 빈도를 계산하고, 범죄 발생에 따라서 트윗 빈도를 분석하였다. 범죄가 발생하였을 때, 범죄와 관련된 트윗의 빈도가 변화하였다. 게다가, 범죄 발생 전후에 트윗 빈도가 특정 패턴을 보이기 때문에 SNS 데이터가 범죄 예측 모델에 도움이 될 것이다.

효율적인 트윗 분석 시스템 설계 및 구현 방법 (An Efficient Method for Design and Implementation of Tweet Analysis System)

  • 최민석
    • 디지털융복합연구
    • /
    • 제13권2호
    • /
    • pp.43-50
    • /
    • 2015
  • 다양한 소셜 네트워크 서비스의 등장과 사용자의 급증으로 소셜 네트워크 상에서 생산되는 데이터가 급증하고 있다. 전파 속도가 빠르고 개인적 성향의 의견들을 많이 포함하고 있는 소셜 네트워크 데이터의 특성으로 이를 분석하여 다양한 방면으로 활용하려는 요구도 증가하고 있다. 이러한 요구에 부응하여 실시간으로 대용량 데이터를 분석 처리하기 위한 다양한 기술 및 서비스들이 등장하고 있지만, 단기간에 적은 비용으로 그것들을 적용하기에는 어려움이 따른다. 본 논문에서는 새로운 기술이나 서비스의 도입 없이 효과적으로 트윗을 분석하기 위한 시스템 설계 및 구현 방법을 제안한다. 리눅스 기반의 호스팅 서버에 MySQL 데이터베이스와 PHP 스크립트를 이용하여 트윗 데이터를 수집하고 분석하는 모니터링 시스템을 구축하여 제안된 방법을 검증하였다.

오피니언 마이닝을 이용한 한글 트윗 감정분석 시스템 (The Hangul Tweet Sentiment Analysis System using Opinion Mining)

  • 어문선;박두순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1145-1146
    • /
    • 2013
  • 인터넷과 스마트폰의 발달로 SNS서비스의 사용자와 데이터가 활발하게 증가하고 있다. 이로 인하여 SNS 데이터의 가치와 신뢰성이 점점 증가하고 있으며, 이러한 추세에 따라 여러 연구와 실험을 통하여 데이터를 분석하고 분석 결과를 제공하는 서비스가 증가하고 있다. 본 논문에서는 이러한 배경을 바탕으로 특정 키워드를 포함하고 있는 한글 트윗을 검색하여 해당 트윗에 대한 연관 키워드와 감정 키워드를 분석해서 출력해주는 시스템을 개발한다.

LDA를 이용한 트윗 유저의 연령대, 성별, 지역 분석 (Analyzing ages, gender, location on Twitter using LDA)

  • 이호경;천주룡;송남훈;고영중
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2013년도 제25회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.116-119
    • /
    • 2013
  • 요즘 많은 사람들은 트위터를 통해 짧은 문장의 트윗을 작성하여 자신의 의견이나 생각을 표현한다. 사람들이 작성한 트윗은 사용자의 연령, 성별, 지역에 따라 다른 특성이 담겨있다. 이러한 정보를 이용하여, 기업에서는 연령대, 성별, 지역에 따라 각기 다른 마케팅 전략을 세울 수 있을 것이다. 본 논문에서는 트위터 사용자들의 트윗을 분석하여 연령대, 성별, 지역을 예측하려 한다. 네이버 오픈사전의 자질, 한국전자통신연구원(ETRI)의 개체명 사전을 이용한 자질 및 한국어 형태소 분석, 음절 단위의 bigram을 클래스별 의미 있는 자질로 선택하고 LDA를 이용하여 예측된 확률분포를 활용하여 분류한 결과, 연령 72%, 성별 75%, 지역 43%의 납득할만한 예측 정확도 결과를 얻게 되었다.

  • PDF

영화 흥행 예측을 위한 영화 관객 수와 관련 트윗간의 상관관계 분석 (An Analysis of Corelation between Movie Attendance and Related Tweets for Predicting Box Office)

  • 임준엽;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1245-1247
    • /
    • 2013
  • 최근 들어 영화에 대한 수요가 증가하면서 국내 영화시장규모는 지속적으로 성장하고 있다. 이와 관련하여 여러 가지 위험요소를 제거하고 시장에서의 성공을 위해 영화의 흥행을 예측하기 위한 다양한 연구들이 진행되고 있다. 그러나 그러한 예측을 위한 관련 요소들 간의 상관관계를 정확한 수치로 표현하는 일은 매우 어려우며 관련연구 또한 아직 미흡하다. 본 논문에서는 트위터에서 발생되는 트윗을 설문 표본으로 삼고 영화 관련 트윗과 영화의 흥행을 의미하는 관객 수와의 상관관계를 분석하여 상관계수를 도출하였다. 실험 결과 실험에 사용된 영화 10편의 관객 수에 대한 데이터 모두 관련 트윗의 발생비율과 양의 상관관계를 가짐을 알 수 있었으며 이를 통해 트위터를 이용한 영화의 흥행 여부 예측에 대한 가능성을 제시했다.

지리적 공간과 장치 정보를 사용한 개선된 트윗 봇 검출 (Improved Tweet Bot Detection Using Geo-Location and Device Information)

  • 이알찬;서고은;신원용;김동건;조재희
    • 한국정보통신학회논문지
    • /
    • 제19권12호
    • /
    • pp.2878-2884
    • /
    • 2015
  • 온라인 소셜 네트워크 서비스 중 하나인 트위터는 가장 보편적으로 사용되는 마이크로 블로그인데, 트위터의 개방적 구조로 인해 자동화 프로그램인 트윗 봇이 많이 생성되고 있다. 이 트윗 봇은 적법한 봇과 악성 봇으로 분류되는데, 이 중 악성 봇은 일반 사용자들에게 많은 양의 스팸 정보나 유해한 컨텐츠를 배포하기 때문에 트윗 봇을 검출하는 작업은 반드시 필요하다. 기존 연구에서는 시간적 정보를 활용하여 사람과 트윗 봇을 분류하였다. 본 논문에서는 먼저 사용자들의 고 정밀 위치 정보를 알려주는 공간 태그된 트윗 정보를 활용하여 트위터 사용자들의 정확한 위치를 알아낸다. 그리고, 각 사용자의 공간 변수에 대한 엔트로피 값 및 사용자의 장치 정보를 사용하여 새로운 봇 검출 알고리즘을 제안한다. 주요 결과로써, 시간 정보만을 이용한 기존 연구결과보다 각 신뢰도별 봇 검출 확률 및 거짓 경보 확률이 모두 우수하게 나타난다.

도시 지역 트윗 데이터의 시간대별 공간분포 특성 - 부산광역시를 사례로 - (A Study on the Spatial Patterns of Tweet Data for Urban Areas by Time - A Case of Busan City -)

  • 구자용
    • 지적과 국토정보
    • /
    • 제46권2호
    • /
    • pp.269-281
    • /
    • 2016
  • 최근 공간 정보 분야에서 소셜 미디어와 같은 공간 빅 데이터의 분석과 처리에 많은 관심이 집중되고 있다. 본 연구에서는 공간 빅 데이터 분석의 한 사례로서 트윗 데이터가 가지고 있는 위치 정보와 시간 정보를 바탕으로 시간대별로 공간분포를 분석하고 그 특성을 파악하였다. 부산시 지역의 트윗 데이터를 수집하고, 시간대별 공간분석을 통하여 그 특성을 파악하여, 그 지역의 토지이용 특성과 비교하였다. 부산시 지역의 트윗 데이터를 시간대에 따라 평일 주간, 평일 야간, 휴일 주간, 휴일 야간으로 구분하고, 각 시간대별로 공간적 분포 특성을 파악하여, 공간적으로 집중된 지역의 토지이용 특성과 비교하였다. 본 연구의 결과 트윗 데이터는 시간대에 따라 공간분포가 다르게 나타나고 있으며, 이는 그 지역의 일상생활 패턴과 토지이용 특성을 어느 정도 반영하고 있었다. 본 연구에서는 공간정보 분야에서 트윗 데이터와 같은 소셜 미디어 자료의 분석을 통한 활용 가능성을 제시하였다. 향후 토지 계획이나 도시 계획 등의 분야에서 다양한 소셜 미디어 자료를 활용할 수 있을 것으로 전망된다.