• 제목/요약/키워드: 트윗

검색결과 169건 처리시간 0.026초

트위터 데이터 수집을 위한 동적 시드 선택 (Dynamic Seed Selection for Twitter Data Collection)

  • 이현철;변창현;김양곤;이상호
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제41권4호
    • /
    • pp.217-225
    • /
    • 2014
  • 트위터와 같은 소셜 네트워크 분석은 인간의 행동을 이해하거나, 화제가 되는 주제를 탐지하거나, 영향력 있는 사람을 식별하거나, 커뮤니티나 그룹을 발견하는데 흥미로운 시각을 제공할 수 있다. 하지만 소셜 네트워크가 가지는 특성(즉 데이터가 방대하고, 정교하지 않으며 또한 동적인 특성)으로 인하여 소셜 네트워크에서 주제와 연관이 있는 데이터를 수집하는 것은 어려운 일이다. 본 논문은 주어진 주제와 관련 있는 트윗을 효과적으로 수집하기 위하여 시드 노드를 동적으로 선택하는 알고리즘을 제안한다. 본 알고리즘은 사용자의 영향력을 측정하기 위하여 사용자 속성을 활용하며, 수집 프로세스 중에 시드 노드를 동적으로 할당한다. 우리는 제안한 알고리즘을 실제 트윗 데이터에 적용하였으며, 만족할 만한 성능결과를 얻었다.

신문기사로부터 추출한 최근동향에 대한 트위터 감성분석 (Twitter Sentiment Analysis for the Recent Trend Extracted from the Newspaper Article)

  • 이경호;이공주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제2권10호
    • /
    • pp.731-738
    • /
    • 2013
  • 본 논문은 사회의 최근 동향에 대한 여론의 반응을 관찰하기 위한 방법을 나타낸다. 최근 동향을 나타내는 키워드를 신문기사로부터 추출하고, 추출된 키워드를 이용하여 수집된 트윗의 감성 분석을 통해 최근 동향에 대한 여론을 분석한다. 수집된 신문기사를 k-means알고리즘을 이용하여 군집화하고, 군집내의 단어의 출현 빈도를 이용하여 토픽 키워드를 선정하였다. 각 토픽에 대하여 수집된 트윗은 그 토픽 대한 트윗이라는 가정하에 기계학습 방법을 이용하여 긍/부정을 판별하여 감성을 판단하게 하였다. 그리고 이와 같은 가정에 대한 타당성을 검증해 보았다.

트위터 API를 활용한 트위터 검색 기능 개선 (Improving Twitter Search Function Using Twitter API)

  • 남용욱;김용혁
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권3호
    • /
    • pp.879-886
    • /
    • 2018
  • 트위터에서 제공해주는 기본 검색 기능은 검색어가 담긴 트윗 뿐 아니라 검색어를 포함하는 닉네임을 가진 유저가 쓰는 모든 트윗들을 보여준다. 따라서 검색 키워드와 관계 없는 트윗들도 검색 결과로 노출하게 되어 해당 키워드가 포함된 트윗 만을 검색하려고 하는 많은 사용자들에게 불편함을 주고 있다. 본 연구에서는 이러한 문제점을 해결하고자 검색 키워드가 들어있는 트윗만을 검색하는 알고리즘을 만들어 트위터 검색 기능을 개선하였다. 개선된 기능은 ASP.NET MVC5를 이용하여 웹 서비스로 구현하여 많은 사람들이 이용할 수 있다. 검색 결과를 모아놓은 객체에 C#의 강력한 컬렉션 메소드를 사용하여 '리트윗' 이나 '마음에 들어요' 의 개수가 많은 순서대로 출력할 수도 있고, 리트윗 숫자가 설정한 수치보다 적을 경우 검색 결과에서 제외할 수 있는 필터 기능도 추가하였다. 따라서 사람들에게 관심을 많이 받는 의견을 빠르게 탐색할 수도 있으며, 이는 검색 이용자와 데이터 분석가들이 트위터에서 검색하는데 편리함을 줄 것으로 기대된다.

트위터에서 이슈가 되고있는 뉴스 기사에 대한 소셜 사용자 네트워크 기반 정치 성향 분류 (Political Bias Classification Based on Social User Networks on Issuable Political News Article in Twitter)

  • 김준길;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.641-644
    • /
    • 2012
  • 트위터에서 정치 성향을 가지거나 관심이 있는 트위터 사용자는 관심있는 정치 인물이나 단체에 대한 뉴스 기사에 대해 자신의 의견을 남기거나 그대로 인용하게 된다. 또한, 자신의 의견과 공감하거나 비공감하는 트윗에 대해서 리트윗을 하거나 추가적인 자신의 의견을 언급하기도 한다. 본 논문에서는 이슈가 되고있는 정치 뉴스 기사에 대해 관심 있는 트위터 사용자들을 찾아 트위터 사용자들 간의 트윗 문서들 사이에서의 관계 정보를 가지는 사용자 네트워크에서의 트위터 사용자들의 성향을 분류해주는 방법을 제안한다. 제안한 방법의 유효성을 검증하기 위해 트위터에서 이슈가 된 정치 뉴스 기사들과 각 뉴스 이슈를 언급한 트위터 데이터에서 트윗 문서 내용 유사도 기반 분류 방법과의 비교 실험 하였다. 실험 결과에서 사용자간의 관계 정보를 이용한 성향 분류 방법이 유효함을 보였다.

트윗 데이터를 이용한 황사 관련 질병 유의성 분석 (Significance Analysis of Yellow Dust Related Disease Using Tweet Data)

  • 정용한;서민송;유환희
    • 지적과 국토정보
    • /
    • 제47권1호
    • /
    • pp.267-276
    • /
    • 2017
  • 우리나라는 황사로 인해 농업 및 산업분야, 시민건강 등 다양한 분야에 걸쳐 피해가 발생되고 있으며 이에 대한 대책 마련이 시급한 실정이다. 이에 본 연구에서는 2009년 이후 최대 황사가 나타났던 2015년 2월 23일을 기준으로 전후 11일간의 황사 관련 트윗 데이터를 수집하고, 이슈어 분석, 건강과 관련된 트윗 데이터 그룹 재구성, 질병과의 연관규칙 분석 등을 걸쳐 황사발생과 관련 질병의 유의성을 검정한 결과 다음과 같은 결론을 얻었다. 황사관련 트윗 데이터로부터 도출된 질병과 건강보험심사평가원에서 취득한 환자실태 자료를 종합하여 비염, 천식, 결막염 환자에 대한 유의성 검정을 실시한 결과, 유의확률 5%에서 결막염은 16개 시 도 중 13개 지역에서 유의하게 나타났으며, 비염은 6개 지역에서, 천식은 3개 지역에서 질병 발생에 유의한 것으로 나타났다. 이상과 같이 트윗 데이터와 같은 SNS데이터로 부터 시민들의 건강에 대한 정보를 취득할 수 있었으며, 이를 활용한 시민건강 관리 대책을 수립하는데 유용한 정보를 제공해 줄 수 있을 것으로 판단된다.

지오트윗 사용자의 이동 특성 분석에 관한 연구: 국내 이동과 해외 이동 비교 연구 (A Study on the Movement Characteristics of Geotweet Users: A Comparative Study on Domestic and International Movements)

  • 백의영;조재희
    • 한국융합학회논문지
    • /
    • 제11권7호
    • /
    • pp.169-180
    • /
    • 2020
  • 본 연구는 국가 간 이동이 발생한 지오트윗 사용자를 이동거리평균과 이동거리표준편차에 따라 그룹화하여, 국가 간 이동과 자국 내 이동에서 나타나는 특징을 발견하고 연구의 의의를 찾고자 하였다. 데이터마트를 구축 후 국가 간 이동과 자국 내 이동이 발생한 지오트윗을 분리하였고, 해버사인공식을 이용해 사용자의 이동거리를 측정하였다. 국가 간 이동 집단에서는 동일한 언어를 사용하며 생활방식이 비슷한 국가 사이에서 많이 이동하였고, 자국 내 이동에서는 인프라가 잘 구축된 선진국 위주의 국가에서 많은 이동이 발생하였다. 본 연구는 사용자별 이동거리를 계산하여 공통된 특징을 도출하고자 하였으며, 사용자의 이동거리 특성에 따라 그룹화하였다. 본 연구에서 분석한 21개국은 국가별 경제력이나 나이, 직업 등에서 차이가 커 많은 제반 사항이 고려되어야 정밀한 분석이 가능할 것이다. 향후에는 현실적인 사항을 추가한 연구가 진행되어야 할 것이다.

트위터 유력자와의 의견일치여부가 의견표명에 미치는 영향: 유력자 유형의 상호작용효과를 중심으로 (The Effect of Opinion Congruency with Twitter Influentials on Opinion Expression: The Interaction Effect of Influential Type)

  • 진소연;이숙정
    • 한국콘텐츠학회논문지
    • /
    • 제16권4호
    • /
    • pp.455-465
    • /
    • 2016
  • 본 연구는 트위터 유력자가 이용자의 온-오프라인 의견표명 의도에 미치는 영향을 살펴보고자 하였다. 침묵의 나선 이론과 수정 행동 가설에 근거하여 상반된 가설을 도출하였고, 어느 가설이 더 타당한지를 검증해보기 위해 실험연구를 진행하였다. 실험참가자들은 입양특례법 개정안에 대한 공인 유력자의 찬성 트윗, 공인 유력자의 반대 트윗, 일반인 유력자의 찬성 트윗, 일반인 유력자의 반대 트윗이라는 4개의 실험 조건에 배치되었다. 입양특례법 개정안에 대한 실험참가자의 의견을 바탕으로, 실험집단은 공인 유력자와의 의견일치 집단, 공인 유력자와의 의견불일치 집단, 일반 유력자와의 의견일치 집단, 일반 유력자와의 의견불일치 집단으로 구분되었다. 분석결과, 유력자와의 의견일치여부는 이용자의 의견표명 의도에 영향을 주지 않았다. 그러나 유력자 유형에 따른 상호작용 효과가 발견되었는데, 일반인 유력자와의 의견불일치가 이용자들의 온-오프라인 의견표명 의지를 높이는 것으로 나타났다. 본 연구결과는 트위터 유력자가 이용자들을 침묵시키는 것이 아니라 오히려 의견표명을 동기화시킬 가능성이 있음을 보여준다.

TV토론회에서 트위터가 선거에 미치는 영향 -제18대 대통령 선거 TV토론회를 중심으로- (Twitter's impact on the election of TV debates -18th presidential election TV debates-)

  • 한창진;김경수
    • 디지털콘텐츠학회 논문지
    • /
    • 제14권2호
    • /
    • pp.207-214
    • /
    • 2013
  • 제18대 대통령선거 TV 토론회는 SNS 중 트위터의 참여가 많았다. 매스미디어에서 미디어웹 2.0을 통해 SNS와 결합한 소셜미디어시대가 도래하면서 변화가 시작된 것이다. 트위터리안들이 후보자의 발언을 듣고 인터넷이나 스마트폰을 이용하여 검색과 트윗, 리트윗을 하면서 정책 이슈, 의제를 형성하였고, 트윗 수가 최고인 이슈는 발언 즉시 만들어졌다. 내용 중에는 진보성향의 트윗이 많았고, 네거티브적인 내용은 핵심키워드를 자주 거론하지 않아도 트윗 수가 많아 정책 이슈가 되었다. 인기 리트윗은 이슈와 상관없이 토론회 과정을 평가하는 형식이었다. 이렇게 트위터가 TV 보완재가 되어 트위터 여론을 만들었다. SNS 트위터가 TV와 결합하면서 유권자들의 투표 참여와 직접 민주주의 실현 계기가 되었다. 앞으로 TV토론회에서 TV 화면에 실시간 트위터 지지율을 자막으로 표시한다면 선거에서 트위터 영향력은 더 확대될 것으로 전망된다.

트위터 사용자의 위치정보와 성향을 고려한 트윗 수집 시스템 (Tweet Acquisition System by Considering Location Information and Tendency of Twitter User)

  • 최우성;임준엽;황병연
    • Spatial Information Research
    • /
    • 제22권3호
    • /
    • pp.1-8
    • /
    • 2014
  • 최근 소셜 네트워크 서비스가 급격히 성장하면서, 소셜 네트워크 분석에 관련된 연구들도 많은 관심을 받고 있다. 특히 트위터는 사회적 이슈나 사건들에 대해 실시간으로 반응하기 때문에, 사회과학 분야나 정보검색 분야의 연구자들이 유용한 실험 데이터를 수집하는 데에 활용되고 있다. 그러나 정작 데이터를 수집하는 방법론에 관한 연구는 아직 미흡하다. 이에 본 논문에서는 위치 기반의 이벤트와 정치 사회적 이벤트 위주의 사용자의 성향을 고려한 트윗 수집 시스템을 제안한다. 우선 위치정보와 이벤트 관련 키워드를 포함하고 있는 트윗과 정치 사회적인 이벤트 검출에 필요한 ID들을 수집한 후, 사용자들의 성향을 분류할 ID 분석기를 설계했다. 또한 ID 분석기의 신뢰도 측정을 위해 상위 등급에 분류된 ID를 이용하여 트윗을 분석했다. 분석결과 1등급으로 분류된 ID는 88.8%의 신뢰도를 보였으며, 2등급으로 분류된 ID는 76.05%의 신뢰도를 보였다. 또한 ID 분석기는 77.5%의 신뢰도를 보였으며 소수의 ID를 사용함으로써 데이터의 수집시간을 줄였다.

국내 공공도서관의 트위터 이용에 관한 내용분석 (A Content Analysis on the Domestic Public Libraries' Use of Twitter)

  • 심지영
    • 정보관리학회지
    • /
    • 제34권1호
    • /
    • pp.241-262
    • /
    • 2017
  • 본 연구에서는 국내 공공도서관의 트위터 이용을 파악하고 분석하고자 한다. 도서관 정보서비스 환경에서 트위터 이용의 구체적인 패턴을 파악하기 위해, 트위터 이용이 활발한 14개 공공도서관 계정으로부터 3,038개의 트윗 데이터를 수집하여 내용분석을 수행하였다. 귀납적 방식으로 코딩 체계를 수립하였으며, 오픈 코딩 방식을 통해 공공도서관 트윗 데이터를 분석하였다. 또한 도서관별로 활성화된 유형을 파악하기 위해 대응일치분석을 수행하였다. 그 결과, 공공도서관 트위터 이용에 관한 상위 범주 3개와 9개의 하위 범주, 37개의 세부 항목을 파악하였다. 본 연구의 내용분석 결과는 향후 트위터 이용을 계획하는 도서관에게 참고자료로 제시될 수 있으리라 본다.