• 제목/요약/키워드: 트위터 데이터

검색결과 227건 처리시간 0.032초

트윗 분류를 위한 효과적인 자질 추출 (Effective Feature Extraction for Tweets Classification)

  • 홍초희;김학수
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2011년도 한국컴퓨터종합학술대회논문집 Vol.38 No.1(A)
    • /
    • pp.229-232
    • /
    • 2011
  • 트위터는 소설 네트워크 서비스 중 하나로, 기존의 미디어 형태와 다른 새로운 형태의 미디어이다. 최근 스마트폰의 사용증가로 접근성이 용이하여 사용자가 급격하게 증가하고 있다. 그래서 트위터 메시지 관리와 응용에 대한 관심이 커지고 있다. 그러나 트위터 데이터의 특징상 정보 추출이 어려워 트위터 데이터 처리의 문제가 발생된다. 본 논문에서는 방대한 양의 트위터 데이터를 관리 및 응용을 위하여 트위터 데이터 분류 실험을 통하여 트위터 데이터에 대한 적합한 자질 추출 기법을 소개한다.

트위터 특징에 기반한 콘텐츠 중요성 평가 기법 (An Evaluation Method for Contents Importance Based on Twitter Characteristics)

  • 이의종;김정동;백두권
    • 정보과학회 논문지
    • /
    • 제41권12호
    • /
    • pp.1136-1144
    • /
    • 2014
  • 트위터는 하루 약 1억 4000만개의 콘텐츠를 생성하는 소셜 네트워크 서비스로 다양한 데이터를 포함하고 있으며 이를 분석하기 위한 연구가 다방면에서 진행 중에 있다. 본 연구는 트위터의 콘텐츠 검색 분야에서 유용하게 사용될 수 있는 콘텐츠 중요성을 평가하기 위한 연구이다. 트위터 콘텐츠의 중요성이란 단일 콘텐츠가 트위터 서비스 사용자들에게 사실관계가 명확한 정보를 전달하고 있는지를 평가하는 요소를 말한다. 본 논문은 트위터 콘텐츠의 중요성 평가를 위해 콘텐츠 작성자의 청자 수인 팔로워와 콘텐츠의 인기도라고 할 수 있는 리트윗을 사용했다. 더불어 실제 트위터 데이터를 사용해 제안한 방법이 효과적으로 콘텐츠의 영향력을 측정할 수 있음을 보였다. 또한 정보를 전달하는 정보 전달자의 분류를 통해 공공성을 띈 사용자의 분류가 작성한 콘텐츠가 트위터 영향력 측정에 유용하게 사용될 수 있음을 트위터 데이터 분석을 통해 보여주었다.

비정형 데이터를 활용한 감기 판단 사전 구축 (Constructing the Dictionary of Flue using unstructured data)

  • 김광민;남기훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 추계학술발표대회
    • /
    • pp.1187-1190
    • /
    • 2015
  • 최근에 비정형 데이터의 잠재적 가치를 유용한 데이터로써 사용하려는 경우가 많아지고 있다. 특히 트위터는 사용자의 상태나 이벤트가 잘 나타나 있어서 하나의 사용자의 이벤트로서 간주될 수 있다. 본 논문은 트위터에서 발생하는 이벤트에 주목하여, 감기라는 이벤트를 트위터 내에서 추적하고자 한다. 추적을 위해서는 트위터를 판단할 필요가 있는데, 이를 위해 기존의 감성 사전 방식 중 하나인 통계적 사전 구축을 기반으로 키워드를 활용하여 감기 판단 사전을 구축하는 방식을 제안한다.

트위터 기반 접속 정보 통계 시스템 (Information Statistics Systems on Access to Twitter-Based)

  • 양새동;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.541-543
    • /
    • 2015
  • IT 기술 발전과 스마트 기기의 대중화로 인해 SNS(Social Networking Service)를 사용하는 사용자들이 증가하고 있다. 이로 인해 SNS에서 발생하는 데이터들도 급증하고 있고, 이러한 데이터에서 가치를 창출하기 위해 IT 기업들은 기술 개발을 하고 있다. 본 논문에서는 트위터에서 발생하는 데이터의 가치를 창출하기 위해 트위터에 접속하는 정보를 통계 내는 시스템을 설계하고 구현하고자 한다. 제안하는 시스템은 트위터 데이터를 수집하고 NoSQL 기반으로 저장한 뒤에 Mahout 사용하여 사용자들의 접속 정보를 통계 내는 시스템이다. 개발 시스템을 이용하면 트위터 데이터에서 가치를 창출하기 위해 필요한 기술 개발의 배경 마련에 도움이 될 것이라고 예상된다.

  • PDF

트위터 이용한 인물 평판 분석 시스템 (Design of a Reputation System for Twitter)

  • 이경호;이공주
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2012년도 제24회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.62-66
    • /
    • 2012
  • 본 논문은 트위터 사용자들이 글(트윗)을 통해 표현한 인물에 대한 평가를 수집, 분석하여 인물에 대한 평판을 종합적으로 분석하는 시스템의 구성에 대한 논문이다. 트위터의 Open API를 이용한 데이터 수집과 수집된 데이터의 특징에 대하여 분석하고 감성사전을 이용한 데이터 분석과 분석된 결과의 저장방식에 대하여 논한다. 2012년에 치루어지는 18대 대통령 선거의 출마자들을 본 시스템에 적용하여 시스템의 유효성을 검증하고자 한다.

  • PDF

자동화된 트위터 데이터 수집 시스템 설계 및 구현 : 환경 데이터를 중심으로 (Design and Implementation of Automated Twitter Data Collecting System : Focus on Environmental Data)

  • 김도형;구자환;김응모
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.361-364
    • /
    • 2020
  • 소셜 네트워크 서비스의 사용자가 늘어나면서, 소셜 네트워크 서비스상에서 발생하는 빅데이터를 활용한 서비스가 늘어나고 있다. 소셜 네트워크 서비스 데이터는 실시간으로 생성되며, 따라서 데이터 수집 시스템 역시 자동화하여 준 실시간으로 데이터를 수집할 필요가 있다. 본 논문에서는 대표적인 소셜 네트워크 서비스인 트위터의 데이터를 지속적으로 수집하기 위한 자동 수집 시스템을 제안한다. 수집 시스템은 Twitter API 를 활용하는 Python 라이브러리를 통해 내용 및 메타데이터를 수집하며, 수집된 데이터를 재 검증한 뒤 저장한다. 또한 구현된 시스템에 환경 데이터를 주제로 하는 쿼리를 입력하여 실제 트위터 데이터를 수집하며 구현된 시스템을 검증해보았다.

국내 공공도서관의 트위터 이용에 관한 내용분석 (A Content Analysis on the Domestic Public Libraries' Use of Twitter)

  • 심지영
    • 정보관리학회지
    • /
    • 제34권1호
    • /
    • pp.241-262
    • /
    • 2017
  • 본 연구에서는 국내 공공도서관의 트위터 이용을 파악하고 분석하고자 한다. 도서관 정보서비스 환경에서 트위터 이용의 구체적인 패턴을 파악하기 위해, 트위터 이용이 활발한 14개 공공도서관 계정으로부터 3,038개의 트윗 데이터를 수집하여 내용분석을 수행하였다. 귀납적 방식으로 코딩 체계를 수립하였으며, 오픈 코딩 방식을 통해 공공도서관 트윗 데이터를 분석하였다. 또한 도서관별로 활성화된 유형을 파악하기 위해 대응일치분석을 수행하였다. 그 결과, 공공도서관 트위터 이용에 관한 상위 범주 3개와 9개의 하위 범주, 37개의 세부 항목을 파악하였다. 본 연구의 내용분석 결과는 향후 트위터 이용을 계획하는 도서관에게 참고자료로 제시될 수 있으리라 본다.

트위터를 통한 공공도서관 마케팅 효과에 대한 실증적 분석 (A Study on the Effect of Twitter Activities on the Libraries' Performance Indicators within Public Libraries)

  • 한남기;김기영
    • 한국정보관리학회:학술대회논문집
    • /
    • 한국정보관리학회 2014년도 제21회 학술대회 논문집
    • /
    • pp.209-212
    • /
    • 2014
  • 본 연구는 한국 공공도서관의 소셜 미디어 마케팅이 실제로 어떤 효과를 나타내고 있는지를 실증적으로 검토하기 위해 수행되었다. 분석에는 공공도서관의 2012년 트위터 사용 데이터, 국가도서관 통계를 사용하였다. 트위터를 활용한 그룹과 활용하지 않은 그룹 간의 대출량 및 이용자량 변화에 대한 t검정, 트위터 활동 데이터와 대출량 및 이용자량 변화 간의 선형 회귀분석이 수행되었으며, 그 결과 두 분석 모두 유의한 결과를 도출하지 못하였다. 이를 기반으로 표본 문제, 트위터 계정 활용 문제, 성과 지표 문제를 제시하였다.

  • PDF

트위터 분석을 위한 분산 시스템 설계 및 구현 (DiSAnT: Design and Implementation of Distributed System for Analysing Twitter)

  • 윤진영;김석중;이범석;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 춘계학술발표대회
    • /
    • pp.1326-1329
    • /
    • 2012
  • 트위터는 대표적인 소셜 네트워크 서비스이며 스마트 기기의 발달로 사용자 수뿐만 아니라 생성되는 트윗의 수도 지속적으로 늘고 있다. 또한 트위터는 인증과정을 통하여 API 요청을 제한해 데이터의 수집이 어렵기 때문에 트위터 기반 연구를 위해서는 빅 데이터를 처리하기 위한 분산처리 기술이 요구된다. 본 논문에서는 네트워크로 연결된 다수의 클라이언트를 이용해 계정과 트윗의 수집에 용이하고 수집한 데이터를 분석할 수 있는 기능까지 추가한 분산처리 시스템인 DiSAnT을 소개한다.

트위터에서 이슈가 되고있는 뉴스 기사에 대한 소셜 사용자 네트워크 기반 정치 성향 분류 (Political Bias Classification Based on Social User Networks on Issuable Political News Article in Twitter)

  • 김준길;이경순
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.641-644
    • /
    • 2012
  • 트위터에서 정치 성향을 가지거나 관심이 있는 트위터 사용자는 관심있는 정치 인물이나 단체에 대한 뉴스 기사에 대해 자신의 의견을 남기거나 그대로 인용하게 된다. 또한, 자신의 의견과 공감하거나 비공감하는 트윗에 대해서 리트윗을 하거나 추가적인 자신의 의견을 언급하기도 한다. 본 논문에서는 이슈가 되고있는 정치 뉴스 기사에 대해 관심 있는 트위터 사용자들을 찾아 트위터 사용자들 간의 트윗 문서들 사이에서의 관계 정보를 가지는 사용자 네트워크에서의 트위터 사용자들의 성향을 분류해주는 방법을 제안한다. 제안한 방법의 유효성을 검증하기 위해 트위터에서 이슈가 된 정치 뉴스 기사들과 각 뉴스 이슈를 언급한 트위터 데이터에서 트윗 문서 내용 유사도 기반 분류 방법과의 비교 실험 하였다. 실험 결과에서 사용자간의 관계 정보를 이용한 성향 분류 방법이 유효함을 보였다.