• Title/Summary/Keyword: 트위터 데이터

Search Result 227, Processing Time 0.034 seconds

Effective Feature Extraction for Tweets Classification (트윗 분류를 위한 효과적인 자질 추출)

  • Hong, Cho-Hee;Kim, Hark-Soo
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2011.06a
    • /
    • pp.229-232
    • /
    • 2011
  • 트위터는 소설 네트워크 서비스 중 하나로, 기존의 미디어 형태와 다른 새로운 형태의 미디어이다. 최근 스마트폰의 사용증가로 접근성이 용이하여 사용자가 급격하게 증가하고 있다. 그래서 트위터 메시지 관리와 응용에 대한 관심이 커지고 있다. 그러나 트위터 데이터의 특징상 정보 추출이 어려워 트위터 데이터 처리의 문제가 발생된다. 본 논문에서는 방대한 양의 트위터 데이터를 관리 및 응용을 위하여 트위터 데이터 분류 실험을 통하여 트위터 데이터에 대한 적합한 자질 추출 기법을 소개한다.

An Evaluation Method for Contents Importance Based on Twitter Characteristics (트위터 특징에 기반한 콘텐츠 중요성 평가 기법)

  • Lee, Euijong;Kim, Jeong-Dong;Baik, Doo-Kwon
    • Journal of KIISE
    • /
    • v.41 no.12
    • /
    • pp.1136-1144
    • /
    • 2014
  • Twitter is a social network service that generates about 140 million contents a day. Contents of Twitter contain a variety of information and many researchers research those in various fields. In this research, we propose a method for evaluating the importance of content based on characteristics of Twitter. We have found that number of follower means user's popularity and Re-tweet that means the popularity of content. We perform experiments about proposed method using real Twitter data for proving effectiveness of proposed method. Also, we found information providers in Twitter are public user who represent a company or a representative of a specific group.

Constructing the Dictionary of Flue using unstructured data (비정형 데이터를 활용한 감기 판단 사전 구축)

  • Kim, KangMin;Nam, KiHun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1187-1190
    • /
    • 2015
  • 최근에 비정형 데이터의 잠재적 가치를 유용한 데이터로써 사용하려는 경우가 많아지고 있다. 특히 트위터는 사용자의 상태나 이벤트가 잘 나타나 있어서 하나의 사용자의 이벤트로서 간주될 수 있다. 본 논문은 트위터에서 발생하는 이벤트에 주목하여, 감기라는 이벤트를 트위터 내에서 추적하고자 한다. 추적을 위해서는 트위터를 판단할 필요가 있는데, 이를 위해 기존의 감성 사전 방식 중 하나인 통계적 사전 구축을 기반으로 키워드를 활용하여 감기 판단 사전을 구축하는 방식을 제안한다.

Information Statistics Systems on Access to Twitter-Based (트위터 기반 접속 정보 통계 시스템)

  • Yang, Xitong;Jung, Hoe-kyung
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2015.05a
    • /
    • pp.541-543
    • /
    • 2015
  • Due to the popularity of IT technology and smart devices, SNS (Social Networking Service), there are increasing users using. This causes increasing of data generated by the SNS may also, IT companies are developing a technique to create value in this data. In this paper, we design and implement the system that statistical information for connecting to the tweeter to create value of the data generated by the tweeter. The proposed system is a system using Mahout behind collected data and stored as a tweeter NoSQL based statistics that the contact information of the user. The developed system is expected to be helpful in providing the background technology necessary to create value in the data of the tweeter.

  • PDF

Design of a Reputation System for Twitter (트위터 이용한 인물 평판 분석 시스템)

  • Lee, Gyoung-Ho;Lee, Kong Joo
    • Annual Conference on Human and Language Technology
    • /
    • 2012.10a
    • /
    • pp.62-66
    • /
    • 2012
  • 본 논문은 트위터 사용자들이 글(트윗)을 통해 표현한 인물에 대한 평가를 수집, 분석하여 인물에 대한 평판을 종합적으로 분석하는 시스템의 구성에 대한 논문이다. 트위터의 Open API를 이용한 데이터 수집과 수집된 데이터의 특징에 대하여 분석하고 감성사전을 이용한 데이터 분석과 분석된 결과의 저장방식에 대하여 논한다. 2012년에 치루어지는 18대 대통령 선거의 출마자들을 본 시스템에 적용하여 시스템의 유효성을 검증하고자 한다.

  • PDF

Design and Implementation of Automated Twitter Data Collecting System : Focus on Environmental Data (자동화된 트위터 데이터 수집 시스템 설계 및 구현 : 환경 데이터를 중심으로)

  • Kim, Do-Hyung;Koo, Jahwan;Kim, Ung-Mo
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.05a
    • /
    • pp.361-364
    • /
    • 2020
  • 소셜 네트워크 서비스의 사용자가 늘어나면서, 소셜 네트워크 서비스상에서 발생하는 빅데이터를 활용한 서비스가 늘어나고 있다. 소셜 네트워크 서비스 데이터는 실시간으로 생성되며, 따라서 데이터 수집 시스템 역시 자동화하여 준 실시간으로 데이터를 수집할 필요가 있다. 본 논문에서는 대표적인 소셜 네트워크 서비스인 트위터의 데이터를 지속적으로 수집하기 위한 자동 수집 시스템을 제안한다. 수집 시스템은 Twitter API 를 활용하는 Python 라이브러리를 통해 내용 및 메타데이터를 수집하며, 수집된 데이터를 재 검증한 뒤 저장한다. 또한 구현된 시스템에 환경 데이터를 주제로 하는 쿼리를 입력하여 실제 트위터 데이터를 수집하며 구현된 시스템을 검증해보았다.

A Content Analysis on the Domestic Public Libraries' Use of Twitter (국내 공공도서관의 트위터 이용에 관한 내용분석)

  • Shim, Jiyoung
    • Journal of the Korean Society for information Management
    • /
    • v.34 no.1
    • /
    • pp.241-262
    • /
    • 2017
  • This study aims to identify and analyze the Twitter use of domestic public libraries. In order to identify the detailed patterns of Twitter use in library and information services, a content analysis was conducted for the 3,038 tweet data from the top 14 public libraries' accounts on Twitter use. Inductive approach was adopted to develop a coding scheme and open coding was conducted with the entire tweet. Additionally, correspondence analysis was conducted for the result of content analysis to identify how library accounts correspond to specific types. As a result, 3 main categories and 9 sub-categories of public libraries' Twitter use were developed. And the 37 detailed patterns of public libraries' use of Twitter were identified. The identified patterns can provide the libraries interested in Twitter use with guidelines.

A Study on the Effect of Twitter Activities on the Libraries' Performance Indicators within Public Libraries (트위터를 통한 공공도서관 마케팅 효과에 대한 실증적 분석)

  • Han, Nam-Gi;Kim, Giyeong
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2014.08a
    • /
    • pp.209-212
    • /
    • 2014
  • 본 연구는 한국 공공도서관의 소셜 미디어 마케팅이 실제로 어떤 효과를 나타내고 있는지를 실증적으로 검토하기 위해 수행되었다. 분석에는 공공도서관의 2012년 트위터 사용 데이터, 국가도서관 통계를 사용하였다. 트위터를 활용한 그룹과 활용하지 않은 그룹 간의 대출량 및 이용자량 변화에 대한 t검정, 트위터 활동 데이터와 대출량 및 이용자량 변화 간의 선형 회귀분석이 수행되었으며, 그 결과 두 분석 모두 유의한 결과를 도출하지 못하였다. 이를 기반으로 표본 문제, 트위터 계정 활용 문제, 성과 지표 문제를 제시하였다.

  • PDF

DiSAnT: Design and Implementation of Distributed System for Analysing Twitter (트위터 분석을 위한 분산 시스템 설계 및 구현)

  • Yoon, Jinyoung;Kim, Sukjoong;Lee, Bumsuk;Hwang, Byung-Yeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.04a
    • /
    • pp.1326-1329
    • /
    • 2012
  • 트위터는 대표적인 소셜 네트워크 서비스이며 스마트 기기의 발달로 사용자 수뿐만 아니라 생성되는 트윗의 수도 지속적으로 늘고 있다. 또한 트위터는 인증과정을 통하여 API 요청을 제한해 데이터의 수집이 어렵기 때문에 트위터 기반 연구를 위해서는 빅 데이터를 처리하기 위한 분산처리 기술이 요구된다. 본 논문에서는 네트워크로 연결된 다수의 클라이언트를 이용해 계정과 트윗의 수집에 용이하고 수집한 데이터를 분석할 수 있는 기능까지 추가한 분산처리 시스템인 DiSAnT을 소개한다.

Political Bias Classification Based on Social User Networks on Issuable Political News Article in Twitter (트위터에서 이슈가 되고있는 뉴스 기사에 대한 소셜 사용자 네트워크 기반 정치 성향 분류)

  • Kim, Jun-Gil;Lee, Kyung-Soon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.641-644
    • /
    • 2012
  • 트위터에서 정치 성향을 가지거나 관심이 있는 트위터 사용자는 관심있는 정치 인물이나 단체에 대한 뉴스 기사에 대해 자신의 의견을 남기거나 그대로 인용하게 된다. 또한, 자신의 의견과 공감하거나 비공감하는 트윗에 대해서 리트윗을 하거나 추가적인 자신의 의견을 언급하기도 한다. 본 논문에서는 이슈가 되고있는 정치 뉴스 기사에 대해 관심 있는 트위터 사용자들을 찾아 트위터 사용자들 간의 트윗 문서들 사이에서의 관계 정보를 가지는 사용자 네트워크에서의 트위터 사용자들의 성향을 분류해주는 방법을 제안한다. 제안한 방법의 유효성을 검증하기 위해 트위터에서 이슈가 된 정치 뉴스 기사들과 각 뉴스 이슈를 언급한 트위터 데이터에서 트윗 문서 내용 유사도 기반 분류 방법과의 비교 실험 하였다. 실험 결과에서 사용자간의 관계 정보를 이용한 성향 분류 방법이 유효함을 보였다.