A Method of Classifying Tweet by subject using features

특징추출을 이용한 트위터 메시지 주제 분류 방법

  • Published : 2014.05.28

Abstract

Twitter is the special place that people in the world can freely share their information and opinion. There are tries to utilize a vast amount of information made from twitter. The study on classification of tweets by subject is actively conducted. Twitter is a service for sharing information with short 140-characters text message. The short message including brief content makes extracting a variety of information hard. In the paper, we suggests the method to classify tweet by subject. The method uses both tweet and subject features. In order to conduct experiments to verify the proposed method, we collected 10,000 tweet messages with the Twitter API. Through the experimental results, we will show that the performance of our proposed method is better than those of previous methods.

트위터는 전세계적으로 다양한 정보와 의견을 공유하는 교류의 장으로 이용되고 있다. 트위터에서 생성되는 막대한 양의 데이터를 활용하려는 시도가 이루어지고 있다. 그 중 다양한 주제별 정보를 추출하여 이용하려는 연구가 활발히 진행되고 있다. 트위터는 140자의 짧은 메시지로 정보를 공유하는 서비스이다. 이러한 짧은 메시지는 트윗에서 다양한 주제별 정보를 추출하는 것을 어렵게 한다. 본 논문에서는 트윗의 기능들과 분류할 주제의 특징을 이용하여 트윗 주제별 분류 방법을 제안한다. 이 방법의 유용성을 검증하기 위해, 트윗 API를 사용하여 수집된 10000개의 트윗으로 실험하였다. 그 결과 기존 연구들보다 뛰어난 결과를 얻었다.

Keywords