• Title/Summary/Keyword: Tweet

Search Result 117, Processing Time 0.029 seconds

A Sentiment Analysis Tool for Korean Twitter (한국어 트위터의 감정 분석 도구)

  • Seo, Hyung-Won;Jeon, Kil-Ho;Choi, Myung-Gil;Nam, Yoo-Rim;Kim, Jae-Hoon
    • Annual Conference on Human and Language Technology
    • /
    • 2011.10a
    • /
    • pp.94-97
    • /
    • 2011
  • 본 논문은 자동으로 한글 트위터 메시지(트윗: tweet)에 포함된 감정을 분석하는 방법에 대하여 기술한다. 제안된 시스템에 의하여 수집된 트윗들은 어떤 질의에 대해 긍정 혹은 부정으로 분류된다. 이것은 일반적으로 어떤 상품을 구매하기 원하는 고객이나, 상품에 대한 고객들의 평가를 수집하기 원하는 기업에게 유용하다. 영문 트윗에 대한 연구는 이미 활발하게 진행되고 있지만 한글 트윗, 특히 감정 분류에 대한 연구는 아직 공개된 것이 없다. 수집된 트윗들은 기계 학습(Naive Bayes, Maximum Entropy, 그리고 SVM)을 이용하여 분류하였고 한글 특성에 따라 자질 선택의 기본 단위를 2음절과 3음절로 나누어 실험하였다. 기존의 영어에 대한 연구는 80% 이상의 정확도를 가지는 반면에, 본 실험에서는 60% 정도의 정확도를 얻을 수 있었다.

  • PDF

Words Recommendation Algorithm for Similarity Connection based on Data Transmutability (데이터 변형성 기반 유사성 연결을 위한 단어 추천 알고리즘)

  • Kim, Boon-Hee
    • The Journal of the Korea institute of electronic communication sciences
    • /
    • v.8 no.11
    • /
    • pp.1719-1724
    • /
    • 2013
  • Big data which requires a different approach from existing data processing methods, is unstructured data with a variety of features. The features mean the volume of data, the rate of change of the data, the data with a variety of features. Tweets of twitter in only Korea are more than 5 millions per day. So much cheaper data storage and analysis system due to the increasing demand for information, the value of research is increasing. In this paper, the technology required by the deformation characteristics of the data elements as a technology priority-based word-based recommendation algorithm is proposed.

A Status Analysis of Location Disclosure Tweet of Disaster Information using Social Bigdata Monitoring (소셜 빅데이터 모니터링을 통한 재난정보 위치공개 트윗 현황 분석)

  • Lee, Bo-Ram;Bae, Byungl-Gul;Choi, Seon-Hwa
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.11a
    • /
    • pp.900-901
    • /
    • 2014
  • 최근 정보처리기술의 비약적인 발전은 소셜미디어를 통해 생산되는 종합정보의 처리를 용이하게 하였으며 광역적 의사소통을 가능하게 하였다. 이와 같은 기술의 발전을 재난관리에 적극 활용하려는 움직임이 확산되고 있으며, 이는 국내외의 여러 사례들을 통해 그 필요성이 입증되고 있다. 본 연구에서는 국립재난안전연구원에서 개발한 실시간 소셜 빅데이터 모니터링 시스템인 '소셜빅보드(Social Big Board)'를 활용하여 대상 기간 동안의 지역별 위치공개 트윗 현황을 조사하였다. 이를 위해 전체 재난 안전관련 트윗 중 위치정보공개 트윗을 대상으로 분석을 수행 하였으며 그 결과, 분석기간에 따른 전체 트윗과 지역별 위치정보공개 트윗은 재난상황의 발생과 피해규모에 따라 발생의 정도가 다르게 나타나는 것을 확인하였다. 향후, 재난 안전과 관련된 위치정보공개 트윗의 지속적인 모니터링 수행을 통해 신뢰성 있는 재난 대응체계 구축이 가능할 것으로 기대된다.

Tweet-Based Filtering and Refinement for Finding Accurate Issues (정확한 이슈를 찾기 위한 트위터 기반 정제기법 제안)

  • Choi, BongJun;Woo, Ho Jin;Lee, Won Suk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2014.04a
    • /
    • pp.653-655
    • /
    • 2014
  • 스마트 디바이스 산업의 발전으로 소셜미디어 데이터의 양은 기하급수적으로 증가하고 있다. 이렇게 증가한 데이터와 함께 분석을 통해 발견할 수 있는 정보의 양도 다양해지면서 여러 산업분야에서 소셜미디어 데이터 분석을 위한 연구가 진행되고 있다. 소셜미디어는 종류가 다양하고 하루 평균 발생량이 너무 많기 때문에 분석시간이 오래 걸릴 뿐 아니라, 불필요한 불용어 및 방해요소 때문에 적절한 정제작업이 필요하다. 본 논문에서는 소셜미디어의 한 종류인 트위터 분석을 위해 여러 가지 기법으로 데이터를 정제한다. 정제과정은 분석에 용이한 형태로 데이터를 변형시킨 후 의미없는 데이터와 분석에 방해가 되는 불용어를 제거한다. 이 정제를 통해 데이터 정보의 질을 높이고 분석 시간을 단축시켜 빠르고 신뢰성 높은 분석결과를 도출할 수 있다.

A Method for Detecting Event-location based on Example in Tweet (트위터에서의 사례 기반 이벤트 지명 검출 기법)

  • Ha, HyunSoo;Hwang, Byung-Yeon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1119-1121
    • /
    • 2015
  • 본 논문에서는 트위터 내용을 통해 이벤트를 탐지하는 시스템에서 지명 검출 정확도를 개선하는 방법을 제안한다. SNS를 이용한 개인 정보 유출 사례들이 늘어감에 따라 자신의 위치 정보를 공개하기 꺼려하기 때문에 이벤트가 발생한 지역을 검출하기 위해서는 텍스트 내용을 직접 분석해야한다. 그러나 오타나 줄임말, 동형이의어의 사용으로 정확한 지명 검출에 어려움이 발생하였다. 따라서 정확도를 향상시키기 위해 본 논문에서는 두 가지 지명 검출 기법을 제안한다. 지명 단어에서 발생되는 노이즈를 제거하는 지명 노이즈 제거 기법과 랜드 마크를 이용하여 지명 단어를 확정하는 지명 확정 기법이다. 실험 결과 기존 시스템의 정확도 49%에서 지명 노이즈 제거기법은 56%, 지명 확정 기법은 73%로 각각 향상되었다.

Extracting Reliable User's Tweet for Social Events Based on User Behavior in Twitter (소셜 사건에 대한 사용자의 행동 분석에 기반한 신뢰성 높은 사용자의 트윗 추출)

  • Tsolmon, Bayar;Lee, Kyung-Soon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2012.11a
    • /
    • pp.608-611
    • /
    • 2012
  • 소셜 사건이 일어나면 그 사건과 관련된 트윗이 폭발적으로 증가하는데 트윗 일부 내용을 살펴보면 스팸, 광고와 같은 트윗이 많이 포함되어 있다. 수 많은 트위터 데이터에서 사용자가 사건과 직접 관련된 신뢰성 높은 트윗을 찾아 읽는데 시간이 많이 걸릴 수 있다. 이러한 문제를 해결하기 위해 본 논문에서 트위터의 리트윗 정보, 사용자 신뢰도 측정 및 활동 분석, 팔로잉과 팔로워간의 정보 등 사용자의 행동 분석을 이용하여 소셜 사건과 직접 관련된 신뢰성 높은 사용자의 트윗을 추출하는 방법을 제안한다. 제안 방법의 유효성을 검증하기 위해 소셜 이슈 4 개에 대한 트윗 데이터에서의 실험을 통하여 상위 100 개의 결과에서의 정확률(P@100) 76.6%의 성능을 보였다. 실험을 통해 제안 방법이 신뢰성 높은 사용자의 트윗을 추출하는데 효과적인 방법임을 알 수 있다.

Geo-spatial Analysis of the Seoul Subway Station Areas Using the Haversine Distance and the Azimuth Angle Formulas (다트판형 공간분할 기법을 이용한 서울지역 지하철 역세권 분석)

  • Cho, Jae Hee;Baik, Eui Young
    • Journal of Information Technology Services
    • /
    • v.17 no.4
    • /
    • pp.139-150
    • /
    • 2018
  • This paper investigated the human distribution in subway station areas in Seoul, using geotweets and subway ridership data. Eight stations were selected from the districts of Gangnam and Gangbuk. Geotweets located within a 600-meter radius of the central coordinates of each station were extracted, and distances between the center of station and each tweet location were calculated. Donut-shaped dimension and pie-shaped dimension were generated, using the Haversine distance formula and the Azimuth angle formula respectively. By combining the two dimensions, Dartboard-shaped space division is created. Popular places within the subway station areas identified from this research are almost the same as the current well-known popular places, and this is an important case showing that people send tweets from various places where they engage in daily activities. We expect this study can be a methodological guideline for social scientists who use spatio-temporal or GPS data for their research.

Twitter HashTag Recommendation Scheme based on Similar Tweet Analysis (유사 트윗 분석에 기반한 트위터 해시태그 추천기법)

  • Jeon, Mina;Jun, Sanghoon;Hwang, Eenjun
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2013.11a
    • /
    • pp.962-963
    • /
    • 2013
  • 트위터 해시태그(#, HashTag)는 트윗(Tweets)에서 특정 키워드나 내용을 주제별로 분류하고 검색을 보다 효율적으로 사용하기 위한 사용자 정의 태그이다. 사용자가 정의하기에 따라 다양한 형태로 작성되기 때문에 오히려 검색의 효율성이 떨어질 수 있으며, 사용자는 자신이 작성한 트윗에 어떤 해시태그를 추가해야 하는지에 대한 궁금증이 생기는 경우가 발생한다. 본 논문에서는 이러한 문제를 해결하기 위해 사용자가 작성한 트윗에 적합한 해시태그를 추천하는 기법을 제안한다. 수집한 트윗과 해시태그의 키워드를 추출하고 트윗의 유사도를 계산하기 위해 TF-IDF와 Cosine Similarity를 적용하여 유사한 트윗을 갖는 해시태그를 추천한다. 본 논문에서 제안된 기법을 검증하기 위한 실험으로 추천의 정확성을 평가했다.

Impact of Social Networks in Educational Media

  • Al-Said, Khaleel M.;Al Said, Nidal;Hattab, Ezz
    • Journal of information and communication convergence engineering
    • /
    • v.18 no.4
    • /
    • pp.230-238
    • /
    • 2020
  • This study aims to determine whether student participation on Twitter affects academic performance. The key goals of the training course were to acquire social networking knowledge and skills and to learn how to share information, be productive in discussions, and create an interest-based community. The initial sample comprised 286 students from Jordan universities, 68.4% of whom agreed to participate in the study. Undergraduate students accounted for 73.9%, and graduate students accounted for 26.1%. Only 14.3% of the students chose the Twitter-based learning model. This is a mixed-methods study that integrates quantitative and qualitative approaches. The undergraduate students were found to tweet more and have more likes, while graduate students had more followers and were following more accounts. Moreover, 21% of the participants were the most active. Spearman's correlation analysis revealed a connection between participation in social media and student performance. Therefore, the results of this study may help educational professionals and education managers.

Entity Linking For Tweets Using User Model and Real-time News Stream (유저 모델과 실시간 뉴스 스트림을 사용한 트윗 개체 링킹)

  • Jeong, Soyoon;Park, Youngmin;Kang, Sangwoo;Seo, Jungyun
    • Korean Journal of Cognitive Science
    • /
    • v.26 no.4
    • /
    • pp.435-452
    • /
    • 2015
  • Recent researches on Entity Linking(EL) have attempted to disambiguate entities by using a knowledge base to handle the semantic relatedness and up-to-date information. However, EL for tweets using a knowledge base is still unsatisfactory, mainly because the tweet data are mostly composed of short and noisy contexts and real-time issues. The EL system the present work builds up links ambiguous entities to the corresponding entries in a given knowledge base via exploring the news articles and the user history. Using news articles, the system can overcome the problem of Wikipedia coverage (i.e., not handling real-time issues). In addition, given that users usually post tweets related to their particular interests, the current system referring to the user history robustly and effectively works with a small size of tweet data. In this paper, we propose an approach to building an EL system that links ambiguous entities to the corresponding entries in a given knowledge base through the news articles and the user history. We created a dataset of Korean tweets including ambiguous entities randomly selected from the extracted tweets over a seven-day period and evaluated the system using this dataset. We use accuracy index(number of correct answer given by system/number of data set) The experimental results show that our system achieves a accuracy of 67.7% and outperforms the EL methods that exclusively use a knowledge base.