• 제목/요약/키워드: 트위터 분석

검색결과 344건 처리시간 0.03초

영어 트위터 감성 분석을 위한 SentiWordNet 활용 기법 비교 (A Comparative Study on Using SentiWordNet for English Twitter Sentiment Analysis)

  • 강인수
    • 한국지능시스템학회논문지
    • /
    • 제23권4호
    • /
    • pp.317-324
    • /
    • 2013
  • 트위터 감성 분석은 트윗글의 감성을 긍정과 부정으로 분류하는 작업이다. 이 연구에서는 SentiWordNet(SWN) 감성 사전에 기반한 트윗글 감성 분석을 다룬다. SWN은 전체 영어 단어에 대해 단어의 의미별로 긍정, 부정의 감성 강도를 저장해 둔 감성 사전이다. 기존 SWN 기반 감성 분석 연구들은 문서에 출현하는 각 용어의 감성을 SWN으로부터 결정한 다음 이를 바탕으로 문서 전체의 감성을 결정하였는데, 그 방법들이 매우 다양하다. 예를 들어, 한 용어의 감성 결정 시 해당 용어의 SWN 내 의미별 긍정, 부정 감성 강도 차이들의 평균을 계산하거나 긍정과 부정 각각의 감성 강도 평균 혹은 최대값을 구하기도 하며, 문서 전체의 감성을 결정하는 경우에도 문서 내 용어들의 감성 값들에 대해 평균 혹은 최대값을 취하기도 하였다. 또한 SWN 내 형용사, 동사, 명사, 부사의 품사 집합 전체 혹은 특정 부분집합에 대해 위의 감성 결정 작업을 적용하기도 한다. 이처럼 기존 연구에서는 SWN 기반의 다양한 감성 자질 추출 절차가 시도되고 있으나 이들 자질 추출 기법 전반에 대한 성능 비교 연구는 찾기 힘들다. 이 연구에서는 SWN을 트위터 감성 분석에 활용하는 다양한 방법들을 일반화하는 절차들을 소개하고 각 방법들의 성능 비교 및 분석 결과를 제시한다.

소셜 빅데이터를 이용한 영화 흥행 요인 분석 (Movie Box-office Analysis using Social Big Data)

  • 이오준;박승보;정다울;유은순
    • 한국콘텐츠학회논문지
    • /
    • 제14권10호
    • /
    • pp.527-538
    • /
    • 2014
  • 수요 예측은 영화 산업에서 매우 중요한 문제이다. 최근 들어 트위터(Twitter), 페이스북(Facebook)과 같은 소셜미디어의 비정형 텍스트 데이터를 이용하여 영화 흥행을 예측하고 분석하는 시도들이 활발하게 이루어지고 있다. 기존에는 주로 데이터의 주기별 변화량을 측정하여 데이터 양과 영화 흥행간의 상관성을 분석하거나 데이터에 대해 감성의 극성 값을 부여하는 오피니언 마이닝을 통해 영화의 흥행 추이를 예측하였다. 하지만 이러한 정량적 접근만으로는 관객들이 영화를 선택하게 된 근거나 영화의 어떤 속성을 선호하는지를 알 수 없기 때문에 영화의 흥행 요인을 밝히는데 한계가 있었다. 따라서 본 연구는 트위터 데이터를 수집한 후 빈도수 측정을 통해 트윗의 내용을 대표하는 토픽(topic) 키워드를 추출하여 관객들의 관심을 반영하는 영화적 속성들이 무엇인지를 밝히고, 그 속성들에 대한 관객들의 반응을 분석함으로써 영화의 흥행에 영향을 미친 요인들을 제시한다.

SNS에서의 언어 간 감성 차이 연구: 6개 언어를 중심으로 (Differences in Sentiment on SNS: Comparison among Six Languages)

  • 김형호;장필식
    • 디지털융복합연구
    • /
    • 제14권3호
    • /
    • pp.165-170
    • /
    • 2016
  • 본 연구의 목적은 SNS 활용에 있어 사용자 언어 간 감성의 평균차이가 있는지를 검증하는 것이다. 가장 많이 이용되는 SNS 중 하나인 트위터를 대상으로, 영어, 독일어, 러시아어, 스페인어, 터키어 및 네덜란드어 등 6개 언어로 작성된 약 2억 개 트윗을 스트리밍 API를 이용하여 수집하였으며, SentiStrength를 이용하여 주관적/객관적 비율, 감성강도, 긍정/부정 비율, 리트윗 횟수 및 경계불투과도 등에 대한 분석을 시행하고, 트위터를 통한 감성표현의 경향성과 변동을 파악하였다. 분석결과, 언어권에 따라 주관적/객관적 트윗 비율과 긍정/부정 트윗 비율이 각각 통계적으로 유의한 차이가 있는 것으로 나타났다(p<0.001). 또한, 언어의 종류는 감성강도와 경계 불투과도 그리고 리트윗 횟수에 통계적으로 유의한(p<0.001) 영향을 미치는 것으로 파악되었다. 이러한 결과는 SNS를 활용한 감성분석에 있어 언어, 문화 별 경향성 및 수준차이를 반드시 고려하여야 한다는 것을 보여준다.

트위터 문서에서 시간 및 리트윗 분석을 통한 핵심 사건 추출 (Extracting Core Events Based on Timeline and Retweet Analysis in Twitter Corpus)

  • ;이경순
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권1호
    • /
    • pp.69-74
    • /
    • 2012
  • 인터넷 사용자들은 어떠한 이슈에 대해 소셜 네트워크 서비스를 통해 빠르고 간결하게 다른 사람들과 지속적인 커뮤니케이션을 원한다. 사회적 이슈에 대해 어떠한 사건이 일어나게 되면 그날의 트윗 글과 리트윗 개수에 영향을 미치게 된다. 본 논문에서는 트위터 자료에서 사회적인 핵심 사건을 추출하기 위해 시간 분석과 감성 자질 및 리트윗 정보를 이용하는 방법을 제안한다. 제안 방법의 유효성을 검증하기 위해 비교실험으로 어휘 빈도수를 이용하여 핵심 사건을 추출하는 방법, 어휘 빈도수와 감성 자질을 함께 이용한 방법, 시간 분석을 반영하기 위해 카이제곱만을 이용한 방법과 제안 방법인 어휘 빈도수, 감성 자질, 리트윗 및 카이제곱을 함께 이용한 방법으로 성능을 비교하였다. 성능 평가를 위해서는 추출된 사건리스트에서 상위 10개 결과에서 정확도를 계산하였는데, 제안 방법이 94.9%의 성능을 보였다. 실험을 통해 제안한 방법이 핵심 사건 추출에 효과적인 방법임을 알 수 있다.

소셜 감성이 개별 기업 주식수익률에 미치는 비대칭적 영향 분석 (Asymmetric Effect of Social Sentimental on an Individual Stock Price Return)

  • 김세완;박지원;김영민;함희경
    • 경영정보학연구
    • /
    • 제22권4호
    • /
    • pp.59-74
    • /
    • 2020
  • 본 연구는 소셜 감성(social sentimental)을 긍정 및 부정적 의견으로 구분하여 이들 의견이 개별 기업의 주식수익률에 미치는 영향이 비대칭적인지(asymmetric) 분석하였다. 이를 위하여 한국거래소에서 활발하게 거래되고 트위터 의견도 충분한 기아차, 아모레퍼시픽, 포스코, 한국전력 등 4개 기업을 분석대상으로 하였다. 주요 분석 결과는 다음과 같다. 첫째, 긍정적 의견은 개인투자자의 거래 비중이 상대적으로 낮은 아모레퍼시픽의 주식수익률에는 영향을 주지 못한 반면 나머지 3개 기업의 주식수익률에는 유의한 양(+)의 영향을 주었다. 둘째, 부정적 의견은 4기업의 주식수익률에 모두 유의하게 음(-)의 영향을 주는 것으로 나타났다. 특히 부정적 의견이 긍정적 의견보다 주식수익률에 미치는 영향이 더 크게 나타났으며, 이는 투자자들이 손실회피 성향 등으로 수익보다 손실에 더 민감하기 때문으로 보인다. 본 연구는 트위터의 긍정 또는 부정적 의견이 주식수익률에 비대칭적(asymmetric)으로 영향을 미치는 것을 발견하였으며, 이는 트위터의 의견을 투자자 심리(sentiment) 대용변수(proxy)로 활용할 수 있음을 보여준다.

다중 소셜 네트워크 서비스 간에 사용자 연결 방법 (A Method of User Mapping across Multiple Social Network Service)

  • 김석현;박준범;조진만;최대선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.427-430
    • /
    • 2014
  • 최근 온라인상에 공개된 정보에서 개인정보 노출 여부를 분석하고 노출된 개인정보에 대한 위험도를 평가하는 기술이 연구되고 있다. 이와 같은 연구를 위해서는 다양한 경로에서 수집되는 개인정보들에 대한 사용자 ID 연결이 먼저 이루어져야 한다. 그래서 본 논문에서는 페이스북과 트위터 사용자를 연결할 수 있는 방안을 제시하고, 그 성능을 분석했다. 총 5가지 정보에 대한 유사도 측정 실험을 진행하여 각각에 정보가 페이스북과 트위터 사용자를 연결하는데 미치는 영향력을 확인했다. 정보의 영향력은 지역(72.2%), 링크(52%), 이름(51.3%), 이미지(11%), 관계(1%) 순으로 확인되었다.

영화 흥행 예측을 위한 영화 관객 수와 관련 트윗간의 상관관계 분석 (An Analysis of Corelation between Movie Attendance and Related Tweets for Predicting Box Office)

  • 임준엽;황병연
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2013년도 추계학술발표대회
    • /
    • pp.1245-1247
    • /
    • 2013
  • 최근 들어 영화에 대한 수요가 증가하면서 국내 영화시장규모는 지속적으로 성장하고 있다. 이와 관련하여 여러 가지 위험요소를 제거하고 시장에서의 성공을 위해 영화의 흥행을 예측하기 위한 다양한 연구들이 진행되고 있다. 그러나 그러한 예측을 위한 관련 요소들 간의 상관관계를 정확한 수치로 표현하는 일은 매우 어려우며 관련연구 또한 아직 미흡하다. 본 논문에서는 트위터에서 발생되는 트윗을 설문 표본으로 삼고 영화 관련 트윗과 영화의 흥행을 의미하는 관객 수와의 상관관계를 분석하여 상관계수를 도출하였다. 실험 결과 실험에 사용된 영화 10편의 관객 수에 대한 데이터 모두 관련 트윗의 발생비율과 양의 상관관계를 가짐을 알 수 있었으며 이를 통해 트위터를 이용한 영화의 흥행 여부 예측에 대한 가능성을 제시했다.

자동 생성된 사용자 프로파일을 이용한 하이브리드 음식 추천 시스템 (Hybrid Food Recommendation System Using Auto-generated User Profiles)

  • 정주석;강신재
    • 한국지능시스템학회논문지
    • /
    • 제21권5호
    • /
    • pp.609-617
    • /
    • 2011
  • 본 논문에서는 트위터로부터 자동 생성한 사용자 프로파일을 이용하는 개인 맞춤형 음식 추천 시스템을 제안한다. 사용자 개인의 트위터 문장에서 명사를 추출하고, 감정단어와의 공기 여부에 따라 감정점수를 계산한 후. 사용자 프로파일을 생성한다. 각 음식에 관한 정보는 웹에서 검색한 웹 페이지를 분석, 가공하여 음식별 대표 명사 목록을 만들어 사용한다. 이렇게 구축된 사용자 프로파일과 각 음식별 특징 정보 간 유사도를 계산하여 사용자에 맞는 음식을 추천 해준다. 제안하는 방법은 추천 시스템을 처음 사용하는 사용자라 할지라도 사용자 프로파일이 자동으로 구축되어 추천에 사용되기 때문에 항상 추천 결과를 얻을 수 있는 장점이 있다.

소셜네트워크 활용이 사회자본 형성에 미치는 영향 : 트위터, 페이스북, 카카오스토리를 중심으로 (The Effect of Social Network Usage on the Formation of Social Capital : Based on Twitter, Facebook, KakaoStory)

  • 홍삼열;오재철
    • 한국전자통신학회논문지
    • /
    • 제7권6호
    • /
    • pp.1471-1477
    • /
    • 2012
  • 소셜네트워크는 다양한 콘텐츠와의 결합을 통하여 네트워크를 통해 형성된 지인 관계를 기반으로 공유와 배포를 원활하게 하는 주요 플랫폼으로 활용되는 등 몇 가지의 공통적인 기능을 가지고 있다. 이에 트위터, 페이스북, 카카오스토리를 모두 사용하고 있는 사용자들을 대상으로 설문조사를 진행하였으며, 설문에 응답한 자료를 통계 내어 각각의 서비스가 영향을 주는 요인들은 어떤 것인지 완성적 사회자본과 도구적 사회자본으로 나누어 분석한 결과를 제시하였다. 이 연구는 사용자들의 목적에 따라 소셜네트워크를 선택하는 기준이 되고, 새로운 소셜네트워크를 개발하거나 기존의 서비스를 발전시키는데 기여할 수 있을 것이다.

토픽 기반의 트윗 분류를 위한 해시태그 분석 기법 (Hashtag Analysis Scheme for Topic based Tweet Categorization)

  • 김용성;전상훈;유제혁;황인준
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2014년도 추계학술발표대회
    • /
    • pp.737-740
    • /
    • 2014
  • 최근 SNS 사용자가 급증하면서 매우 다양하고 방대한 양의 글이 여러 종류의 SNS를 통해 생성되고 있다. 그중 트위터는 정보의 전달 및 확산에 상당히 유용한 도구로 사용되고 있다. 이러한 트위터의 사용자 트윗은 뉴스, 음악, 사진, 여행 등 다양한 형태로 등장한다. 또한 트위터는 해시태그라는 사용자 정의 태그를 사용하는데 이는 트윗의 키워드 및 핵심을 쉽게 표현할 수 있도록 해주는 효과적인 수단이다. 최근 상당히 많은 양의 트윗의 생성에도 불구하고 이를 다양한 카테고리별로 분류할 수 있는 연구가 많이 진행되지 않았다. 따라서 본 논문에서는 해시태그를 이용해 트윗의 핵심을 파악하고 수많은 트윗을 다양한 토픽별로 분류할 수 있는 기법을 제안한다. 우선 다양한 카테고리의 인기 해시태그가 포함된 트윗을 수집하고 수집한 트윗에서 해시태그별 키워드를 추출한다. 그리고 코사인 유사도를 통해 해시태그별 내용 유사도를 파악하여 각 카테고리 내의 해시태그가 얼마나 유사한 내용을 지니고 있는지 파악한다. 마지막으로 사용자 트윗이 입력되면 모든 카테고리와 유사도를 비교하여 가장 유사도가 높은 카테고리를 찾아 추천해준다. 제안된 기법을 바탕으로 프로토타입을 구현하고 실험을 통해 성능을 평가한다.