• 제목/요약/키워드: tweet analysis

검색결과 76건 처리시간 0.021초

영어 트위터 감성 분석을 위한 SentiWordNet 활용 기법 비교 (A Comparative Study on Using SentiWordNet for English Twitter Sentiment Analysis)

  • 강인수
    • 한국지능시스템학회논문지
    • /
    • 제23권4호
    • /
    • pp.317-324
    • /
    • 2013
  • 트위터 감성 분석은 트윗글의 감성을 긍정과 부정으로 분류하는 작업이다. 이 연구에서는 SentiWordNet(SWN) 감성 사전에 기반한 트윗글 감성 분석을 다룬다. SWN은 전체 영어 단어에 대해 단어의 의미별로 긍정, 부정의 감성 강도를 저장해 둔 감성 사전이다. 기존 SWN 기반 감성 분석 연구들은 문서에 출현하는 각 용어의 감성을 SWN으로부터 결정한 다음 이를 바탕으로 문서 전체의 감성을 결정하였는데, 그 방법들이 매우 다양하다. 예를 들어, 한 용어의 감성 결정 시 해당 용어의 SWN 내 의미별 긍정, 부정 감성 강도 차이들의 평균을 계산하거나 긍정과 부정 각각의 감성 강도 평균 혹은 최대값을 구하기도 하며, 문서 전체의 감성을 결정하는 경우에도 문서 내 용어들의 감성 값들에 대해 평균 혹은 최대값을 취하기도 하였다. 또한 SWN 내 형용사, 동사, 명사, 부사의 품사 집합 전체 혹은 특정 부분집합에 대해 위의 감성 결정 작업을 적용하기도 한다. 이처럼 기존 연구에서는 SWN 기반의 다양한 감성 자질 추출 절차가 시도되고 있으나 이들 자질 추출 기법 전반에 대한 성능 비교 연구는 찾기 힘들다. 이 연구에서는 SWN을 트위터 감성 분석에 활용하는 다양한 방법들을 일반화하는 절차들을 소개하고 각 방법들의 성능 비교 및 분석 결과를 제시한다.

모바일러닝에서 학생들의 질문패턴 분석: 트위터활용 중심 (Analysis of the Questioning Pattern of Students in Mobile Learning: with focus on Twitter Application)

  • 하일규;하성룡;김종근
    • 한국정보통신학회논문지
    • /
    • 제18권5호
    • /
    • pp.1224-1230
    • /
    • 2014
  • 트위터(Twitter)는 상대방의 트윗(tweet)에 대해 리트윗(retweet) 또는 응답(reply)하는 방법이 용이하여 손쉬운 의사 전달과 정보 획득의 도구로 활용되고 있다. 최근 들어 이러한 트위터를 다양한 분야에 이용하려는 시도가 있어 왔고, 특히 교육분야에 이용하고자 하는 연구가 진행되어 왔다. 트위터는 교육현장에서 교수자와 학습자간의 의사소통 도구로 활용되거나, 시간과 공간의 제약 없이 학습자들의 협동학습에 활용되어 질 수 있다. 이와 같이 트위터가 다양한 활용 가능성을 가지고 있음에도 불구하고, 실질적인 적용 및 고찰을 통해 그 교육적 효과를 입증하는 연구는 많지 않다. 본 연구에서는 트위터를 대학의 한 학기동안 학생들의 질의 응답도구로 활용하도록 하고 그 활동을 조사, 분석한다. 분석 결과, 트위터 활용을 강제하지 않은 경우 학생들의 트위터 활용도는 낮게 나타난다. 따라서 트위터는 교육적 활용 가능성을 가지고 있지만, 그러한 효과를 나타내기 위해서는 교수자와 학습자간에 적극적인 노력이 필요함을 보인다.

트위터 상의 이미지 이용에 관한 분석 (An Analysis of Image Use in Twitter Message)

  • 정은경;윤정원
    • 한국비블리아학회지
    • /
    • 제24권4호
    • /
    • pp.75-90
    • /
    • 2013
  • 이용자들은 최근 소셜 미디어를 활발하게 이용하고 있으며, 소셜 미디어는 이미지와 같은 멀티미디어 정보의 배태가 주요한 특징이다. 본 연구는 트위터 상에서 이미지 이용 행태를 규명하고자 하였다. 이를 위하여 2013년 4월에 발생한 "보스턴 마라톤 대회 테러" 사건과 관련된 1,589건의 이미지 포함 트윗 메시지를 수집하여 이 중에서 영향력 있는 트윗 메시지 200건과 선호하는(favorite) 트윗 메시지 200건, 무작위로 선택된 일반 트윗 메시지 200건을 각각 선정하여 데이터 분석을 실시하였다. 데이터 분석은 두 단계의 분석과정과 세 그룹의 데이터 셋을 대상으로 수행하였다. 첫 번째 단계에서는 기존 선행연구를 바탕으로 개발된 코딩 체계를 활용하여 세 그룹의 데이터에 대해서 트윗 메시지, 이미지 이용, 이용자에 관하여 각각 수행되었다. 두 번째 단계는 세 그룹의 데이터 셋(일반 트윗, 영향력 있는 트윗, 선호하는 트윗)의 코딩 결과를 비교 분석하였다. 이러한 분석과정을 통해서, 의견을 표현하는 트윗이 가장 선호되었으며, 정보를 공유하는 트윗이 가장 영향력이 있는 것으로 나타났다. 이미지 이용 관점에서는 정보배포, 일러스트레이션, 감정적/설득적, 정보처리 이용목적이 가장 두드러지게 나타났다. 이러한 이미지 이용은 기존의 이미지 이용 패턴과 달리 이미지를 데이터로서 이용하는 목적이 객체 중심으로 이용하는 목적보다 높은 것으로 나타났다. 이용자 분석에서는 정부기관, 유명인, 이미지 사이트가 가장 선호되고 영향력 있는 것으로 나타났다. 이러한 연구결과는 이용 맥락 관점의 차세대 이미지 정보 검색 패러다임을 위한 이용자 관점의 이해 증진에 기여할 수 있을 것으로 기대한다.

트위터 오피니언 마이닝을 통한 코로나19 기간 대학 비대면 수업에 대한 의견 고찰 (Exploring Opinions on University Online Classes During the COVID-19 Pandemic Through Twitter Opinion Mining)

  • 김동훈;강정;주영준
    • 한국문헌정보학회지
    • /
    • 제55권4호
    • /
    • pp.5-22
    • /
    • 2021
  • 본 연구는 코로나바이러스감염증-19 (이하 코로나19) 확산 이후 대학의 부분 또는 전면 비대면 수업으로의 전환에 대해 소셜 미디어 플랫폼 중 하나인 트위터에서 이를 어떻게 생각하고 논의하고 있는지를 파악하기 위해 진행되었다. 이를 위해 트위터에서 비대면 수업 관련 트윗을 수집한 후 감성분석 및 시계열 주제 분석을 실시하였다. 감성분석결과, 전반적으로 긍정적인 여론보다 부정적인 여론이 많았지만 시간이 지남에 따라 점차 부정적인 여론이 줄어드는 경향이 나타남을 확인하였다. 또한 월별 감성점수분포를 통해 학기 중이 방학기간보다 감성점수 분포의 폭이 넓음을 확인하였고, 이를 통해 학기 중일 때가 방학 때보다 비대면 수업에 대해 더 다양한 감정과 의견을 교환한다는 사실을 확인할 수 있었다. 다음으로 긍정트윗과 부정트윗을 구분하여 시계열 주제 분석을 실시한 결과, 긍정트윗에서는 수업환경 및 장비, 긍정적인 감정 표현, 강의시청장소, 언어수업, 시험 및 과제와 같은 다섯 가지 주요한 주제가 나타났으며, 부정트윗에서는 시간(수업시간, 쉬는시간), 시험 및 과제, 부정적인 감정 표현, 수업환경 및 장비와 같은 네 가지 주요한 주제가 나타남을 확인하였다. 또한 각 주제별 대표 키워드들의 비율을 통해 시간에 따른 주제의 변화를 파악함으로써 비대면 수업에 대한 여론의 트렌드를 살펴 보고자 하였다. 본 연구는 기존 비대면 수업 관련 연구들과는 달리 소셜 미디어 중 하나인 트위터를 활용하여 국내 대학의 비대면 수업에 대한 전반적인 의견을 파악하고자 하였으며, 감성분석과 시계열 주제 분석을 활용하여 비대면 수업에 대한 긍부정 여론을 나누어 식별 및 시간의 흐름에 따른 트렌드의 변화를 파악하였다는 점에서 학문적 함의를 지닌다. 또한 연구결과는 국내 대학에서의 비대면 수업에 대한 구성 및 개선방안 등에 활용될 수 있으며, 비대면 수업을 설계하는 대학 및 교수자들에게 도움이 될 수 있다는 점에서 실질적인 함의를 지닌다.

인공지능 기술에 관한 가트너 하이프사이클의 네트워크 집단구조 특성 및 확산패턴에 관한 연구 (Structural features and Diffusion Patterns of Gartner Hype Cycle for Artificial Intelligence using Social Network analysis)

  • 신선아;강주영
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.107-129
    • /
    • 2022
  • 기술경쟁이 심화되고 있는 오늘날 신기술에 대한 선도적 위치의 선점이 중요하다. 선도적 위치의 선점과 적정시점에 기술 획득·관리를 위해 이해관계자들은 지속적으로 기술에 대한 탐색활동을 수행한다. 이를 위한 참고 자료로서 가트너 하이프 사이클(Gartner Hype Cycle)은 중요한 의미가 있다. 하이프 사이클은 기술수명주기(S-curve)와 하이프 수준(Hype Level)을 결합하여 새로운 기술에 대한 대중의 기대감을 시간의 흐름에 따라 나타낸 그래프이다. 새로운 기술에 대한 기대는 기술사업화뿐만 아니라 연구개발 투자의 정당성, 투자유치를 위한 기회의 발판이 된다는 점에서 연구개발 담당자 및 기술투자자의 관심이 높다. 그러나 산업계의 높은 관심에 비해 실증분석을 시도한 선행연구는 다양하지 못하다. 선행문헌 분석결과 데이터 종류(뉴스, 논문, 주가지수, 검색 트래픽 등)나 분석방법은 한정적이었다. 이에 본 연구에서는 확산의 주요한 채널이 되어가고 있는 소셜네트워크서비스의 데이터를 활용하여 'Gartner Hype Cycle for Artificial Intelligence, 2021'의 단계별 기술들에 대한 집단구조(커뮤니티)의 특성과 커뮤니티 간 정보 확산패턴을 분석하고자 한다. 이를 위해 컴포넌트 응집규모(Component Cohesion Size)를 통해 각 단계별 구조적 특성과 연결중심화(Degree Centralization)와 밀도(Density)를 통해 확산의 방식을 확인하였다. 연구결과 기술을 수용하는 단계별 집단들의 커뮤니케이션 활동이 시간이 지날 수록 분절이 커지며 밀도 역시 감소함을 확인하였다. 또한 새로운 기술에 대한 관심을 촉발하는 혁신태동기 집단의 경우 정보확산을 촉발하는 외향연결(Out-degree) 중심화 지수가 높았으며, 이후의 단계는 정보를 수용하는 내향연결(In-degree) 중심화 지수가 높은 것으로 나타났다. 해당 연구를 통해 하이프 사이클에 관한 이론적 기초를 제공할 것이다. 또한 인공지능기술에 대한 기술관심집단들의 기대감을 반영한 정보확산의 특성과 패턴을 소셜데이터를 통해 분석함으로써 기업의 기술투자 의사결정에 새로운 시각을 제공할 것이다.

TV 시청률과 마이크로블로그 내용어와의 시간대별 관계 분석 (Analysis of the Time-dependent Relation between TV Ratings and the Content of Microblogs)

  • 최준연;백혜득;최진호
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.163-176
    • /
    • 2014
  • 소셜미디어 확산으로 많은 사용자들이 SNS를 통해 자신의 생각과 의견을 표출하며 다른 사용자들과 상호작용하고 있다. 특히 트위터와 같은 마이크로블로그는 짧은 문장을 통해 영화, TV, 사회 현상 등과 같은 공통의 주제에 대해 많은 사람이 즉각적으로 의견을 표출하고 교환하는 플랫폼의 역할을 수행하고 있다. TV방송 프로그램에 대해서도 의견과 감정을 마이크로블로그를 통해 표출하고 있는데, 본 연구에서는 마이크로블로그의 내용과 시청률과의 관계를 살펴보기 위해, 지난 공중파 방송 프로그램에 대한 트윗을 수집하고 부적절한 트윗들을 제거한 후 형태소 분석을 수행하였다. 추출된 형태소뿐 아니라 이모티콘, 신조어 등 사용자가 입력한 모든 단어들을 후보 자질로 삼아 시청률과의 상관관계를 분석하였다. 실험을 위해 2013년 1월부터 10개월간의 예능프로그램 트윗의 데이터를 수집하여 전국 시청률 데이터와 비교 분석을 수행하였다. 트윗의 발생량은 일주일 중 방송된 요일에 가장 많았으며, 특히 방송시간 부근에서 급격히 증가하는 모습을 보였다. 이것은 전국에 동시간에 방송되는 공중파 프로그램의 특성상 공통된 관심 주제를 제공하기 때문에 나타나는 현상으로 여겨진다. 횟수 기반 자질로 방송 일의 총 트윗 수와 리트윗 수, 방송시간 중의 트윗 수와 리트윗 수와 시청률과의 상관 관계를 분석하였으나 모두 낮은 상관 계수를 나타냈다. 이것은 단순한 트윗 발생 빈도는 방송 프로그램의 만족도 또는 시청률을 제대로 반영하고 있지 못함을 의미한다. 내용 기반 자질로 추출한 단어들 중에는 높은 상관관계를 보여주는 단어들이 발견되었으며, 표준어가 아닌 이모티콘과 신조어 중에도 높은 상관관계를 보여주는 자질이 나타났다. 또한 방송시작 전과 후에 따라 상관계수가 높은 단어가 상이함을 발견하였다. 매주 같은 시간에 방송되는 TV 프로그램의 특성상, 방송을 기다리고 기대하는 내용의 트윗과 방송 후 소감을 표현하는 트윗의 내용에 차이가 존재하였다. 이러한 분석결과는 단어에 따라 시청률과 연관성이 높은 시간대가 달라짐을 의미하며, 시청률을 측정하고자 할 때 각 단어들의 시간대를 고려해서 사용해야 함을 의미한다. 본 연구에서 제안한 방법은 기존의 표본 추출을 통해 이루어지는 TV 시청률 측정을 보완할 수 있는 방법에 활용할 수 있으리라 기대된다.