• 제목/요약/키워드: 트위터 분석

검색결과 344건 처리시간 0.023초

텍스트 마이닝을 이용한 정보보호인식 분석 및 강화 방안 모색 (The Analysis of Information Security Awareness Using A Text Mining Approach)

  • 이태헌;윤영주;김희웅
    • 정보화정책
    • /
    • 제23권4호
    • /
    • pp.76-94
    • /
    • 2016
  • 최근 정보보호 분야에서는 사회공학, 랜섬웨어와 같은 정보보호 기술만으로는 막을 수 없는 공격이 증가하고 있으며, 이에 따라 정보보호인식의 중요성이 부각되고 있다. 또한 정보보호 업계의 수익악화가 두드러짐에 따라 정보보호 업계의 신성장동력을 탐색하고 해외시장을 개척하고자 하는 노력이 증대 되고 있다. 이에 따라 본 연구는 사람들이 생각하는 정보보호 관련 이슈들을 도출하고, 온라인에서의 정보보호 관련 이슈의 국가간 비교 분석을 통하여 한국의 정보보호인식의 개선방안을 제안하고자 한다. 이를 위해 본 연구에서는 토픽 모델링 기법을 적용하여 한국과 미국, 중국의 정보보호 관련 이슈를 확인 하고, 감성 분석을 통하여 점수를 측정해 비교 분석하였다. 본 연구의 학술적 시사점은 비정형 데이터인 트위터의 트윗을 텍스트 마이닝 기법인 토픽 모델링과 감성 분석 기법을 통해 분석하고, 도출된 이슈를 기반으로 국가간 비교 연구를 수행 하였으며 이를 바탕으로 한국의 정보보호인식 강화 방안을 탐색하였다는 점에서 의의가 있다. 또한 본 연구의 실무적 시사점은 트위터 API를 통한 실제 데이터를 이용한 연구로 본 연구 모델을 활용하여 국내 이슈 및 해외 시장 분석에 활용 가능할 것 이라는 점에 있다.

SNS Big-data를 활용한 TV 광고 효과 분석 시스템 설계 (A Design of a TV Advertisement Effectiveness Analysis System Using SNS Big-data)

  • 이아름;방지선;김윤희
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제21권9호
    • /
    • pp.579-586
    • /
    • 2015
  • 스마트폰 보급률이 증가함과 함께 SNS(Social Networking Service) 이용자도 늘어가고 있다. SNS는 실시간으로 사람들 간의 개인적인 의견을 빠르게 주고받을 수 있다는 특징이 있어 이를 통해 개인의 반응을 실시간으로 수집, 분석이 가능하다. 한편, TV광고 효과 분석에 있어 사람들의 의견을 실시간으로 수집하고 분석하기 위해 새로운 접근 방법이 필요해졌다. 이에 본 연구에서는 트위터라는 특정 SNS를 대상으로 광고에 대한 데이터를 수집하여 실시간으로 광고 효과를 분석하는 시스템을 설계 및 구축하였다. 특히, 하둡을 이용하여 빅데이터 분석을 병렬화하여 효율적으로 수행하도록 하였으며, TV광고에 대해 언급도와 선호도, 신뢰도를 각각 분석하여 다양한 분석을 가능하게 하였다. 오피니언 마이닝 기법을 신뢰도 분석에 사용하여 분석의 정확도를 높였다. 구축한 시스템을 통해 트위터 SNS를 대상으로 TV광고에 대한 분석을 세분화하여 신속하게 처리할 수 있음을 보여주었다.

SNS에 제보되는 재해정보 추출 매시업 설계 및 구현 (Design and Implementation of the Extraction Mashup for Reported Disaster Information on SNSs)

  • 서태웅;박만곤;김창수
    • 한국멀티미디어학회논문지
    • /
    • 제16권11호
    • /
    • pp.1297-1304
    • /
    • 2013
  • 급작스런 폭우로 침수피해를 예측하기 힘든 실정에서, 재해 현장에서의 신속한 제보 및 정보 전파의 중요성이 커지고 있다. 재난 상황에서 실시간으로 정보를 수집하는 수단이 많지 않은 점에 착안하여, 본 논문에서는 소셜 네트워크 서비스를 통한 정보 수집 시스템을 설계하였다. 그리고 현재 소셜 네트워크 서비스를 융합한 여러 매시업 시스템들이 정보 확산을 목적으로만 활용하는 점을 개선하여, 기존과는 반대로 소셜네트워크 서비스의 정보를 수집, 분석하여 재해 상황에서 최대한 활용 할 수 있도록 하는 방법을 연구하였다. 최종적으로는 트위터에 실시간으로 등록되는 재해 정보를 통해 수많은 매체 중에서 가장 신속한 재해 정보를 추출하기 위한 연구이다.

Performance Evaluations of Text Ranking Algorithms

  • Kim, Myung-Hwi;Jang, Beakcheol
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.123-131
    • /
    • 2020
  • 텍스트 순위 알고리즘은 키워드 추출을 위한 대표적인 방법이며 그 중요성이 강조되고 있다. 본 논문에서는 텍스트 랭킹 알고리즘에서 대표적으로 사용되는 TF-IDF, SMART, INQUERY, CCA 알고리즘이 적용된 최근 연구와 실험해비교한다. 먼저, 각 알고리즘을 설명한 후 뉴스와 트위터 데이터를 기반으로 알고리즘의 성능을 분석한다. 실험 결과에 따르면 네 가지 알고리즘 모두 뉴스 데이터에서 특정 단어의 추출 성능이 좋다는 것을 알 수 있다. 그러나 Twitter의 경우 CCA는 특정 단어를 추출하는 최고의 성능을 가지며 INQUERY는 가장 낮은 성능을 보여준다. 또한 6 가지 비교 메트릭을 통해 알고리즘의 정확성을 분석한다. 실험 결과 CCA가 뉴스 데이터에서 최고의 정확도를 보여주고, 트위터의 경우 TF-IDF와 CCA는 비슷한 성능을 보이며 높은 정확도를 보인다.

소셜 미디어 상의 마약 범죄 추적을 위한 키워드 수집체계 연구 (A Study on the Keyword Collection System for Tracking Drug Crimes on Social Media)

  • 최민재;이호동;김지연;김창훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.209-212
    • /
    • 2023
  • 소셜미디어를 통한 마약 유통이 증가하면서 젊은 연령층의 마약 문제가 사회 문제로 대두되고 있다. 소셜미디어 상의 마약 유통을 차단하고자 유해 키워드 차단 정책이 마련되고 있지만, 사용자들은 차단 정책을 우회할 수 있는 마약 관련 은어 및 변형어를 사용하여 검색을 시도하기 때문에 다양한 은어 및 변형어를 수집하여 차단 정책에 반영하는 것이 필요하다. 본 논문에서는 마약 유통 및 구매에 빈번하게 사용되는 일반어, 은어, 그리고 일반어와 은어의 각 변형어를 수집하고, 이를 페이스북, 인스타그램, 카카오톡, 트위터, 텔레그램을 통해 검색하여 소셜미디어 유형별로 수집되는 마약 관련 게시글을 정량적으로 분석하였다. 분석 결과, 5종의 소셜미디어 중, 트위터에서 마약 관련 은어 및 변형어를 포함하는 게시글이 가장 많이 검색되는 것을 확인하였다.

  • PDF

트위터 상의 이미지 이용에 관한 분석 (An Analysis of Image Use in Twitter Message)

  • 정은경;윤정원
    • 한국비블리아학회지
    • /
    • 제24권4호
    • /
    • pp.75-90
    • /
    • 2013
  • 이용자들은 최근 소셜 미디어를 활발하게 이용하고 있으며, 소셜 미디어는 이미지와 같은 멀티미디어 정보의 배태가 주요한 특징이다. 본 연구는 트위터 상에서 이미지 이용 행태를 규명하고자 하였다. 이를 위하여 2013년 4월에 발생한 "보스턴 마라톤 대회 테러" 사건과 관련된 1,589건의 이미지 포함 트윗 메시지를 수집하여 이 중에서 영향력 있는 트윗 메시지 200건과 선호하는(favorite) 트윗 메시지 200건, 무작위로 선택된 일반 트윗 메시지 200건을 각각 선정하여 데이터 분석을 실시하였다. 데이터 분석은 두 단계의 분석과정과 세 그룹의 데이터 셋을 대상으로 수행하였다. 첫 번째 단계에서는 기존 선행연구를 바탕으로 개발된 코딩 체계를 활용하여 세 그룹의 데이터에 대해서 트윗 메시지, 이미지 이용, 이용자에 관하여 각각 수행되었다. 두 번째 단계는 세 그룹의 데이터 셋(일반 트윗, 영향력 있는 트윗, 선호하는 트윗)의 코딩 결과를 비교 분석하였다. 이러한 분석과정을 통해서, 의견을 표현하는 트윗이 가장 선호되었으며, 정보를 공유하는 트윗이 가장 영향력이 있는 것으로 나타났다. 이미지 이용 관점에서는 정보배포, 일러스트레이션, 감정적/설득적, 정보처리 이용목적이 가장 두드러지게 나타났다. 이러한 이미지 이용은 기존의 이미지 이용 패턴과 달리 이미지를 데이터로서 이용하는 목적이 객체 중심으로 이용하는 목적보다 높은 것으로 나타났다. 이용자 분석에서는 정부기관, 유명인, 이미지 사이트가 가장 선호되고 영향력 있는 것으로 나타났다. 이러한 연구결과는 이용 맥락 관점의 차세대 이미지 정보 검색 패러다임을 위한 이용자 관점의 이해 증진에 기여할 수 있을 것으로 기대한다.

소셜 감성과 암호화폐 가격 간의 관계 분석: 빅데이터를 활용한 계량경제적 분석 (An Analysis of Relationship between Social Sentiments and Cryptocurrency Price: An Econometric Analysis with Big Data)

  • 유상이;현지연;이상용
    • 경영정보학연구
    • /
    • 제21권1호
    • /
    • pp.91-111
    • /
    • 2019
  • 2017년 말, 전 세계적으로 비트코인을 필두로 암호화폐에 대한 투자 열풍이 시작되었으며, 특히 한국은 그 중심에 서 있는 상황이었다. 한국의 투자자들이 그간 수익성이 있는 투자 기회를 찾기가 어려웠던 만큼 새로운 투자처에 투자심리가 몰린 것으로 보인다. 하지만 암호화폐에 대한 이러한 한국의 열기는 자산의 본질적인 가치에 기초한 투자가 아니라 단기적 차익 실현 기대 및 사회적 분위기에 따른 것이기 때문에 심리적 현상에 좌우되는 바가 크다고 할 수 있다. 따라서 본 연구에서는 이를 살펴보기 위해 트위터와 비트코인을 대표로 선정하여 사람들의 소셜 감성이 암호화폐에 미치는 영향을 분석해보고자 하였다. 데이터는 2017년 11월 1일부터 2018년 4월 30일까지 총 181일간 트위터상에 노출된 비트코인 관련 게시물과 빗썸/업비트의 비트코인 가격을 대상으로 수집하였다. 수집된 트위터 데이터는 감성 분석을 통해 중립어 및 긍·부정어로 정제해주었고, 정제된 중립어, 긍정어, 부정어는 비트코인 가격에 어떤 영향을 미치는지 확인하기 위해 회귀분석 모형에 투입하였다. 회귀분석을 통해 관계를 살펴본 후에는 Granger Causality test를 통해 인과관계의 존재 여부를 확인하였다. 그 결과, 긍정어는 비트코인 가격과 정의 관계로 나타났고, 부정어는 부의 관계로 나타났다. 또한 소셜감성과 비트코인 가격간에는 양방향의 인과관계가 있음을 확인하였다. 즉, 비트코인 가격 변동이 소셜감성에 영향을 미치기도 하지만, 동시에 소셜감성의 변화도 암호화폐 투자자들의 행동에 영향을 미칠 수 있음을 확인할 수 있었다.

텍스트 마이닝을 이용한 2012년 한국대선 관련 트위터 분석 (Analysis of Twitter for 2012 South Korea Presidential Election by Text Mining Techniques)

  • 배정환;손지은;송민
    • 지능정보연구
    • /
    • 제19권3호
    • /
    • pp.141-156
    • /
    • 2013
  • 최근 소셜미디어는 전세계적 커뮤니케이션 도구로서 사용에 전문적인 지식이나 기술이 필요하지 않기 때문에 이용자들로 하여금 콘텐츠의 실시간 생산과 공유를 가능하게 하여 기존의 커뮤니케이션 양식을 새롭게 변화시키고 있다. 특히 새로운 소통매체로서 국내외의 사회적 이슈를 실시간으로 전파하면서 이용자들이 자신의 의견을 지인 및 대중과 소통하게 하여 크게는 사회적 변화의 가능성까지 야기하고 있다. 소셜미디어를 통한 정보주체의 변화로 인해 데이터는 더욱 방대해지고 '빅데이터'라 불리는 정보의 '초(超)범람'을 야기하였으며, 이러한 빅데이터는 사회적 실제를 이해하기 위한 새로운 기회이자 의미 있는 정보를 발굴해 내기 위한 새로운 연구분야로 각광받게 되었다. 빅데이터를 효율적으로 분석하기 위해 다양한 연구가 활발히 이루어지고 있다. 그러나 지금까지 소셜미디어를 대상으로 한 연구는 개괄적인 접근으로 제한된 분석에 국한되고 있다. 이를 적절히 해결하기 위해 본 연구에서는 트위터 상에서 실시간으로 방대하게 생성되는 빅스트림 데이터의 효율적 수집과 수집된 문헌의 다양한 분석을 통한 새로운 정보와 지식의 마이닝을 목표로 사회적 이슈를 포착하기 위한 실시간 트위터 트렌드 마이닝 시스템을 개발 하였다. 본 시스템은 단어의 동시출현 검색, 질의어에 의한 트위터 이용자 시각화, 두 이용자 사이의 유사도 계산, 트렌드 변화에 관한 토픽 모델링 그리고 멘션 기반 이용자 네트워크 분석의 기능들을 제공하고, 이를 통해 2012년 한국 대선을 대상으로 사례연구를 수행하였다. 본 연구를 위한 실험문헌은 2012년 10월 1일부터 2012년 10월 31일까지 약 3주간 1,737,969건의 트윗을 수집하여 구축되었다. 이 사례연구는 최신 기법을 사용하여 트위터에서 생성되는 사회적 트렌드를 마이닝 할 수 있게 했다는 점에서 주요한 의의가 있고, 이를 통해 트위터가 사회적 이슈의 변화를 효율적으로 추적하고 예측하기에 유용한 도구이며, 멘션 기반 네트워크는 트위터에서 발견할 수 있는 고유의 비가시적 네트워크로 이용자 네트워크의 또 다른 양상을 보여준다.

텍스트마이닝을 활용한 핀테크 및 디지털 금융 서비스 트렌드 분석 (Trend Analysis of FinTech and Digital Financial Services using Text Mining)

  • 김도희;김민정
    • 디지털융복합연구
    • /
    • 제20권3호
    • /
    • pp.131-143
    • /
    • 2022
  • 본 연구는 핀테크를 중심으로 국내 디지털 금융 서비스 시장의 트렌드를 파악하고자 신문기사와 트위터 데이터를 대상으로 텍스트마이닝 기법을 사용하여 분석을 진행하였다. 핀테크 시장의 성장 과정에 있어서 간편결제 서비스 도입, 인터넷전문은행 출범, 데이터 3법 개정안 통과, 마이데이터 사업 신청 등 중요하게 작용을 한 4가지 시점을 기준으로 빈도분석을 수행하여 핵심 키워드 간의 차이를 살펴보았다. 또한 핀테크 선도 국가인 중국·미국과 미래 키워드를 핀테크 키워드와 결합한 빈도분석 결과를 통해 세계 시장 속에서 국내 핀테크 산업의 현 위치와 미래 시장 전망을 예측하였다. 마지막으로 트위터 트윗을 대상으로 감성분석을 진행하여 핀테크 서비스에 대한 소비자의 기대와 우려를 정량화하였다. 따라서 본 연구는 금융 생태계 변화 과정을 살펴보고, 분석 결과를 종합함으로써 정부와 기업이 향후 핀테크 시장 발전에 있어서 활용할 수 있는 전략적 방향성 및 대응 전략을 제시한 점에서 의의가 있다.

토픽 모델링을 이용한 트위터 데이터의 공간 분포 패턴 분석 (Spatial Distribution Patterns of Twitter Data with Topic Modeling)

  • 우현지;김영훈
    • 한국지역지리학회지
    • /
    • 제23권2호
    • /
    • pp.376-387
    • /
    • 2017
  • 본 연구는 트위터를 대상으로 트윗 공간 데이터에서 지리적 의미를 탐색하기 위한 방법을 모색하였다. 트윗 공간 데이터의 구축 과정 및 지리적 분석의 프레임워크를 정립하고 지리적 연구 방법론을 제안하였다. 이를 위해 본 연구는 제주도의 GPS 좌표 참조 트윗(geotweet)을 대상으로 트윗의 내용적 특성과 트윗 발생 위치의 공간 분포 특성을 확인하였다. 제주도 좌표 참조 트윗에서는 지명 또는 장소명이 많이 출현하였는데, 이는 자신의 위치를 알리고자하는 의도로 파악하였다. 트윗의 공간 분포는 제주공항을 중심으로 한 일부 관광지 주변으로 핫스팟이 확인되었고, 이는 제주도 유동인구 핫스팟과 유사한 패턴을 보였다. 주제 중심의 트윗 분석을 위해 본 연구에서는 토픽 모델링 알고리즘을 이용하여 분석하였다. 분석 결과, 주제의 지리적 위치와 트윗의 내용은 서로 관련이 있음을 알 수 있었다. 마지막으로 본 연구는 토픽 모델링 분석을 통해 방대한 트윗 데이터의 내용에 상응하는 지역 분포 특성을 직관적으로 확인하는데 유용하게 활용될 수 있다는 것을 확인하였다.

  • PDF