• 제목/요약/키워드: 트위터 데이터

검색결과 227건 처리시간 0.029초

소셜 데이터의 주된 감성분석에 대한 연구 (Study on Principal Sentiment Analysis of Social Data)

  • 장필식
    • 한국컴퓨터정보학회논문지
    • /
    • 제19권12호
    • /
    • pp.49-56
    • /
    • 2014
  • 본 논문에서는 대용량의 문서, 인터넷 댓글, 소셜 데이터, 메시지 텍스트 등으로부터 표준, 일상적 언어, 및 은어(隱語), 비속어, 약어, 이모티콘 등을 감성 분석함으로써, 복합적인 감성 중 근간이 되는 주 감성들을 측정하고 평가하는 방법을 제안한다. 제안된 방법론은 IRLBA(Implicitly Restarted Lanczos Bidiagonalization Algorithm)을 활용하여 규모가 큰 희소행렬에 대한 주성분분석을 실시하며, 데이터 취합, 메시지 분석, 감성 평가, 감성 분석 및 통합 그리고 결과물 시각화 모듈로 구성된다. 본 연구를 통해 제안된 방법론은 소셜 데이터의 감성분석의 정확도를 향상시키고 감성분석의 활용범위를 확장시키는데 있어 도움을 줄 수 있을 것으로 기대된다.

트위터를 활용한 실시간 이벤트 탐지에서의 재난 키워드 필터링과 지명 검출 기법 (Keyword Filtering about Disaster and the Method of Detecting Area in Detecting Real-Time Event Using Twitter)

  • 하현수;황병연
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권7호
    • /
    • pp.345-350
    • /
    • 2016
  • 본 논문에서는 트위터를 활용하여 이벤트를 실시간으로 탐지하는 시스템에서의 재난 키워드 필터링과 지명 검출 기법을 제안한다. 스마트폰의 보급이 SNS의 빠른 확산을 이끌었고, 최근 SNS를 활용하여 다양한 연구들이 진행되고 있다. SNS 중에서 트위터는 140자의 단문으로 작성되어 빠르게 확산되는 특성을 가지고 있다. 따라서 트윗 사용자들이 작성하는 트윗은 하나의 센서 역할을 수행할 수 있다. 이러한 특성들을 이용하여 발생한 이벤트를 탐지하는 연구가 진행되었다. 그러나 최근 개인 정보 유출 사례가 증가해 자신의 위치 정보를 공개하기 꺼려함에 따라 재난이 발생한 지역을 파악하는데 어려움이 있다. 또한 맞춤법을 따르지 않은 게시글의 내용을 분석하는 과정에서 정확성과 관련된 문제가 발생한다. 따라서 이벤트 발생 탐지 과정에 재난 관련 키워드 필터링과 지명 검출 기법이 추가적으로 적용되어야 한다. 본 논문에서는 재난 관련 키워드 필터링의 적용과 두 가지 지명 검출 기법을 제안한다. 지명을 검출하는 두 가지 기법은 지명 단어에서 발생되는 노이즈를 제거하는 지명 노이즈 제거 기법과 랜드 마크를 이용하여 지명 단어를 확정하는 지명 확정 기법이다. 재난 관련 키워드와 두 지명 검출 기법을 적용한 결과 기존 시스템의 정확도 49%에서 지명노이즈 제거기법은 78%, 지명확정기법은 89%로 향상되었다.

텍스트 마이닝을 이용한 정보보호인식 분석 및 강화 방안 모색 (The Analysis of Information Security Awareness Using A Text Mining Approach)

  • 이태헌;윤영주;김희웅
    • 정보화정책
    • /
    • 제23권4호
    • /
    • pp.76-94
    • /
    • 2016
  • 최근 정보보호 분야에서는 사회공학, 랜섬웨어와 같은 정보보호 기술만으로는 막을 수 없는 공격이 증가하고 있으며, 이에 따라 정보보호인식의 중요성이 부각되고 있다. 또한 정보보호 업계의 수익악화가 두드러짐에 따라 정보보호 업계의 신성장동력을 탐색하고 해외시장을 개척하고자 하는 노력이 증대 되고 있다. 이에 따라 본 연구는 사람들이 생각하는 정보보호 관련 이슈들을 도출하고, 온라인에서의 정보보호 관련 이슈의 국가간 비교 분석을 통하여 한국의 정보보호인식의 개선방안을 제안하고자 한다. 이를 위해 본 연구에서는 토픽 모델링 기법을 적용하여 한국과 미국, 중국의 정보보호 관련 이슈를 확인 하고, 감성 분석을 통하여 점수를 측정해 비교 분석하였다. 본 연구의 학술적 시사점은 비정형 데이터인 트위터의 트윗을 텍스트 마이닝 기법인 토픽 모델링과 감성 분석 기법을 통해 분석하고, 도출된 이슈를 기반으로 국가간 비교 연구를 수행 하였으며 이를 바탕으로 한국의 정보보호인식 강화 방안을 탐색하였다는 점에서 의의가 있다. 또한 본 연구의 실무적 시사점은 트위터 API를 통한 실제 데이터를 이용한 연구로 본 연구 모델을 활용하여 국내 이슈 및 해외 시장 분석에 활용 가능할 것 이라는 점에 있다.

효율적인 트윗 분석 시스템 설계 및 구현 방법 (An Efficient Method for Design and Implementation of Tweet Analysis System)

  • 최민석
    • 디지털융복합연구
    • /
    • 제13권2호
    • /
    • pp.43-50
    • /
    • 2015
  • 다양한 소셜 네트워크 서비스의 등장과 사용자의 급증으로 소셜 네트워크 상에서 생산되는 데이터가 급증하고 있다. 전파 속도가 빠르고 개인적 성향의 의견들을 많이 포함하고 있는 소셜 네트워크 데이터의 특성으로 이를 분석하여 다양한 방면으로 활용하려는 요구도 증가하고 있다. 이러한 요구에 부응하여 실시간으로 대용량 데이터를 분석 처리하기 위한 다양한 기술 및 서비스들이 등장하고 있지만, 단기간에 적은 비용으로 그것들을 적용하기에는 어려움이 따른다. 본 논문에서는 새로운 기술이나 서비스의 도입 없이 효과적으로 트윗을 분석하기 위한 시스템 설계 및 구현 방법을 제안한다. 리눅스 기반의 호스팅 서버에 MySQL 데이터베이스와 PHP 스크립트를 이용하여 트윗 데이터를 수집하고 분석하는 모니터링 시스템을 구축하여 제안된 방법을 검증하였다.

소셜 빅데이터 이슈 탐지 및 예측분석 기술 동향 (Technology Trends of Issue Detection and Predictive Analysis on Social Big Data)

  • 이충희;허정;오효정;김현진;류법모;김현기
    • 전자통신동향분석
    • /
    • 제28권1호
    • /
    • pp.62-71
    • /
    • 2013
  • 최근 빅데이터 시대를 맞이하여 소셜미디어가 중요한 정보의 소통수단으로 급부상함에 따라 소셜웹 이슈 탐지 및 예측분석 기술이 큰 주목을 받고 있고, 기업 정부 등에서 정치/경제/사회문화적 이슈들에 대한 온라인 동향 분석 및 이슈 예측 기술의 수요가 급증하고 있다. 본고에서는 페이스북, 트위터 등의 소셜미디어에 대한 온라인 동향 분석 및 모니터링 기술 개발의 국내/국외 상용화 및 연구 현황을 소개한다. 또한, 사회적 동향을 분석해서 만들어진 예측모델에 기반해서 이슈의 향후 전개 과정에 대해 정량적으로 예측하는 기술 현황을 국내와 국외로 나누어 소개한다.

  • PDF

재난관련 트윗 분류를 위한 딥 러닝 결합 모델 (Combining Deep Learning Models for Crisis-Related Tweet Classification)

  • 최원규;이경순
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.649-651
    • /
    • 2018
  • 본 논문에서는 CNN에서 클래스 활성화 맵과 원샷 러닝을 결합하여 트위터 분류를 위한 딥 러닝 모델을 제안한다. 클래스 활성화 맵은 트윗 분류에 대한 분류 주제와 연관된 핵심 어휘를 추출하고 강조 표시하도록 사용되었다. 특히 작은 학습 데이터 셋을 사용하여 다중 클래스 분류의 성능을 향상시키기 위해 원샷 러닝 방법을 적용한다. 제안하는 방법을 검증하기위해 TREC 2018 태스크의 사건 스트림(TREC-IS) 학습데이터를 사용하여 비교실험을 했다. 실험 결과에서 CNN 기본 모델의 정확도는 58.1%이고 제안 방법의 정확도는 69.6%로 성능이 향상됨을 보였다.

  • PDF

소셜 빅 데이터를 이용한 여행사 비교 분석에 관한 연구 (A Study on the Comparison Analysis of Travel Agencies using Social Big Data)

  • 송은지;공효순
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.771-772
    • /
    • 2015
  • 소셜미디어 상 고객들이 쏟아내는 말을 실시간으로 분석, 조사하는 방법으로 버즈 모니터링 이라는 시스템을 이용하여 웹상의 다양한 정보를 자동으로 검색하고 수집하고 있다. 본 논문에서는 여행사에 관해 소셜 미디어 상의 빅 데이터를 이용하여 보다 정확하고 효율적인 정보 수집과 분석이 가능하도록 하기위한 분석 모델을 제안하고 실제 국내 여행사에 관해 비교 분석한다. 먼저 여행사별 인지도,이미지와 선호도 분석을 하고 관광관련 상품과 서비스에 대한 분석과 함께 소비자 분석으로서 관광의 목적, 동행인 등 소비자의 생활패턴에 대한 분석을 한다. 또한 여행사 관련 영향력자 경향을 트위터 상에서 살펴본 결과 해당 여행사 이용경험자와 관련 뉴스를 제공하는 언론, 이벤트에 관심 있는 사용자들로 유형화 할 수 있었다.

  • PDF

소셜 네트워크 서비스 기반 마이닝을 이용한 실시간 랜섬웨어 위험도 분석 시스템 설계 (Design of a Real-time Risk Analysis System for Ransomware Using Mining based on Social Network Service)

  • 나재호;김미희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.254-256
    • /
    • 2017
  • 본 논문에서는 소셜 네트워크 서비스 중 트위터를 마이닝하여 실시간으로 랜섬웨어 위험도 분석을 하는 시스템을 설계한다. 이를 위해 2017년 5월 12일에 가장 피해가 컸던 워너크라이 랜섬웨어를 중심으로 5월 10일에서 20일 사이의 트윗 데이터를 마이닝하고, 기존 시스템인 구글 트렌드와의 유사성을 비교 실험하여 트윗 데이터의 가치를 확인한다. 마지막으로 제안하는 시스템에 대한 향후 연구주제를 제시한다.

SSD에 기반한 하이브리드 메모리 멤캐시드 설계 (The Design of Hybrid Memory Memcached based on SSD)

  • 유상현;윤희용
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2014년도 제50차 하계학술대회논문집 22권2호
    • /
    • pp.333-335
    • /
    • 2014
  • 페이스북, 트위터와 같은 클라우드 및 웹 서비스 제공회사와 클라우드 및 웹 서비스 제공자는 수많은 사용자들에 의해 발생되는 무수한 데이터를 빠르게 처리하기 위해 하드 디스크보다는 램에 저장 할 필요가 있다. 그러한 좋은 도구로서 분산메모리 객체 캐싱 소프트웨어인 멤캐시드가 있다. 멤캐시드의 성능은 저장공간의 크기에 따라 많은 차이를 보이는데, 하드웨어의 비용, 전력소비와 온도조절 등 공간의 제약을 감안했을 때, 무작정 개별 서버에 많은 RAM을 장착하거나, 서버 배열을 확장하는 것은 효율적인 방법이 아니다. 따라서 많은 양의 데이터가 메모리에 저장이 가능하도록 RAM과 SSD를 같이 확장한 SSD 기반 하이브리드 메모리를 제안한다. 하이브리드 메모리는 객체 캐시로 동작하고 페이지 단위로 할당하는 것보다 객체 단위로 자원할당을 함으로서 SSD에서 빠른 무작위 읽기를 할 수 있게 해 객체의 접근속도를 향상시켰다.

  • PDF

프로모션 효과에 영향을 미치는 요인: 프랜차이즈 외식 산업의 SNS 버즈 분석을 중심으로 (The Factors Affecting Promotion Effects: SNS Analysis for Franchise Food Service Industry)

  • 정민서;이철진;윤지희;정윤혁
    • 한국빅데이터학회지
    • /
    • 제2권2호
    • /
    • pp.57-66
    • /
    • 2017
  • 프랜차이즈 경쟁의 심화에 따라 기업은 프로모션에 상당한 재원을 투자하고 있으며, 이에 프로모션의 효과 측정의 필요성이 증가하고 있다. 본 연구는 프랜차이즈 외식 산업에서 이러한 프로모션의 효과를 조사하기 위해 대표적 소셜 네트워크 서비스인 트위터 데이터를 경험적으로 분석하였다. 먼저 프로모션의 간격과 기간, 그리고 계절이 프로모션의 효과에 영향을 미치는 요인임을 통계적으로 입증했고, 나아가 각 요인별로 프로모션의 효과에 영향을 미치는 배경을 파악하여 외식 산업 내 기업의 업종에 따른 프로모션 전략을 제안하였다.

  • PDF