• 제목/요약/키워드: social media mining

검색결과 242건 처리시간 0.033초

주가지수 방향성 예측을 위한 도메인 맞춤형 감성사전 구축방안 (A domain-specific sentiment lexicon construction method for stock index directionality)

  • 김재봉;김형중
    • 디지털콘텐츠학회 논문지
    • /
    • 제18권3호
    • /
    • pp.585-592
    • /
    • 2017
  • 개인용 디바이스의 발달로 개인들이 손쉽게 인터넷에 접속할 수 있게 되었으며, 소셜미디어를 통한 정보의 공유와 습득이 일반화 되고 있다. 특히 분야별 전문 커뮤니티가 발달하며 사회적 영향력을 행사하고 있어 기업과 정부는 이들의 의견을 반영하여 전략을 수립하는 일에 관심을 기울이고 있다. 온라인상의 다양한 텍스트로부터 대중의 의견을 읽어내는 것을 오피니언마이닝이라고 한다. 그 중 하나인 감성사전은 방대한 비정형데이터를 빠르게 파악하는 도구로 여러 분야에서 활용되고 있다. 주식시장은 사회의 여러 요인을 반영하여 변동한다. 최근에는 버즈량 분석 등 빅데이터를 기반으로 오피니언마이닝을 활용한 주식시장 연구가 시도되고 있다. 대표적인 예로 뉴스와 같은 텍스트 데이터 분석을 활용한 연구들이 발표되고 있다. 본 논문에서는 뉴스의 정제된 형식과 한정된 어휘를 사용한 기존연구를 보완하고자 증권전문 사이트 'Paxnet'의 게시 글을 분석대상으로 삼아 주식시장 맞춤형 감성사전을 구축하여 투자자들의 감성을 분석하는 데 기여했다.

뉴스와 소셜 데이터를 활용한 텍스트 기반 가짜 뉴스 탐지 방법론 (Text Mining-based Fake News Detection Using News And Social Media Data)

  • 현윤진;김남규
    • 한국전자거래학회지
    • /
    • 제23권4호
    • /
    • pp.19-39
    • /
    • 2018
  • 최근 가짜 뉴스가 분야를 막론하고 전 세계에서 주목을 받고 있으며, 현대경제연구원에서는 이러한 가짜 뉴스로 인한 피해 규모가 연간 약 30조 900억원에 달하는 것으로 추산하였다. 정부에서는 "가짜 뉴스 찾기"를 주제로 "인공지능 R&D 챌린지" 대회를 개최하여 가짜 뉴스를 가려낼 인공지능 원천기술 개발에 대한 첫 걸음을 내딛고 있으며, 민간 차원에서도 다양한 분야에서 팩트 체크 서비스가 제공되고 있다. 학계에서도 가짜 뉴스를 탐지하기 위한 시도가 전문가 기반, 집단지성 기반, 인공지능 기반, 시맨틱 기반 등으로 활발하게 이루어지고 있다. 하지만 이러한 시도는 조작의 정밀도가 높을수록 뉴스 자체에 대한 분석만으로 진위 여부를 식별하기가 더욱 어렵다는 한계를 경험하고 있으며, 가짜 뉴스 탐지 모델의 정확도가 과평가된 경향을 보이고 있다. 따라서 본 연구에서는 가짜 뉴스 탐지 모델 정확도의 공정성을 확보하고, 뉴스의 내용뿐만 아니라 해당 뉴스에 대한 반응으로 자연적으로 발생한 광범위한 소셜 데이터를 활용하여 뉴스의 진위 여부를 판정하는 방안을 제안하고자 한다.

챗봇 데이터에 나타난 우울 담론의 범주와 특성의 이해 (Understanding the Categories and Characteristics of Depressive Moods in Chatbot Data)

  • 진효진;정찬이;백금희;차지영;최정회;차미영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제11권9호
    • /
    • pp.381-390
    • /
    • 2022
  • 자연어처리 기술과 비대면 문화의 확산과 더불어 챗봇의 사용 증가세가 가파르며, 챗봇의 용도 또한 일상 대화와 소비자 응대를 넘어서 정신건강을 위한 용도로 확장하고 있다. 챗봇은 익명성이 보장된다는 점에서 사용자들이 우울감에 관해 이야기하기 적합한 서비스이다. 그러나 사용자가 작성한 문장들을 분석해 우울 담론의 유형과 특성을 파악하는 연구들은 주로 소셜 네트워크 데이터를 대상으로 했다는 한계점이 존재하며, 실제 환경에서 사용되는 챗봇과 상호작용한 데이터를 분석한 연구는 찾아보기 힘들다. 이 연구에서는 챗봇-사람의 상호작용 데이터에서 무작위로 추출한 '우울'과 관련된 대화 데이터를 토픽 모델링 방법과 텍스트마이닝 기법으로 분석하여 채팅에서의 우울 관련 담론의 특성을 파악하였다. 또한, 챗봇에서 빈번히 나타나는 '우울' 담론의 범주와 트위터 '우울' 담론의 범주의 차이점을 비교하였다. 이를 통해 챗봇 데이터의 '우울' 대화만의 특징을 파악하고, 적절한 심리지원 정보를 제공하는 챗봇 서비스를 위한 시사점과 향후 연구 방향에 대해 논의한다.

LDA 토픽 모델링 기법을 활용한 무용공연의 연구 동향 분석 (Trend Analysis of Dance Performance Research Using Keywords and Topic Modeling of LDA Techniques)

  • 시유
    • 산업융합연구
    • /
    • 제22권3호
    • /
    • pp.13-25
    • /
    • 2024
  • 본 연구는 빅데이터를 기반으로 국내에서 발표된 무용공연 관련 연구 주제를 탐색하고, 시대 흐름에 따라 변화하는 연구동향을 살펴본다. 토픽모델링 분석하여 도출한 결과는 다음과 같다. (1)무용공연 마케팅전략 및 발전방안 연구, (2)무용공연 공간 및 공연만족 재관람요인 연구, (3)무대환경이 무용공연의 대중성 활성화와 기여도 연구, (4)무용공연 현황 및 무용단 운영사례 융합 연구, (5)다양한 소셜미디어 활용한 무용공연 확정성 연구, (6)기술적용 무용공연 콘텐츠 방향 및 개발 연구 6개의 주요 토픽이 도출되었다. 이에 무용공연을 비롯해 무용 분야 관련 연구의 시기, 사회 변화에 따른 연구 트렌드와 주제를 파악하고, 연구자들의 변화 관심 주제의 주요 핵심어를 추출해 키워드를 분석하였으며 시기별 주요 키워드를 비교 분석하였다. 이에 다각화되고 융합되면서 신기술이 적용되는 최신 연구 동향에 대한 발전적 연구의 필요성을 고민하고 제시하였다.

비정형 빅데이터를 이용한 COVID-19 주요 이슈 분석 (Analysis of Major COVID-19 Issues Using Unstructured Big Data)

  • 김진솔;신동훈;김희웅
    • 지식경영연구
    • /
    • 제22권2호
    • /
    • pp.145-165
    • /
    • 2021
  • 2019년 12월 말, 전 세계를 혼란에 빠트린 코로나바이러스감염증-19(COVID-19)의 팬데믹이 시작되었다. 이러한 위기를 극복하고 피해를 최소화하기 위해 정부와 기관에서는 기존의 정책지원 효과를 극대화하고 변화하는 사회를 반영한 전방위적 대응책 마련이 필요하다. 사회적으로 부각되는 논제와 관심사항의 주제를 파악하기 위해, 본 연구는 소셜미디어의 빅데이터를 통해 코로나19와 관련된 주요 생각, 태도, 감정 등을 파악한다. 특히 정부의 대응에 관한 대중의 견해를 알기 위해 '정부 대응방향'을 기준으로 시기를 나누어 분석을 진행했다. 분석에 활용한 데이터는 네이버를 통해 2019년 12월 31일부터 2020년 12월 12일까지 수집되었다. 또한, 분석을 위해 텍스트마이닝 기법 중 TF-IDF 키워드 추출과 LDA 토픽모델링을 활용하였다. 그 결과, 8개의 코로나19 관련 주요 이슈가 도출되었으며, 이러한 이슈 사항과 주요 키워드를 기반으로 해당 분야에서의 코로나19 및 감염병 대응 정책 전략을 제시하였다. 본 연구는 코로나19 팬데믹과 같은 위기상황에 정부와 관련 기관이 국민의 필요와 요구에 따른 정확한 대응책을 마련하는 데 기초자료를 제공했다는 점에서 의의를 가진다.

소셜미디어 데이터 분석을 활용한 COVID-19 전후 박쥐의 인식변화 연구 (A Study on the Perception Change of Bats after COVID-19 by Social Media Data Analysis)

  • 이주경;김벼리;김선숙
    • 환경영향평가
    • /
    • 제31권5호
    • /
    • pp.310-320
    • /
    • 2022
  • 본 연구는 국내 최대 소셜 네트워크인 블로그 글을 대상으로 텍스트마이닝 및 네트워크 분석을 통해 COVID-19 발생 후 '박쥐'에 대한 대중들의 인식 변화를 파악하였다. 국내에서 COVID-19 발생전 2019년부터 2020년까지 9,241건의 네이버 블로그 글을 수집하였다. 수집된 자료는 파이썬(Python)과 NetMiner 4.3.2으로 분석하였고, 시기별로 도출된 키워드와 키워드 간 연관성을 통해 박쥐에 대한 대중들의 인식을 심층적으로 분석하였다. 분석결과, 2020년 박쥐 키워드의 출현 빈도는 2019년에 비해 25배 이상 증가하였고, 중심성 수치 또한 3배 이상 증가되었다. 네트워크 분석 결과, '박쥐'에 대한 인식은 COVID-19 발생전과 후 차이를 나타냈다. COVID-19 이전에 박쥐는 야생동물의 한 종(Species)으로 인식되는 경향성이높았던 반면, COVID-19 발생 초기인 2020년 상반기에는 전염병 및 건강 분야와 연관시켜 인간사회를 위협할 수 있는 존재로 강하게 인식하였고, 하반기에는 생태 및 문화 유형 비중이 높아지면서 박쥐에 대한 관심영역이 확장된 것을 확인하였다. 본 연구는 COVID-19 발생 이후 질병 숙주로서 박쥐의 잠재적인 영향에 대한 대중들의 관심과 인식 변화에 대한 정보를 제공함으로써 질병연구의 확장과 공중보건 관리, 미래감염병 대응을 위한 방향을 제시하였다.

아동·청소년 대상 성범죄 팩션영화의 사회적 역할 탐색: 텍스트 마이닝 기법을 활용한 수용자 감정반응 분석 (Social Roles of Child Sexual Crime Faction Films: Text Mining Analysis of Audiences' Emotional Reactions)

  • 김호경;권기석
    • 한국산학기술학회논문지
    • /
    • 제18권6호
    • /
    • pp.662-672
    • /
    • 2017
  • 아동 청소년 대상 성범죄는 꾸준히 증가 추세에 있지만 실효적인 예방 전략을 수립하기는 역부족이다. 사회문제를 고발하는 영화는 관심을 증폭시키고 조속한 대응방안을 촉구하여 사회변화를 이끌어낸다. 본 연구는 텍스트 마이닝 기법을 활용하여 <도가니>, <소원>, 그리고 <한공주>를 중심으로 아동 청소년 대상 성범죄 팩션영화에 대한 수용자의 반응을 살펴보았다. 영화 개봉 이전 네이버 블로그 총 2,727개를 분석한 결과 사건을 설명하는 사실적인 단어가 빈번하게 등장하였고, 영화 개봉 이후 리뷰 코멘트 총 3,000개를 분석한 결과 감정적인 단어가 주로 언급되었다. 각 영화별로 긍정 부정형의 감정 범주와 정도에 있어서도 차이가 나타났다. <도가니>의 경우 '화나다'와 함께 '억울하다'와 같은 부정적 감정표현이 강한 단어들의 빈도가 높았다. <한공주>도 부정형의 감정단어만이 등장하였지만 '슬프다'는 감정이 가장 많이 등장하고 부정형 강도가 다소 약한 단어들이 뒤를 이었다. <소원>에는 긍정형의 감정표현인 '좋다' 범주가 유일하게 등장하였다. 즉 영화가 개봉되기 이전 수용자는 사건에 대해 객관적인 정보위주로 인식한 반면, 영화를 관람한 이후에는 주관적인 감정과 느낌을 표현하였다. 동일주제를 다루고 있지만, <도가니>는 폭발적인 분노를 일으켰고 사회변화를 이끄는 시민 참여적 움직임을 결성시켰다. 그 결과 성폭력 범죄에 대한 처벌을 강화하는 법률안이 처리되어 시행되는 계기를 마련하였다. 사회 고발적 팩션영화에 대한 수용자의 상이한 감정반응을 파악하고, 향후 사회변화를 이끄는 팩션영화의 방향성에 대해 논의하였다는 점에서 연구의 의의가 있다. 또한 텍스트마이닝을 활용하여 감정포현을 분석한 결과를 바탕으로, 향후 영화에 대한 다양한 감정표현을 위계적으로 분류하는 작업의 필요성이 제기된다.

텍스트마이닝을 활용한 노인 헬스케어 앱 사용 추이 및 동향 분석 (A Study on the Current Situation and Trend Analysis of The Elderly Healthcare Applications Using Big Data Analysis)

  • 변현;전상완;이은석
    • 한국융합학회논문지
    • /
    • 제13권5호
    • /
    • pp.313-325
    • /
    • 2022
  • 본 연구의 목적은 노인 헬스케어앱 시장의 변화 추이를 텍스트 마이닝 분석을 통해 살펴보고 노인 헬스케어앱 활성화를 위한 기초자료를 제시하고자 한다. 데이터 수집은 네이버, 다음, 블로그 웹, 까페를 대상으로 이루어졌으며, 연구방법은 빅데이터 분석 프로그램인 텍스톰(Textom)과 Ucinet6를 이용하여 텍스트마이닝, TF-IDF(Term frequency-inverse document frequency), 감성분석, 의미연결망분석을 실시하였다. 워드 클라우드를 실시한 결과 빈도 순으로 현장교육, 헬스케어, 전신재활운동기구, 서비스, 운동 등으로 나타났으며, TF-IDF 순위로는 현장교육, 헬스케어, 재활운동기구, 서비스, 건강 순으로 나타났다. 노인 스포츠 어플리케이션에 대한 감성분석을 실시한 결과 긍정비율로 81.3%, 부정비율이 18.7%로 나타났으며, 헬스케어앱 정보격차 해소, 융복합 헬스케어기술, 확산매체, 노인헬스케어앱 산업, 사회적 배경, 콘텐츠로 총 6개의 범주가 최종적으로 도출되었다. 결론적으로 노인 헬스케어앱이 노인들에게 수용 및 활용되기 위해 확산 인프라가 잘 갖추어져 있어야 하며, 융복합 기술의 적극적인 도입과 노인도 쉽게 사용할 수 있는 콘텐츠 개발을 통해 헬스케어 앱의 효과를 극대화하여야 한다.

소셜미디어 데이터를 활용한 태안해안국립공원 방문객의 경관인식 파악 - 꽃지해수욕장·신두리해안사구·만리포해수욕장을 대상으로 - (Identifying Landscape Perceptions of Visitors' to the Taean Coast National Park Using Social Media Data - Focused on Kkotji Beach, Sinduri Coastal Sand Dune, and Manlipo Beach -)

  • 이성희;손용훈
    • 한국조경학회지
    • /
    • 제46권5호
    • /
    • pp.10-21
    • /
    • 2018
  • 실제 이용자의 경험을 파악하는 것은 경관관리에 있어서 중요한 관점 중 하나이다. 본 연구는 이점에서 착안하여 블로그 글을 대상으로 텍스트마이닝을 활용하여 이용자들이 자발적으로 올린 글을 바탕으로 그 안에 담긴 경관인식을 파악하였다. 연구 대상지는 태안해안국립공원으로 하였다. '태안 여행'으로 검색하여 나타난 장소는 대부분 태안해안국립공원에 해당되는 곳이었고, 도출된 장소 중 상위 세 곳을 대상으로 에고네트워크 분석을 실시하고, 각 장소 명칭과 연결된 경관인식에 관련한 키워드(장소, 이미지, 활동, 경관대상물)를 추출하였다. 마지막으로, 중심성 분석과 응집성 분석을 통해 각 장소에 대한 사람들의 경관인식과 주요이슈를 도출하고 의미를 해석하였다. 연구결과로 태안 여행에서 인지되는 주요 장소, 그리고 구체적인 장소에서의 개별적인 경관체험과 경관인식을 파악할 수 있었다. 꽃지해수욕장은 장소 관련 키워드가, 신두리해안사구는 경관이미지에 대한 키워드가, 그리고 만리포해수욕장은 경관요소와 관련된 키워드가 주로 나타나고 있어, 방문객이 인식하는 세 장소의 경관 특성이 상이함을 유추할 수 있다. 구체적으로는 꽃지해수욕장은 일몰경관 감상의 명소이자 태안해안국립공원 트래킹 코스의 거점으로서 인식되고 있으며, 신두리해안사구는 비일상적 경관을 보유한 곳이자 생태적으로 가치가 높은 공간으로 보존의 대상으로 인식되고 있는 것으로 나타났다. 마지막으로 만리포해수욕장은 천리포수목원과 인접하고 있어 높은 방문이 이루어지며, 해변 자체의 모습이 인상적인 곳으로 인식되고 있었다. 소셜미디어 데이터는 이용자 관점에서의 분석자료이므로, 전문가의 관점에서 미처 보지 못했던 다양한 내용을 분석할 수 있어서 매우 유용한 자료이다. 본 연구에서는 경관인식 연구에 소셜미디어 데이터를 활용하여 경관대상, 경관이미지, 활동 등의 여러 내용을 종합하여 사람들이 어떻게 경관을 인식하고 향유하는지를 다각적으로 분석하였다. 다만 소셜미디어 데이터는 작성자의 기억과 인식이 증폭되거나 왜곡될 가능성이 있기 때문에, 보다 정확한 분석을 위해서는 추후 현장에서 설문조사 등을 실시하여 본 연구의 결과와 비교, 검증하는 후속 연구가 필요하다.

브랜드 개성 효과: 트위터 상의 브랜드 개성 전달이 온라인 커뮤니티 참여에 미치는 영향 (The Brand Personality Effect: Communicating Brand Personality on Twitter and its Influence on Online Community Engagement)

  • 루스 안젤리 크루즈;이홍주
    • 지능정보연구
    • /
    • 제20권1호
    • /
    • pp.67-101
    • /
    • 2014
  • 새로운 기술의 활용은 고객과의 관계를 맺기위한 기업들의 마케팅 전략을 변모시켜왔다. 새로운 기술 중에서 소셜 미디어는 기업들이 온라인 고객들에게 다가가기 위한 도구이며, 유명한 소셜 미디어 사이트 중의 하나는 마이크로 블로깅 플랫폼인 트위터이다. 매일 5억건이상의 트윗이 발생하기때문에 연구자들에게는 풍부한 데이터의 원천이며, 기업들에겐 매력적인 마케팅 채널이다. 그럼에도 불구하고 효과적인 트위터 활용전략을 수립하는 것이 어려우며, 이는 적절한 트위터 활용에 대한 이론적인 또는 실증적인 검증이 이루어지지 않았기 때문이다. 본 연구는 기업들이 마케팅 채널로서의 트위터를 어떻게 효과적으로 활용할 수 있는지에 대한 실증적인 근거를 브랜드 개성과 브랜드 관여를 중심으로 연구하여 제공하고자 한다. 본 연구는 Aaker의 브랜드 개성에 대한 연구에서 제시한 브랜드 개성 척도를 활용하여 트위터 메시지가 브랜드 개성을 띄고 있는지와 이에 따른 고객들의 참여와 반응을 분석하고자 한다. 또한, 제품의 관여도에 따라서 조절효과가 존재하는지도 분석하였다. 23개 브랜드의 8주간의 트위터 계정의 포스팅을 수집하였으며, 오피니언 마이닝을 통하여 연구 가설을 검증하였다. 구체적인 본 연구의 목적은 첫째로 마케팅 연구에서 제시된 브랜드 개성의 개념이 소셜 미디어인 트위터에도 적용이 가능한지 분석하는 것이다. 둘째는 오프라인 브랜드 개성과 온라인 브랜드 개성간의 일치여부와 소셜 미디어 브랜드 커뮤니티의 활성화간의 관계를 밝히고자 한다. 마지막으로, 제품의 관여도에 따라 온라인/오프라인 브랜드 개성의 일치도가 조절효과를 갖는지를 분석하고자 한다.