• 제목/요약/키워드: news big data

검색결과 287건 처리시간 0.025초

Political Opinion Mining from Article Comments using Deep Learning

  • Sung, Dae-Kyung;Jeong, Young-Seob
    • 한국컴퓨터정보학회논문지
    • /
    • 제23권1호
    • /
    • pp.9-15
    • /
    • 2018
  • Policy polls, which investigate the degree of support that the policy has for policy implementation, play an important role in making decisions. As the number of Internet users increases, the public is actively commenting on their policy news stories. Current policy polls tend to rely heavily on phone and offline surveys. Collecting and analyzing policy articles is useful in policy surveys. In this study, we propose a method of analyzing comments using deep learning technology showing outstanding performance in various fields. In particular, we designed various models based on the recurrent neural network (RNN) which is suitable for sequential data and compared the performance with the support vector machine (SVM), which is a traditional machine learning model. For all test sets, the SVM model show an accuracy of 0.73 and the RNN model have an accuracy of 0.83.

호가창과 뉴스 헤드라인을 이용한 딥러닝 기반 주가 변동 예측 기법 (Deep Learning-based Stock Price Prediction Using Limit Order Books and News Headlines)

  • 류의림;이기용;정연돈
    • 한국전자거래학회지
    • /
    • 제27권1호
    • /
    • pp.63-79
    • /
    • 2022
  • 최근 머신러닝 및 딥러닝 기법을 활용한 주식 가격 예측 연구가 다양하게 이루어지고 있다. 그 중에서도 최근에는 주식 매수 및 매도 주문 정보를 담고 있는 호가창을 이용하여 주가를 예측하려는 연구가 시도되고 있다. 하지만 호가창을 활용한 연구는 대부분 가장 최근 일정 기간 동안의 호가창 추이만을 고려하며, 호가창의 중기 추이와 단기 추이를 같이 고려하는 연구는 거의 진행되지 않았다. 이에 본 논문에서는 호가창의 중기와 단기 추이를 모두 고려하여 주가 등락을 보다 정확히 예측하는 딥러닝 기반 예측 모델을 제안한다. 더욱이 본 논문에서 제안하는 모델은 중단기 호가창 정보 외에도 해당 종목에 대한 동기간 뉴스 헤드라인까지 고려하여 기업의 정성적 상황까지 주가 예측에 반영한다. 본 논문에서 제안하는 딥러닝 기반 예측 모델은 호가창 변화의 특징을 합성곱 신경망으로 추출하고 뉴스 헤드라인의 특징을 Word2vec을 이용하여 추출한 뒤, 이들 정보를 결합하여 특정 기업 주식의 다음 날 등락 여부를 예측한다. 실제 NASDAQ 호가창 데이터와 뉴스 헤드라인 데이터를 사용하여 제안 모델로 5개 종목(Amazon, Apple, Facebook, Google, Tesla)의 일일 주가 등락을 예측한 결과, 제안 모델은 기존 모델에 비해 정확도를 최대 17.66%p, 평균 14.47%p 향상시켰다. 또한 해당 모델로 모의 투자를 수행한 결과, 21 영업일 동안 종목에 따라 최소 $492.46, 최대 $2,840.83의 수익을 얻었다.

A Study on the Smart Tourism Awareness through Bigdata Analysis

  • LEE, Song-Yi;LEE, Hwan-Soo
    • 산경연구논집
    • /
    • 제11권5호
    • /
    • pp.45-52
    • /
    • 2020
  • Purpose: In the 4th industrial revolution, services that incorporate various smart technologies in the tourism sector have begun to gain popularity. Accordingly, academic discussions on smart tourism have also started to become active in various fields. Despite recent research, the definition of smart tourism is still ambiguous, and it is not easy to differentiate its scope or characteristics from traditional tourism concepts. Thus, this study aims to analyze the perception of smart tourism exposed online to identify the current point of smart tourism in Korea and present the research direction for conceptualizing smart tourism suitable for the domestic situation. Research design, data, and methodology: This study analyzes the perception of smart tourism exposed online based on 20,198 news data from portal sites over the past six years. Data on words used with smart tourism were collected from the leading portal sites Naver, Daum, and Google. Text mining techniques were applied to identify the social awareness status of smart tourism. Network analysis was used to visualize the results between words related to smart tourism, and CONCOR analysis was conducted to derive clusters formed by words having similarity. Results: As a result of keyword analysis, the frequency of words related to the development and construction of smart tourism areas was high. The analysis of the centrality of the connection between words showed that the frequency of keywords was similar, and that the words "smartphones" and "China" had relatively high connection centrality. The results of network analysis and CONCOR indicated that words were formed into eight groups including related technologies, promotion, globalization, service introduction, innovation, regional society, activation, and utilization guide. The overall results of data analysis showed that the development of smart tourism cities was a noticeable issue. Conclusions: This study is meaningful in that it clearly reflects the differences in the perception of smart tourism between online and research trends despite various efforts to develop smart tourism in Korea. In addition, this study highlights the need to understand smart tourism concepts and enhance academic discussions. It is expected that such academic discussions will contribute to improving the competitiveness of smart tourism research in Korea.

서비스워커 기반의 캐싱 시스템을 이용한 웹 콘텐츠 로딩 속도 향상 기법 (Web Content Loading Speed Enhancement Method using Service Walker-based Caching System)

  • 김현국;박진태;최문혁;문일영
    • 한국항행학회논문지
    • /
    • 제23권1호
    • /
    • pp.55-60
    • /
    • 2019
  • contents and big data웹은 사람들의 일상생활에 있어 가장 밀접한 기술 중 하나로 오늘날 대부분의 사람들은 웹을 통해 데이터를 공유하고 있다. 단순 메신저, 뉴스, 영상뿐만 아니라 다양한 데이터가 현재 웹을 통하여 전파되고 있는 셈이다. 또한 웹 어셈블리 기술이 등장하면서 기존 네이티브 환경에서 구동되던 프로그램들이 웹의 영역에 진입하기 시작하면서 웹이 공유하는 데이터는 이제 VR/AR 콘텐츠, 빅데이터 등 그 범주가 점차 넓어지고, 크기가 거대해지고 있다. 따라서 본 논문에서는 브라우저에 종속적이지 않고 독립적으로 동작이 가능한 서비스워커와 웹 브라우저 내에 데이터를 효과적으로 저장할 수 있는 캐시 API를 활용하여 웹 서비스를 사용하는 사용자들에게 웹 콘텐츠를 효과적으로 전달할 수 있는 방법을 제시하였다.

Analysis on Media Reports of the 「Security Services Industry Act」 Using News Big Data -Focusing on the Period from 1990 to 2021-

  • Cho, Cheol-Kyu;Park, Su-Hyeon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권5호
    • /
    • pp.199-204
    • /
    • 2022
  • 이 연구의 목적은 경비업법에 대한 연구자들의 관점이 아닌 언론보도 빅데이터를 분석하여 경비업법에 대한 이해를 넓히고 다양한 현상들에 대한 의미를 살펴보는데 연구의 목적을 두고 있다. 연구방법은 우리니라의 범죄예방과 사회질서유지의 중요한 주체로써 경비업무의 대한 규정하고 있는 「경비업법」을 키워드로 검색하였다. 자료검색은 빅카인즈에서 제공가능한 1990년부터 2021년까지로 하였다. 또한 자료검색 기간동안의 구체적인 분석을 위해 정착기(1976~2001), 성장기-양적(2002~2012), 성장기-질적(2013~2021)로 구분하여 분석하였다 연구결과에 따른 경비업법의 언론보도 인식은 시대의 흐름에 따라 민간경비의 사회적 역할 및 중요성은 계속 강조되고 있다고 볼 수 있다. 그에 따른 민간경비의 시장성은 앞으로도 다양한 산업군과 결합되어 국민의 생명과 재산을 보호하는데 큰 역할을 할 것으로 판단된다. 하지만 경찰과 더불어 치안서비스를 제공하는 민간경비산업은 법적 규제 및 불법적인 문제들로 야기되는 다양한 사회적 이슈로 인해 민간경비산업의 발전을 저해하는 요소로 부각될 수 있기 때문에 거기에 따른 책임 및 역할을 더욱더 강화시킬 필요성이 제기된다.

<메르스>에 대한 은유와 이데올로기적 함축: KBS와 JTBC 뉴스 보도를 중심으로 (Metaphors for MERS and Their Ideological Meaning: Focusing on the news reports from Korean media KBS and JTBC)

  • 전혜영;유희재
    • 한국어학
    • /
    • 제72권
    • /
    • pp.199-225
    • /
    • 2016
  • This study has two main purposes: to establish a list of source domains in the metaphors for Middle East respiratory syndrome (MERS) and to uncover ideological meanings embedded in them in Korean news reports from KBS and JTBC. The first part of this study presents metaphors such as [MERS IS WAR], [MERS IS WAVE], [MERS IS A LIVING THING], and [MERS IS A THING], which were found in the data. The latter part of this study deals with how the two broadcasting companies use these metaphors differently according to their ideologies. In the metaphor of [MERS IS WAR], KBS tends to show less of the agents who controls the war since the war against MERS has failed which casts responsibility to the controlling agents, the government and big hospitals. In this, KBS tries to present less of the information of the responsible agents that presented in JTBC. Through the metaphor of [MERS IS WAVE], KBS presents the aftermath of MERS as something not serious. Compared to JTBC, KBS tends to suggest that the aftermath of MERS is predominantly an economic effects by metaphorically suggesting that predominantly the economic sector got hit by MERS.

공공데이터와 감성분석을 이용한 대학평판시스템 (The College Reputation System using Public Data and Sentiment Analysis)

  • 김은아;이연식
    • 융합보안논문지
    • /
    • 제18권1호
    • /
    • pp.103-110
    • /
    • 2018
  • 현대 사회는 인터넷과 SNS를 통해 발생하는 복합적이며 대량의 데이터를 수집 집계 분석하는 빅데이터 처리 기술이 여러 분야에서 요구되고 있다. 그 중 대표적인 활용분야가 기업이나 대학에 대한 평판을 평가하는 평판시스템이다. 대학평판을 측정하고 수치화하기 위해서는 공정하고 객관적인 자료와 효율적인 데이터 처리가 무엇보다도 중요하다. 이를 위하여 공공데이터 지표를 활용하여 정량지수를 구하였고, 뉴스 기사를 활용한 감성분석을 통해서 정성지수를 구한 후 혼합 대학평판 지수를 산출하였다. 본 논문에서는 대학평판을 측정하기 위하여 정량지수로 객관성을 확보하면서 감성적 평판을 반영한 혼합 대학평판 지수를 산출하였고 이를 바탕으로 혼합 대학평판 시스템을 제안하였다.

  • PDF

시스템적인 군집 확인과 뉴스를 이용한 주가 예측 (Predicting stock movements based on financial news with systematic group identification)

  • 성노윤;남기환
    • 지능정보연구
    • /
    • 제25권3호
    • /
    • pp.1-17
    • /
    • 2019
  • 빅데이터 시대에 정보의 양이 급증하고, 그중 많은 부분을 차지하는 문자열 정보를 정량화하여 의미를 찾아 낼 수 있는 인공지능 방법론이 함께 발전하면서, 텍스트 마이닝을 통해 주가 예측에 적용해 온라인 뉴스로 주가를 예측하려는 시도가 다양해지고 있다. 이러한 주가 예측의 방법은 대개 예측하고자 하는 기업의 뉴스로 주가를 예측하는 방식이다. 하지만 특정 회사의 뉴스만이 그 회사의 주가에 영향을 주는 것이 아니라, 그 회사와 관련성이 높은 회사들의 뉴스 또한 주가에 영향을 줄 수 있다. 그러나 관련성이 높은 기업을 찾는 것은 시장 전반의 공통적인 영향과 무작위 신호 때문에 쉽지 않다. 따라서 기존 연구들은 주로 미리 정해진 국제 산업 분류 표준에 기반을 둬 관련성이 높은 기업을 찾았다. 하지만 최근 연구에 따르면, 국제 산업 분류 표준은 섹터에 따라 동질성이 다르며, 동질성이 낮은 섹터는 그들을 모두 함께 고려하여 주가를 예측하는 것이 성능에 악영향을 줄 수 있다는 한계점을 가진다. 이러한 한계점을 극복하기 위해, 본 논문에서는 주가 예측 연구에서 처음으로 경제물리학에서 주로 사용되는 무작위 행렬 이론을 사용하여 시장 전반 효과와 무작위 신호를 제거하고 군집 분석을 시행하여 관련성이 높은 회사를 찾는 방법을 제시하였다. 또한, 이를 기반으로 관련성이 높은 회사의 뉴스를 함께 고려하며 다중 커널 학습을 사용하는 인공지능 모형을 제시한다. 본 논문의 결과는 무작위 행렬 이론을 통해 시장 전반의 효과와 무작위 신호를 제거하여 정확한 상관 계수를 찾아 군집 분석을 시행한다면 기존 연구보다 더 좋은 성능을 보여 준다는 것을 보여준다.

토픽모델링과 시계열 회귀분석을 활용한 헬스케어 분야의 뉴스 빅데이터 분석 연구 (Big Data News Analysis in Healthcare Using Topic Modeling and Time Series Regression Analysis)

  • 김은정;장석권;이상용
    • 경영정보학연구
    • /
    • 제25권3호
    • /
    • pp.163-177
    • /
    • 2023
  • 본 연구는 디지털 헬스케어 산업 활성화를 위한 정책적 접근으로서, 주요 의제 도출 및 정책적 시사점을 제시하는데 목적이 있다. 본 연구에서는 10년(2013년~2022년) 간의 헬스케어와 관련된 뉴스 빅데이터 총 91,873건을 수집하여 토픽모델링 분석, 다차원척도 분석 및 시계열 회귀분석을 수행하였다. 토픽모델링 분석 및 다차원척도법을 통해 총 20개의 토픽을 도출하여 2차원선상에 토픽들의 군집 형태를 파악하였고, 시계열 회귀분석을 통해, 상승 추세를 나타내는 4개의 Hot topic(건강관리, 바이오제약, 기업매출·전망, 정부·정책)과 하향 추세를 나타내는 3개의 Cold topic(스마트기기, 주식·투자, 도시·건설)을 도출되었다. 본 연구의 결과는 우리나라 정책을 수립하는 정부 기관에 중요한 기초 자료로 활용될 수 있을 것이다.

인구절벽사회에서 노인과 일자리 감성분석 (Sentiment Analysis of Elderly and Job in the Demographic Cliff)

  • 김양우
    • 한국콘텐츠학회논문지
    • /
    • 제20권11호
    • /
    • pp.110-118
    • /
    • 2020
  • 소셜미디어 데이터는 우리사회의 문제점과 여론의 향방을 알 수 있는 대리지표로서의 역할을 하고 있다. 이 연구는 2016년부터 2018년 까지 뉴스데이터 109,015건 건의 자료를 활용하여 우리사회 노인과 일자리 감성분석을 실시함으로써, 고령사회와 인구절벽에 직면한 한국 사회에서, 가용노동력 확대 가능성을 알아보았다. 노인 일자리 토픽키워드로 '노인*일자리', '노인*고용', '노인*임금' 등을 사용하였다. 감성분석결과, 대부분의 기간에서는 긍정적 감성이 우세하여 생산연령인구 확충가능성을 알 수 있었다. 노인 일자리확대관련 긍정 감성과 저임금관련 부정감성으로, 일은 하지만 여전히 빈곤한 노인의 실태가 나타났다. 본 연구에서는 소셜 빅데이터를 활용하여 계층적 군집분석과 연관 텍스트분석으로 노인과 일자리 관련 우리사회의 인식과 감성을 분석하였다.