• 제목/요약/키워드: news data

검색결과 885건 처리시간 0.024초

소셜 빅데이터 마이닝 기반 실시간 랜섬웨어 전파 감지 시스템 (Real-Time Ransomware Infection Detection System Based on Social Big Data Mining)

  • 김미희;윤준혁
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제7권10호
    • /
    • pp.251-258
    • /
    • 2018
  • 파일을 암호화시켜 몸값을 요구하는 악성 소프트웨어인 랜섬웨어는 빠른 전파력과 지능화로 더욱 위협적이 되고 있다. 이에 빠른 탐지 및 위험 분석이 요구되고 있지만, 실시간 분석 및 보고가 미비한 상태이다. 본 논문에서는 실시간 분석이 가능하도록 소셜 빅데이터 마이닝 기술을 활용하여 랜섬웨어 전파 감지 시스템을 제안한다. 본 시스템에서는 트위터 스트림을 실시간 분석하여 랜섬웨어와 관련된 키워드를 가진 트윗을 크롤링한다. 또한 뉴스피드 분석기를 통해 뉴스서버를 크롤링하여 랜섬웨어 관련 키워드를 추출하고, 보안업체의 서버나 탐색 엔진을 통해 뉴스나 통계데이터를 추출한다. 수집된 데이터는 데이터 마이닝 알고리즘으로 랜섬웨어 감염 정도를 분석한다. 2017년 전파가 많이 되었던 워너크라이와 록키 랜섬웨어 감염전파 시 관련 트윗의 수와 구글 트렌드(통계 정보) 정보, 관련 기사를 비교하여 트윗을 이용한 본 시스템의 랜섬웨어 감염 탐지 가능성을 보이고, 엔트로피와 카이-스퀘어 분석을 통해 제안 시스템 성능을 보인다.

KOSPI index prediction using topic modeling and LSTM

  • Jin-Hyeon Joo;Geun-Duk Park
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권7호
    • /
    • pp.73-80
    • /
    • 2024
  • 본 연구는 토픽 모델링과 장단기 기억(LSTM) 신경망을 결합하여 한국 종합주가지수(KOSPI) 예측의 정확도를 향상하는 방법을 제안한다. 본 논문에서는 LDA(Latent Dirichlet Allocation) 기법을 이용해 금융 뉴스 데이터에서 금리 인상 및 인하와 관련된 10개의 주요 주제를 추출하고, 추출된 주제를 과거 KOSPI 지수와 함께 LSTM 모델에 입력하여 KOSPI 지수를 예측하는 모델을 제안한다. 제안된 모델은 과거 KOSPI 지수를 LSTM 모델에 입력하여 시계열 예측 방법과 뉴스 데이터를 입력하여 토픽 모델링하는 방법을 결합하여 KOSPI 지수를 예측하는 특성을 가진다. 제안된 모델의 성능을 검증하기 위해, 본 논문에서는 LSTM의 입력 데이터의 종류에 따라 4개의 모델(LSTM_K 모델, LSTM_KNS 모델, LDA_K 모델, LDA_KNS 모델)을 설계하고 각 모델의 예측 성능을 제시하였다. 예측 성능을 비교한 결과, 금융 뉴스 주제 데이터와 과거 KOSPI 지수 데이터를 입력으로 하는 LSTM 모델(LDA_K 모델)이 가장 낮은 RMSE(Root Mean Square Error)를 기록하여 가장 좋은 예측 성능을 보였다.

뉴스기사 빅데이터의 키워드분석을 활용한 창업 트렌드 분석:2013~2022 (Analysis entrepreneurship trends using keyword analysis of news article Big Data :2013~2022)

  • 김재억;전병훈
    • Journal of Platform Technology
    • /
    • 제11권3호
    • /
    • pp.83-97
    • /
    • 2023
  • 본 연구는 시멘틱 네트워크 분석을 통해 방대한 뉴스 기사를 분석하여 창업 트렌드를 파악하고자 하였다. 한국언론진흥재단에서 제공하는 빅카인즈 기사 분석 서비스를 이용해 2013년 1월부터 2022년 12월까지 19개 신문사의 뉴스 기사 330,628건을 종합적으로 분석하였다. 이 연구는 사회적 환경과 글로벌 경제 트렌드가 창업에 미치는 영향을 고려하여 최근 10년 동안 주요 이슈의 변화를 탐구하는 데 중점을 두었다. 또한 코로나-19 팬데믹 전후의 뉴스 기사 수와 이슈 변화를 비교하여 빈도 분석, 관계 분석, 연관어 분석을 통해 창업 트렌드를 시각화 하여 제시하였다. 연구 결과, 창업 연관어의 상위 키워드는 창업의 활성화, 사업화 등이고, 코로나-19와 창업 키워드 간의 상관관계는 선형적인 의미에서 거의 무시할 수 있는 수준이었으나, 팬데믹 기간동안 뉴스 기사 수는 감소하여 영향을 미치는 것으로 나타났다. 특히 가장 많이 언급된 키워드는 중소벤처기업부, 장소는 미국, 인물은 한정화. 기관은 중소벤처기업부로 나타났으며 창업분야는 어떤 분야보다 사회적 이슈에 다각적인 영향을 받고,시기적 접근 빈도가 증가하는 중요한 특징이 나타났다. 본 연구결과는 창업 관련 이슈 및 사건에 대한 이해와 탐구에 필수적인 기초자료를 제공하여 향후 해당 분야 연구주제를 제안할 연구로서의 의미가 있다.

  • PDF

지역사회발전을 위한 지역신문의 역할 (A Study on the Role of the Local Newspaper for Community Development)

  • 남부현;김성수
    • 농촌지도와개발
    • /
    • 제3권1호
    • /
    • pp.141-155
    • /
    • 1996
  • The purpose of this study was to investigate the sole of local newspaper for community development in Korea. Specific objectives of the study were : 1) to identify the role of local newspaper in community development, 2) to analyze problems and situations on local newspapers in Korea, and 3) to suggest desirable roles of local newspaper for the community development. To attain the above objectives, this study was carried out through literature review, contest analysis of selected local newspapers, and the questionnaire survey of selected readers of local newspaper. The data were collected from 267 readers of local newspaper who participated in the farmers` training session in the Rural Development Administration, by using questionnaires developed by the researcher, and total of 263 questionnaires were analyzed. The statistical techniques used for the study were frequence, percentile, standard deviation utilizing the $SPSS/PC^+$. The major findings of the study were as follows : 1. The major roles of functions of local newspapers identified in this study were summarized as to reinforce the community consciousness, to form community opinion, to watch and to monitor community environment, to provide education and entertainment, and to contribute to the conveyance and promotion of community culture. 2. The general characteristic of local newspaper readers surveyed were; a) average distance from town to their village was 9.3 Km, b) average age was 29 years, c) about 75% of them were senior high school graduates, and d) about 96% of them participated in group activities. 3. About 45% of the respondents used television or radio for their moor sources of local news were TV or radio, while about 31% respondents used immunity newspaper for their moor sources of local news. About 67% of the respondents kept their readership over two years, and about 40% of them read community newspaper regularly at their home. 4. The results of content analysis showed drat the local newspapers were dealing with articles on cultural affairs, community consciousness, administrative and civic affairs, however, there were not enough educational news, and various kinds of general news in the community. 5. Survey also showed the most needed news were ; 1) political news including administrative and civic affairs, 2) economic news including sales and distribution, 3) social news including social problems on environmental pollution and community development works, 4) educational news including technology and information, 5) cultural news including guide to cultural and historical sites and local brief news. 6. In the evaluation of local newspaper, the readers were generally positive in valued roles of local newspaper in community relations, community development, promoting community cohesion and understanding of community members, and about 40% of the respondents were positive in predicting the bright future perspectives of local newspapers. 7. In the readers` evaluation of local newspaper, readers responded that local newspapers were very closely related to the community and residents, reflecting the current concerns of local population and recognizing the value of community media, and the contents of local newspaper were positively related to daily lives of community residents and opinions of overall community.

  • PDF

우리말 신문기사 검색을 위한 질문응답시스템 구현에 관한 연구 (Design of a Korean Question-Answering System for News Item Retrieval)

  • 정영미
    • 정보관리학회지
    • /
    • 제4권1호
    • /
    • pp.3-23
    • /
    • 1987
  • 이 연구에서 구현한 질문응답시스템은 한글 자연어로 된 텍스트와 질문을 자동으로 처리하는 지능형 정보시스템이다. 입력데이타는 스포츠관계 기사로 국한하였으며 프로그래밍 언어로는 코볼을 사용하였다. 이 시스템의 구문분석기는 격문법에 기초한 것으로서 어휘사전, 용언의 격프레임, 언어학적 규칙 등을 사용하여 문장을 분석한다. 본문검색과 사실검색이 모두 가능한 이 시스템에서는 질문에 대한 해답이 문장형태이거나 사실데이타 형태로 출력된다.

  • PDF

Analysis of the Empirical Effects of Contextual Matching Advertising for Online News

  • Oh, Hyo-Jung;Lee, Chang-Ki;Lee, Chung-Hee
    • ETRI Journal
    • /
    • 제34권2호
    • /
    • pp.292-295
    • /
    • 2012
  • Beyond the simple keyword matching methods in contextual advertising, we propose a rich contextual matching (CM) model adopting a classification method for topic targeting and a query expansion method for semantic ad matching. This letter reports on an investigation into the empirical effects of the CM model by comparing the click-through rates (CTRs) of two practical online news advertising systems. Based on the evaluation results from over 100 million impressions, we prove that the average CTR of our proposed model outperforms that of a traditional model.

통계적 기법을 이용한 화자변화 검출 실험 (A Speaker Change Detection Experiment that Uses a Statistical Method)

  • 이경록;김진영
    • 음성과학
    • /
    • 제8권4호
    • /
    • pp.59-72
    • /
    • 2001
  • In this paper, we experimented with speaker change detection that uses a statistical method for NOD (News On Demand) service. A specified speaker's change can find out content of each data in speech if analysed because it means change of data contents in news data. Speaker change detection acts as preprocessor that divide input speech by speaker. This is an important preprocessor phase for speaker tracking. We detected speaker change using GLR(generalized likelihood ratio) distance base division and BIC (Bayesian information criterion) base division among matrix method. An experiment verified speaker change point using BIC base division after divide by speaker unit using GLR distance base method first. In the experimental result, FAR (False Alarm Rate) was 63.29 in high noise environment and FAR was 54.28 in low noise environment in MDR (Missed Detection Rate) 15% neighborhood.

  • PDF

A Study on the Analysis of Museum Gamification Keywords Using Social Media Big Data

  • Jeon, Se-won;Choi, YounHee;Moon, Seok-Jae;Yoo, Kyung-Mi;Ryu, Gi-Hwan
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제13권4호
    • /
    • pp.66-71
    • /
    • 2021
  • The purpose of this paper is to identify keywords related to museums, gamification, and visitors, and provide basic data that the museum market can be expanded by using gamification. That used to collect data for blogs, news, cafes, intellectuals, academic information by Naver and Daum which is Web documents in Korea, and Google Web, news, Facebook, Baidu, YouTube, and Twitter for analysis. For the data analysis period, a total of one year of data was selected from April 16, 2020 to April 16, 2021, after Corona. For data collection and analysis, the frequency and matrix of keywords were extracted through Textom, a social matrix site, and the relationship and connection centrality between keywords were analysed and visualized using the Netdraw function in the UCINET6 program. In addition, We performed CONCOR analysis to derive clusters for similar keywords. As a result, a total of 25,761 cases that analysing the keywords of museum, gamification and visitors were derived. This shows that the museum, gamification, and spectators are related to each other. Furthermore, if a system using gamification is developed for museums, the museum market can be developed.

A Study on the Promotion of Yakseon Food Using Big Data

  • LEE, JINHO;KIM, AE SOOK;Hwang, Chi-Gon;Ryu, Gi Hwan
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제14권4호
    • /
    • pp.41-46
    • /
    • 2022
  • The purpose of this study is to confirm and analyze the impact on consumers through big data keyword analysis on weak food. For data collection, web documents, blogs, news, cafes, intellectuals, academic information, and Google Web, news, and Facebook provided by Naver and Daum were used as analysis targets. The data analysis period was set from January 2018 to December 2021. For data collection and analysis, the frequency and matrix of keywords were extracted through Textom, a social matrix site, and the relationship and connection centrality between keywords were analyzed and visualized using the Netdraw function among UCINET6 programs. In addition, CONCOR analysis was conducted to derive clusters for similar keywords. As a result of analyzing yakseon food with keywords, a total of 35,985 cases of collected data were derived. Through this, it was confirmed that medicinal food affects consumers. Furthermore, if a business model is created and developed through yakseon food, it will be possible to lead the popularization of yakseon food.

빅데이터 분석기법을 활용한 아파트 가격 관련 뉴스 기사의 극성 분석 (A Study on the Polarity of Apartment Price News Using Big Data Analysis Method)

  • 조상연;홍은표
    • 디지털융복합연구
    • /
    • 제17권9호
    • /
    • pp.47-54
    • /
    • 2019
  • 본 연구는 빅데이터 분석 방법인 오피니언 마이닝을 사용하여 아파트 가격 관련 뉴스 기사의 극성을 확인하는 연구로 자료는 2012년, 2018년 2년간 네이버에 게시된 인터넷 뉴스 기사를 사용하였다. 감성분석 모형을 모델링하고 주제 지향형 감성사전 구축 방법을 제안하였다. 제안한 감성분석 모형을 통해 분석한 결과, 아파트 가격이 상승하는 시기에는 사회적 이슈 선정에 있어서 언론사의 성향에 따라 차이가 있는 것을 확인하였고 정부와 동일한 성향의 언론사에서 긍정 기사가 많은 것을 확인하였다. 부동산 분야에서 사용할 수 있는 감성분석 모형을 제시하고 부동산 관련 비정형 데이터의 극성을 분석하였다는 것에 의의가 있다. 향후 다양한 분야에 접목하기 위해서는 주제별 감성사전을 구축해야 하며 다양한 비정형 데이터를 수집하고 수집 기간을 확장하는 것이 필요하다.