• Title/Summary/Keyword: Big data Processing

Search Result 1,063, Processing Time 0.031 seconds

Pizza Sales Prediction by Using Big Data Analysis. (빅데이터 분석을 통한 피자 판매량 예측)

  • Lee, Daebum;Kim, Kyoungsup;Lee, Youngsoo;Kim, Hanahan;Byun, Dongsam;Park, Sungchul;Jeon, Hwaseong;Kim, Juntae
    • Annual Conference of KIPS
    • /
    • 2014.11a
    • /
    • pp.890-893
    • /
    • 2014
  • IT산업의 새로운 패러다임으로 빅데이터 분석이 주요한 기술로 부각되고 있다. 본 논문에서는 빅데이터를 수집, 분석하여 이를 통해 피자 판매량을 예측하는 모델을 제안한다. 판매량 예측을 위하여 과거 판매 데이터와 함께 공휴일, 날씨, 뉴스기사, 경제지표, 트렌드, 스포츠 이벤트 등의 데이터를 수집하여 이용하였으며, 판매량 예측 방법으로는 회기분석과 인공신경망 학습 등을 사용하여 빅데이터를 사용하지 않은 경우와 정확도를 비교하였다. 실험 결과 빅데이터를 이용함으로써 예측 오차율이 5%이상 향상됨을 확인하였다.

News Big Data Analysis System for Public Issue Extraction (공공이슈 추출을 위한 뉴스 빅데이터 분석 시스템)

  • Kim, Seung Ju;Yoon, Chang Geun;Lee, Cha Hun;Park, Dong Hwan;Lee, Hae Jun;Park, Hyeok Ju;Lee, Yong Kyu
    • Annual Conference of KIPS
    • /
    • 2018.10a
    • /
    • pp.17-20
    • /
    • 2018
  • 대중의 관심인 공공이슈를 파악하기 위하여 다양한 종류의 빅데이터를 분석하는 연구가 진행되고 있다. 그러나 기존의 연구에서는 키워드의 노출 횟수만 파악하여 결과로 반영한다. 본 논문은 포털 사이트로부터 얻은 언론사별 뉴스 빅데이터를 이용하여 키워드별 노출 빈도수, 댓글 수 및 추천 수를 반영한 분석 방법을 제안하였다. 공공이슈를 추출하여 얻어낸 키워드들을 워드클라우드, Sankey다이어그램과 같은 형태로 시각화하여 사용자에게 제공한다. 제안된 방법을 사용하면 대중의 반응을 반영한 분석 결과를 확인 할 수 있다.

Lifelog Big Data Based Metabolic Syndrome Management System (라이프로그 빅데이터 기반 대사증후군 관리 시스템)

  • Kim, Ji-Eon;Kim, Seung-Jin;No, Si-Hyeong;Jeong, Chang-Won;Kim, Tae-Hoon;Jun, Hong-Yong;Yu, Tae-Yang;Yoon, Kwon-Ha
    • Annual Conference of KIPS
    • /
    • 2018.05a
    • /
    • pp.236-237
    • /
    • 2018
  • 최근 생활습관정보는 대사증후군을 진단하기 위한 임상적 진단지표로 중요하게 활용되고 있다. 대사증후군은 심혈관 및 간질환 그리고 당뇨와 같은 여러 합병증을 유발할 수 있는 질환으로 질환 정도에 따른 체계적 관리가 필요하다. 그러나 대사증후군 환자의 생활습관을 수집하기 위한 대부분의 시스템은 자가진단 및 예방 중심의 시스템으로 구성되어 있어 정확한 생활습관을 수집하여 생활습관을 관리하기에는 어려움이 있다. 본 논문에서 제안하는 시스템은 임상적 진단지표에 도움이 될 수 있도록 신뢰성 있는 생활습관 정보를 수집하기 위한 방법을 제시하고 수집된 생활습관정보를 모니터링 하여 환자의 생활습관 개선 여부에 따라 지속적인 피드백을 제공하여 체계적으로 생활습관을 관리할 수 있는 시스템을 제안하고자 한다.

Construction of Big Data Visualization and Management System Based on R-CDM (R-CDM 기반의 빅데이터 시각화 및 관리 시스템 구축)

  • Kim, Seung-Jin;Jeong, Chang-Won;Kim, Tae-Hoon;Lee, Chung-Sub;No, Si-Hyeong;Kim, Ji-Eon;Lee, Go-eun;Yoon, Kwon-Ha
    • Annual Conference of KIPS
    • /
    • 2019.10a
    • /
    • pp.38-39
    • /
    • 2019
  • 본 논문은 R-CDM 의료영상정보를 기반으로 ELK Stack 기술을 적용하여 획득한 데이터의 분석 결과를 시각화하기 위한 시스템에 대해 기술한다. 제안한 시스템은 의료 빅데이터의 검색, 수집 그리고 분석 결과를 모니터링 할 수 있으며, 특히 대량의 데이터의 변화와 데이터간의 차이를 확인할 수 있다. 본 연구에서 제안한 시스템은 수집된 의료영상 빅데이터에 대해 적용하여 현황과 처리결과 그리고 실시간 분석결과에 대한 모니터링을 통해 관리의 효율성을 높여 실시간 검색 및 분석 서비스 분야에 기여할 것으로 기대된다.

Big Data based Diet Analysis and Relevant Product Recommendation Online-mall API (빅 데이터 기반의 식습관 분석 및 관련 상품 추천 온라인 몰 API)

  • Jang, Soe-Un;Kim, Moon-Hyun;Na, Ji-Hyun;Hong, Jang-Eui
    • Annual Conference of KIPS
    • /
    • 2019.10a
    • /
    • pp.1129-1132
    • /
    • 2019
  • 최근 현대인들은 식습관이 불규칙하고 서구화되면서, 건강상의 많은 문제를 겪고 있다. 이와 더불어 1인 가구의 증가와 간단한 구매 방법 등으로 인해 온라인 몰 사용자가 늘어나고 있다. 본 프로젝트는 이러한 추세를 바탕으로, 사용자가 자주 사용하는 온라인 몰에 축적된 데이터를 기반으로 사용자의 식습관을 분석한다. 뿐만 아니라, 이를 바탕으로 구매 패턴을 분석하여 사용자의 영양 상태를 개선시킬 수 있는 상품 추천 서비스를 제공한다. 사용자는 자주 사용하는 온라인 쇼핑몰에서 상품 구매를 함과 동시에 구매한 상품에 대해 시각화된 영양소 분석 결과와 구매 패턴 분석 결과를 제공받을 수 있다. 본 논문에서는 개발한 API를 통해 사용자는 부족한 영양소를 쉽게 파악하여 효율적으로 건강관리를 할 수 있게 된다. 더 나아가, 자신의 구매 패턴을 파악할 수 있게 되어 현명한 소비 습관을 만드는 데에 기여할 수 있다.

Big data-based real-time drug side-effect risk assessment model (빅데이터 기반 실시간 의약품 부작용 위험도 평가 모델)

  • Lee, Chae-Eun;Bae, Eun-Ji;Yoon, Sook-Young;Lim, Su-Yeon;Kim, Yong-Min;Kim, Woong-Sup
    • Annual Conference of KIPS
    • /
    • 2019.10a
    • /
    • pp.754-757
    • /
    • 2019
  • 대한민국 인구의 고령화는 점점 더 심화되며 노인 환자의 수도 증가하는 추세이다. 노인환자들은 의약품 부작용 위험도가 높기 때문에 노인에게 부적절한 약물과 처방 이후의 부작용 발생 현황에 대한 통계적인 분석이 필요하다고 판단하였다. 의약품 부작용관련 문헌 정보와 실제 병원의 전자 의무 기록을 이용해 데이터 베이스를 구축하고 Python 을 사용해 부작용 탐지 알고리즘을 설계했다. 노인 환자가 특정 약품을 투약한 이후에 그 약품에 부작용에 해당하는 진단을 받는다면 부작용이 발생한 것으로 판단한다. 알고리즘을 기반으로 사용자들이 쉽게 접근할 수 있도록 웹을 구축했다. d3.js 를 통해 직관적으로 부작용 확률을 확인할 수 있도록 구현했고 새로운 진단 또는 처방을 입력하여 실시간으로 확률에 반영하였다. 실시간으로 데이터를 확인할 수 있기 때문에 부작용 이슈에 신속하게 예방 및 대응이 가능할 것으로 기대된다.

Host-Based Malware Variants Detection Method Using Logs

  • Joe, Woo-Jin;Kim, Hyong-Shik
    • Journal of Information Processing Systems
    • /
    • v.17 no.4
    • /
    • pp.851-865
    • /
    • 2021
  • Enterprise networks in the PyeongChang Winter Olympics were hacked in February 2018. According to a domestic security company's analysis report, attackers destroyed approximately 300 hosts with the aim of interfering with the Olympics. Enterprise have no choice but to rely on digital vaccines since it is overwhelming to analyze all programs executed in the host used by ordinary users. However, traditional vaccines cannot protect the host against variant or new malware because they cannot detect intrusions without signatures for malwares. To overcome this limitation of signature-based detection, there has been much research conducted on the behavior analysis of malwares. However, since most of them rely on a sandbox where only analysis target program is running, we cannot detect malwares intruding the host where many normal programs are running. Therefore, this study proposes a method to detect malware variants in the host through logs rather than the sandbox. The proposed method extracts common behaviors from variants group and finds characteristic behaviors optimized for querying. Through experimentation on 1,584,363 logs, generated by executing 6,430 malware samples, we prove that there exist the common behaviors that variants share and we demonstrate that these behaviors can be used to detect variants.

The Future of Quantum Information: Challenges and Vision

  • Kim, Dohyun;Kang, Jungho;Kim, Tae Woo;Pan, Yi;Park, Jong Hyuk
    • Journal of Information Processing Systems
    • /
    • v.17 no.1
    • /
    • pp.151-162
    • /
    • 2021
  • Quantum information has passed the theoretical research period and has entered the realization step for its application to the information and communications technology (ICT) sector. Currently, quantum information has the advantage of being safer and faster than conventional digital computers. Thus, a lot of research is being done. The amount of big data that one needs to deal with is expected to grow exponentially. It is also a new business model that can change the landscape of the existing computing. Just as the IT sector has faced many challenges in the past, we need to be prepared for change brought about by Quantum. We would like to look at studies on quantum communication, quantum sensing, and quantum computing based on quantum information and see the technology levels of each country and company. Based on this, we present the vision and challenge for quantum information in the future. Our work is significant since the time for first-time study challengers is reduced by discussing the fundamentals of quantum information and summarizing the current situation.

Improved Deep Residual Network for Apple Leaf Disease Identification

  • Zhou, Changjian;Xing, Jinge
    • Journal of Information Processing Systems
    • /
    • v.17 no.6
    • /
    • pp.1115-1126
    • /
    • 2021
  • Plant disease is one of the most irritating problems for agriculture growers. Thus, timely detection of plant diseases is of high importance to practical value, and corresponding measures can be taken at the early stage of plant diseases. Therefore, numerous researchers have made unremitting efforts in plant disease identification. However, this problem was not solved effectively until the development of artificial intelligence and big data technologies, especially the wide application of deep learning models in different fields. Since the symptoms of plant diseases mainly appear visually on leaves, computer vision and machine learning technologies are effective and rapid methods for identifying various kinds of plant diseases. As one of the fruits with the highest nutritional value, apple production directly affects the quality of life, and it is important to prevent disease intrusion in advance for yield and taste. In this study, an improved deep residual network is proposed for apple leaf disease identification in a novel way, a global residual connection is added to the original residual network, and the local residual connection architecture is optimized. Including that 1,977 apple leaf disease images with three categories that are collected in this study, experimental results show that the proposed method has achieved 98.74% top-1 accuracy on the test set, outperforming the existing state-of-the-art models in apple leaf disease identification tasks, and proving the effectiveness of the proposed method.

Applying Response Surface Methodology to Predict the Homogenization Efficiency of Milk (우유 균질 조건 예측을 위한 반응표면방법론의 활용)

  • Sungsue Rheem;Sejong Oh
    • Journal of Dairy Science and Biotechnology
    • /
    • v.41 no.1
    • /
    • pp.1-8
    • /
    • 2023
  • Response surface methodology (RSM) is a statistical approach widely used in food processing to optimize the formulation, processing conditions, and quality of food products. The homogenization process is achieved by subjecting milk to high pressure, which breaks down fat globules and disperses fat more evenly throughout milk. This study focuses on an application of RSM including the logit transformation to predict the efficiency of milk homogenization, which can be maximized by minimizing the relative difference in fat percentage between the top part and the remainder of milk. To avoid a negative predicted value of the minimum of this proportion, the logit transformation is used to turn the proportion into the logit, whose possible values are real numbers. Then, the logit values are modeled and optimized. Subsequently, the logistic transformation is used to turn the predicted logit into the predicted proportion. From our model, the optimum condition for the maximized efficiency of milk homogenization was predicted as the combination of a homogenizer pressure of 30 MPa, a storage temperature of 10℃, and a storage period of 10 days. Additionally, with a combination of a homogenizer pressure of 30 MPa, a storage temperature of 10℃, and a storage period of 50 days, the level of milk homogenization was predicted to be acceptable, even with the problem of extrapolation taken into account.