• 제목/요약/키워드: Big data analytics

검색결과 284건 처리시간 0.023초

군집분석과 연관규칙을 활용한 고객 분류 및 장바구니 분석: 소매 유통 빅데이터를 중심으로 (Customer Classification and Market Basket Analysis Using K-Means Clustering and Association Rules: Evidence from Distribution Big Data of Korean Retailing Company)

  • 리우룬칭;이영찬;무홍레이
    • 지식경영연구
    • /
    • 제19권4호
    • /
    • pp.59-76
    • /
    • 2018
  • With the arrival of the big data era, customer data and data mining analysis have gradually dominated the process of Customer Relationship Management (CRM). This phenomenon indicates that customer data along with the use of information techniques (IT) have become the basis for building a successful CRM strategy. However, some companies can not discover valuable information through a large amount of customer data, which leads to the failure of making appropriate business strategy. Without suitable strategies, the companies may lose the competitive advantage or probably go bankrupt. The purpose of this study is to propose CRM strategies by segmenting customers into VIPs and Non-VIPs and identifying purchase patterns using the the VIPs' transaction data and data mining techniques (K-means clustering and association rules) of online shopping mall in Korea. The results of this paper indicate that 227 customers were segmented into VIPs among 1866 customers. And according to 51,080 transactions data of VIPs, home product and women wear are frequently associated with food, which means that the purchase of home product or women wears mainly affect the purchase of food. Therefore, marketing managers of shopping mall should consider these shopping patterns when they build CRM strategy.

스마트 플랜트를 위한 빅데이터 및 AutoML 플랫폼 개발 (Development of Big Data and AutoML Platforms for Smart Plants)

  • 강진영;정병석
    • 한국빅데이터학회지
    • /
    • 제8권2호
    • /
    • pp.83-95
    • /
    • 2023
  • 스마트 플랜트 발전에 있어서 빅데이터 분석과 인공지능은 중요한 역할을 한다. 본 연구에서는 플랜트 데이터를 위한 빅데이터 플랫폼과 인공지능 기반 플랜트 유지 관리를 위한 'AutoML 플랫폼'을 개발하였다. 빅데이터 플랫폼은 하둡, 스파크, 카프카를 활용하여 플랜트에서 발생하는 대용량의 데이터를 수집, 처리, 적재하는 플랫폼이다. AutoML 플랫폼은 설비의 예지보전 및 공정 최적화를 위한 예측 모델을 구축하는 머신러닝 자동화 시스템이다. 위 플랫폼은 기존 플랜트 운영 정보 시스템과의 호환성을 고려하여 데이터 파이프라인을 구성하고, 웹 기반 GUI를 통해 작업자의 접근성과 편의성을 향상하였으며, 데이터 처리와 학습 알고리즘에 사용자 정의 모듈을 탑재하는 기능을 통해 유연성을 증대시켰다. 본 논문은 국내 정유회사의 특정 공정을 대상으로 플랫폼을 실제 운영해보았고, 이를 통해 스마트 플랜트를 위한 효과적인 데이터 활용 플랫폼 사례를 제시한다.

A 은행 사례 분석을 통한 빅데이터 기반 자금세탁방지 시스템 설계 (A Study on Big Data Anti-Money Laundering Systems Design through A Bank's Case Analysis)

  • 김상완;함유근
    • 한국빅데이터학회지
    • /
    • 제1권1호
    • /
    • pp.85-94
    • /
    • 2016
  • 본 논문은 타 산업에 비해 상대적으로 빅데이터의 잠재 가치가 높은 금융권에서 사전 예방과 실시간 탐지가 특히 중요해지고 있는 자금세탁방지를 위한 빅데이터 기반의 시스템 구현 방안을 제시한다. 기존 A 은행의 사례 분석을 통해 현 자금세탁방지 업무에 빅데이터를 적용 가능한 부분과 기능들 논의한다. 연구 결과 빅데이터를 활용한 자금세탁방지 시스템은 기존의 자금세탁방지 시스템에 추가적으로 소셜 네트워크 서비스나 로그 파일 등의 다양한 출처로부터 데이터를 수집해 일부가 아닌 전체 데이터를 대상으로 빠른 속도로 거래 모니터링과 잠재적 위험 탐지가 가능하다. 즉 빅데이터 기반 자금세탁방지 시스템은 비정형 데이터인 소셜 네트워크 서비스 데이터와 기존 거래나 고객정보를 통합하고 소셜 네트워크 분석 방법을 적용하여 고객확인의무와 잠재 요주의 인물 탐지 기능을 제고시킬 수 있다. 또한 빅데이터 분석 인프라 하에서 룰 모델이나 거래패턴 스코어링 모델을 적용해 실시간으로 혐의 거래 적발이 가능하다.

  • PDF

Quantitative Study of Soft Masculine Trends in Contemporary Menswear Using Semantic Network Analysis

  • Tin Chun Cheung;Sun Young Choi
    • 한국의류학회지
    • /
    • 제46권6호
    • /
    • pp.1058-1073
    • /
    • 2022
  • Big data analytics and social media have shifted the way fashion trends are dictated. Fashion as a medium for expressing gender has created new concepts of masculinity in popular culture, where men are increasingly depicted in a softer style. In this study, we analyzed 2,879 menswear collections over a 10-year period from Vogue US to uncover key menswear trends. Using Semantic Network Analysis (SNA) on Orange3, we were able to quantitatively analyze how contemporary menswear designers interpreted diversified trends of masculinity on the runway. Frequency and degree centrality were measured to weigh the significance of trend keywords. "Jacket (f = 3056; DC = 0.80), shirt (f = 1912; DC = 0.60) and pant (f = 1618; DC = 0.53)" were among the most prominent keywords. Our results showed that soft masculine keywords, e.g., "lace, floral, and pink" also appeared, but with the majority scoring DC = < 0.10. The findings provide an insight into key menswear trends through frequency, degree centrality measurements, time-series analysis, egocentric, and visual semantic networks. This also demonstrates the feasibility of using text analytics to visualize design trends, concepts, and patterns for application as an ideation tool for academic researchers, designers, and fashion retailers.

Stochastics and Artificial Intelligence-based Analytics of Wastewater Plant Operation

  • Sung-Hyun Kwon;Daechul Cho
    • 청정기술
    • /
    • 제29권2호
    • /
    • pp.145-150
    • /
    • 2023
  • Tele-metering systems have been useful tools for managing domestic wastewater treatment plants (WWTP) over the last decade. They mostly generate water quality data for discharged water to ensure that it complies with mandatory regulations and they may be able to produce every operation parameter and additional measurements in the near future. A sub-big data group, comprised of about 150,000 data points from four domestic WWTPs, was ready to be classified and also analyzed to optimize the WWTP process. We used the Statistical Product and Service Solutions (SPSS) 25 package in order to statistically treat the data with linear regression and correlation analysis. The major independent variables for analysis were water temperature, sludge recycle rate, electricity used, and water quality of the influent while the dependent variables representing the water quality of the effluent included the total nitrogen, which is the most emphasized index for discharged flow in plants. The water temperature and consumed electricity showed a strong correlation with the total nitrogen but the other indices' mutual correlations with other variables were found to be fuzzy due to the large errors involved. In addition, a multilayer perceptron analysis method was applied to TMS data along with root mean square error (RMSE) analysis. This study showed that the RMSE in the SS, T-N, and TOC predictions were in the range of 10% to 20%.

빅데이터 기반 환자 간병 방법 분석 연구 (A Study on Big Data Based Method of Patient Care Analysis)

  • 박지훈;황승연;윤범식;최수길;이돈희;김정준;문진용;박경원
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권3호
    • /
    • pp.163-170
    • /
    • 2020
  • 정보통신기술의 발전과 함께 데이터의 생산량이 기하급수적으로 증가하면서 빅데이터에 대한 관심이 높아지고 있다. 빅데이터 관련 기술들도 발전함에 따라 여러 분야에서 빅데이터가 수집, 저장, 처리, 분석, 활용되고 있다. 특히 보건의료 분야에서의 빅데이터 분석은 사회경제적으로도 큰 영향력을 발휘할 수 있기 때문에 큰 주목을 받고 있다. 빅데이터 기술을 환자 진단 데이터 분석에 활용하여 간단한 병원 진료에 투여되는 막대한 비용을 절감할 수 있을 것으로 전망된다. 따라서 본 논문에서는 환자 데이터를 분석하여 병원에 가기 어려운 환자나 의학적인 전문 지식이 없는 간병인들에게 의사의 진단과 가까운 간병 가이드 정보를 제시하고자 한다. 먼저 수집된 환자 데이터를 HDFS에 저장하고, 하둡 환경에서 빅데이터 처리 및 분석 도구인 R을 이용하여 데이터를 처리한 후 분류분석을 한다. R의 다양한 기능들을 웹에 구현하기 위해 활용되는 R Shiny를 이용하여 웹 서버에 시각화를 한다.

CNN 기반 리뷰 유용성 점수 예측을 통한 개인화 추천 서비스 성능 향상에 관한 연구 (A Study on Enhancing Personalization Recommendation Service Performance with CNN-based Review Helpfulness Score Prediction)

  • 이청용;이병현;이흠철;김재경
    • 지능정보연구
    • /
    • 제27권3호
    • /
    • pp.29-56
    • /
    • 2021
  • 전자상거래 시장이 빠르게 성장하면서 다양한 유형의 제품이 출시되고 있으며, 이로 인해 사용자들은 구매 의사결정과정에 많은 시간이 소요되는 정보 과부하 문제에 직면하고 있다. 따라서 사용자에게 맞춤형 제품 및 서비스를 제공해줄 수 있는 개인화 추천 서비스의 중요성이 대두되고 있다. 대표적으로 Netflix, Amazon, Google 등 세계적 기업은 개인화 추천 서비스를 도입하여 사용자의 구매 의사결정을 지원하고 있다. 이에 따라 사용자의 정보탐색 비용이 감소하는 효과가 나타났고, 기업의 매출 상승에도 긍정적인 영향을 끼치고 있다. 기존 개인화 추천 서비스 관련 연구에서 주로 사용된 협업필터링(Collaborative Filtering, CF) 기법은 정량화된 정보를 활용하여 사용자의 선호도를 예측하였다. 그러나 정량화된 정보만을 활용하면 사용자의 구매 의도는 고려하지 못하므로 추천 성능이 저하될 수 있다는 문제점이 제기되고 있다. 이와 같은 기존 연구의 문제점을 개선하기 위해 최근에는 사용자가 작성한 리뷰를 활용한 개인화 추천 서비스 연구가 활발히 진행되고 있다. 그러나 리뷰에는 광고성 내용, 거짓 후기, 의미를 전혀 파악할 수 없거나 제품과 관련 없는 내용 등 구매의사결정을 저해하는 요소들이 포함되어 있다. 이러한 요소들이 포함된 리뷰를 활용하여 추천 서비스를 제공하게 되면, 추천 성능이 저하되는 문제가 발생할 수 있다. 따라서 본 연구에서는 이러한 문제점을 개선하기 위해 Convolutional Neural Network(CNN) 기반 리뷰 유용성 점수 예측을 통한 새로운 추천 방법론을 제안하였다. 본 연구에서 제안하는 유용한 리뷰를 포함하는 방법론과 기존 모든 선호도 평점을 고려하는 추천 방법론을 비교한 결과, 본 연구에서 제안한 방법론이 더 우수한 예측 성능을 나타내고 있음을 확인할 수 있었다. 또한 본 연구의 결과는 리뷰 유용성에 대한 정보를 개인화 추천 서비스에 반영하면 전통적인 CF의 성능을 향상할 수 있음을 시사한다.

MIS Quarterly 연구동향 탐색: 토픽모델링 및 키워드 네트워크 분석 활용 (An Exploration of MIS Quarterly Research Trends: Applying Topic Modeling and Keyword Network Analysis)

  • 강은경;정연식;양선욱;권지윤;양성병
    • 지능정보연구
    • /
    • 제28권2호
    • /
    • pp.207-235
    • /
    • 2022
  • 지식과 정보산업이 경제의 주축인 지식기반 사회에 있어 지식의 공유와 확산 및 체계적인 관리는 국가 경쟁력 향상뿐만 아니라 지속 가능한 사회 발전의 필수 전략으로 인식되고 있다. 정보기술과 경영의 융합이 다양한 방식으로 일어나고 있는 정보시스템(Information Systems: IS) 연구분야에서, 연구자들이 서로 협력하여 오래된 지식을 과학적 지식네트워크의 관점에서 새로운 지식으로 만들어 낼 때 비로소 지식의 진화가 일어난다. 특히, 인용과 공저, 키워드와 같은 네트워크 기반의 학제적 접목을 통해 해당 연구분야의 관심 주제와 적용된 방법론, 연구동향 등을 파악함으로써 새로운 통찰을 이끌어낼 수 있다. 선행연구에서는 연구주제와 방법론, 공동저자 등의 관계를 밝혀 해당 커뮤니티의 지식체계 구조와 연구동향을 파악하려는 다양한 시도가 있어 왔으나, 두 개 이상의 저널을 일부 기간으로 한정해서 비교한 연구가 대부분을 차지하였으며, IS 연구의 전 역사를 아우르면서 연구동향을 살펴본 연구는 부족한 실정이다. 이에 본 연구에서는 IS 연구분야에서 관련 지식을 넓히는 데 주도적인 역할을 수행하고 있는 MIS Quarterly (MISQ) 저널을 중심으로 창간호(1977년)부터 최근(2022년 1분기)까지 게재된 모든 논문으로부터 (1) 키워드를 추출하고, (2) 추출된 키워드를 연구주제와 방법론, 이론 등으로 각각 구분한 후, (3) 토픽모델링과 키워드 네트워크 분석을 활용하여 IS 연구분야의 태동부터 현재까지의 변화 양상을 연대기적으로 파악하였다. 본 연구를 통해 MISQ에 게재된 IS 연구의 변화 양상을 살펴봄으로써, IS 연구분야의 발전 방향을 예측하고, IS 분야의 연구자들에게 새로운 연구방향을 제시하여 미래 지향적인 연구를 진행하는 데 실질적인 도움을 줄 수 있을 것으로 기대한다.

건강추천시스템(HRS) 연구 동향: 인용네트워크 분석과 GraphSAGE를 활용하여 (Research Trends of Health Recommender Systems (HRS): Applying Citation Network Analysis and GraphSAGE)

  • 장하렴;유지수;양성병
    • 지능정보연구
    • /
    • 제29권2호
    • /
    • pp.57-84
    • /
    • 2023
  • 현대사회는 정보통신기술 및 빅데이터 기술의 발전으로 누구나 인터넷을 통해 손쉽게 방대한 데이터를 얻고 활용할 수 있는 시대로, 양질의 데이터를 수집하는 능력을 넘어 수많은 정보 속에서 올바른 데이터만을 선별하는 능력이 더욱 중요해지고 있다. 이러한 기조는 학계에서도 이어지고 있는데, 축적되는 연구물 속에서 양질의 연구를 선별하여 올바른 지식구조를 형성하기 위해, 다양한 연구 분야에서 체계적 고찰(systematic review) 및 비체계적 고찰(non-systematic review)과 같은 문헌연구(literature review)가 수행되고 있다. 한편, 코로나19 팬데믹 이후 의료산업에서도 그동안 합의에 이르지 못했던 원격의료가 제한적으로나마 허용되고, 인공지능 및 빅데이터 기술이 응용된 건강추천시스템(health recommender systems: HRS)과 같은 새로운 의료서비스가 각광을 받고 있다. 하지만, 실무적으로 HRS가 미래 의료산업 발전을 이끌 중요한 기술로 평가받고 있음에도 불구하고, 학술적인 문헌연구는 다른 분야에 비해 매우 부족한 실정이다. 더불어 HRS는 학제적 성격이 강한 융합 분야임에도 불구하고, 기존의 문헌연구는 비체계적 고찰과 체계적 고찰 방법만을 주로 활용하여 이뤄졌기 때문에, 다른 연구 분야와의 상호작용이나 동적인 관계를 유추하기에는 한계가 존재한다. 이에, 본 연구에서는 인용네트워크 분석(citation network analysis: CNA)을 활용하여 HRS 및 주변 연구 분야의 전체적인 네트워크 구조를 파악하였다. 또한, 이 과정에서 최신 논문이 인용 관계가 잘 나타나지 않는 문제를 보완하기 위해 GraphSAGE 알고리즘을 적용함으로써, HRS 연구에 있어 'recommender system', 'wireless & IoT', 'computer vision', 'text mining' 등과 같은 연구 분야들의 중요도가 높아지고 있음을 파악하였으며, 이와 동시에 개인화(personalization) 및 개인정보보호(privacy) 등과 같은 새로운 키워드가 주요 이슈로 등장하고 있음을 확인하였다. 본 연구를 통해 HRS 연구 커뮤니티의 구조를 파악하고, 관련된 연구 동향을 살펴보며, 미래 HRS 연구 방향을 설계함에 있어 실질적인 통찰을 제공할 수 있을 것으로 기대한다.

선박 신수요 예측을 위한 빅데이터 기반 인공지능 알고리즘을 활용한 플랫폼 개발 (Development of a Platform Using Big Data-Based Artificial Intelligence to Predict New Demand of Shipbuilding)

  • 이상원;정인환
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.171-178
    • /
    • 2019
  • 한국의 조선 산업은 대내외 환경 변화로 인해 심각한 위기 상황에 처해 있다. 이 위기를 극복하기 위해서, 선박 신수요 예측을 통한 제품 및 기술의 선제적 개발이 필요하다. 본 연구의 목표는 선박 신수요 예측을 위해 선박 빅데이터에 기반한 인공지능 알고리즘의 개발이다. 본 연구에서는 선박 수요 예측에 특화된 빅데이터 분석 플랫폼을 개발하고 데이터 분석을 통한 선박 신수요 예측 결과를 신제품 기획/개발에 활용하고자 한다. 이를 통해 장비 및 기자재 제조업체를 위한 지속 가능한 신사업 모델 개발로 조선소 및 선박 기자재 업체에 대한 신성장동력을 창출할 수 있을 것이다. 또한 조선 업체들은 측정 가능한 성과를 기반으로 비즈니스 사례를 창출하고 시장 지향적 인 제품과 서비스를 계획하며 높은 시장 파괴력을 가진 혁신을 지속적으로 달성 할 수 있을 것으로 기대된다.