• 제목/요약/키워드: Big data analytics

검색결과 287건 처리시간 0.033초

빅데이터 분석을 활용한 실험계획법 기반의 코팅제 배합비율 최적화 모형 (Optimization Model for the Mixing Ratio of Coatings Based on the Design of Experiments Using Big Data Analysis)

  • 노성여;김영진
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제3권10호
    • /
    • pp.383-392
    • /
    • 2014
  • 코팅제에 대한 연구는 고분자 산업에서 가장 보편화되고 활발하게 연구되고 있는 내용의 하나이다. 코팅제는 전자산업, 의료, 광학 분야 등에서 중요성이 더욱 커지고 있으며, 특히 자동차 및 전자부품의 첨단화에 힘입어 코팅제에 대한 성능과 정밀도 등 기술적인 요구사항이 증가하고 있는 추세이다. 또한 방대한 환경 정보와 상황 정보를 기반으로 한 사물 인터넷과 빅데이터 분석 기술의 도입을 통해 산업 현장에서는 더욱 지능화되고 자동화된 시스템과 처리 기술의 필요성이 높아지고 있다. 이에 본 논문에서는 사물 인터넷 기술과 빅데이터 분석을 활용한 실험계획법 기반의 코팅제 배합 데이터에 대한 최적화 모형을 제안한다. 본 논문에서는 실제 생산현장에서 사용하는 코팅제 배합 기준 데이터와 발생한 오차에 대하여 작업자가 수정한 보정 결과 데이터를 실험계획법을 기반으로 분석하여 최적의 코팅제 배합 기준 데이터를 계산하였다. 또한 빅데이터 분석 기술과 사물 인터넷 기술을 활용하여 기존의 코팅제 배합 기준 데이터만을 적용한 공정이 아니라 제조 환경 정보와 상황 정보를 이용하여 색상과 품질 유지에 가장 중요한 인자를 검색하고 기준값을 보정하는 최적화 모형을 도출하였다. 실험 및 분석을 통해 확보된 기준 데이터는 제조 공정에 적용할 경우 배합의 정확도 향상과 LOT별 작업시간 단축을 가능하게 해주고, 건당 처리시간의 감소로 인한 생산 납품시간 단축, 불량률 감소 등에 따른 원가 절감에 기여할 수 있다. 또한, 다양한 모델링에 대한 제조 공정에서의 표준 데이터를 획득할 수 있다.

관광 빅데이터 기반의 용인시 관내 관광 활성화 방안: 이동통신과 신용카드 데이터를 결합한 지리정보시스템 분석을 중심으로 (A Study on the Revitalization of Local Tourism in Yongin City Based on Tourism Bigdata Analytics: Focusing on Geographic Information System Analytics Combining Mobile Communication and Credit Card Data)

  • 안은희;안정국
    • 한국융합학회논문지
    • /
    • 제12권4호
    • /
    • pp.207-216
    • /
    • 2021
  • 최근 지역경제 활성화를 위해 관내 관광객 유치에 관한 관심이 높아지고 있으며, 이에 관내 관광객들을 이동경로 및 소비 패턴 분석에 기반한 맞춤형 관광 전략이 중요하다. 하지만 기존의 연구들은 한정된 주류 관광객 분석에 초점을 두어, 관광객들의 행위 기반 데이터 관점의 분석이 부족하였다. 이에 본 연구는 빅데이터 분석과 지리정보시스템을 결합하여 관내 관광객들의 이동 경로 및 소비 패턴을 분석하여 빅데이터 기반의 관광 전략을 제시하고자 한다. 본 연구는 용인시에서 발생한 카드 지출 데이터 및 통신 데이터를 바탕으로 관내 관광객들의 이동 패턴 및 소비 패턴을 분석하여 시각화하였다. 2017년 7월부터 2018년 6월까지 1년간의 데이터 분석을 통해 여성보다 남성이 다양한 지역에서 소비하는 경향이 있고, 나이별로는 30대와 40대가 소비지역이 비슷하게 나타나는 것을 알 수 있었다. 본 연구는 관광 및 소비 패턴을 지리정보시스템을 활용하여 가시화함으로써 관광, 행정 및 정책의 실무자들에게 전략적 방안을 제시하는데 시사점이 있다.

빅데이터 기반 대용량 시계열 에너지 데이터 처리 시스템 (Time-series big data analytics software on IoT streaming data)

  • 강정훈;유준재
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 춘계학술발표대회
    • /
    • pp.52-53
    • /
    • 2018
  • 본 논문은 에너지 빅데이터를 분석하기 위해 대용량의 시계열 데이터를 처리하는 시스템의 설계, 구축 방법을 제시한다. 이미 사용 중인 건물이나 공장의 에너지 효율화를 위해서 정부는 효율자원 시장 지원 사업을 수행하고 있다, 에너지 소비 설비에 따라 고효율 자원으로 변경 설치하는 데 필요한 자금의 일부를 지원하고 있다. 정부지원으로 고효율 설비로 변경함에 따라 실증 사이트에서는 측정 데이터를 수집하여, 효율화 정도를 파악하기 위한 에너지 데이터 분석 시스템을 구축하여 운영하였다. 해당 측정 정보는 IoT 전력량계를 통해 수집되며, 수집된 데이터는 클라우드 시스템에서 다양한 머신러닝 알고리즘에 적용되어, 에너지 소비 효율 평가에 필요한 성능 지표를 연산한다. 구현된 진단 시스템은 기축 건물의 에너지 효율향상 상황을 분석하는데 기여할 수 있다. 빅데이터 기반의 에너지 분석 기능을 사용하여 에너지 고효율 장비의 운영시간, 부하율 등의 효율성과 성능통계를 연산할 수 있다.

효율적 수입식품 검사를 위한 머신러닝 기반 부적합 건강기능식품 탐지 방법 (A Method of Machine Learning-based Defective Health Functional Food Detection System for Efficient Inspection of Imported Food)

  • 이경수;박예린;신윤종;손권상;권오병
    • 지능정보연구
    • /
    • 제28권3호
    • /
    • pp.139-159
    • /
    • 2022
  • 코로나19 이후 건강기능식품의 관심이 높아짐에 따라 수입 식품 안전성 검사의 중요성도 더욱 커지고 있다. 그러나 매년 증가하는 건강기능식품 수입량과 반대로 식품 검사에 필요한 예산과 인력은 한계점에 다다르고 있다. 따라서 본 연구의 목적은 수출입 식품 중 건강기능식품을 대상으로 데이터의 특성을 살펴보고, 판별의 정확성과 결과의 설명 가능성을 고려하여 효율적으로 부적합 식품을 탐지할 수 있는 기계학습 모델 기반 자동화 시스템 설계 방안을 제시하는 것이다. 이를 위해 첫째, 부적합 판정에 영향을 미치는 식품 검사 데이터로부터 부적합 판정에 유의한 파생변수를 생성하며, 둘째, 건강기능식품 수출입 검사 데이터에 대한 탐색적 분석을 통해 클래스 불균형과 비선형성 등을 고려하여 영향변수를 선정하며, 셋째, 다양한 머신러닝 기법을 적용하여 모델 별 성능과 해석가능성에 대해 비교를 수행하고자 한다. 성능 분석 결과, 앙상블 모델이 가장 우수하였으며, 본 연구에서 제안하는 파생변수 및 모델이 수출입 식품 검사에서 활용하고 있는 시스템에 도움이 될 수 있음을 확인하였다.

공공 데이터 기반 소비자 상황을 고려한 시간대별 미디어 추천 시스템 연구 (A Study on the Media Recommendation System with Time Period Considering the Consumer Contextual Information Using Public Data)

  • 김은비;이청용;장필식;김재경
    • 지능정보연구
    • /
    • 제28권4호
    • /
    • pp.95-117
    • /
    • 2022
  • 인터넷 기술의 발전으로 인해 다양한 미디어가 등장하면서 광고주들은 기업의 광고 전략에 적합한 미디어를 선택하는데 어려움을 경험하고 있다. 전통적인 광고 마케팅 전략을 바탕으로 광고 미디어를 선택하면 소비자의 상황 정보를 효과적으로 반영하는데 어려움이 존재한다. 이러한 상황에서 소비자의 과거 데이터를 분석하여 소비자가 필요하거나 관심 있는 정보를 바탕으로 광고주에게 맞춤형 미디어를 제공하는 추천 시스템이 필요하다. 전통적인 추천 시스템은 정량적 선호도 정보를 기반으로 추천 서비스를 제공하기 때문에 다양한 상황 정보를 반영하기 어려운 문제점이 존재한다. 본 연구에서는 딥러닝을 이용하여 소비자의 미디어 시청 시간, 거주 지역, 나이, 성별 등 상황 정보를 고려하여 광고주에게 맞춤형 미디어를 추천하는 방법론을 제안한다. 본 연구는 한국방송광고진흥공사에서 제공하는 소비자행태조사 데이터를 사용하여 추천 시스템을 구축하였다. 또한, 기존 연구에서 널리 사용되는 여러 벤치마크 모델과 비교하여 추천 성능을 검증하였다. 실험 결과, 본 연구에서 제안하는 소비자의 상황 정보를 반영한 추천 모델이 기존의 벤치마크 모델보다 높은 정확성을 나타내는 것을 확인하였다. 이 연구는 향후 광고주들이 소비자의 여러 상황 정보를 바탕으로 맞춤형 미디어 선택할 때 효과적인 의사결정을 내릴 수 있도록 도움을 주는데 기여를 할 수 있을 것으로 기대한다

기계학습 알고리즘을 사용한 스포츠 경기장 방문객 마케팅 적용 방안 (A Study on Application of Machine Learning Algorithms to Visitor Marketing in Sports Stadium)

  • 박소현;임선영;박영호
    • 디지털콘텐츠학회 논문지
    • /
    • 제19권1호
    • /
    • pp.27-33
    • /
    • 2018
  • 본 연구에서는 마케팅 분야 중 스포츠 경기장을 찾는 관람객의 빅 데이터를 분석하여 소비자에게 맞춤형 마케팅 서비스를 제공하는 연구를 진행한다. 이를 위해 본 연구에서는 K-평균 군집화 방법을 사용하여 유사 관람객 그룹을 도출하고자 하며, K-근접 이웃 방법을 사용하여 새로운 방문객의 관심 매장을 예측하고자 한다. 실험 결과를 통해 상기 두 가지 알고리즘을 사용하는 것은 유사 관람객 그룹을 도출하며 신규 관람객 입장 시 신규 관람객의 특성에 맞는 적합한 마케팅 서비스를 제공 할 수 있게 하였다.

빅데이터 기반의 건설기술 개발 트렌드 분석에 관한 연구 - 4차 산업혁명 ICT 기술 관련 건설특허를 중심으로 - (Analysis of the Trends of Construction Technology Development based on Big Data - Focused on Construction Patents in Relation to the 4th Industrial Revolution ICT Technologies -)

  • 한재훈;김한수
    • 한국건설관리학회논문집
    • /
    • 제18권5호
    • /
    • pp.20-31
    • /
    • 2017
  • 최근 전 세계적으로 4차 산업혁명에 대한 관심이 높아지면서 건설산업에서도 이를 대응하는 것이 중요한 현안이 되고 있다. 건설산업이 4차 산업혁명을 효과적으로 대응하기 위해서는 관련 기술을 건설기술과 접목시키는 노력이 필요하며. 이를 위해서는 4차 산업혁명 기술을 건설기술에 접목시킨 트렌드를 분석하고 이해할 필요가 있다. 본 연구의 목적은 빅데이터분석 기법을 활용하여 지난 10년간의 ICT 건설기술 개발 트렌드를 분석하고 주요 특징을 도출하는데 있다. 트렌드 분석 결과, 총 11개의 트렌드가 도출되었으며 ICT 건설기술 개발이 예상만큼 활발하지 않은 것으로 나타났다. 또한 그간 건설기술 개발은 소프트웨어 기술 보다는 하드웨어 기술 개발에 치중되어 있던 것으로 나타나 향후 소프트웨어 기술 개발에 대한 관심과 노력이 필요한 것으로 나타났다.

텍스트마이닝을 이용한 약물유해반응 보고자료 분석 (Analysis of Adverse Drug Reaction Reports using Text Mining)

  • 김현희;유기연
    • 한국임상약학회지
    • /
    • 제27권4호
    • /
    • pp.221-227
    • /
    • 2017
  • Background: As personalized healthcare industry has attracted much attention, big data analysis of healthcare data is essential. Lots of healthcare data such as product labeling, biomedical literature and social media data are unstructured, extracting meaningful information from the unstructured text data are becoming important. In particular, text mining for adverse drug reactions (ADRs) reports is able to provide signal information to predict and detect adverse drug reactions. There has been no study on text analysis of expert opinion on Korea Adverse Event Reporting System (KAERS) databases in Korea. Methods: Expert opinion text of KAERS database provided by Korea Institute of Drug Safety & Risk Management (KIDS-KD) are analyzed. To understand the whole text, word frequency analysis are performed, and to look for important keywords from the text TF-IDF weight analysis are performed. Also, related keywords with the important keywords are presented by calculating correlation coefficient. Results: Among total 90,522 reports, 120 insulin ADR report and 858 tramadol ADR report were analyzed. The ADRs such as dizziness, headache, vomiting, dyspepsia, and shock were ranked in order in the insulin data, while the ADR symptoms such as vomiting, 어지러움, dizziness, dyspepsia and constipation were ranked in order in the tramadol data as the most frequently used keywords. Conclusion: Using text mining of the expert opinion in KIDS-KD, frequently mentioned ADRs and medications are easily recovered. Text mining in ADRs research is able to play an important role in detecting signal information and prediction of ADRs.

확장된 사용자 유사도를 이용한 CF-기반 건강기능식품 추천 시스템 (A CF-based Health Functional Recommender System using Extended User Similarity Measure)

  • 홍세인;정의주;김재경
    • 지능정보연구
    • /
    • 제29권3호
    • /
    • pp.1-17
    • /
    • 2023
  • 정보통신기술의 발전과 디지털 기기의 대중화로 인해, 온라인 시장의 규모가 커지고 있다. 그 결과 고객들은 상품을 선택하는데 많은 시간과 비용이 소요되는 정보 과부하(Information Overload) 문제에 직면하고 있다. 따라서 고객이 선호할만한 상품을 추천해 주는 추천 시스템은 필수적인 도구가 되었으며 협업 필터링(Collaborative Filtering) 기법은 가장 널리 쓰이는 추천 방법이다. 전통적인 추천 시스템은 평점과 같은 정량적인 데이터만을 사용하기 때문에 추천의 정확도는 높지 않다. 이와 같은 문제를 해결하기 위해 요즘에는 사용자 리뷰와 같은 정성적 데이터를 반영하는 연구가 활발히 진행되고 있다. 협업 필터링의 일반적인 절차는 사용자-상품 행렬 생성, 이웃 집단 탐색, 추천 목록 생성 3단계로 구성되며 코사인 같은 사용자 유사도를 사용하여 목표 고객의 이웃을 탐색하며, 추천 상품 목록을 생성한다. 본 연구에서는 이웃 집단 탐색 및 추천 목록 생성 단계에서 사용하는 사용자 간의 유사도를 기존의 사용자 평점을 이용한 유사도에 고객의 리뷰 데이터를 사용하는 확장된 사용자 유사도를 제시한다. 리뷰를 정량화 하기 위해 본 연구에서는 텍스트 마이닝을 활용한다. 즉, 리뷰 데이터에 TF-IDF, Word2Vec, 그리고 Doc2Vec 기법을 사용하여 두 사용자 간의 리뷰 유사도를 구한 후 사용자 평점을 사용한 유사도와 리뷰 유사도를 결합한 확장된 유사도를 생성하는 것이다. 이를 검증하기 위해 전자상거래 사이트인 Amazon의 'Health and Personal Care'의 사용자 평점과 리뷰 데이터를 사용하였다. 실험 결과, 사용자 간 유사도를 산출할 때 기존의 평점에 기반한 유사도만을 사용하는 것보다, 사용자 리뷰의 유사도를 추가로 반영한 확장된 유사도를 사용하면 추천의 정확도가 높아진다는 것을 확인했다. 또한, 여러 텍스트 마이닝 기법 중에서 TF-IDF 기법을 사용한 확장된 유사도를 이웃 집단 탐색 및 추천 목록 생성단계에서 사용할 때의 성능이 가장 좋게 나타났다.

Splunk 플랫폼을 활용한 유해 정보 탐지를 위한 빅데이터 분석 시스템 설계 (Design of Splunk Platform based Big Data Analysis System for Objectionable Information Detection)

  • 이협건;김영운;김기영;최종석
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권1호
    • /
    • pp.76-81
    • /
    • 2018
  • 미래 경제 성장 동력으로 부상하고 있는 사물인터넷은 이미 생활과 밀접한 분야에서는 도입이 활발하게 이루어지고 있으나, 잠재된 보안위협은 여전히 잔존하고 있다. 특히 인터넷 상의 유해 정보는 스마트홈 및 스마트시티의 활성화로 인해 폭발적으로 설치된 CCTV에 할당된 IP 정보 및 심지어 접속 포트 번호들이 포털 검색 결과 및 페이스북, 트위터와 같은 소셜 미디어 등에 공개되어 간단한 툴로도 보다 쉽게 해킹이 가능하다. 사용자들이 많이 사용하는 포털 검색 데이터 및 소셜 미디어 데이터의 보안취약점 및 불법 사이트 정보들을 데이터 분석하여, 보안취약성 같은 위험 요소가 내포된 데이터 및 사회적 문제를 야기하는 불법 사이트에 대한 대응을 신속하게 수행할 수 있게 지원하는 빅데이터 분석 시스템이 필요하다. 본 논문에서는 빅데이터 분석 시스템 설계를 위해 하둡 기반 빅데이터 분석 시스템과 스파크 기반 빅데이터 분석 시스템 연구를 통해 요구사항을 도출하여 요구사항에 맞게 Splunk 플랫폼을 활용한 유해 정보 탐지를 위한 빅데이터 분석 시스템을 설계하였다.