• 제목/요약/키워드: Bigdata

검색결과 644건 처리시간 0.02초

RandomForest와 XGBoost를 활용한 한국어 텍스트 분류: 서울특별시 응답소 민원 데이터를 중심으로 (Korean Text Classification Using Randomforest and XGBoost Focusing on Seoul Metropolitan Civil Complaint Data)

  • 하지은;신현철;이준기
    • 한국빅데이터학회지
    • /
    • 제2권2호
    • /
    • pp.95-104
    • /
    • 2017
  • 2014년 서울시는 시민의 목소리에 신속한 응대를 목표로 '서울특별시 응답소' 서비스를 시작하였다. 접수된 민원은 내용을 바탕으로 카테고리 확인 및 담당부서로 분류 되는데, 이 부분을 자동화시킬 수 있다면 시간 및 인력 비용이 감소될 것이다. 본 연구는 2010년 6월 1일부터 2017년 5월 31일까지 7년치 민원 사례 17,700건의 데이터를 수집하여, 최근 화두가 되고 있는 XGBoost 모델을 기존 RandomForest 모델과 비교하여 한국어 텍스트 분류의 적합성을 확인하였다. 그 결과 RandomForest에 대비 XGBoost의 정확도가 전반적으로 높게 나타났다. 동일한 표본을 활용하여 업 샘플링과 다운 샘플링 시행 후에는 RandomForest의 정확도가 불안정하게 나타난 반면, XGBoost는 전반적으로 안정적인 정확도를 보였다.

  • PDF

프로세스 마이닝을 이용한 웹 사이트의 이용 패턴 분석 및 그룹 간 비교 분석 (Usage Pattern Analysis and Comparative Analysis among User Groups of Web Sites Using Process Mining Techniques)

  • 김슬기;정재윤
    • 한국빅데이터학회지
    • /
    • 제2권2호
    • /
    • pp.105-114
    • /
    • 2017
  • 오늘날 많은 서비스 지원이 웹 사이트를 통해 제공되고 있다. 웹 사이트의 이용 및 효율성을 최적화하기 위하여 방문자들의 이용 패턴 분석이 매우 중요하다. 본 연구에서는 BPI Challenge 2016에서 제공하는 웹 사이트 접속 로그를 분석하여 이용 패턴 분석 및 이용자 그룹별 비교 분석 연구를 수행하였다. 이 데이터는 네덜란드 고용보험사(UWV)의 IT 시스템의 웹 사이트 접속 로그를 제공하며, 고객의 인적 정보, 해당 기관의 웹 사이트를 사용할 때의 고객 행동을 설명하는 클릭 데이터 등의 대한 정보를 포함하고 있다. 본 연구에서는 프로세스 마이닝 기법을 이용하여 사용 고객의 사용 패턴과 고객 그룹 간 특징을 분석하여, 궁극적으로 웹 서비스를 이용하는 고객들을 대상으로 서비스 품질을 향상시키고자 한다.

  • PDF

사물인터넷과 빅데이터를 이용한 스포츠 시설 에너지 관리시스템에 관한 연구 (A Study on Energy Management System of Sport Facilities using IoT and Bigdata)

  • 권용광;허준
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권3호
    • /
    • pp.59-64
    • /
    • 2020
  • 파리기후협약에서 한국은 2030년까지 온실가스 배출전망(BAU) 대비 37% 감축이라는 의욕적인 목표를 제출하였다. 그리고 대응방안의 하나로 지능형 전력망인 스마트 그리드가 제시되었다. 스마트 그리드의 적용되기 위해서는 다양한 분야에 EMS(Energy Management System)가 설치 및 운영되어야 하는데, 수요자의 인식부족과 시스템 ROI의 한계로 보급이 지연되고 있는 상황이다. 따라서 최근에는 설치된 EMS의 효율을 높이기 위한 다양한 데이터 분석과 제어기술이 제시되고 있다. 본 연구에서는 IoT로 수집된 빅데이터를 SARIMA 모델로 분석하여 예측함으로써 공공 스포츠 시설의 에너지 사용량을 절검하여 운영하는 계측제어 알고리듬을 제시한다.

빅데이터 분석을 이용한 기온 변화에 대한 판매량 예측 모델 (Sales Volume Prediction Model for Temperature Change using Big Data Analysis)

  • 백승훈;오지연;이지수;홍준기;홍성찬
    • 한국빅데이터학회지
    • /
    • 제4권1호
    • /
    • pp.29-38
    • /
    • 2019
  • 본 연구에서는 판매량 증대와 효율적인 재고 관리를 위해 지난 5년간 온라인 쇼핑몰 'A'에서 누적된 빅데이터를 활용하여 기온 변화에 따른 반팔 티셔츠와 아우터웨어(outer wear)의 판매량을 예측하는 판매 예측 모델을 제안한다. 제안한 모델은 2014년부터 2017년도까지 기온 변화에 따른 반팔 티셔츠와 아우터웨어의 판매량을 분석하여 2018년 기온 변화에 따른 반팔티셔츠와 아우터웨어의 판매량을 예측한다. 제안한 판매 예측 모델을 사용하여 반팔티셔츠와 아우터웨어의 판매량 예측값과 실제 2018년 판매량을 비교 분석한 결과 반팔티셔츠와 아우터웨어의 예측 오차율은 각각 ±1.5%와 ±8%를 나타내었다.

  • PDF

공간 데이터 분석 기반의 비즈니스의 혁신: 해외 사례 분석을 중심으로 (Business Innovation Through Spatial Data Analysis: A Multi-Case Analysis)

  • 함유근
    • 한국빅데이터학회지
    • /
    • 제4권1호
    • /
    • pp.83-97
    • /
    • 2019
  • 서 및 통신 기술 발전으로 기업경영과 관련된 공간 데이터가 급증하고 있다. 공간 데이터는 이제 2차원적인 지리 데이터를 벗어나 3차원 이상의 공간에 관한 비정형 데이터로 진화하고 있다. 가상공간과 현실공간을 연결해야 하는 제4차산업혁명과 함께 기업들이 이를 활용할 기회도 크게 확대되고 있다. 최근의 해외 사례들의 분석 결과 특히 공간 속에 위치한 고객과 사물의 상황을 파악하여 맞춤화된 서비스를 제공하고, 위험관리를 하며, 더 나아가 업무 프로세스의 혁신도 공간 데이터 분석으로 가능해지고 있다. 향후 공간 속 사람과 사물 들 간의 관계 및 상황을 다양한 소스로부터의 공간 데이터를 결합하여 실시간으로 분석하는 비즈니스 혁신이 모든 분야에서 확대될 전망된다.

  • PDF

소셜 미디어 참여에 관한 연구 동향과 쟁점의 변화: 네트워크 분석과 클러스터링 기법을 활용한 메타 분석을 중심으로 (Trends in Social Media Participation and Change in ssues with Meta Analysis Using Network Analysis and Clustering Technique)

  • 신현보;선형주;이준기
    • 한국빅데이터학회지
    • /
    • 제4권1호
    • /
    • pp.99-118
    • /
    • 2019
  • 본 연구는 소셜 미디어 참여 관련 연구 베타분석을 위해 네트워크 분석과 클러스터링 기법을 활용하였다. 주경로 분석 결과 37개의 주요 연구가 추출되었고 커뮤니티 관련 네트워크와 뉴 미디어 관련 네트워크 두 가지로 구분되었다. 연결망 분석과 클러스터링 결과 네가지 클러스터가 형성되었다. 본 연구는 학술 데이터를 활용해 연구 동향을 거시적으로 파악하며 그 방법론으로 네트워크 분석과 기계학습을 활용하였다는 학술적 의의를 가진다.

  • PDF

건설프로젝트에서 Mobile-Cloud Computing Service 특성이 정보융합과 기대성과에 미치는 영향에 관한 연구: 사회적 자본의 관점에서 (A Study on the Effect of Mobile Cloud Computing Services Characteristics on the Intellectual Convergence and the Performance Expectancy in Construction Project: From the Perspective of the Social Capital)

  • 김영우;오재인
    • 한국빅데이터학회지
    • /
    • 제4권1호
    • /
    • pp.129-142
    • /
    • 2019
  • 건설 프로젝트는 불완전한 생산환경으로 인해 많은 건설실패가 발생하고 있다. 본 연구는 건설 현장에서 건설 기간 동안 ICT 자원을 임대하여 활용하고, 물리적인 유선 통신망 대신 스마트 폰, 테블릿 PC, 노트북 등 Mobile Device를 활용하는 Mobile Cloud Computing Service(이하 M-Cloud)를 도입할 경우 M-Cloud가 갖고 있는 신속정확성, 공유협업성, 편재성 등의 특성들이 건설현장에 참여하고 있는 다양한 프로젝트 참여자들 간의 사회적 관계망에 영향을 주어 참여자들 간의 정보교환 및 융합을 촉진하고, 상호 신뢰증진과 함께 궁극적으로 프로젝트 기대성과에 큰 도움을 줄 수 있다는 것을 실증적인 방법으로 연구하였다.

  • PDF

CDR 자료를 이용한 고병원성 조류인플루엔자 분석 (The Analysis of HPAI Using CDR Data)

  • 최대우;주재윤;송유한;한예지
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.13-22
    • /
    • 2019
  • 이 연구는 2018년도 정부(농림축산식품부)의 재원으로 농림식품기술기획평가원 지원을 받아 수행된 연구이다. 고병원성 조류인플루엔자의 유입은 해외로부터 철새를 통해 유입되고 있으나 어떤 경로를 통해 감염 원인을 농장에 제공하는지 정확히 밝혀진 바 없다. 그리고 발생 농장으로부터 농장 간의 전이도 차량이 주 원인이라고 추정할 뿐, 전파 주 원인이 정확히 밝혀진 것은 아니다. 본 논문 연구에서는 KT가 제공하는 CDR(Call Detailed Record) 데이터를 기반으로, 발생후보지로 추정되는 철새도래지를 방문한 사람이 어떤 경로를 거쳐 감염 농장으로 유입이 되는지 해당 시기의 인구 흐름을 보려고 한다.

  • PDF

금융회사 RPA(로봇자동화) 관련 규제 연구 (Research on Financial Regulations Related RPA(Robotic Process Automation))

  • 한택룡;이경호
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.47-59
    • /
    • 2019
  • 최근 국내외에서 확산되고 있는 RPA(Robotic Process Automation) 솔루션은 사용자가 응용프로그램의 GUI(Graphic User Interface)에서 대상 업무를 간편하게 자동화 할 수 있어 국내 다수 금융회사에서도 동 솔루션을 적용하는 사례가 지속적으로 증가하고 있다. 하지만 금융기관이 반드시 준수해야 하는 주요 감독규제들은 기존 전통적인 SDLC(Software Development Life Cycle)를 기반으로 하고 있어 일반 사용자의 시스템 Interface 환경 단에서 자동화하는 RPA에 그대로 적용되기에는 어려움이 있었다. 이에 본 논문에서는 금융회사가 RPA를 도입함에 있어 고려되어야 하는 주요 감독규정들과 통제항목들을 정리하고 RPA를 도입한 24개 금융회사의 통제 적용현황을 조사하여 향후 관련 컴플라이언스의 개정 필요성을 제시해보고자 한다.

  • PDF

머신러닝을 이용한 반도체 웨이퍼 평탄화 공정품질 예측 및 해석 모형 개발 (Predicting and Interpreting Quality of CMP Process for Semiconductor Wafers Using Machine Learning)

  • 안정언;정재윤
    • 한국빅데이터학회지
    • /
    • 제4권2호
    • /
    • pp.61-71
    • /
    • 2019
  • 반도체 웨이퍼의 표면을 연마하여 평탄화하는 Chemical Mechanical Planarization(CMP) 공정은 다양한 화학물질과 물리적인 기계장치에 의한 작용을 받기 때문에 공정을 안정적으로 관리하기 힘들다. CMP 공정에서 품질 지표로는 Material Removal Rate(MRR)를 많이 사용하고, CMP 공정의 안정적 관리를 위해서는 MRR을 예측하는 것이 중요하다. 본 연구에서는 머신러닝 기법들을 이용하여 CMP 공정에서 수집된 시계열 센서 데이터를 분석하여 MRR을 예측하는 모형과 공정 품질을 해석하기 위한 분류 모형을 개발한다. 나아가 분류 결과를 분석하여, CMP 공정 품질에 영향을 미치는 유의미한 변수를 파악하고 고품질을 유지하기 위한 공정 조건을 설명한다.

  • PDF