• 제목/요약/키워드: WEKA

검색결과 57건 처리시간 0.026초

인터넷 기반 스마트 화초 관리 시스템 (Smart Plants Management System based on Internet)

  • 박현숙;박천관;홍유식
    • 한국인터넷방송통신학회논문지
    • /
    • 제15권5호
    • /
    • pp.193-199
    • /
    • 2015
  • 요즈음, 온도 및 습도, 조도 센서를 이용하여서, 식물 재배 환경 정보를 자동으로 수집하고 생장환경을 관리하는 지능형 온실 시스템이 많이 연구되고 있다. 본 논문에서는 조도, 온도 및 습도를 예측해서 인터넷 기반에서, 식물 재배의 최적 환경 조건을 추론하는 모의실험을 하였다. IOT 환경에서, 식물 재배 조건을 온도, 습도, 조도를 아두이노 센서에 실시간으로 온실 관리자에게 전송해서, 식물 재배에 필요한 최적의 온도, 습도 조건 값보다 크거나 적으면 자동으로 SMS 경고 문자를 실시간으로 전송해 주기 때문에, 급격한 기후 변화 (눈,비, 폭염)조건일 경우라도 최적의 화초 재배조건을 관리 할 수 있다. 본 논문에서는 퍼지논리와 WEKA TOOL을 이용하여서, 같은 온대 식물이라도, 그 지역에 필요한 최적의 온도, 습도, 조도(일사량) 수치를 산출하는 모의실험을 하였다.

기계경비시스템 오경보 이벤트 분석을 위한 데이터마이닝 기법 연구 (A Study of Data Mining Methodology for Effective Analysis of False Alarm Event on Mechanical Security System)

  • 김종민;최경호;이동휘
    • 융합보안논문지
    • /
    • 제12권2호
    • /
    • pp.61-70
    • /
    • 2012
  • 본 연구의 목적은 효율적인 기계경비시스템 오경보 이벤트 분석을 위해 가장 적합한 데이터마이닝 기법을 도출하는데 있다. 이를 위해 기계경비시스템 오경보의 발생원인을 살펴보고, 오경보 시의 출동건수, 오경보율 그리고 오경보원인의 통계자료를 토대로한 데이터를 데이터마이닝 프로그램인 WEKA에 맞게 변환시켜 여러 알고리즘에 적용 및 분석하였다. 본 논문에서는 적합한 데이터마이닝 기법을 찾기 위해 Decision Tree, Naive Bayes, BayesNet Apriori, J48Tree 알고리즘을 활용하였고, 분석을 통해 생성된 가장 높은 값을 도출하여 해당 알고리즘의 적용 가능성을 확인하였다. 이와 같은 연구를 통해 효율적으로 기계경비시스템의 오경보를 예측하고, 오경보에 대한 보다 효율적인 대처방안을 모색할 수 있음을 보여주었다.

머신러닝 알고리즘 분석 및 비교를 통한 Big-5 기반 성격 분석 연구 (A Study on Big-5 based Personality Analysis through Analysis and Comparison of Machine Learning Algorithm)

  • 김용준
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권4호
    • /
    • pp.169-174
    • /
    • 2019
  • 본 연구에서는 설문지를 이용한 데이터 수집과 데이터 마이닝에서 클러스터링 기법으로 군집하여 지도학습을 이용하여 유사성을 판단하고, 성격들의 상관 관계의 적합성을 분석하기 위해 특징 추출 알고리즘들과 지도학습을 이용하는 것을 목표로 진행한다. 연구 수행은 설문조사를 진행 후 그 설문조사를 토대로 모인 데이터들을 정제하고, 오픈 소스 기반의 데이터 마이닝 도구인 WEKA의 클러스터링 기법들을 통해 데이터 세트를 분류하고 지도학습을 이용하여 유사성을 판단한다. 그리고 특징 추출 알고리즘들과 지도학습을 이용하여 성격에 대해 적합한 결과가 나오는지에 대한 적합성을 판단한다. 그 결과 유사성 판단에 가장 정확도 높게 도움을 주는 것은 EM 클러스터링으로 3개의 분류하고 Naïve Bayes 지도학습을 시킨 것이 가장 높은 유사성 분류 결과를 도출하였고, 적합성을 판단하는데 도움이 되도록 특징추출과 지도학습을 수행하였을 때, Big-5 각 성격마다 문항에 추가되고 삭제되는 것에 따라 정확도가 변하는 모습을 찾게 되었고, 각 성격 마다 차이에 대한 분석을 완료하였다.

Big 5 성격 요소와 머신 러닝 알고리즘을 통한 창의적인 사람들의 특징 연구 (Feature Selection for Creative People Based on Big 5 Personality traits and Machine Learning Algorithms)

  • 김용준
    • 한국인터넷방송통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.97-102
    • /
    • 2019
  • 창의적인 사람에 대한 정확한 기준이나 수치화를 사용하여 체계적인 분류와 분석 방법이 없었기에 정의하는 데에 어려움이 많다. 이 문제를 해결하기 위하여 본 연구에서는 창의적인 사람을 어떻게 구분 지을 수 있을지에 대한 것과 어떤 유사한 성격이 있는지 분석한다. 본 연구에서 우선 Big 5 성격 특성 기법을 이용하여 설문조사를 진행하고, 그 설문조사로 얻은 데이터 세트를 가지고 데이터 마이닝 도구인 WEKA를 이용하여 데이터 세트를 분류하고 분석한 뒤, 창의적인 사람들과 연관성 있는 성격 특징들을 다양한 머신 러닝 기법을 이용하여 분석하는 것을 목표로 진행하였다. 7개의 특징 선택 알고리즘을 활용하고, 특징 선택 알고리즘들로 분류된 특징 집단을 선택하여 머신 러닝 알고리즘에 적용하여 정확도를 알아냈고, 서포트 벡터 머신을 통해 나온 특징이 가장 높은 분류 결과를 도출하였다.

의사결정나무를 이용한 토양유기탄소 추정 모델 제작 (Building a Model for Estimate the Soil Organic Carbon Using Decision Tree Algorithm)

  • 유수홍;허준;정재훈;한수희
    • 대한공간정보학회지
    • /
    • 제18권3호
    • /
    • pp.29-35
    • /
    • 2010
  • 토양유기탄소는 산림의 형성에 도움을 주며, 대기 중의 이산화탄소양을 조절함으로써 지구 온난화에 영향을 미치는 중요한 인자 중 하나이다. 토양에 존재하는 인자의 분포를 정확히 파악하려면 모든 지역에 대해 샘플링을 수행 해야하나 이는 매우 비현실적인 방법이다. 따라서 알맞은 모델을 제작하여 토양유기탄소의 분포를 추정할 수 있다면 그 활용도가 높을 것으로 판단된다. 본 연구에서는 의사결정나무 알고리즘을 이용해 경사 데이터, 경사향 데이터, Digital Elevation Model (DEM), 식생의 형태 데이터로부터 토양유기탄소를 상대적으로 다량 함유하고 있는 환경 인자를 파악할 수 있는 모델을 제작했으며, 정확도 검증은 10 집단 교차 검정을 통해 수행하였다. 이를 위하여 See 5와 Weka 소프트웨어를 이용하였다. See5 소프트웨어의 경우, 토양유기탄소 표층에 대해 식생의 형태에 의해 토양유기탄소량이 결정되는 것으로 나타났으며, 중간층에 대해서는 DEM에 의해 토양유기탄소량이 달라진다는 결론이 도출됐다. 생성된 모델의 정확도는 표층에 대해 70.8%, 중간층에 대해 64.7%인 것으로 나타났다. Weka 소프트웨어의 경우, 토양유기탄소 샘플의 표층에 대해 See5와 동일한 결과가 도출되었지만, 중간층에 대해서는 DEM이나 식생의 형태뿐만 아니라 경사향도 영향을 미친다는 결론이 도출되었다. 생성된 모델의 정확도는 표층에 대해 68.98%, 중간층에 대해 60.65%인 것으로 나타났다. 본 연구는 토양유기탄소량의 파악 및 토양유기탄소 지도 제작에 활용될 수 있을 것으로 사료된다.

Map-Reduce 프로그래밍 모델 기반의 나이브 베이스 학습 알고리즘 (Naive Bayes Learning Algorithm based on Map-Reduce Programming Model)

  • 강대기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2011년도 추계학술대회
    • /
    • pp.208-209
    • /
    • 2011
  • 본 논문에서는, 맵-리듀스 모델 기반에서 나이브 베이스 알고리즘으로 학습과 추론을 수행하는 방안에 대해 소개하고자 한다. 이를 위해 Apache Mahout를 이용하여 분산 나이브 베이스 (Distributed Naive Bayes) 학습 알고리즘을 University of California, Irvine (UCI)의 벤치마크 데이터 집합에 적용하였다. 실험 결과, Apache Mahout의 분산 나이브 베이스 학습 알고리즘은 일반적인 WEKA의 나이브 베이스 학습 알고리즘과 그 성능면에서 큰 차이가 없음을 알 수 있었다. 이러한 결과는, 향후 빅 데이터 환경에서 Apache Mahout와 같은 맵-리듀스 모델 기반 시스템이 기계 학습에 큰 기여를 할 수 있음을 나타내는 것이다.

  • PDF

WEB 기반 교통사고 분석 (Analysis System for Traffic Accident based on WEB)

  • 홍유식;한창평
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권6호
    • /
    • pp.13-20
    • /
    • 2022
  • 겨울철 도로에서 발생하는 안개 및 결빙구간 교통사고 사망률의 경우는 도로조건 및 기상조건이 매우 중요한 요소 이다. 본 논문에서는 교통사고 예측 데이터를 가정하고 교통사고 위험율을 에측 하는 모의실험을 수행하였다. 그뿐만 아니라, 본 논문에서는 교통사고를 줄이고 교통사고를 예방하기 위해서, 교통공단에서 제공하는 교통사고 사망자 데이터를 WEKA 데이터 마이닝 기법 및 TENSOR FLOW 공개 소스를 이용해서 요인 분석 및 교통사고 치사율 사망을 예측하였다. 추가적인 기능으로는 지도 표시 기능을 이용해서, 운전자가 WEB 기반에서, 안개 및 결빙구간 정보를 운전자에게 제공하는 모의실험 및 교통사고 사진을 실시간으로 전송하는 모의실험 결과를 설명하였다.

Network Traffic Measurement Analysis using Machine Learning

  • Hae-Duck Joshua Jeong
    • 한국인공지능학회지
    • /
    • 제11권2호
    • /
    • pp.19-27
    • /
    • 2023
  • In recent times, an exponential increase in Internet traffic has been observed as a result of advancing development of the Internet of Things, mobile networks with sensors, and communication functions within various devices. Further, the COVID-19 pandemic has inevitably led to an explosion of social network traffic. Within this context, considerable attention has been drawn to research on network traffic analysis based on machine learning. In this paper, we design and develop a new machine learning framework for network traffic analysis whereby normal and abnormal traffic is distinguished from one another. To achieve this, we combine together well-known machine learning algorithms and network traffic analysis techniques. Using one of the most widely used datasets KDD CUP'99 in the Weka and Apache Spark environments, we compare and investigate results obtained from time series type analysis of various aspects including malicious codes, feature extraction, data formalization, network traffic measurement tool implementation. Experimental analysis showed that while both the logistic regression and the support vector machine algorithm were excellent for performance evaluation, among these, the logistic regression algorithm performs better. The quantitative analysis results of our proposed machine learning framework show that this approach is reliable and practical, and the performance of the proposed system and another paper is compared and analyzed. In addition, we determined that the framework developed in the Apache Spark environment exhibits a much faster processing speed in the Spark environment than in Weka as there are more datasets used to create and classify machine learning models.

선박 탑승자를 위한 다중 센서 기반의 스마트폰을 이용한 활동 인식 시스템 (Activity Recognition of Workers and Passengers onboard Ships Using Multimodal Sensors in a Smartphone)

  • 라지브 쿠마 피야레;이성로
    • 한국통신학회논문지
    • /
    • 제39C권9호
    • /
    • pp.811-819
    • /
    • 2014
  • 상황 인식은 유비쿼터스컴퓨팅 환경에 대한 진화를 변화시켰고 무선 센서네트워크 기술은 많은 응용기기에 대한 새로운 방법을 제시하였다. 특히, 행동 인식은 사람의 응용서비스를 제공하는데 있어 특정 사용자의 상황을 인식하는 핵심 요소로 의학, 취미, 군사 분야에서 폭넓은 응용분야를 갖고 있고 사용반경의 확대에서도 효율과 정확도를 높이는 방법에 크게 기여한다. 스마트폰 센서로부터 나오는 데이터로부터 프레임이 512인셈플 데이터를 얻어, 프레임간50%의 오버랩을 갖도록 하고 Machine Learning Algorithm 인 WEKA Experimenter (University of Waikato, Version 3.6.10)을 써서 데이더로부터 시간영역 특징값을 추출함으로써 행동 인식에 대한 99.33%의 정확도를 얻을 수 있었다. 또한, WEKA Experimenter의 사용기법인 C4.5 Decision Tree과 다른 방법인 BN, NB, SMO or Logistic Regression간의 비교실험을 하였다.

유비쿼터스 컴퓨팅 환경에서 개인화를 위한 상황정보 기반 사용자 프로파일 (Context Based User Profile for Personalization in Ubiquitous Computing Environments)

  • 문애경;김형환;박주영;최영일
    • 한국통신학회논문지
    • /
    • 제34권5B호
    • /
    • pp.542-551
    • /
    • 2009
  • 본 논문은 사용자에게 '상황에 따른 개인화된 서비스'를 추천하기 위한 사용자 프로파일을 제안한다. 제안하는 사용자 프로파일은 상황정보와 사용자의 서비스 사용 정보를 '학습'하여 생성된 [상황 정보, 서비스]의 이차원 조합으로 표현되며, 사용자에게 서비스를 '추천'하고자 할 때 사용된다. 학습단계에서는 강화학습의 기본 개념을 활용하여 미리 설정된 모델 없이 행동과 보상 값만으로 사용자 프로파일을 구성하며, 추천단계에서는 시간 및 장소 등의 현재 가용한 상황정보와 학습된 사용자 프로파일을 이용하여 현재 상태에서 사용자가 선호할 만한 서비스 목록을 생성하고 가장 높은 선호도 값을 갖는 서비스를 추천한다. 끝으로 본 논문에서 제안하는 학습 및 추천 알고리즘을 검증하기 위해 UCI 데이터를 사용한 모의 실험을 통해 Weka tool-kit의 주요 알고리즘들과 성능을 비교한다.