• 제목/요약/키워드: Learning Data

검색결과 11,614건 처리시간 0.036초

A Quantitative Analysis on Machine Learning and Smart Farm with Bibliographic Data from 2013 to 2023

  • Yong Sauk Hau
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제16권3호
    • /
    • pp.388-393
    • /
    • 2024
  • The convergence of machine learning and smart farm is becoming more and more important. The purpose of this research is to quantitatively analyze machine learning and smart farm with bibliographic data from 2013 to 2023. This study analyzed the 251 articles, filtered from the Web of Science, with regard to the article publication trend, the article citation trend, the top 10 research area, and the top 10 keywords representing the articles. The quantitative analysis results reveal the four points: First, the number of article publications in machine learning and smart farm continued growing from 2016. Second, the article citations in machine learning and smart farm drastically increased since 2018. Third, Computer Science, Engineering, Agriculture, Telecommunications, Chemistry, Environmental Sciences Ecology, Material Science, Instruments Instrumentation, Science Technology Other Topics, and Physics are top 10 research areas. Fourth, it is 'machine learning', 'smart farming', 'internet of things', 'precision agriculture', 'deep learning', 'agriculture', 'big data', 'machine', 'smart' and 'smart agriculture' that are the top 10 keywords composing authors' keywords in the articles in machine learning and smart farm from 2013 to 2023.

AI 사이버보안 체계를 위한 블록체인 기반의 Data-Preserving AI 학습환경 모델 (Blockchain Based Data-Preserving AI Learning Environment Model for Cyber Security System)

  • 김인경;박남제
    • 한국정보기술학회논문지
    • /
    • 제17권12호
    • /
    • pp.125-134
    • /
    • 2019
  • 인공지능 기술은 작동과정에 대한 투명성이 보장되지 않는 수동적 인식 영역에 제한되는 한계점으로 인해, AI가 학습하는 데이터에 의존적인 취약점을 갖는다. 인공지능 학습을 위한 원시데이터는 AI 학습의 고도화를 위한 데이터 품질 확보를 위해 수작업으로 가공과 검수를 해야 하기에 인적 오류가 내재되어 있으며, 데이터의 훼손, 불완전함, 원시데이터와의 차이 등으로 인해 가공데이터를 통한 AI 학습 시 예상 치 못한 결과값을 도출할 수 있다. 이에 본 연구에서는 사이버 보안 관점에서의 접근을 통한 AI 학습데이터의 부정확한 사례 및 사이버보안 공격 방법 분석을 통해 기계학습 전 학습데이터 관리의 필요성을 살펴보고, 학습 데이터 무결성 검증을 위해 블록체인 기반의 학습데이터 환경 모델인 Data-preserving 인공지능 시스템 구축 방향을 제시한다. Data-preserving AI 학습환경 모델은 AI 학습데이터 제공 전 변조되지 않은 데이터로 학습됨을 보장 하여 데이터 가공 시 및 원시데이터 수집을 위한 오픈 네트워크에서의 데이터 제공 및 활용 시 있을 수 있는 사이버 공격, 데이터 변질 등의 위협을 사전에 방지할 수 있을 것으로 기대된다.

사용자 건강 상태알림 서비스의 상황인지를 위한 기계학습 모델의 학습 데이터 생성 방법 (Generating Training Dataset of Machine Learning Model for Context-Awareness in a Health Status Notification Service)

  • 문종혁;최종선;최재영
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권1호
    • /
    • pp.25-32
    • /
    • 2020
  • 다양한 분야에서 활용되는 상황인지 시스템은 상황정보를 획득하기 위한 추상화 과정에서 규칙 기반의 인공기능 기술이 기존에 사용되었다. 그러나 서비스에 대한 사용자의 요구사항이 다양해지고 사용되는 데이터의 증대로 규칙이 복잡해지면서 규칙 기반 모델의 유지보수와 비정형 데이터를 처리하는데 어려움이 있다. 이러한 한계점을 극복하기 위해 많은 연구들에서는 상황인지 시스템에 기계학습 기술을 적용하였으며, 이러한 기계학습 기반의 모델을 상황인지 시스템에 사용하기 위해서는 주기적으로 학습 데이터를 제공해야 한다. 이에 기계학습 기반 상황인지 시스템에 대한 선행연구에서는 여러 개의 기계학습 모델을 적용하기 위한 학습 데이터 생성, 제공 등의 과정을 보였으나 제한된 종류의 기계학습 모델만을 적용 가능하여 확장성이 고려되어야 한다. 본 논문은 기계학습 기반의 상황인지 시스템의 확장성을 고려한 기계학습 모델의 학습 데이터 생성 방법을 제안한다. 제안하는 방법은 시스템의 확장성을 고려하여 기계학습 모델의 요구사항을 반영할 수 있는 학습 데이터 생성 모델을 정의하고 학습 데이터 생성 모듈을 바탕으로 각각의 기계학습 모델의 학습 데이터를 생성하는 것이다. 시스템의 확장성의 검증을 위해 실험에서는 노인의 건강상태 알림 서비스를 위한 심박상태 분석 모델을 대상으로 한 학습데이터 생성 스키마를 기반으로 학습데이터 생성 모델을 정의하고 실환경에서 정의된 모델을 S/W에 적용하여 학습데이터를 생성한다. 또한 생성된 학습데이터의 유효성을 검증하기 위해 사용되는 기계학습 모델에 생성한 학습데이터를 학습시켜 정확도를 비교하는 과정을 보인다.

데이터 마이닝을 위한 경쟁학습모텔과 BP알고리즘을 결합한 하이브리드형 신경망 (A Neural Network Combining a Competition Learning Model and BP ALgorithm for Data Mining)

  • 강문식;이상용
    • Journal of Information Technology Applications and Management
    • /
    • 제9권2호
    • /
    • pp.1-16
    • /
    • 2002
  • Recently, neural network methods have been studied to find out more valuable information in data bases. But the supervised learning methods of neural networks have an overfitting problem, which leads to errors of target patterns. And the unsupervised learning methods can distort important information in the process of regularizing data. Thus they can't efficiently classify data, To solve the problems, this paper introduces a hybrid neural networks HACAB(Hybrid Algorithm combining a Competition learning model And BP Algorithm) combining a competition learning model and 8P algorithm. HACAB is designed for cases which there is no target patterns. HACAB makes target patterns by adopting a competition learning model and classifies input patterns using the target patterns by BP algorithm. HACAB is evaluated with random input patterns and Iris data In cases of no target patterns, HACAB can classify data more effectively than BP algorithm does.

  • PDF

특허분석을 위한 빅 데이터학습 (A Big Data Learning for Patent Analysis)

  • 전성해
    • 한국지능시스템학회논문지
    • /
    • 제23권5호
    • /
    • pp.406-411
    • /
    • 2013
  • 빅 데이터는 여러 분야에서 다양한 개념으로 사용된다. 예를 들어, 컴퓨터학과 사회학에서 빅 데이터에 대한 접근방법에 차이가 있지만, 데이터분석 관점에서는 공통적인 부분을 갖는다. 즉, 공학이든 사회과학이든 빅 데이터에 대한 분석은 반드시 필요하다. 통계학과 기계학습은 빅 데이터의 분석을 위한 대표적인 분석도구이다. 본 논문에서는 빅 데이터분석을 위한 학습도구에 대하여 알아보고 검색된 빅 데이터 원천에서부터 분석을 거쳐 최종적으로 분석결과를 사용하는 전체과정에 대하여 효율적인 빅 데이터학습 절차에 대하여 제안한다. 특히, 대표적인 빅 데이터 구조를 갖고 있는 특허문서에 대하여 빅데이터학습을 적용하여 특허분석을 수행하고 이 결과를 기술예측에 적용하는 방법에 대하여 연구한다. 제안방법에 대한 실제적용을 위하여 전 세계 특허청으로부터 빅 데이터 관련 특허문서를 검색하여 텍스트 마이닝의 전처리와 통계학의 다중선형회귀분석을 이용한 구체적인 빅 데이터학습에 대한 사례연구를 수행하였다.

트랜잭션 기반 머신러닝에서 특성 추출 자동화를 위한 딥러닝 응용 (A Deep Learning Application for Automated Feature Extraction in Transaction-based Machine Learning)

  • 우덕채;문현실;권순범;조윤호
    • 한국IT서비스학회지
    • /
    • 제18권2호
    • /
    • pp.143-159
    • /
    • 2019
  • Machine learning (ML) is a method of fitting given data to a mathematical model to derive insights or to predict. In the age of big data, where the amount of available data increases exponentially due to the development of information technology and smart devices, ML shows high prediction performance due to pattern detection without bias. The feature engineering that generates the features that can explain the problem to be solved in the ML process has a great influence on the performance and its importance is continuously emphasized. Despite this importance, however, it is still considered a difficult task as it requires a thorough understanding of the domain characteristics as well as an understanding of source data and the iterative procedure. Therefore, we propose methods to apply deep learning for solving the complexity and difficulty of feature extraction and improving the performance of ML model. Unlike other techniques, the most common reason for the superior performance of deep learning techniques in complex unstructured data processing is that it is possible to extract features from the source data itself. In order to apply these advantages to the business problems, we propose deep learning based methods that can automatically extract features from transaction data or directly predict and classify target variables. In particular, we applied techniques that show high performance in existing text processing based on the structural similarity between transaction data and text data. And we also verified the suitability of each method according to the characteristics of transaction data. Through our study, it is possible not only to search for the possibility of automated feature extraction but also to obtain a benchmark model that shows a certain level of performance before performing the feature extraction task by a human. In addition, it is expected that it will be able to provide guidelines for choosing a suitable deep learning model based on the business problem and the data characteristics.

A Study on the Development of Adaptive Learning System through EEG-based Learning Achievement Prediction

  • Jinwoo, KIM;Hosung, WOO
    • 4차산업연구
    • /
    • 제3권1호
    • /
    • pp.13-20
    • /
    • 2023
  • Purpose - By designing a PEF(Personalized Education Feedback) system for real-time prediction of learning achievement and motivation through real-time EEG analysis of learners, this system provides some modules of a personalized adaptive learning system. By applying these modules to e-learning and offline learning, they motivate learners and improve the quality of learning progress and effective learning outcomes can be achieved for immersive self-directed learning Research design, data, and methodology - EEG data were collected simultaneously as the English test was given to the experimenters, and the correlation between the correct answer result and the EEG data was learned with a machine learning algorithm and the predictive model was evaluated.. Result - In model performance evaluation, both artificial neural networks(ANNs) and support vector machines(SVMs) showed high accuracy of more than 91%. Conclusion - This research provides some modules of personalized adaptive learning systems that can more efficiently complete by designing a PEF system for real-time learning achievement prediction and learning motivation through an adaptive learning system based on real-time EEG analysis of learners. The implication of this initial research is to verify hypothetical situations for the development of an adaptive learning system through EEG analysis-based learning achievement prediction.

미분류 데이터의 초기예측을 통한 군집기반의 부분지도 학습방법 (A Clustering-based Semi-Supervised Learning through Initial Prediction of Unlabeled Data)

  • 김응구;전치혁
    • 한국경영과학회지
    • /
    • 제33권3호
    • /
    • pp.93-105
    • /
    • 2008
  • Semi-supervised learning uses a small amount of labeled data to predict labels of unlabeled data as well as to improve clustering performance, whereas unsupervised learning analyzes only unlabeled data for clustering purpose. We propose a new clustering-based semi-supervised learning method by reflecting the initial predicted labels of unlabeled data on the objective function. The initial prediction should be done in terms of a discrete probability distribution through a classification method using labeled data. As a result, clusters are formed and labels of unlabeled data are predicted according to the Information of labeled data in the same cluster. We evaluate and compare the performance of the proposed method in terms of classification errors through numerical experiments with blinded labeled data.

빅데이터와 AI를 활용한 교육용 자료의 분석에 대한 조사 (A Survey on Deep Learning-based Analysis for Education Data)

  • 노영욱
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.240-243
    • /
    • 2021
  • 최근에 빅 데이터와 AI 기술을 교육의 평가와 개별 학습에 적용하는 연구 성과가 있었다. 정보 기술의 혁신으로 소셜 미디어, MOOC, 지능형 개인지도 시스템, LMS, 센서 및 모바일 장치 등으로부터 학생들의 개인 기록, 생리학적 데이터, 학습 로그 및 활동, 학습 성과 및 결과를 포함하는 동적이고 복잡한 데이터를 수집 가능하였다. 또한 COVID-19 환경에서 e-러닝이 활성화 되어 많은 양의 학습 데이터가 생성되었다. 이 데이터로부터 학습 분석과 AI 기술을 적용하여 의미있는 패턴의 추출과 지식의 발견이 될 것으로 예상된다. 학습자 측면에서 학생의 학습 및 정서적 행동 패턴과 프로필을 식별하고, 평가 및 평가 방법을 개선하고, 개별 학생의 학습 성과 또는 중퇴를 예측하고, 개인화 된 지원을 위한 적응 시스템에 대한 연구는 필요하다. 본 연구에서는 교육용 데이터를 대상으로 이상탐지와 추천시스템에서 사용하는 기계학습 기술에 대한 조사와 분류를 하여 교육 분야의 연구에 기여하고자 한다.

  • PDF

Text Classification with Heterogeneous Data Using Multiple Self-Training Classifiers

  • William Xiu Shun Wong;Donghoon Lee;Namgyu Kim
    • Asia pacific journal of information systems
    • /
    • 제29권4호
    • /
    • pp.789-816
    • /
    • 2019
  • Text classification is a challenging task, especially when dealing with a huge amount of text data. The performance of a classification model can be varied depending on what type of words contained in the document corpus and what type of features generated for classification. Aside from proposing a new modified version of the existing algorithm or creating a new algorithm, we attempt to modify the use of data. The classifier performance is usually affected by the quality of learning data as the classifier is built based on these training data. We assume that the data from different domains might have different characteristics of noise, which can be utilized in the process of learning the classifier. Therefore, we attempt to enhance the robustness of the classifier by injecting the heterogeneous data artificially into the learning process in order to improve the classification accuracy. Semi-supervised approach was applied for utilizing the heterogeneous data in the process of learning the document classifier. However, the performance of document classifier might be degraded by the unlabeled data. Therefore, we further proposed an algorithm to extract only the documents that contribute to the accuracy improvement of the classifier.