• 제목/요약/키워드: 기계 학습 알고리즘

검색결과 774건 처리시간 0.032초

다단계 뉴럴네트워크(Neural Network)에 의한 온-라인 기계상태감시

  • 한정희;왕지남;허정준
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 1995년도 춘계공동학술대회논문집; 전남대학교; 28-29 Apr. 1995
    • /
    • pp.504-509
    • /
    • 1995
  • 컴퓨터에 의한 생산시스템의 통합체계화와 온-라인화에 따라 자동화된 설비진단 방법이 요구되어지고 있다. 이에 따라 기계설비에 각종 센서를 부착하여 실시간으로 수집된 출력신호를 이용하여 기계설비를 온-라인으로 감시하는 여러가지 기법들이 제시되고 있다. 본 연구에서는 진동센서로부터의 신호를 radial 함수에 근거한 다단계 뉴럴 네트워크(Neural Network)로 모형화하여 기계설비 상태를 감시하는 방법을 제시한다. 또한 다단계 모델링 분석을 통하여 신호를 예측하고 설비고장 원인을 분류하며, 다른 모형과의 비교를 통하여 효율성 평가와 최적 단계수를 결정하였다. 온라인 학습 알고리즘은 recursive least squares와 clustering 방법을 이용한다.

  • PDF

빅데이터 환경에서 기계학습 알고리즘 응용을 통한 보안 성향 분석 기법 (Security tendency analysis techniques through machine learning algorithms applications in big data environments)

  • 최도현;박중오
    • 디지털융복합연구
    • /
    • 제13권9호
    • /
    • pp.269-276
    • /
    • 2015
  • 최근 빅데이터 관련 산업 활성화에 따라 글로벌 보안 업체들은 지능적인 보안 위협 모니터링과 예방을 위해 분석 데이터의 범위를 정형/비정형 데이터로 확대하고, 보안 예방을 목적으로 사용자의 성향 분석 기법을 활용하려는 추세이다. 이는 기존 정형 데이터(기존 수치화 가능한 자료)의 분석 결과에서 추론할 수 있는 정보의 범위가 한정적이기 때문이다. 본 논문은 빅데이터 환경에서 기계학습 알고리즘($Na{\ddot{i}}ve$ Bayes, Decision Tree, K-nearest neighbor, Apriori)을 효율적으로 응용하여 보안 성향(목적 별 항목 분류, 긍정 부정 판단, 핵심 키워드 연관성 분석)을 분석하는데 활용한다. 성능 분석 결과 보안 성향 판단을 위한 보안항목 및 특정 지표를 정형/비정형 데이터에서 추출할 수 있음을 확인하였다.

미세먼지 예측을 위한 기계 학습 알고리즘의 적합성 평가 (Conformity Assessment of Machine Learning Algorithm for Particulate Matter Prediction)

  • 조경우;정용진;강철규;오창헌
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.20-26
    • /
    • 2019
  • 미세먼지의 인체 영향으로 인해 기존 대기 환경 모니터링 네트워크에서 측정된 과거 데이터를 활용하여 미세먼지를 예측하려는 다양한 연구가 진행되고 있다. 하지만 기존 설계된 예측 모델의 측정 환경, 세부 조건을 정확히 설정하기 어려우며, 측정된 기상 데이터의 누락과 같은 문제로 기존 연구 결과에 기반 한 새로운 예측 모델의 설계가 필요하다. 본 논문에서는 미세먼지 예측을 위한 선행 연구로서 다수의 연구에서 사용된 기계 학습 알고리즘인 다중 선형 회귀와 인공 신경망을 통해 예측 모델을 설계하여 미세먼지 예측을 위한 알고리즘의 적합성을 평가하였다. RMSE를 통한 예측 성능 비교 결과, MLR 모델의 경우 18.13, MLP 모델의 경우 14.31의 값을 보여 미세먼지 농도를 예측함에 있어 인공 신경망 모델이 예측에 더 적합함을 보였다.

빅데이터 분석을 활용한 재해 분야별 안전지수 서비스 모델 연구 (A Study on the Safety Index Service Model by Disaster Sector using Big Data Analysis)

  • 정명균;이석형;김창수
    • 한국재난정보학회 논문집
    • /
    • 제16권4호
    • /
    • pp.682-690
    • /
    • 2020
  • 연구목적: 본 연구는 재난 발생 데이터와 실시간 기상·대기 관련 데이터를 수집하고 정제과정을 통하여 데이터베이스를 구축하고, API로 제공되는 공공 데이터와 연계하여 빅 데이터 기반의 도시안전지수의 서비스 모델을 제안하고자 한다. 연구방법: 재난 발생과 관련한 다양한 정보를 공공 데이터와 SNS를 활용하여 수집하고, 기계학습 알고리즘으로 분석한 결과를 중심으로 이용자 관심지역의 재난상황을 실시간 대시보드로 확인하고 대처하는 방법을 제공하고자 한다. 연구결과: 분야별 지역안전지수와 기상·대기의 상관관계가 높은 속성을 추출하여 예측모델과 비교하면 교통사고 분야의 지역안전지수는 기상·대기 데이터와 상당한 상관관계가 있음을 확인하였다. 결론: 기계학습 알고리즘 기반의 안전지수 예측모델을 생성하여 이용자 관심 지역에 분야별 안전지수를 지도에 표시하는 시스템을 제안하였다.

Nonstandard Machine Learning Algorithms for Microarray Data Mining

  • Zhang, Byoung-Tak
    • 한국생물정보학회:학술대회논문집
    • /
    • 한국생물정보시스템생물학회 2001년도 제2회 생물정보 워크샵 (DNA Chip Bioinformatics)
    • /
    • pp.165-196
    • /
    • 2001
  • DNA chip 또는 microarray는 다수의 유전자 또는 유전자 조각을 (보통 수천내지 수만 개)칩상에 고정시켜 놓고 DNA hybridization 반응을 이용하여 유전자들의 발현 양상을 분석할 수 있는 기술이다. 이러한 high-throughput기술은 예전에는 생각하지 못했던 여러가지 분자생물학의 문제에 대한 해답을 제시해 줄 수 있을 뿐 만 아니라, 분자수준에서의 질병 진단, 신약 개발, 환경 오염 문제의 해결 등 그 응용 가능성이 무한하다. 이 기술의 실용적인 적용을 위해서는 DNA chip을 제작하기 위한 하드웨어/웻웨어 기술 외에도 이러한 데이터로부터 최대한 유용하고 새로운 지식을 창출하기 위한 bioinformatics 기술이 핵심이라고 할 수 있다. 유전자 발현 패턴을 데이터마이닝하는 문제는 크게 clustering, classification, dependency analysis로 구분할 수 있으며 이러한 기술은 통계학과인공지능 기계학습에 기반을 두고 있다. 주로 사용된 기법으로는 principal component analysis, hierarchical clustering, k-means, self-organizing maps, decision trees, multilayer perceptron neural networks, association rules 등이다. 본 세미나에서는 이러한 기본적인 기계학습 기술 외에 최근에 연구되고 있는 새로운 학습 기술로서 probabilistic graphical model (PGM)을 소개하고 이를 DNA chip 데이터 분석에 응용하는 연구를 살펴본다. PGM은 인공신경망, 그래프 이론, 확률 이론이 결합되어 형성된 기계학습 모델로서 인간 두뇌의 기억과 학습 기작에 기반을 두고 있으며 다른 기계학습 모델과의 큰 차이점 중의 하나는 generative model이라는 것이다. 즉 일단 모델이 만들어지면 이것으로부터 새로운 데이터를 생성할 수 있는 능력이 있어서, 만들어진 모델을 검증하고 이로부터 새로운 사실을 추론해 낼 수 있어 biological data mining 문제에서와 같이 새로운 지식을 발견하는 exploratory analysis에 적합하다. 또한probabilistic graphical model은 기존의 신경망 모델과는 달리 deterministic한의사결정이 아니라 확률에 기반한 soft inference를 하고 학습된 모델로부터 관련된 요인들간의 인과관계(causal relationship) 또는 상호의존관계(dependency)를 분석하기에 적합한 장점이 있다. 군체적인 PGM 모델의 예로서, Bayesian network, nonnegative matrix factorization (NMF), generative topographic mapping (GTM)의 구조와 학습 및 추론알고리즘을소개하고 이를 DNA칩 데이터 분석 평가 대회인 CAMDA-2000과 CAMDA-2001에서 사용된cancer diagnosis 문제와 gene-drug dependency analysis 문제에 적용한 결과를 살펴본다.

  • PDF

K-means 알고리즘과 GBR 알고리즘을 이용한 정수장 응집제 투입률 결정 기법 (Determination of coagulant input rate in water purification plant using K-means algorithm and GBR algorithm)

  • 김진영;강복선;정회경
    • 한국정보통신학회논문지
    • /
    • 제25권6호
    • /
    • pp.792-798
    • /
    • 2021
  • 본 논문에서는 인공지능 기반의 빅데이터 분석과 예측을 통하여 정수장의 공정 중 약품투입곤정에서 응집제 투입률을 결정하는 알고리즘을 도출하였다. 또한, 빅데이터 기술 및 인공지능 알고리즘 적용 방법에 대한 분석 및 기존의 학문적, 기술적 자료를 검토하여 유사 분야 적용 사례를 분석 검토하였다. 이를 통한 최적 응집제 투입률 제시를 목표로 운영 근무자의 의사결정 패턴을 입력 변수와 출력변수의 관계 패턴으로 학습한 후 학습된 패턴을 실제 응집제 주입 공정에 적용하여 침전수 탁도가 목표치에 근사한 일정 수준을 유지할 수 있도록 운영이 가능하였다. 데이터 범위 산정과 전처리를 거친 변수를 선정하여 알고리즘 수행을 준비한 후 군집화와 분류 알고리즘을 적용하여 알고리즘 수행과 결과에 대한 피드백을 반복하여 학습을 진행하였다.

회전수가 변하는 기기의 고장진단에 있어서 특성 기반 분류와 합성곱 기반 알고리즘의 예측 정확도 비교 (Comparison of Prediction Accuracy Between Classification and Convolution Algorithm in Fault Diagnosis of Rotatory Machines at Varying Speed)

  • 문기영;김형진;황세윤;이장현
    • 한국항해항만학회지
    • /
    • 제46권3호
    • /
    • pp.280-288
    • /
    • 2022
  • 본 연구는 정상 가동 중에도 회전수가 변하는 기기의 이상 및 고장 진단 방안을 다루고 있다. 회전수가 변함에 따라 비정상적 시계열 특성을 내포한 센서 데이터에 기계학습을 적용할 수 있는 절차를 제시하고자 하였다. 기계학습으로는 k-Nearest Neighbor(k-NN), Support Vector Machine(SVM), Random Forest을 사용하여 이상 및 고장 진단을 수행하였다. 또한 진단 정확성을 비교할 목적으로 이상 감지에 오토인코더, 고장진단에는 합성곱 기반의 Conv1D도 추가로 이용하였다. 비정상적 시계열로부터 통계 및 주파수 속성으로 구성된 시계열 특징 벡터를 추출하고, 추출된 특징 벡터에 정규화 및 차원 축소 기법을 적용하였다. 특징 벡터의 선택과 정규화, 차원 축소 여부에 따라 달라지는 기계학습의 진단 정확도를 비교하였다. 또한, 적용된 학습 알고리즘 별로 초매개변수 최적화 과정과 적층 구조를 설명하였다. 최종적으로 기존의 심층학습과 비교하여, 기계학습도 가변 회전기기의 고장을 정확하게 진단할 수 있는 절차를 제시하였다.

분산 딥러닝 모델 개발을 위한 고수준 분석 플랫폼 (High-level Analytics Platform for Development of Distributed Deep Learning Model)

  • 박경석;유찬희;;엄정호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.804-806
    • /
    • 2020
  • 딥러닝(deep learning)은 기계학습 알고리즘 중 가장 널리 활용되고 있는 알고리즘이다. 딥러닝 기술은 산업, 과학, 국방 및 공공 부문을 비롯하여 거의 모든 분야에서 폭넓게 확산되고 있다. 그러나 기계학습 기술에 대한 이해와 프로그래밍 지식이 부족할 경우 자유롭게 활용하는 데는 제약이 따르고 있으며 빅데이터를 활용하여 일반 이용자들이 직접 분산 학습 모형을 개발하고 배포하는 데 어려움이 발생하고 있다. 이러한 요구를 충족시키기 위해 딥러닝 프레임워크의 저수준 API를 추상화하여 고수준 분석과 분산 딥러닝을 지원하고 일반 이용자들이 실무적으로 복잡한 딥러닝 기술을 활용할 수 있는 기술을 개발하였다. 플랫폼 개발과 함께 중요하게 고려해야 하는 요소 중 하나로 플랫폼의 배포와 확장성 역시 고려되어야 한다. 본 플랫폼은 조직 내 계산 자원을 이용하여 플랫폼을 배포할 수 있으며 상용 클라우드 서비스와 연동하여 배포할 수 있도록 설계됨에 따라 환경의 제약 없이 유연한 서비스 제공이 가능하다.

의견어중심의 의존트리패턴자질을 이용한 기계학습기반 한국어 블로그 문서 의견분류시스템 (Machine Learning Based Blog Text Opinion Classification System Using Opinion Word Centered-Dependency Tree Pattern Features)

  • 곽동민;이승욱
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2009년도 추계학술발표대회
    • /
    • pp.337-338
    • /
    • 2009
  • 블로그문서의 의견극성분류 연구는 주로 기계학습기법에 기반한 방법이었고, 이때 주로 활용된 자질은 명사, 동사 등의 품사정보와 의견어 어휘정보였다. 하지만 하나의 의견어 어휘만을 고려한다면 그 극성을 판별하는데 필요한 정보가 충분하지 않아 부정확한 결과를 도출하는 경우가 발생할 수 있다. 본 논문에서는 여러 어휘를 동시에 고려하였을 때 보다 정확한 의견분류를 수행할 수 있을 것이라는 가정을 세웠다. 본 논문에서는 효과적인 의견어휘자질의 추출을 위하여 의견이 내포될 가능성이 높은 의견어휘를 기반으로 의존구문분석을 통해 의존트리패턴을 추출하였고, 제안하는 PF-IDF가중치를 적용하여 지지벡터기계(SVM)와 다항시행접근 단순베이지안(MNNB)알고리즘으로 비교 실험을 수행하였다. 기준시스템인 TF-IDF가중치 기법에 비해 정확도(accuracy)가 지지벡터기계에서 5%, 다항시행접근 단순베이지안에서 8.9% 향상된 성능을 보였다.

k-최근점 학습에 기반한 타동사-목적어 연어 사전의 최적화 (Optimization of Transitive Verb-Objective Collocation Dictionary based on k-nearest Neighbor Learning)

  • 김유섭;장병탁;김영택
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권3호
    • /
    • pp.302-313
    • /
    • 2000
  • 영한 기계번역에서 영어 문장의 동사구를 한국어로 정확하게 번역하기 위해서는 일반적으로 타동사와 목적어의 연어 관계를 이용한다. 본 논문에서는 k-최근점(k-nearest neighbor) 학습을 연어 관계에 적용하여 동사 번역을 선택하는 알고리즘을 제시하였는데 k-최근점 학습을 위해서 워드넷에서의 의미거리를 정의하여 사용하였다. 그리고 실시간 번역 시스템에 사용될 사전을 구성하기 위하여, 말뭉치로부터 타동사-목적어 쌍을 추출하여 학습예제를 구축하고, 이 예제의 크기를 번역률과 연관시켜 최적화시키는 알고리즘을 제시한다. 본 논문에서는 위의 알고리즘들을 사용하여 동사 'build'의 번역률을 약 90%로 유지하면서 사전의 크기를 최적화하였다.

  • PDF