• 제목/요약/키워드: 변형 기반 학습

검색결과 166건 처리시간 0.025초

불완전한 데이터를 처리할수 있는 분류기 (A Classifier Capable of Handling Incomplete Data Set)

  • 이종찬;이원돈
    • 한국정보통신학회논문지
    • /
    • 제14권1호
    • /
    • pp.53-62
    • /
    • 2010
  • 본 논문은 변수 값들이나 부류 값을 손실한, 불완전한 데이터를 포함하는 데이터 집합을 가지고 학습하는 문제에 적용될 수 있는 분류 알고리즘을 소개한다. 이 알고리즘은 가중치 값과 확률 기법들을 이용하는 데이터 확장 방법을 사용한다. 이는 휘셔(Fisher)의 식을 기반으로 최적의 투사 면이 되도록 고려된 분류기를 확장함으로써 수행한다. 이를 위해, 데이터 확장에 적용되는 과정으로 부터 몇몇 식들이 유도된다. 제안한 알고리즘의 성능평가를 위해, 데이터에서 하나의 변수를 선택하고 이 선택된 변수에 소실 값과 소실되지 않은 값들의 비율을 변형함에 의해 다른 측정값들의 결과들이 반복적으로 비교된다. 또한 데이터 집합의 객관적인 평가를 위해 기계학습에서 지식 습득 도구로 널리 쓰이는 C4.5의 결과와 비교한다.

영상복원용 신경회로망 필터의 최적화 알고리즘 구현 (Implementation of Neural Filter Optimal Algorithms for Image Restoration)

  • 이배호;문병진
    • 한국정보처리학회논문지
    • /
    • 제6권7호
    • /
    • pp.1980-1987
    • /
    • 1999
  • 복원 영상은 원 영상에 비해 항상 왜곡 및 잡음 요소가 첨가되는 경향이 있다. 영상 복원에서는, 변형 요소를 포함한 영상의 잡음, 또는 왜곡 정보를 교정하여 복원 영상의 품질을 향상시키고, 원 영상에 가장 근접한 값으로 표현하여야 한다. 영상 복원을 위한 공간 필터 중에서 선형 필터는 쉽게 구현될 수 있고, 가우시안 잡음 제거율이 높다는 장점이 있지만, 얼룩이나 임펄스 잡음 제거에 대해서는 좋지 않은 성능을 보이기 때문에, 이러한 단점을 보완할 수 있는 비선형 필터 알고리즘으로 본 논문에서는 적응성 다단계 최적화 필터(OAMF : optimal adaptive multistage filter)라는 영상 복원 공간 필터를 제안하였다. 적응성 다단계 최적화 필터는 영상 복원에서 필터링 시간 감소, 잡음 제거율 증가 그리고 외곽선 정보의 보존률 증가 등을 목적으로 역전파 학습 알고리즘의 가중치 학습법을 기반으로 적응성 다단계 필터(AMF)를 최적화 한 것이다. 본 논문에서 제시한 영상 복원 공간필터가 기존의 다른 필터들에 비해 임펄스 잡음 제거와 외곽선 정보 보존 기능, 가우시안 잡음 제거 능력 등이 향상됨을 시뮬레이션 결과로 입증하였다.

  • PDF

음향방출 기반 배관 조기 결함 검출 및 진단 방법 (Acoustic Emission based early fault detection and diagnosis method for pipeline)

  • 김재영;정인규;김종면
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제8권3호
    • /
    • pp.571-578
    • /
    • 2018
  • 노후된 배관은 예기치 못한 누수나 균열을 발생시킨다. 이를 방치하거나 늦게 대응하면 지속적인 가스자원, 수자원 등의 막대한 손실을 발생시킨다. 본 논문에서는 배관의 결함을 검출하기 위해 음향방출 신호를 사용하는 배관 조기 결함 검출 방법과 진단 알고리즘을 제안한다. 배관의 결함으로 인해 변형이 생길 경우 배관의 고유진동수가 변화하므로 이를 관찰함으로써 배관의 이상 유무를 판단할 수 있다. 배관 조기결함 검출 방법은 정상상태의 스펙트럼과 취득된 신호의 스펙트럼을 주파수 성분의 크기에 대해 비교함으로써 배관의 결함 유무를 판단한다. 배관 조기 결함 진단 알고리즘은 정상상태와 결함상태를 기계학습 알고리즘인 서포트 벡터 머신(SVM)으로 학습하고 실제 취득된 배관 음향방출 신호를 입력하여 배관 상태를 진단한다. 실험에서는 제작된 배관 테스트베드를 사용하여 정상상태, 5mm 균열 상태, 10mm 균열 및 파공 상태를 가공하여 제안 방법을 테스트하였다. 실험 결과에서는 제안한 검출 방법 및 진단 알고리즘의 배관 조기 결함 검출 성능의 우수성을 검증하였다.

멀티 파티 시스템에서 딥러닝을 위한 프라이버시 보존 기술 (Privacy Preserving Techniques for Deep Learning in Multi-Party System)

  • 고혜경
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.647-654
    • /
    • 2023
  • 딥러닝은 이미지, 텍스트와 같이 복잡한 데이터를 분류 및 인식하는데 유용한 방법으로 딥러닝 기법의 정확도는 딥러닝이 인터넷상의 AI 기반의 서비스를 유용하게 하는데 기초가 되었다. 그러나 딥러닝에서 훈련에 사용되는 방대한 양의 사용자 데이터는 사생활 침해 문제를 야기하였고 사진이나 보이스와 같이 사용자이 개인적이고 민감한 데이터를 수집한 기업들이 데이터들을 무기한으로 소유한다. 사용자들은 자신의 데이터를 삭제할 수 없고 사용되는 목적도 제한할 수 없다. 예를 들면, 환자 진료기록에 대한 딥러닝 기술을 적용하기 원하는 의료기관들과 같은 데이터소유자들은 사생활과 기밀유지 문제로 환자의 데이터를 공유할 수 없고 딥러닝 기술의 혜택을 받기 어렵다. 우리는 멀티 파티 시스템에서 다수의 작업자들이 입력 데이터집합을 공유하지 않고 신경망 모델을 공동으로 사용할 수 있는 프라이버시 보존 기술을 적용한 딥러닝 방법을 설계한다. 변형된 확률적 경사 하강에 기초한 최적화 알고리즘을 이용하여 하위 집합을 선택적으로 공유할 수 있는 방법을 이용하였고 결과적으로 개인정보를 보호하면서 학습 정확도를 증가시킨 학습을 할 수 있도록 하였다.

RoutingConvNet: 양방향 MFCC 기반 경량 음성감정인식 모델 (RoutingConvNet: A Light-weight Speech Emotion Recognition Model Based on Bidirectional MFCC)

  • 임현택;김수형;이귀상;양형정
    • 스마트미디어저널
    • /
    • 제12권5호
    • /
    • pp.28-35
    • /
    • 2023
  • 본 연구에서는 음성감정인식의 적용 가능성과 실용성 향상을 위해 적은 수의 파라미터를 가지는 새로운 경량화 모델 RoutingConvNet(Routing Convolutional Neural Network)을 제안한다. 제안모델은 학습 가능한 매개변수를 줄이기 위해 양방향 MFCC(Mel-Frequency Cepstral Coefficient)를 채널 단위로 연결해 장기간의 감정 의존성을 학습하고 상황 특징을 추출한다. 저수준 특징 추출을 위해 경량심층 CNN을 구성하고, 음성신호에서의 채널 및 공간 신호에 대한 정보 확보를 위해 셀프어텐션(Self-attention)을 사용한다. 또한, 정확도 향상을 위해 동적 라우팅을 적용해 특징의 변형에 강인한 모델을 구성하였다. 제안모델은 음성감정 데이터셋(EMO-DB, RAVDESS, IEMOCAP)의 전반적인 실험에서 매개변수 감소와 정확도 향상을 보여주며 약 156,000개의 매개변수로 각각 87.86%, 83.44%, 66.06%의 정확도를 달성하였다. 본 연구에서는 경량화 대비 성능 평가를 위한 매개변수의 수, 정확도간 trade-off를 계산하는 지표를 제안하였다.

MCMC 결측치 대체와 주성분 산점도 기반의 SOM을 이용한 희소한 웹 데이터 분석 (Sparse Web Data Analysis Using MCMC Missing Value Imputation and PCA Plot-based SOM)

  • 전성해;오경환
    • 정보처리학회논문지D
    • /
    • 제10D권2호
    • /
    • pp.277-282
    • /
    • 2003
  • 웹으로부터 유용한 정보를 얻기 위한 연구는 현재 많이 진행되고 있다. 본 논문에서는 특히 웹 로그 데이터의 희소성에 대한 문제 해결과 이를 통한 웹 사용자의 군집화 방안에 대하여 연구하였다. MCMC 방법의 베이지안 추론에 의한 결측치 대체 기법을 이용하여 웹 데이터의 희소성을 제거하였고, 주성분에 의한 산점도를 통하여 형상지도의 차원을 결정한 자기 조직화지도를 이용하여 웹 사용자의 군집화를 수행하였다. 제안 기법은 기존의 방법들에 비해 모형의 정확도와 빠른 학습 시간을 제공하여 주었다. KDD Cup 데이터를 이용한 실험을 통하여 제안 방법에 대한 문제 해결 절차 및 성능 평가를 객관적으로 확인하였다.

A Simple Paint Thickness Estimation Model in Shipyard Spray Painting

  • Geun-Wan, Kim;Seung-Hun, Lee;Yung-Keun, Kwon
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권2호
    • /
    • pp.209-216
    • /
    • 2023
  • 본 논문에서는 조선소 페인트 분사작업에서 분사 거리와 속도의 변화에 따라 페인트 두께를 추정할 수 있는 모델을 개발하고자 한다. 이를 위해 도장로봇을 이용하여 다섯가지 서로 다른 분사 거리와 속도값에 대한 실험 데이터를 취득하였다. 또한 노즐의 훼손 등으로 인해 노이즈가 발생하는데 이를 처리하기 위해 적절한 전처리과정을 적용하였다. 제안하는 방법은 주어진 데이터로부터 분사 거리와 속도에 대한 페인트 두께 추정 함수를 새로운 분사 거리와 속도에 대한 페인트 두께 추정 함수로 변형하는 계산을 한다. 인공신경망기반 예측 모델과 비교한 결과 제안하는 방법이 더욱 안정적이고 정확하게 예측할 수 있음을 확인할 수 있었다.

타이타늄 압연재의 기계학습 기반 극저온/상온 변형거동 예측 (Prediction of Cryogenic- and Room-Temperature Deformation Behavior of Rolled Titanium using Machine Learning)

  • 천세호;유진영;이성호;이민수;전태성;이태경
    • 소성∙가공
    • /
    • 제32권2호
    • /
    • pp.74-80
    • /
    • 2023
  • A deformation behavior of commercially pure titanium (CP-Ti) is highly dependent on material and processing parameters, such as deformation temperature, deformation direction, and strain rate. This study aims to predict the multivariable and nonlinear tensile behavior of CP-Ti using machine learning based on three algorithms: artificial neural network (ANN), light gradient boosting machine (LGBM), and long short-term memory (LSTM). The predictivity for tensile behaviors at the cryogenic temperature was lower than those in the room temperature due to the larger data scattering in the train dataset used in the machine learning. Although LGBM showed the lowest value of root mean squared error, it was not the best strategy owing to the overfitting and step-function morphology different from the actual data. LSTM performed the best as it effectively learned the continuous characteristics of a flow curve as well as it spent the reduced time for machine learning, even without sufficient database and hyperparameter tuning.

조경실무 교육수요 수준별 이러닝 콘텐츠 개발 방법론 - 모듈형 학습객체 개발과 재사용을 중심으로 - (A Study on the Development Method of e-Learning Contents by the Level of Demand for Landscaping Practical Education - Development and Reuse of Modular Learning Objects -)

  • 최자호
    • 한국조경학회지
    • /
    • 제46권3호
    • /
    • pp.1-13
    • /
    • 2018
  • 조경은 폭넓은 지식과 경험이 요구되는 소수인력분야로 타 분야에 비해 서비스 시장이 협소하여, 실무자를 위한 교육 서비스가 부족한 실정이다. 이에 본 연구는 교육수요 수준별로 맞춤형 조경실무교육이 가능함과 동시에 개발 과정의 경제적 효율성을 높이는 이러닝 콘텐츠 개발 방법론을 제시하고자 수행하였다. 먼저, 이론 고찰에서 ADDIE 모형을 변형해 효율성을 추구한 교육 과정 개발 모형을 선정하였으며, 스콤 기반 모형의 학습객체 재사용 개념을 도입하였다. 특히, 선행연구에서 나타난 문제점을 보완하기 위해 분석, 설계 단계를 강화하였으며, 조경과 ICT에 대한 융복합 지식을 지닌 교수설계자가 전반적 단계를 주도하도록 하였다. 실제적 개발 과정은 단계별 절차에 의해 조경실무자 요구, 환경 등의 '분석', 콘텐츠 재사용성을 고려한 교수학습 절차, 활동 등의 '설계', 실제 촬영, 편집 등의 1차 개발, 1차 개발 콘텐츠를 재사용하는 2차 개발 등의 '개발', 전문성, 만족도 등에 대한 '평가 및 수정' 단계 순으로 진행하였다. 연구결과, 모듈형 학습객체로 구성된 공간별 과정이 총 8과목 216차시로 1차 개발되었으며, 모듈화된 학습객체를 단위별로 교차 조합한 분야별 과정이 총 3과목 208차시, 난이도별 과정이 총 3과목 216차시로 2차 개발되었다. 이에 대한 '평가'로 만족도 평가는 전반적 만족도 4.02, 8개 척도의 평균값은 3.97로 둘 다 4.0에 근접하였다. 전문성 평가는 8개 과목의 평가점수가 84.8~99.0으로 매우 높게 집계되었으며, 내용적으로는 5개 평가항목의 점수가 89.9~96.4점으로 비교적 균등하게 나타났다. 결론적으로 이러닝 콘텐츠의 디지털적 특성과 조경산업의 일반적 특성에 대한 명확한 이해를 바탕으로 연구를 수행함에 따라 모듈형 학습객체로 구성된 교육 과정 개발과 단위별 학습객체의 재사용에 의한 교육 과정 개발이 가능하였다. 특히, 보편적 절차에 의한 전문적 지식과 경험을 전달하는데 효과적임이 검증되었으며, 오프라인 교육에서 발생하는 아날로그적 문제점을 일부 극복할 수 있는 계기를 마련하였다. 향후, 콘텐츠 확충에 의한 추가연구와 세분화된 주제를 대상으로 연구할 필요가 있다.

기계학습 알고리즘에 기반한 뇌파 데이터의 감정분류 및 정확도 향상에 관한 연구 (A research on the emotion classification and precision improvement of EEG(Electroencephalogram) data using machine learning algorithm)

  • 이현주;신동일;신동규
    • 인터넷정보학회논문지
    • /
    • 제20권5호
    • /
    • pp.27-36
    • /
    • 2019
  • 본 연구에서는 공개된 뇌파 데이터인 DEAP(A Database for Emotion Analysis using Physiological Signals) 데이터 세트를 활용한 감정분류 분석 및 정확도 향상에 대한 실험을 진행하였다. 실험에는 32명에 대한 32개의 뇌파측정 채널 데이터가 모두 사용되었다. 전처리과정에서는 뇌파 데이터에 대한 256Hz 샘플링작업을 진행하였고, 유한 임펄스 응답 필터를 사용하여 주파수 대역별로 쎄타(4-8Hz), 슬로 알파(8-10Hz), 알파(8-12Hz), 베타(12-30Hz), 감마(31-45Hz) 파형에 대한 데이터를 추출하였다. 추출한 데이터는 시간-주파수 변형을 통하여 데이터의 상태를 구분한 후에, 독립성분분석방법을 통해 잡음(Artifact)을 제거하여 데이터를 정제했다. 도출된 데이터는 분류기 기계학습 알고리즘 실험을 시행할 수 있도록 CSV 파일로 변형 하였으며, 감정분류에는 Arousal-Valence 평면을 사용하였다. 감정은 "긍정적(Positive)", "부정적(Negative)" 이외에 평온한 상태로 존재하는 "중립적(Neutral)"의 3가지 상태로 분류하였다. 정확도를 개선하기 위해서 랜덤 포레스트(Random Forest) 알고리즘에 속성 선택적 분류기(Attribute Selected Classifier: ASC) 방식에 의해 선택된 속성을 적용하여 실험하였다. 정확도는 "각성(Arousal)" 부분에서 Koelstra의 결과보다 "32.48%" 높은 결과가 도출되었고, Liu의 실험의 "정서가(Valence)"와 비교해보면 ASC(Random Forest) 결과가 "8.13%" 더 높은 결과를 도출하였다. 정확도를 개선하기 위해 ASC 방식을 적용한 랜덤 포레스트 분류기 실험결과에서는 전체평균을 기준으로 기존 연구 결과와 대비하여 "2.68%" 높은 정확도가 도출되었다.