• 제목/요약/키워드: Sum of the Squared Errors

검색결과 43건 처리시간 0.02초

시간흐름을 고려한 특징 추출과 군집 분석을 이용한 헬스 리스크 관리 (Health Risk Management using Feature Extraction and Cluster Analysis considering Time Flow)

  • 강지수;정경용;정호일
    • 한국융합학회논문지
    • /
    • 제12권1호
    • /
    • pp.99-104
    • /
    • 2021
  • 본 논문에서는 시간 흐름을 고려한 특징추출과 군집분석을 이용한 헬스 리스크 관리를 제안한다. 제안하는 방법은 세단계로 진행한다. 첫 번째는 전처리 및 특징추출 단계이다. 이는 웨어러블 디바이스를 이용하여 라이프로그를 수집하여 불완전데이터, 에러, 잡음, 모순된 데이터를 제거하며 결측 값을 처리한다. 그 다음 특징추출을 위해 주성분 분석을 통해 중요 변수를 선택하고, 상관계수와 공분산을 통해 데이터 간의 관계와 유사한 데이터들의 분류를 진행한다. 또한 라이프로그에서 추출한 특징을 분석하기 위해 시간의 흐름을 고려하여 K-means 알고리즘을 통해 동적 군집을 진행한다. 새로운 데이터는 오차 제곱합의 증가분을 기반으로 유사성 거리 측정 방법을 통해 군집을 진행하고, 시간의 흐름을 고려하여 군집에 대한 정보를 추출한다. 따라서 특징 군집을 통해 헬스 의사결정 시스템을 이용하여 신체적 특성, 생활습관, 질병여부, 헬스케어 이벤트 발생위험, 예상 정도 등의 요소를 통해 리스크를 관리할 수 있다. 성능평가는 Precision, Recall, F-measure을 사용하여 제안하는 방법과 퍼지방법, 커널기반 방법을 비교한다. 평가결과 제안하는 방법이 우수하게 평가된다. 따라서 제안하는 방법을 통해 유병자와의 유사도를 이용하여 정확한 사용자의 잠재적 건강 위험을 예측 및 적절한 관리가 가능하다.

비전공자 학부생의 훈련데이터와 기초 인공신경망 개발 결과 분석 및 Orange 활용 (Analysis and Orange Utilization of Training Data and Basic Artificial Neural Network Development Results of Non-majors)

  • 허경
    • 실천공학교육논문지
    • /
    • 제15권2호
    • /
    • pp.381-388
    • /
    • 2023
  • 스프레드시트를 활용한 인공신경망 교육을 통해, 비전공자 학부생들은 인공신경망의 동작 원리을 이해하며 자신만의 인공신경망 SW를 개발할 수 있다. 여기서, 인공신경망의 동작 원리 교육은 훈련데이터의 생성과 정답 라벨의 할당부터 시작한다. 이후, 인공 뉴런의 발화 및 활성화 함수, 입력층과 은닉층 그리고 출력층의 매개변수들로부터 계산되는 출력값을 학습한다. 마지막으로, 최초 정의된 각 훈련데이터의 정답 라벨과 인공신경망이 계산한 출력값 간 오차를 계산하는 과정을 학습하고 오차제곱의 총합을 최소화하는 입력층과 은닉층 그리고 출력층의 매개변수들이 계산되는 과정을 학습한다. 스프레드시트를 활용한 인공신경망 동작 원리 교육을 비전공자 학부생 대상으로 실시하였다. 그리고 이미지 훈련데이터와 기초 인공신경망 개발 결과를 수집하였다. 본 논문에서는 12화소 크기의 소용량 이미지로 두 가지 훈련데이터와 해당 인공신경망 SW를 수집한 결과를 분석하고, 수집한 훈련데이터를 Orange 머신러닝 모델 학습 및 분석 도구에 활용하는 방법과 실행 결과를 제시하였다.

역산이론을 이용한 연안 수질모형의 매개변수 추정 (Parameter Estimation of Coastal Water Quality Model Using the Inverse Theory)

  • 조홍연;조범준;정신택
    • 한국해안해양공학회지
    • /
    • 제17권3호
    • /
    • pp.149-157
    • /
    • 2005
  • 모형의 지배방정식에서 정의되는 대표적인 매개변수는 유역 및 대기로부터의 오염부하량,퇴적물로부터의 오염물질 용출부하량, 확산계수, 반응계수 등으로, 직접적인 관측이 곤란할 뿐만 아니라 많은 관측비용을 필요로 한다. 본 연구에서는 매개변수를 포함한 오염물질 수지방정식을 구성하고, 구성된 선형 연립방정식을 이용하여 계산된 농도분포자료와 관측된 시계열 농도턱포자료를 이용하여 계산한 질량변화량의 차이를 최소화하는 역산문제를 구성하여 모형의 매개변수를 추정하는 방법을 제시하였다. 이 방법을 이용하여 천수만, 울산만(울산항)해 역에서 관측된 연직방향 농도분포 자료를 이용하여 연직 확산계수 및 대기로부터의 오염부하량, 퇴적물로부터의 오염물질 용출부하량, 확산$\cdot$반응에 의한 오염물질 변화량 등을 추정하였으며, 추정 매개변수는 시기적으로 변동이 크게 나타났다. 한편, 관측자료와 추정매개변수를 이용한 계산결과를 비교한 결과, RMS 오차는 괄측자료 범위의 $5.0\%$ 이하, 일치지수는 0.95 이상으로 본 방법을 이용한 매개변수 추정결과의 신뢰성은 우수한 것으로 파악되었다.