• 제목/요약/키워드: Multivariate Time Series Classification

검색결과 12건 처리시간 0.027초

다변량 시계열 자료를 이용한 부정맥 예측 (Prediction of arrhythmia using multivariate time series data)

  • 이민혜;노호석
    • 응용통계연구
    • /
    • 제32권5호
    • /
    • pp.671-681
    • /
    • 2019
  • 최근에 부정맥 환자가 증가하면서 머신러닝을 이용한 부정맥을 예측하는 연구가 활발하게 진행되고 있다. 기존의 많은 연구들은 특정한 시점의 RR 간격 데이터에서 추출한 특징변수 다변량 데이터에 기반하여 부정맥을 예측하였다. 본 연구에서는 심장 상태가 시간에 따라 변해가는 패턴도 부정맥 예측에 중요한 정보가 될 수 있다고 생각하여 일정한 시간 간격을 두고 특징변수의 다변량 벡터를 추출하여 쌓음으써 얻어지는 다변량 시계열 데이터로 부정맥을 예측하는 것의 유용성에 대해 살펴보았다. 1-Nearest Neighbor 방법과 그것을 앙상블(ensemble)한 learner를 중심으로 비교했을 경우 시계열의 특징을 고려한 적절한 시계열 거리함수를 선택하여 시계열 정보를 활용한 다변량 시계열 데이터 기반 방법의 분류 성능이 더 좋게 나오는 것을 확인하였다.

textNAS의 다변수 시계열 데이터로의 적용 및 손동작 인식 (TextNAS Application to Multivariate Time Series Data and Hand Gesture Recognition)

  • 김기덕;김미숙;이학만
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.518-520
    • /
    • 2021
  • 본 논문에서는 텍스트 분류에 사용된 textNAS를 다변수 시계열 데이터에 적용 가능하도록 수정하여 이를 통한 손동작 인식 방법을 제안한다. 이를 사용하면 다변수 시계열 데이터 분류를 통한 행동 인식, 감정 인식, 손동작 인식 등 다양한 분야에 적용 가능하다. 그리고 분류에 적합한 딥러닝 모델을 학습을 통해 자동으로 찾아줘 사용자의 부담을 덜어주며 높은 성능의 클래스 분류 정확도를 얻을 수 있다. 손동작 인식 데이터셋인 DHG-14/28과 Shrec'17 데이터셋에 제안한 방법을 적용하여 기존의 모델보다 높은 클래스 분류 정확도를 얻을 수 있었다. 분류 정확도는 DHG-14/28의 경우 98.72%, 98.16%, Shrec'17 14 class/28 class는 97.82%, 98.39%를 얻었다.

  • PDF

Movie Box-office Prediction using Deep Learning and Feature Selection : Focusing on Multivariate Time Series

  • Byun, Jun-Hyung;Kim, Ji-Ho;Choi, Young-Jin;Lee, Hong-Chul
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권6호
    • /
    • pp.35-47
    • /
    • 2020
  • 박스 오피스 예측은 영화 이해관계자들에게 중요하다. 따라서 정확한 박스 오피스 예측과 이에 영향을 미치는 주요 변수를 선별하는 것이 필요하다. 본 논문은 영화의 박스 오피스 예측 정확도 향상을 위해 다변량 시계열 데이터 분류와 주요 변수 선택 방법을 제안한다. 연구 방법으로 한국 영화 일별 데이터를 KOBIS와 NAVER에서 수집하였고, 랜덤 포레스트(Random Forest) 방법으로 주요 변수를 선별하였으며, 딥러닝(Deep Learning)으로 다변량 시계열을 예측하였다. 한국의 스크린 쿼터제(Screen Quota) 기준, 딥러닝을 이용하여 영화 개봉 73일째 흥행 예측 정확도를 주요 변수와 전체 변수로 비교하고 통계적으로 유의한지 검정하였다. 딥러닝 모델은 다층 퍼셉트론(Multi-Layer Perceptron), 완전 합성곱 신경망(Fully Convolutional Neural Networks), 잔차 네트워크(Residual Network)로 실험하였다. 결과적으로 주요 변수를 잔차 네트워크에 사용했을 때 예측 정확도가 약 93%로 가장 높았다.

Subset 샘플링 검증 기법을 활용한 MSCRED 모델 기반 발전소 진동 데이터의 이상 진단 (Anomaly Detection In Real Power Plant Vibration Data by MSCRED Base Model Improved By Subset Sampling Validation)

  • 홍수웅;권장우
    • 융합정보논문지
    • /
    • 제12권1호
    • /
    • pp.31-38
    • /
    • 2022
  • 본 논문은 전문가 독립적 비지도 신경망 학습 기반 다변량 시계열 데이터 분석 모델인 MSCRED(Multi-Scale Convolutional Recurrent Encoder-Decoder)의 실제 현장에서의 적용과 Auto-encoder 기반인 MSCRED 모델의 한계인, 학습 데이터가 오염되지 않아야 된다는 점을 극복하기 위한 학습 데이터 샘플링 기법인 Subset Sampling Validation을 제시한다. 라벨 분류가 되어있는 발전소 장비의 진동 데이터를 이용하여 1) 학습 데이터에 비정상 데이터가 섞여 있는 상황을 재현하고, 이를 학습한 경우 2) 1과 같은 상황에서 Subset Sampling Validation 기법을 통해 학습 데이터에서 비정상 데이터를 제거한 경우의 Anomaly Score를 비교하여 MSCRED와 Subset Sampling Validation 기법을 유효성을 평가한다. 이를 통해 본 논문은 전문가 독립적이며 오류 데이터에 강한 이상 진단 프레임워크를 제시해, 다양한 다변량 시계열 데이터 분야에서의 간결하고 정확한 해결 방법을 제시한다.

서로 다른 특성의 시계열 데이터 통합 프레임워크 제안 및 활용 (Introduction and Utilization of Time Series Data Integration Framework with Different Characteristics)

  • 황지수;문재원
    • 방송공학회논문지
    • /
    • 제27권6호
    • /
    • pp.872-884
    • /
    • 2022
  • IoT 산업 발전으로 다양한 산업군에서 서로 다른 형태의 시계열 데이터를 생성하고 있으며 이를 다시 통합하여 재생산 및 활용하는 연구로 진화하고 있다. 더불어, 실제 산업에서 데이터 처리 속도 및 활용 시스템의 이슈 등으로 인해 시계열 데이터 활용 시 데이터의 크기를 압축하여 통합 활용하는 경향이 증가하고 있다. 그러나 시계열 데이터의 통합 가이드라인이 명확하지 않고 데이터 기술 시간 간격, 시간 구간 등 각각의 특성이 달라 일괄 통합하여 활용하기 어렵다. 본 논문에서는 통합 기준 설정 방법과 시계열 데이터의 통합시 발생하는 문제점을 기반으로 두 가지의 통합 방법을 제시하였다. 이를 기반으로 시계열 데이터의 특성을 고려한 이질적 시계열 데이터 통합 프레임워크를 구성하였으며 압축된 서로 다른 이질적 시계열 데이터의 통합과 다양한 기계 학습에 활용할 수 있음을 확인하였다.

뇌파 분류에 유용한 주성분 특징 (On Useful Principal Component Features for EEG Classification)

  • Park, Sungcheol;Lee, Hyekyoung;Park, Seungjin
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2003년도 봄 학술발표논문집 Vol.30 No.1 (B)
    • /
    • pp.178-180
    • /
    • 2003
  • EEG-based brain computer interface(BCI) provides a new communication channel between human brain and computer. EEG data is a multivariate time series so that hidden Markov model (HMM) might be a good choice for classification. However EEG is very noisy data and contains artifacts, so useful features mr expected to improve the performance of HMM. In this paper we addresses the usefulness of principal component features with Hidden Markov model (HHM). We show that some selected principal component features can suppress small noises and artifacts, hence improves classification performance. Experimental study for the classification of EEG data during imagination of a left, right up or down hand movement confirms the validity of our proposed method.

  • PDF

개입모형을 이용한 EEG 신호의 다변량 분석에 관한 연구 (Multivariate Analysis of EEG Signal using Intervention Models)

  • 임성식;김진호;김치용;황민철
    • 대한인간공학회지
    • /
    • 제18권1호
    • /
    • pp.13-24
    • /
    • 1999
  • The objective of the study is to discriminate EEG(electroencephalogram) due to emotional changes. Emotion was evoked by the series of auditory stimuli which were selected from the natural sounds in the sound effect collection of compact disc. Seventeen university students participated and experienced positive or negative emotions by six auditory stimuli with intermission between stimuli. Temporal EEG ($T_3$, $T_4$, $T_5$, and $T_6$) was recorded at the same time and a subjective test was performed on the eleven point scales after the experiment. The maximum and minimum scores of the EEG among six stimuli EEG were analyzed for discrimination of emotion. The EEG signals were transformed into feature objects based on scalar intervention model coefficients. Auditory stimulus was considered as intervention variable. They were classified by Discriminant Analysis for each channel. The features showed results with the best classification accuracy of 91.2 % in $T_4$ for auditory stimuli. This study could be extended to establish an algorithm which quantifies and classifies emotions evoked by auditory stimulus using time-series models.

  • PDF

선박 추진용 2행정 저속엔진의 고장모드 데이터 개발 및 LSTM 알고리즘을 활용한 특성인자 신뢰성 검증연구 (The Study of Failure Mode Data Development and Feature Parameter's Reliability Verification Using LSTM Algorithm for 2-Stroke Low Speed Engine for Ship's Propulsion)

  • 박재철;권혁찬;김철환;장화섭
    • 대한조선학회논문집
    • /
    • 제60권2호
    • /
    • pp.95-109
    • /
    • 2023
  • In the 4th industrial revolution, changes in the technological paradigm have had a direct impact on the maintenance system of ships. The 2-stroke low speed engine system integrates with the core equipment required for propulsive power. The Condition Based Management (CBM) is defined as a technology that predictive maintenance methods in existing calender-based or running time based maintenance systems by monitoring the condition of machinery and diagnosis/prognosis failures. In this study, we have established a framework for CBM technology development on our own, and are engaged in engineering-based failure analysis, data development and management, data feature analysis and pre-processing, and verified the reliability of failure mode DB using LSTM algorithms. We developed various simulated failure mode scenarios for 2-stroke low speed engine and researched to produce data on onshore basis test_beds. The analysis and pre-processing of normal and abnormal status data acquired through failure mode simulation experiment used various Exploratory Data Analysis (EDA) techniques to feature extract not only data on the performance and efficiency of 2-stroke low speed engine but also key feature data using multivariate statistical analysis. In addition, by developing an LSTM classification algorithm, we tried to verify the reliability of various failure mode data with time-series characteristics.

Data abnormal detection using bidirectional long-short neural network combined with artificial experience

  • Yang, Kang;Jiang, Huachen;Ding, Youliang;Wang, Manya;Wan, Chunfeng
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.117-127
    • /
    • 2022
  • Data anomalies seriously threaten the reliability of the bridge structural health monitoring system and may trigger system misjudgment. To overcome the above problem, an efficient and accurate data anomaly detection method is desiderated. Traditional anomaly detection methods extract various abnormal features as the key indicators to identify data anomalies. Then set thresholds artificially for various features to identify specific anomalies, which is the artificial experience method. However, limited by the poor generalization ability among sensors, this method often leads to high labor costs. Another approach to anomaly detection is a data-driven approach based on machine learning methods. Among these, the bidirectional long-short memory neural network (BiLSTM), as an effective classification method, excels at finding complex relationships in multivariate time series data. However, training unprocessed original signals often leads to low computation efficiency and poor convergence, for lacking appropriate feature selection. Therefore, this article combines the advantages of the two methods by proposing a deep learning method with manual experience statistical features fed into it. Experimental comparative studies illustrate that the BiLSTM model with appropriate feature input has an accuracy rate of over 87-94%. Meanwhile, this paper provides basic principles of data cleaning and discusses the typical features of various anomalies. Furthermore, the optimization strategies of the feature space selection based on artificial experience are also highlighted.

기체크로마토그래피 및 질량분석법에 의한 민속 소주중의 알코올 동족체 분석 (Gas Chromatographic and Mass Spectrometric Determination of Alcohol Homologues in the Korean Folk Sojues (Distilled Liquor))

  • 이동선;박혜성;김건;이택수;노봉수
    • 대한화학회지
    • /
    • 제38권9호
    • /
    • pp.640-652
    • /
    • 1994
  • 전통 민속소주의 향기성분의 실체를 규명할 목적으로 안동소주, 문배술, 이강주, 진도홍주 중에 존재하는 알코올 동족체인 퓨젤유 성분을 GC-FID-MS로 분석하여 중국산 카오량츄인 Moutainchiew, Ergoutoutiu 등과 비교하였다. 다공성 중합체인 Porapak Q를 이용한 고체상 추출법과 수증기 증류법, 용매추출법 등의 시료전처리 방법을 비교 실험하고 분석조건에 따른 알코올 동족체의 용리거동을 검토하였다. 컬럼오븐온도 변화와 분자량, 끓는점, 용량계수 사이에는 직선적 상관성을 나타내었다. 알코올 동족체의 탄소수가 증가할수록 머무름시간, 분자량, 끓는점, 용량계수의 log값들은 직선적으로 증가하였다. 알코올 동족체의 유전상수가 클수록 머무름 시간은 짧아지고 용량계수는 작아지는 경향을 나타내었으나 탄소수 4개의 sec-butyl alcohol은 유전상수가 작음에도 불구하고 탄소수 3개인 n-propyl alcohol보다 머무름시간이 짧았다. Ethyl alcohol 이외에 methyl alcohol, n-propyl alcohol, isobutyl alcohol, isopentyl alcohol, phenethyl alcohol 등이 검출되었다. 중국산 고량주에는 n-propyl alcohol 함량이 상대적으로 많은데 비하여 우리나라 소주에는 isopentyl alcohol의 함량이 높았다. 관능검사보다 객관적인 객관적인 함량형태 인식을 위하여 다변량통계해석법(주성분분석)을 사용하여 고찰한 결과 우리나라 민속소주는 중국산 고량주와는 완전히 다른 형태를 보여주었다.

  • PDF