• 제목/요약/키워드: Kernel Classification

검색결과 218건 처리시간 0.032초

A ResNet based multiscale feature extraction for classifying multi-variate medical time series

  • Zhu, Junke;Sun, Le;Wang, Yilin;Subramani, Sudha;Peng, Dandan;Nicolas, Shangwe Charmant
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권5호
    • /
    • pp.1431-1445
    • /
    • 2022
  • We construct a deep neural network model named ECGResNet. This model can diagnosis diseases based on 12-lead ECG data of eight common cardiovascular diseases with a high accuracy. We chose the 16 Blocks of ResNet50 as the main body of the model and added the Squeeze-and-Excitation module to learn the data information between channels adaptively. We modified the first convolutional layer of ResNet50 which has a convolutional kernel of 7 to a superposition of convolutional kernels of 8 and 16 as our feature extraction method. This way allows the model to focus on the overall trend of the ECG signal while also noticing subtle changes. The model further improves the accuracy of cardiovascular and cerebrovascular disease classification by using a fully connected layer that integrates factors such as gender and age. The ECGResNet model adds Dropout layers to both the residual block and SE module of ResNet50, further avoiding the phenomenon of model overfitting. The model was eventually trained using a five-fold cross-validation and Flooding training method, with an accuracy of 95% on the test set and an F1-score of 0.841.We design a new deep neural network, innovate a multi-scale feature extraction method, and apply the SE module to extract features of ECG data.

GPGPU 기반 Convolutional Neural Network의 효율적인 스레드 할당 기법 (Efficient Thread Allocation Method of Convolutional Neural Network based on GPGPU)

  • 김민철;이광엽
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권10호
    • /
    • pp.935-943
    • /
    • 2017
  • 많은 양의 데이터 기반으로 학습하는 neural network 중 이미지 분류나 음성 인식 등에 사용되어 지고 있는 CNN(Convolution neural network)는 현재까지도 우수한 성능을 가진 구조로 계속적으로 발전되고 있다. 제한된 자원을 가진 임베디드 시스템에서 활용하기에는 많은 어려움이 있다. 그래서 미리 학습된 가중치를 사용하지만 여전히 한계점이 있기 때문에 이를 해결하기 위해 GPU의 범용 연산을 위해서 사용하는 GP-GPU(General-Purpose computing on Graphics Processing Units)를 활용하는 추세다. CNN은 단순하고 반복적인 연산을 수행하기 때문에 SIMT(Single Instruction Multiple Thread)기반의 GPGPU에서 스레드 할당과 활용 방법에 따라 연산 속도가 많이 달라진다. 스레드로 Convolution 연산과 Pooling 연산을 수행할 때 쉬어야 하는 스레드가 발생하는 데 이러한 문제를 해결하기 위해 남은 스레드가 다음 피쳐맵과 커널 계산에 활용되는 방법을 사용함으로써 연산 속도를 증가시켰다.

한국(韓國) 재래종(在來種) 옥수수의 계통분류(系統分類) 및 유전적(遺傳的) 특성(特性)에 관(關)한 연구(硏究) (Studies on Classification and Genetic Nature of Korean Local Corn Lines)

  • 이인섭;최봉호
    • 농업과학연구
    • /
    • 제9권1호
    • /
    • pp.396-450
    • /
    • 1982
  • 육종(育種) 자료(資料)를 얻기위해 수집(蒐集)한 한국(韓國) 재래종(在來種) 옥수수 57계통(系統)에 대(對)하여 주성분(主成分) 분석(分析)을 이용(利用)하여 재래종(在來種) 옥수수를 해석(解析)하고 계통분류(系統分類)를 하고 분류(分類)된 계통군별(系統群別)로 주요(主要) 특성(特性)에 대(對)한 유전적(遺傳的) 특성(特性)을 구명(究明)하고자 본(本) 연구(硏究)를 수행(修行)하였던 바 그 결과(結果)를 요약(要約)하면 다음과 같다. 1. 특성(特性)들의 평균치(平均値)는 모든 특성(特性)에서 계통간(系統間) 차이(差異)가 있었으며 비중(比重)을 제외(除外)한 모든 특성(特性)에서 교배유형별(交配類型別)로 차이(差異)가 있었는데 출수기(出穗期)까지의 일수(日數)를 제외(除外)한 모든 특성(特性)에서 자식(自殖)된 계통(系統)의 것은 세력(勢力)이 감소(減少)되었고 톱교배(交配)된 계통(系統)의 것은 세력(勢力)이 증대(增大) 되었다. 2. 특성간(特性間)의 상관계수(相關係數)는 0.99~-0.59 사이에 분포(分布)하였는데 특성간(特性間)의 상관(相關)은 대체(大體)로 낮은 것이 많았다. 그러나 수량구성요소(收量構成要素)와 관련(關聯)된 주요특성(主要特性)에서는 상관(相關)이 높았고 교배유형(交配類型)에 따른 특성간(特性間)의 상관계수(相關係數)의 크기는 별(別) 차이(差異)가 없었다. 3. 27개(個) 특성(特性) 가운데서 12개(個)의 주요특성(主要特性)을 이용(利用)한 주성분(主成分) 분석(分析)에서 제(第)4 주성분(主成分)까지를 가지고 전(全) 변동(變動)의 86.4%를 형매교배(兄妹交配)에서, 84.3%를 자식교배(自殖交配)에서 81.1%를 톱교배(交配)에서 각각(各各) 설명(說明)할 수 있었다. 4. 주성분(主成分)에 대(對)한 특성(特性)의 기여율(寄與率)은 특성(特性)에 따라 달랐고 상위(上位) 주성분(主成分)에서 컸으며 하위(下位) 주성분(主成分)에서 작았다. 5. 주성분(主成分)과 특성간(特性間)의 상관계수(相關係數)는 주성분(主成分)의 생물학적(生物學的) 의의(意義)와 주성분(主成分)에 대응(對應)한 식물체(植物體)의 형(型)을 명확(明確)히 하였는데 제(第)1 주성분(主成分)은 식물체(植物體)의 크기에 관련(關聯)된 주성분(主成分)이었고, 제(第)2 주성분(主成分)은 식물체(植物體)의 분화(分化) 및 생장기간(生長期間)에 관련(關聯)된 주성분(主成分)이었고, 제(第)3 주성분(主成分)과 제(第)4 주성분(主成分)은 형매교배(兄妹交配)된 계통(系統) 및 자식계통(自殖系統)에서는 뚜렷한 특징(特徵)이 없었으나 톱교배(交配)된 계통(系統)에서는 엽(葉)의 크기에 관련(關聯)된 주성분(主成分)이었다. 6. 계통간(系統間) 거리(距離)에 의(依)해 57계통(系統)은 4개(個)의 계통군(系統群)으로 분류(分類)되었으나 전계통(全系統)의 91.1%인 52계통(系統)이 계통군(系統群) I로 분류(分類)되어 수집(蒐集)된 재래종(在來種) 옥수수의 대부분(大部分)이 동일계통(同一系統)인 것으로 나타났고, 계통군(系統群) II에는 3계통(系統)이, 계통군(系統群) III과 계통군(系統群) IV에는 각각(各各) 1계통(系統)이 속(屬)하였다. 계통군(系統群) I은 조생(早生), 단간(短稈), 중형자수(中型雌穗), 중립(中粒) 및 중수(中收) 계통(系統)들이었고, 계통군(系統群) II는 만생(晩生), 중간(中稈), 소형자수(小型雌穗), 소립(小粒), 다자수(多雌穗) 및 다수(多收) 계통(系統)들이었다. 계통군(系統群) III은 중생(中生), 장간(長稈), 소형자수(小型雌穗) 및 소립(小粒), 소수(少收) 계통(系統)들이었고, 계통군(系統群) IV는 중생(中生), 장간(長稈), 대형자수(大型雌穗), 소자수(少雌穗) 및 중수계통(中收系統)이었다. 7. 특성(特性)들의 자식열세도(自殖劣勢度)는 계통(系統)에 따라 차이(差異)가 있었으며 수량(收量), 이삭중(重), 초장(草長) 등(等)에서 비교적(比較的) 크게 나타났고, 분류(分類)된 군별(群別) 자식열세도(自殖劣勢度)는 100 입중(粒重), 엽수(葉數), 엽장(葉長) 및 출수기(出穗期)까지의 일수(日數) 등(等)의 특성(特性)이 계통군(系統群) I에서 컸고, 기타의 특성(特性)은 계통군(系統群) II에서 컸다. 8. 특성(特性)들의 잡종강세도(雜種强勢度)는 계통간(系統間) 차이(差異)가 있었으며 이삭중(重), 이삭당(當) 입중(粒重), 100입중(粒重) 및 엽장(葉長) 등(等)에서 높았으며 분류(分類)된 군별(群別)로 보면 이삭길이, 이삭직경(直徑), 이삭중(重), 이삭당(當) 입중(粒重), 100 입중(粒重) 및 엽장(葉長) 등(等)의 특성(特性)은 계통군(系統群) II에서 높았고 기타의 특성(特性)은 계통군(系統群) I에서 높았다. 9. 특성(特性)들의 동질접합체(同質接合體) 정도(程度)는 이삭중(重)(79.1%)에서 가장 높았으며 이삭 수(數)(-2.1%)에서 가장 낮았는데 특성별(特性別)로 큰 차이(差異)가 있었다. 분류(分類)된 군별(群別)에 있어서도 동질접합체(同質接合體) 정도(程度)는 특성(特性)에 따라 차이(差異)가 있었는데 계통군(系統群) II에서 높은 것이 많았고 계통군(系統群) I에서 낮은 것이 많았다. 10. 형매교배(兄妹交配)된 계통(系統)의 특성(特性)과 톱 교배(交配)된 계통(系統)의 특성(特性)과의 상관관계(相關關係)는 모든 특성(特性)에서 정(正)의 상관(相關)을 나타내었으며 이삭수(數), 초장(草長), 엽장(葉長), 수량(收量) 및 단백질(蛋白質) 함량(含量) 등(等)에서 높은 상관(相關)을 나타내었으며 이삭 직경(直徑), 100입중(粒重) 및 엽수(葉數) 등(等)에서는 유의성(有意性)이 인정(認定)되지 않았다.

  • PDF

수도권 지역에서 기상-대기질 모델링을 위한 VOC와 PM2.5의 화학종 분류 및 시간분배계수 산정 (Estimation of Chemical Speciation and Temporal Allocation Factor of VOC and PM2.5 for the Weather-Air Quality Modeling in the Seoul Metropolitan Area)

  • 문윤섭
    • 한국지구과학회지
    • /
    • 제36권1호
    • /
    • pp.36-50
    • /
    • 2015
  • 본 연구의 목적은 휘발성 유기화합물(VOC)과 먼지(PM)의 배출원 프로파일로부터 화학종 분류를 할당하고, 성김 행렬 조작자 핵심 배출량 시스템(SMOKE) 내에 배출원 분류코드에 따른 배출원 프로파일의 화학종 분류와 시간분배계수를 수정하는 것이다. 기솔린, 디젤 증기, 도장, 세탁, LPG 등과 같은 VOC 배출원 프로파일로부터 화학 종 분류는 탄소 결합 IV (CBIV) 화학 메커니즘과 주 규모 대기오염연구센터 99 (SAPRC99) 화학 메커니즘을 위해 각각 12종과 34종을 포함한다. 또한 토양, 도로먼지, 가솔린, 디젤차, 산업기원, 도시 소각장, 탄 연소 발전소, 생체 연소, 해안 등과 같은 PM2.5 배출원 프로파일로부터 화학종 분류는 미세 먼지, 유기탄소, 원소 탄소, 질산염과 황산염의 5종으로 할당하였다. 게다가 점 및 선 배출원의 시간 프로파일은 2007년 수도권 지역에서의 굴뚝 원격감시시스템(TMS)과 시간별 교통 흐름 자료로부터 구하였다. 특별히 점 배출원에 있어 오존 모델링을 위한 시간분배계수는 굴뚝 원격감시시스템 자료의 $NO_X$ 배출량 인벤토리에 근거하여 추정하였다.

고양이(Feliscatus)의 분포밀도와 잠재서식지 예측을 이용한 우선 관리 대상 지역 분석 (Analyzing Priority Management Areas for Domestic Cats (Felis catus) Using Predictions of Distribution Density and Potential Habitat)

  • 정아미;이상돈
    • 환경영향평가
    • /
    • 제32권6호
    • /
    • pp.545-555
    • /
    • 2023
  • 본 연구는 국내 고양이(Felis catus)의 분포밀도와 잠재 서식지를 예측하여 핵심분포지역을 선정하고, 보호지역을 중첩하여 우선으로 고양이 관리가 시행되어야 할 지역을 선정하고자 하였다. 분포밀도 파악을 위해 커널밀도추정을 사용하였고, 고밀도 지역을 분류한 결과 수도권 지역과 충남, 대전, 대구에서 밀도가 높았다. MaxEnt 모형을 활용한 잠재 서식지 예측에서는 고도, 시가지로부터의 거리, 지표 거칠기 등이 중요한 변수로 확인되었고, 임계값을 기준으로 출현/비출현 지역을 분류한 결과 수도권과 세종, 대전, 충남, 대구에서 출현 예측 지역의 면적이 높았다. 고밀도 지역과 출현 예측 지역을 중첩하여 핵심분포지역을 선정하였고, 핵심분포지역과 야생동물 보호지역을 중첩하여 우선으로 관리해야 할 지역을 파악하였다. 그 결과 경기도와 충남지역이 제일 면적이 넓은 지역으로 선정되었다. 또한 보호지역과 같은 우선 관리 대상 지역을 중심으로 핵심분포지역이 둘러싸고 있어, 추가적인 유입을 막고 관리하기 위한 완충구역을 설정하는 것이 필요하다. 이러한 결과는 고양이의 서식현황을 조사하고, 우리나라 실정에 맞는 관리방안 설정을 위한 기초자료로 활용될 수 있다.

온라인 주식 포럼의 핫토픽 탐지를 위한 감성분석 모형의 개발 (Development of Sentiment Analysis Model for the hot topic detection of online stock forums)

  • 홍태호;이태원;리징징
    • 지능정보연구
    • /
    • 제22권1호
    • /
    • pp.187-204
    • /
    • 2016
  • 소셜 미디어를 이용하는 사용자들이 직접 작성한 의견 혹은 리뷰를 이용하여 상호간의 교류 및 정보를 공유하게 되었다. 이를 통해 고객리뷰를 이용하는 오피니언마이닝, 웹마이닝 및 감성분석 등 다양한 연구분야에서의 연구가 진행되기 시작하였다. 특히, 감성분석은 어떠한 토픽(주제)를 기준으로 직접적으로 글을 작성한 사람들의 태도, 입장 및 감성을 알아내는데 목적을 두고 있다. 고객의 의견을 내포하고 있는 정보 혹은 데이터는 감성분석을 위한 핵심 데이터가 되기 때문에 토픽을 통한 고객들의 의견을 분석하는데 효율적이며, 기업에서는 소비자들의 니즈에 맞는 마케팅 혹은 투자자들의 시장동향에 따른 많은 투자가 이루어지고 있다. 본 연구에서는 중국의 온라인 시나 주식 포럼에서 사용자들이 직접 작성한 포스팅(글)을 이용하여 기존에 제시된 토픽들로부터 핫토픽을 선정하고 탐지하고자 한다. 기존에 사용된 감성 사전을 활용하여 토픽들에 대한 감성값과 극성을 분류하고, 군집분석을 통해 핫토픽을 선정하였다. 핫토픽을 선정하기 위해 k-means 알고리즘을 이용하였으며, 추가로 인공지능기법인 SOM을 적용하여 핫토픽 선정하는 절차를 제시하였다. 또한, 로짓, 의사결정나무, SVM 등의 데이터마이닝 기법을 이용하여 핫토픽 사전 탐지를 하는 감성분석을 위한 모형을 개발하여 관심지수를 통해 선정된 핫토픽과 탐지된 핫토픽을 비교하였다. 본 연구를 통해 핫토픽에 대한 정보 제공함으로써 최신 동향에 대한 흐름을 알 수 있게 되고, 주식 포럼에 대한 핫토픽은 주식 시장에서의 투자자들에게 유용한 정보를 제공하게 될 뿐만 아니라 소비자들의 니즈를 충족시킬 수 있을 것이라 기대된다.

CNN-LSTM 조합모델을 이용한 영화리뷰 감성분석 (Sentiment Analysis of Movie Review Using Integrated CNN-LSTM Mode)

  • 박호연;김경재
    • 지능정보연구
    • /
    • 제25권4호
    • /
    • pp.141-154
    • /
    • 2019
  • 인터넷 기술과 소셜 미디어의 빠른 성장으로 인하여, 구조화되지 않은 문서 표현도 다양한 응용 프로그램에 사용할 수 있게 마이닝 기술이 발전되었다. 그 중 감성분석은 제품이나 서비스에 내재된 사용자의 감성을 탐지할 수 있는 분석방법이기 때문에 지난 몇 년 동안 많은 관심을 받아왔다. 감성분석에서는 주로 텍스트 데이터를 이용하여 사람들의 감성을 사전 정의된 긍정 및 부정의 범주를 할당하여 분석하며, 이때 사전 정의된 레이블을 이용하기 때문에 다양한 방향으로 연구가 진행되고 있다. 초기의 감성분석 연구에서는 쇼핑몰 상품의 리뷰 중심으로 진행되었지만, 최근에는 블로그, 뉴스기사, 날씨 예보, 영화 리뷰, SNS, 주식시장의 동향 등 다양한 분야에 적용되고 있다. 많은 선행연구들이 진행되어 왔으나 대부분 전통적인 단일 기계학습기법에 의존한 감성분류를 시도하였기에 분류 정확도 면에서 한계점이 있었다. 본 연구에서는 전통적인 기계학습기법 대신 대용량 데이터의 처리에 우수한 성능을 보이는 딥러닝 기법과 딥러닝 중 CNN과 LSTM의 조합모델을 이용하여 감성분석의 분류 정확도를 개선하고자 한다. 본 연구에서는 대표적인 영화 리뷰 데이터셋인 IMDB의 리뷰 데이터 셋을 이용하여, 감성분석의 극성분석을 긍정 및 부정으로 범주를 분류하고, 딥러닝과 제안하는 조합모델을 활용하여 극성분석의 예측 정확도를 개선하는 것을 목적으로 한다. 이 과정에서 여러 매개 변수가 존재하기 때문에 그 수치와 정밀도의 관계에 대해 고찰하여 최적의 조합을 찾아 정확도 등 감성분석의 성능 개선을 시도한다. 연구 결과, 딥러닝 기반의 분류 모형이 좋은 분류성과를 보였으며, 특히 본 연구에서 제안하는 CNN-LSTM 조합모델의 성과가 가장 우수한 것으로 나타났다.

비대칭적 전이효과와 SVM을 이용한 변동성 매도전략의 수익성 개선 (Performance Improvement on Short Volatility Strategy with Asymmetric Spillover Effect and SVM)

  • 김선웅
    • 지능정보연구
    • /
    • 제26권1호
    • /
    • pp.119-133
    • /
    • 2020
  • Fama에 의하면 효율적 시장에서는 일시적으로 높은 수익을 얻을 수는 있지만 꾸준히 시장의 평균적인 수익을 초과하는 투자전략을 만드는 것은 불가능하다. 본 연구의 목적은 변동성의 장중 비대칭적 전이효과를 이용하는 변동성 매도전략을 기준으로 투자 성과를 추가적으로 개선하기 위하여 SVM을 활용하는 투자 전략을 제안하고 그 투자성과를 분석하고자 한다. 한국 시장에서 변동성의 비대칭적 전이효과는 미국 시장의 변동성이 상승한 날은 한국 시장의 아침 동시호가에 변동성 상승이 모두 반영되지만, 미국 시장의 변동성이 하락한 날은 한국 시장의 변동성이 아침 동시호가에서 뿐만 아니라 장 마감까지 계속해서 하락하는 이상현상을 말한다. 분석 자료는 2008년부터 2018년까지의 S&P 500, VIX, KOSPI 200, V-KOSPI 200 등의 일별 시가지수와 종가지수이다. 11년 동안의 분석 결과, 미국 시장의 변동성이 상승으로 마감한 날은 그 영향력이 한국 시장의 아침 동시호가 변동성에 모두 반영되지만, 미국 시장의 변동성이 하락으로 마감한 날은 그 영향력이 한국 시장의 아침 동시호가뿐만 아니라 오후 장 마감까지도 계속해서 유의적으로 영향을 미치고 있다. 시장이 효율적이라면 미국 시장의 전일 변동성 변화는 한국 시장의 아침 동시호가에 모두 반영되고 동시호가 이후에는 추가적인 영향력이 없어야 한다. 이러한 변동성의 장중 비정상적 전이 패턴을 이용하는 변동성 매도전략을 제안하였다. 미국 시장의 전날 변동성이 하락한 경우 한국 시장에서 아침 동시호가에 변동성을 매도하고 장 마감시에 포지션을 청산하는 변동성 데이트레이딩전략을 분석하였다. 연수익률은 120%, 위험지표인 MDD는 -41%, 위험과 수익을 고려한 성과지수인 Sharpe ratio는 0.27을 기록하고 있다. SVM 알고리즘을 이용해 변동성 데이트레이딩전략의 성과 개선을 시도하였다. 2008년부터 2014년까지의 입력자료를 이용하여 V-KOSPI 200 변동성지수의 시가-종가 변동 방향을 예측하고, 시가-종가 변동율이(-)로 예측되는 경우에만 변동성 매도포지션을 진입하였다. 거래비용을 고려하면 2015년부터 2018년까지 테스트기간의 연평균수익률은 123%로 기준 전략 69%보다 크게 높아지고, 위험지표인 MDD도 -41%에서 -29%로 낮아져, Sharpe ratio가 0.32로 개선되고 있다. 연도별로도 모두 수익을 기록하면서 안정적 수익구조를 보여주고 있고, 2015년을 제외하고는 투자 성과가 개선되고 있다.