• 제목/요약/키워드: 1D Convolution

검색결과 95건 처리시간 0.024초

Emotion Recognition using Short-Term Multi-Physiological Signals

  • Kang, Tae-Koo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권3호
    • /
    • pp.1076-1094
    • /
    • 2022
  • Technology for emotion recognition is an essential part of human personality analysis. To define human personality characteristics, the existing method used the survey method. However, there are many cases where communication cannot make without considering emotions. Hence, emotional recognition technology is an essential element for communication but has also been adopted in many other fields. A person's emotions are revealed in various ways, typically including facial, speech, and biometric responses. Therefore, various methods can recognize emotions, e.g., images, voice signals, and physiological signals. Physiological signals are measured with biological sensors and analyzed to identify emotions. This study employed two sensor types. First, the existing method, the binary arousal-valence method, was subdivided into four levels to classify emotions in more detail. Then, based on the current techniques classified as High/Low, the model was further subdivided into multi-levels. Finally, signal characteristics were extracted using a 1-D Convolution Neural Network (CNN) and classified sixteen feelings. Although CNN was used to learn images in 2D, sensor data in 1D was used as the input in this paper. Finally, the proposed emotional recognition system was evaluated by measuring actual sensors.

WaveNet과 Work Forward Validation을 활용한 시계열 데이터 분석 (Time Series Data Analysis using WaveNet and Walk Forward Validation)

  • 윤협상
    • 한국시뮬레이션학회논문지
    • /
    • 제30권4호
    • /
    • pp.1-8
    • /
    • 2021
  • 복잡하고 비선형적인 특징을 갖는 시계열 데이터를 예측하기 위해 딥러닝 기법이 널리 사용되고 있다. 본 연구에서는 최근에 개발된 WaveNet을 개선하고 워크포워드 검증 기법을 적용하여 전력 소비량 데이터를 24시간 이전에 예측하고자 한다. 원래 WaveNet은 오디오 데이터 예측에 사용하고자 고안되었으며, 장기간의 데이터를 효과적으로 예측하기 위해 1차원 팽창인과 합성곱(1D dilated causal convolution)을 사용한다. 먼저, WaveNet이 부호화된 정수 값이 아니라 실수 값을 출력하여 전력 데이터를 예측하기 적합하도록 개선하였다. 다음으로 학습 과정에 적용된 하이퍼파라미터(입력 기간, 배치 크기, WaveNet 블록 개수, 팽창 비율, 학습률 변경)를 조정하여 적절한 성능을 나타내도록 하였다. 마지막으로 성능 평가를 통해 전통적인 홀드아웃 검증 기법보다 본 연구에서 사용한 워크포워드 검증 기법이 전력 소비량 데이터 예측에 우수함 성능을 나타냄을 확인하였다.

주파수 선택 지표에 따른 길쌈 부호 수중 음향 통신 시스템의 성능 평가 (Performance of Convolution Coding Underwater Acoustic Communication System on Frequency Selectivity Index)

  • 서철원;박지현;박규칠;신정채;정진우;윤종락
    • 한국음향학회지
    • /
    • 제32권6호
    • /
    • pp.494-501
    • /
    • 2013
  • 천해 수중 음향 채널의 배경잡음과 다중경로에 의한 비트 오류율(BER)을 경감하기 위해 Quadrature Phase Shift Keying(QPSK)에 전방 오류 정정 코드(FEC)로 부호화 비율 1/2의 길쌈 코딩(CC)을 적용하였다. 전송신호의 대역폭에 대한 채널의 일관성 대역폭의 비를 주파수 선택 지표로 정의하였고 주파수 선택지표에 따른 전송 신호의 BER과 비트 에너지 대 잡음비의 이득을 평가하였다. 실내 수조 실험 결과, 주파수 선택지표가 약 1.0 이하인 경우 BER은 이론적인 결과와 일치하고 비트 에너지 대 잡음비의 이득은 약 5 dB로 이론적인 결과와 일치한다. 주파수 선택 지표가 1.0 이상인 주파수 선택적인 다중경로 채널에서도 BER은 효율적으로 감소하지만 비트 에너지 대 잡음비가 일정크기 이상인 조건에서만 CC의 비트 오류 감소에 효과가 있다. 이러한 결과는 본 연구에서 정의한 주파수 선택 지표가 다중 경로 채널에서 CC의 성능 평가의 지표로 적용될 수 있다. 아울러 등화기를 적용하지 않고 저속 수중 음향 통신시스템에 효과적으로 BER을 줄일 수 있다.

영상 재구성 처리를 위한 이차원 필터의 구성 (Development of Two Dimensional Filter for the Reconstructive Image Processing)

  • 이황수
    • 대한전자공학회논문지
    • /
    • 제16권6호
    • /
    • pp.16-21
    • /
    • 1979
  • 단순역투사에 의하여 얻어진 선명치 않은 영상에서 단층영상을 재구성할 수 있는 이차원 필터들을 주파수영역에서 고찰하고 이의 성능을 비교하였다 이 필터 함수들은 단층영상시스템의 전달함수로부터 구하였으며 그 모양은 ramp 함수에 window 함수를 곱한 형태로 되어 있다. 이 window 함수는 영상 재구성에서의 불필요한 잡음화상을 줄이는 역할을 하는 것이 모의영상 데이터를 이용한 computer simulation에서 밝혀졌다. 또한 simulation의 결과로 이차원 영상 재구성 방법이 일차원 convolution mehod에 의한 영상 재구성에 비해서 화질은 나쁘지만 계산시간은 십배 이상 단축됨을 발견하였다. 이차원 영상 재구성에서는 window 함수가 변함에 따라 재구성된 영상의 화질도 달라진다. 즉 영상의 해상도를 높일 수록 잡음이 많이 섞인 화상을 얻게 되는 것을 재구성한 영상들을 통하여 고찰하였다.

  • PDF

3D 딥러닝 기술 동향 (Recent R&D Trends for 3D Deep Learning)

  • 이승욱;황본우;임성재;윤승욱;김태준;최진성;박창준
    • 전자통신동향분석
    • /
    • 제33권5호
    • /
    • pp.103-110
    • /
    • 2018
  • Studies on artificial intelligence have been developed for the past couple of decades. After a few periods of prosperity and recession, a new machine learning method, so-called Deep Learning, has been introduced. This is the result of high-quality big- data, an increase in computing power, and the development of new algorithms. The main targets for deep learning are 1D audio and 2D images. The application domain is being extended from a discriminative model, such as classification/segmentation, to a generative model. Currently, deep learning is used for processing 3D data. However, unlike 2D, it is not easy to acquire 3D learning data. Although low-cost 3D data acquisition sensors have become more popular owing to advances in 3D vision technology, the generation/acquisition of 3D data remains a very difficult problem. Moreover, it is not easy to directly apply an existing network model, such as a convolution network, owing to the variety of 3D data representations. In this paper, we summarize the 3D deep learning technology that have started to be developed within the last 2 years.

실내 무선 채널 환경에서 무선 LAN용 OFDM 시스템의 성능 분석 (Performance Analysis of a OFDM System for Wireless LAN in Indoor Wireless Channel)

  • 최연주;김항래;김남;고영훈;안재형
    • 한국전자파학회논문지
    • /
    • 제12권2호
    • /
    • pp.268-277
    • /
    • 2001
  • 본 논문에서는 IEEE 802.11a 무선 LAN에 적합한 OFDM 시스템에 비터비 복호를 사용하는 길쌈 부호와 단일 탭의 LMS 등화기를 적용하여 실내 무선 채널 환경에서 시스템 성능을 시뮬레이션을 통해 분석한다. 실내 무선 채널은 라이시안 페이딩 모델링하고, 부채널변조 방식으로는 QPSK와 16QAM을 사용한다. 직접 파 대 간섭파 전력비 K=5 dB 인 라이시안 페이딩 채널에서 길쌈 부호 및 비터비 복호를 사용하는 경우, 경판정에서 QPSK는 8.6 dB, 16QAM 은 19.2dB, 연판정에서 QPSK는 5.3dB, 16QPSK는 5.3dB, 16QAM은 9.8dB에서 $10^{-4}$의 BER을 만족하였다. 또한 16QAM/OEFM 방식에 단일 탭의 LMS 등화기를 사용하면 길쌈 부호만을 사용한 경우보다 경판정 비터비 복호의 경우 8.6dB,연판정의 경우에는 2dB의 성능이 향상됨을 알 수 있었다.

  • PDF

DP-LinkNet: A convolutional network for historical document image binarization

  • Xiong, Wei;Jia, Xiuhong;Yang, Dichun;Ai, Meihui;Li, Lirong;Wang, Song
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권5호
    • /
    • pp.1778-1797
    • /
    • 2021
  • Document image binarization is an important pre-processing step in document analysis and archiving. The state-of-the-art models for document image binarization are variants of encoder-decoder architectures, such as FCN (fully convolutional network) and U-Net. Despite their success, they still suffer from three limitations: (1) reduced feature map resolution due to consecutive strided pooling or convolutions, (2) multiple scales of target objects, and (3) reduced localization accuracy due to the built-in invariance of deep convolutional neural networks (DCNNs). To overcome these three challenges, we propose an improved semantic segmentation model, referred to as DP-LinkNet, which adopts the D-LinkNet architecture as its backbone, with the proposed hybrid dilated convolution (HDC) and spatial pyramid pooling (SPP) modules between the encoder and the decoder. Extensive experiments are conducted on recent document image binarization competition (DIBCO) and handwritten document image binarization competition (H-DIBCO) benchmark datasets. Results show that our proposed DP-LinkNet outperforms other state-of-the-art techniques by a large margin. Our implementation and the pre-trained models are available at https://github.com/beargolden/DP-LinkNet.

PDE-PRESERVING PROPERTIES

  • PETERSSON HENRIK
    • 대한수학회지
    • /
    • 제42권3호
    • /
    • pp.573-597
    • /
    • 2005
  • A continuous linear operator T, on the space of entire functions in d variables, is PDE-preserving for a given set $\mathbb{P}\;\subseteq\;\mathbb{C}|\xi_{1},\ldots,\xi_{d}|$ of polynomials if it maps every kernel-set ker P(D), $P\;{\in}\;\mathbb{P}$, invariantly. It is clear that the set $\mathbb{O}({\mathbb{P}})$ of PDE-preserving operators for $\mathbb{P}$ forms an algebra under composition. We study and link properties and structures on the operator side $\mathbb{O}({\mathbb{P}})$ versus the corresponding family $\mathbb{P}$ of polynomials. For our purposes, we introduce notions such as the PDE-preserving hull and basic sets for a given set $\mathbb{P}$ which, roughly, is the largest, respectively a minimal, collection of polynomials that generate all the PDE-preserving operators for $\mathbb{P}$. We also describe PDE-preserving operators via a kernel theorem. We apply Hilbert's Nullstellensatz.

CNN 기반 초분광 영상 분류를 위한 PCA 차원축소의 영향 분석 (The Impact of the PCA Dimensionality Reduction for CNN based Hyperspectral Image Classification)

  • 곽태홍;송아람;김용일
    • 대한원격탐사학회지
    • /
    • 제35권6_1호
    • /
    • pp.959-971
    • /
    • 2019
  • 대표적인 딥러닝(deep learning) 기법 중 하나인 Convolutional Neural Network(CNN)은 고수준의 공간-분광 특징을 추출할 수 있어 초분광 영상 분류(Hyperspectral Image Classification)에 적용하는 연구가 활발히 진행되고 있다. 그러나 초분광 영상은 높은 분광 차원이 학습 과정의 시간과 복잡도를 증가시킨다는 문제가 있어 이를 해결하기 위해 기존 딥러닝 기반 초분광 영상 분류 연구들에서는 차원축소의 목적으로 Principal Component Analysis (PCA)를 적용한 바 있다. PCA는 데이터를 독립적인 주성분의 축으로 변환시킬 수 있어 분광 차원을 효율적으로 압축할 수 있으나, 분광 정보의 손실을 초래할 수 있다. PCA의 사용 유무가 CNN 학습의 정확도와 시간에 영향을 미치는 것은 분명하지만 이를 분석한 연구가 부족하다. 본 연구의 목적은 PCA를 통한 분광 차원축소가 CNN에 미치는 영향을 정량적으로 분석하여 효율적인 초분광 영상 분류를 위한 적절한 PCA의 적용 방법을 제안하는 데에 있다. 이를 위해 PCA를 적용하여 초분광 영상을 축소시켰으며, 축소된 차원의 크기를 바꿔가며 CNN 모델에 적용하였다. 또한, 모델 내의 컨볼루션(convolution) 연산 방식에 따른 PCA의 민감도를 분석하기 위해 2D-CNN과 3D-CNN을 적용하여 비교 분석하였다. 실험결과는 분류정확도, 학습시간, 분산 비율, 학습 과정을 통해 분석되었다. 축소된 차원의 크기가 분산 비율이 99.7~8%인 주성분 개수일 때 가장 효율적이었으며, 3차원 커널 경우 2D-CNN과는 다르게 원 영상의 분류정확도가 PCA-CNN보다 더 높았으며, 이를 통해 PCA의 차원축소 효과가 3차원 커널에서 상대적으로 적은 것을 알 수 있었다.

Recognition of Virtual Written Characters Based on Convolutional Neural Network

  • Leem, Seungmin;Kim, Sungyoung
    • Journal of Platform Technology
    • /
    • 제6권1호
    • /
    • pp.3-8
    • /
    • 2018
  • This paper proposes a technique for recognizing online handwritten cursive data obtained by tracing a motion trajectory while a user is in the 3D space based on a convolution neural network (CNN) algorithm. There is a difficulty in recognizing the virtual character input by the user in the 3D space because it includes both the character stroke and the movement stroke. In this paper, we divide syllable into consonant and vowel units by using labeling technique in addition to the result of localizing letter stroke and movement stroke in the previous study. The coordinate information of the separated consonants and vowels are converted into image data, and Korean handwriting recognition was performed using a convolutional neural network. After learning the neural network using 1,680 syllables written by five hand writers, the accuracy is calculated by using the new hand writers who did not participate in the writing of training data. The accuracy of phoneme-based recognition is 98.9% based on convolutional neural network. The proposed method has the advantage of drastically reducing learning data compared to syllable-based learning.