• 제목/요약/키워드: Max-Pooling

검색결과 29건 처리시간 0.025초

초고속 R-CNN을 이용한 얼굴영상에서 눈 및 입술영역 검출방법 (A Method of Eye and Lip Region Detection using Faster R-CNN in Face Image)

  • 이정환
    • 한국융합학회논문지
    • /
    • 제9권8호
    • /
    • pp.1-8
    • /
    • 2018
  • 얼굴인식, 홍채인식과 같은 생체보안 분야에서 눈, 코, 입술 등 얼굴특징을 추출하는 과정은 필수적이다. 본 논문은 초고속(faster) R-CNN을 이용하여 얼굴영상에서 눈 및 입술영역을 검출하는 방법을 연구하였다. 초고속 R-CNN은 딥러닝을 이용한 물체검출 방법으로 기존의 특징기반 방법에 비해 성능이 우수한 것으로 알려져 있다. 본 논문에서는 얼굴영상에 콘볼루션, 선형정류과정, max pooling과정을 차례로 적용하여 특징맵을 추출하고 이로부터 제안영역(region proposal)을 검출하는 RPN(region proposal network)을 학습한다. 그리고 제안영역과 특징맵을 이용하여 눈 및 입술 검출기(detector)를 학습한다. 제안방법의 성능을 검토하기 위해 남녀한국인 얼굴영상 800장으로 실험하였다. 학습을 위해 480장을 이용했으며 테스트용으로 320장을 사용하였다. 컴퓨터모의 실험결과 눈 및 입술영역 검출의 평균정확도는 50 에포치일 때 각각 97.7%, 91.0%를 얻을 수 있었다.

Classification Algorithms for Human and Dog Movement Based on Micro-Doppler Signals

  • Lee, Jeehyun;Kwon, Jihoon;Bae, Jin-Ho;Lee, Chong Hyun
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제6권1호
    • /
    • pp.10-17
    • /
    • 2017
  • We propose classification algorithms for human and dog movement. The proposed algorithms use micro-Doppler signals obtained from humans and dogs moving in four different directions. A two-stage classifier based on a support vector machine (SVM) is proposed, which uses a radial-based function (RBF) kernel and $16^{th}$-order linear predictive code (LPC) coefficients as feature vectors. With the proposed algorithms, we obtain the best classification results when a first-level SVM classifies the type of movement, and then, a second-level SVM classifies the moving object. We obtain the correct classification probability 95.54% of the time, on average. Next, to deal with the difficult classification problem of human and dog running, we propose a two-layer convolutional neural network (CNN). The proposed CNN is composed of six ($6{\times}6$) convolution filters at the first and second layers, with ($5{\times}5$) max pooling for the first layer and ($2{\times}2$) max pooling for the second layer. The proposed CNN-based classifier adopts an auto regressive spectrogram as the feature image obtained from the $16^{th}$-order LPC vectors for a specific time duration. The proposed CNN exhibits 100% classification accuracy and outperforms the SVM-based classifier. These results show that the proposed classifiers can be used for human and dog classification systems and also for classification problems using data obtained from an ultra-wideband (UWB) sensor.

합성곱 신경망의 학습 가속화를 위한 방법 (A Method for accelerating training of Convolutional Neural Network)

  • 최세진;정준모
    • 문화기술의 융합
    • /
    • 제3권4호
    • /
    • pp.171-175
    • /
    • 2017
  • 최근 CNN(Convolutional Neural Network)의 구조가 복잡해지고 신견망의 깊이가 깊어지고 있다. 이에 따라 신경망의 학습에 요구되는 연산량 및 학습 시간이 증가하게 되었다. 최근 GPGPU 및 FPGA를 이용하여 신경망의 학습 속도를 가속화 하는 방법에 대한 연구가 활발히 진행되고 있다. 본 논문에서는 NVIDIA GPGPU를 제어하는 CUDA를 이용하여 CNN의 특징추출부와 분류부에 대한 연산을 가속화하는 방법을 제시한다. 특징추출부와 분류부에 대한 연산을 GPGPU의 블록 및 스레드로 할당하여 병렬로 처리하였다. 본 논문에서 제안하는 방법과 기존 CPU를 이용하여 CNN을 학습하여 학습 속도를 비교하였다. MNIST 데이터세트에 대하여 총 5 epoch을 학습한 결과 제안하는 방법이 CPU를 이용하여 학습한 방법에 비하여 약 314% 정도 학습 속도가 향상된 것을 확인하였다.

국소부위 패턴 표현을 위한 샘플링 기반 초해상도 U-Net (Sampling-based Super Resolution U-net for Pattern Expression of Local Areas)

  • 이교석;갈원모;임명재
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.185-191
    • /
    • 2022
  • 본 연구에서는 U-Net, 잔차 신경망, 서브 픽셀 컨볼루션을 기반으로 새로운 초해상도 신경망을 제안한다. U-Net의 최대 풀링으로 인해 세부적인 정보의 손실이 일어나는 것을 막기 위해 서브 픽셀 컨볼루션을 활용한 다운 샘플링 그리고 연결을 제안한다. 이는 필터 안의 최대 값만으로 새로운 피처맵을 만드는 최대 풀링과 다르게 필터 안의 모든 픽셀을 사용한다. 2×2 크기의 필터가 지나가면서 왼쪽 위, 오른쪽 위, 왼쪽 아래, 오른쪽 아래의 픽셀들로만 이루어진 피처맵을 만든다. 이를 통해 크기가 절반이 되고, 피처맵이 개수가 4배가 된다. 그리고 연산량을 줄이기 위해 두 가지 방법을 제안했다. 첫 번째는 U-Net의 업 컨볼루션 대신 연산량이 없고, 성능이 더 좋은 서브 픽셀 컨볼루션을 사용한다. 두 번째는 U-Net의 연결 층 대신 두 피처 맵을 더하는 층을 사용한다. 밴치 마크 데이터 세트로 실험한 결과 스케일 2의 set5 데이터를 제외하고 모든 스케일 및 벤치마크 데이터 세트에서 더 나은 PSNR 값을 보여주고, 국소부위의 패턴을 명확하게 표현할 수 있었다.

Multiscale Spatial Position Coding under Locality Constraint for Action Recognition

  • Yang, Jiang-feng;Ma, Zheng;Xie, Mei
    • Journal of Electrical Engineering and Technology
    • /
    • 제10권4호
    • /
    • pp.1851-1863
    • /
    • 2015
  • – In the paper, to handle the problem of traditional bag-of-features model ignoring the spatial relationship of local features in human action recognition, we proposed a Multiscale Spatial Position Coding under Locality Constraint method. Specifically, to describe this spatial relationship, we proposed a mixed feature combining motion feature and multi-spatial-scale configuration. To utilize temporal information between features, sub spatial-temporal-volumes are built. Next, the pooled features of sub-STVs are obtained via max-pooling method. In classification stage, the Locality-Constrained Group Sparse Representation is adopted to utilize the intrinsic group information of the sub-STV features. The experimental results on the KTH, Weizmann, and UCF sports datasets show that our action recognition system outperforms the classical local ST feature-based recognition systems published recently.

아동의 ADHD 진단 보조를 위한 기계 학습 기반의 뇌전도 분류 (Machine Learning-Based EEG Classification for Assisting the Diagnosis of ADHD in Children)

  • 김민기
    • 한국멀티미디어학회논문지
    • /
    • 제24권10호
    • /
    • pp.1336-1345
    • /
    • 2021
  • Attention Deficit Hyperactivity Disorder (ADHD) is one of the most common neurological disorders in children. The diagnosis of ADHD in children is based on the interviews and observation reports of parents or teachers who have stayed with them. Since this approach cannot avoid long observation time and the bias of observers, another approach based on Electroencephalography(EEG) is emerging. The goal of this study is to develop an assistive tool for diagnosing ADHD by EEG classification. This study explores the frequency bands of EEG and extracts the implied features in them by using the proposed CNN. The CNN architecture has three Convolution-MaxPooling blocks and two fully connected layers. As a result of the experiment, the 30-60 Hz gamma band showed dominant characteristics in identifying EEG, and when other frequency bands were added to the gamma band, the EEG classification performance was improved. They also show that the proposed CNN is effective in detecting ADHD in children.

컨볼루션 뉴럴 네트워크 기반의 딥러닝을 이용한 흉부 X-ray 영상의 분류 및 정확도 평가 (Evaluation of Classification and Accuracy in Chest X-ray Images using Deep Learning with Convolution Neural Network)

  • 송호준;이은별;조흥준;박세영;김소영;김현정;홍주완
    • 한국방사선학회논문지
    • /
    • 제14권1호
    • /
    • pp.39-44
    • /
    • 2020
  • 본 연구에서는 CNN과 빅데이터 기술을 이용한 Deep Learning을 통해 흉부 X-ray 영상 분류 및 정확성 연구에 대하여 알아보고자 한다. 총 5,873장의 흉부 X-ray 영상에서 Normal 1,583장, Pneumonia 4,289장을 사용하였다. 데이터 분류는 train(88.8%), validation(0.2%), test(11%)로 분류하였다. Convolution Layer, Max pooling layer pool size 2×2, Flatten layer, Image Data Generator로 구성하였다. Convolution layer가 3일 때와 4일 때 각각 filter 수, filter size, drop out, epoch, batch size, 손실함수 값을 설정하였다. test 데이터로 Convolution layer가 4일 때, filter 수 64-128-128-128, filter size 3×3, drop out 0.25, epoch 5, batch size 15, 손실함수 RMSprop으로 설정 시 정확도가 94.67%였다. 본 연구를 통해 높은 정확성으로 분류가 가능하였으며, 흉부 X-ray 영상뿐만 아니라 다른 의료영상에서도 많은 도움이 될 것으로 사료된다.

Sentinel-1 A/B 위성 SAR 자료와 딥러닝 모델을 이용한 여름철 북극해 해빙 분류 연구 (A Study on Classifying Sea Ice of the Summer Arctic Ocean Using Sentinel-1 A/B SAR Data and Deep Learning Models)

  • 전현균;김준우;수레시 크리쉬난;김덕진
    • 대한원격탐사학회지
    • /
    • 제35권6_1호
    • /
    • pp.999-1009
    • /
    • 2019
  • 북극항로의 개척 가능성과 정확한 기후 예측 모델의 필요성에 의해 북극해 고해상도 해빙 지도의 중요성이 증가하고 있다. 그러나 기존의 북극 해빙 지도는 제작에 사용된 위성 영상 취득 센서의 특성에 따른 데이터의 취득과 공간해상도 등에서 그 활용도가 제한된다. 본 연구에서는 Sentinel-1 A/B SAR 위성자료로부터 고해상도 해빙 지도를 생성하기 위한 딥러닝 기반의 해빙 분류 알고리즘을 연구하였다. 북극해 Ice Chart를 기반으로 전문가 판독에 의해 Open Water, First Year Ice, Multi Year Ice의 세 클래스로 구성된 훈련자료를 구축하였으며, Convolutional Neural Network 기반의 두 가지 딥러닝 모델(Simple CNN, Resnet50)과 입사각 및 thermal noise가 보정된 HV 밴드를 포함하는 다섯 가지 입력 밴드 조합을 이용하여 총 10가지 케이스의 해빙 분류를 실시하였다. 이 케이스들에 대하여 Ground Truth Point를 사용하여 정확도를 비교하고, 가장 높은 정확도가 나온 케이스에 대해 confusion matrix 및 Cohen의 kappa 분석을 실시하였다. 또한 전통적으로 분류를 위해 많이 활용되어 온 Maximum Likelihood Classifier 기법을 이용한 분류결과에 대해서도 같은 비교를 하였다. 그 결과 Convolution 층 2개, Max Pooling 층 2개를 가진 구조의 Convolutional Neural Network에 [HV, 입사각] 밴드를 넣은 딥러닝 알고리즘의 분류 결과가 96.66%의 가장 높은 분류 정확도를 보였으며, Cohen의 kappa 계수는 0.9499로 나타나 딥러닝에 의한 해빙 분류는 비교적 높은 분류 결과를 보였다. 또한 모든 딥러닝 케이스는 Maximum Likelihood Classifier 기법에 비해 높은 분류 정확도를 보였다.

Pointwise CNN for 3D Object Classification on Point Cloud

  • Song, Wei;Liu, Zishu;Tian, Yifei;Fong, Simon
    • Journal of Information Processing Systems
    • /
    • 제17권4호
    • /
    • pp.787-800
    • /
    • 2021
  • Three-dimensional (3D) object classification tasks using point clouds are widely used in 3D modeling, face recognition, and robotic missions. However, processing raw point clouds directly is problematic for a traditional convolutional network due to the irregular data format of point clouds. This paper proposes a pointwise convolution neural network (CNN) structure that can process point cloud data directly without preprocessing. First, a 2D convolutional layer is introduced to percept coordinate information of each point. Then, multiple 2D convolutional layers and a global max pooling layer are applied to extract global features. Finally, based on the extracted features, fully connected layers predict the class labels of objects. We evaluated the proposed pointwise CNN structure on the ModelNet10 dataset. The proposed structure obtained higher accuracy compared to the existing methods. Experiments using the ModelNet10 dataset also prove that the difference in the point number of point clouds does not significantly influence on the proposed pointwise CNN structure.

고추 온실에서 꽃노랑총채벌레의 축차표본조사법 개발 (Development of sequential sampling plan for Frankliniella occidentalis in greenhouse pepper)

  • 엄소은;박태철;손기문;박정준
    • 환경생물
    • /
    • 제40권2호
    • /
    • pp.164-171
    • /
    • 2022
  • 꽃노랑총채벌레(Frankliniella occidentalis)는 500종 이상의 기주를 가지고 토마토반점위조바이러스(Tomato spotted wilt virus; TSWV)를 매개하는 해충이다. 전 세계적으로 방제를 위해 노력하고 있지만 살충제를 이용한 방제는 저항성 그리고 환경 및 경제적 부담으로 인한 한계를 보였기 때문에 고정 정확도를 설정한 표본조사법(Fixed-precision level sampling plan)을 개발하였다. 고추(Capsicum annuum)의 꽃노랑총채벌레 성충 방제를 위한 표본 조사법은 공간분포분석, 표본추출 정지선 그리고 의사결정법으로 구성되었다. 표본추출은 식물체를 상단(지상에서 180 cm 이상), 중단(지상에서 120~160 cm 이상), 하단(지상에서 70~110 cm 이상)으로 나누어 각 높이별로 꽃 3개에서 나오는 꽃노랑총채벌레의 성충의 마리 수를 조사하였다. 표본 추출을 통해 꽃노랑총채벌레 성충의 밀도는 다른 식물체 위치(중단, 하단)보다 상단에서 높은 것으로 나왔다. 공간분포분석에서는 Taylor's power law (TPL)를 통해 도출한 각 위치별 계수를 공분산분석(ANCOVA)하여 차이를 비교하였다. ANCOVA 결과에서 도출된 절편과 기울기의 P 값이 각각 0.94, 0.87인 것을 통해 식물체 내 위치별로 차이가 없음을 확인한 후, 자료를 통합(pooling)하여 계산된 TPL 계수를 이용하여 표본추출 정지선을 구하였다. 꽃노랑총채벌레의 방제의사결정을 위한 방제밀도 수준(m0)은 문헌을 참조하여 3과 18로 설정하였으며 설정값(m0)을 이용해 최대표본수(Nmax)도 조사하였다. 조사 결과, m0=3, 18일 때 Nmax값은 각각 약 97개, 1149개로 계산되었다. 개발된 모델의 적합성 검정을 위해 분석에 사용하지 않은 독립자료를 이용해 Resampling Validation for Sampling Program (RVSP) 프로그램으로 개발된 표본추출법의 적합성 평가를 실시하였고 적합한 정확도를 보이는 것으로 조사되었다.