• 제목/요약/키워드: CNN Feature

검색결과 303건 처리시간 0.148초

LGP-FL과 해마 구조를 이용한 H-CNN 기반 보행자 검출에 대한 연구 (A Study on H-CNN Based Pedestrian Detection Using LGP-FL and Hippocampal Structure)

  • 박수빈;강대성
    • 한국정보기술학회논문지
    • /
    • 제16권12호
    • /
    • pp.75-83
    • /
    • 2018
  • 최근 자율 주행 자동차에 대한 연구가 활발하다. 자율 주행 자동차는 보행자 검출 및 인식 기술이 중요하다. 최근에 주로 사용되는 CNN(Convolutional Neural Network)을 이용한 보행자 검출은 대체로 좋은 성능을 보이나 영상의 환경에 따른 성능 저하가 있다. 본 논문에서는 LGP-FL(Local Gradient Pattern-Feature Layer)을 추가한 CNN Network를 기반으로 해마 신경망의 장기 기억 구조를 적용한 보행자 검출 시스템을 제안한다. 먼저 입력 이미지를 $227{\times}227$의 크기로 변경한다. 그 후 총 5개 층의 Convolution layer를 거쳐 특징을 추출한다. 그 과정에서 추가되는 LGP-FL에서는 LGP 특징 패턴을 추출하여 출현 빈도수가 높은 패턴을 장기 기억 장치에 저장한다. 이후 검출 과정에서 밝기 및 색상 변화에 강인한 LGP 특징 패턴 정보를 이용해 검출함으로써 보다 정확하게 보행자를 검출할 수 있다. 기존의 방법들과 제안하는 기법의 비교를 통해 약 1~4%의 검출률 증가를 확인하였다.

초고속 R-CNN을 이용한 얼굴영상에서 눈 및 입술영역 검출방법 (A Method of Eye and Lip Region Detection using Faster R-CNN in Face Image)

  • 이정환
    • 한국융합학회논문지
    • /
    • 제9권8호
    • /
    • pp.1-8
    • /
    • 2018
  • 얼굴인식, 홍채인식과 같은 생체보안 분야에서 눈, 코, 입술 등 얼굴특징을 추출하는 과정은 필수적이다. 본 논문은 초고속(faster) R-CNN을 이용하여 얼굴영상에서 눈 및 입술영역을 검출하는 방법을 연구하였다. 초고속 R-CNN은 딥러닝을 이용한 물체검출 방법으로 기존의 특징기반 방법에 비해 성능이 우수한 것으로 알려져 있다. 본 논문에서는 얼굴영상에 콘볼루션, 선형정류과정, max pooling과정을 차례로 적용하여 특징맵을 추출하고 이로부터 제안영역(region proposal)을 검출하는 RPN(region proposal network)을 학습한다. 그리고 제안영역과 특징맵을 이용하여 눈 및 입술 검출기(detector)를 학습한다. 제안방법의 성능을 검토하기 위해 남녀한국인 얼굴영상 800장으로 실험하였다. 학습을 위해 480장을 이용했으며 테스트용으로 320장을 사용하였다. 컴퓨터모의 실험결과 눈 및 입술영역 검출의 평균정확도는 50 에포치일 때 각각 97.7%, 91.0%를 얻을 수 있었다.

Road Damage Detection and Classification based on Multi-level Feature Pyramids

  • Yin, Junru;Qu, Jiantao;Huang, Wei;Chen, Qiqiang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권2호
    • /
    • pp.786-799
    • /
    • 2021
  • Road damage detection is important for road maintenance. With the development of deep learning, more and more road damage detection methods have been proposed, such as Fast R-CNN, Faster R-CNN, Mask R-CNN and RetinaNet. However, because shallow and deep layers cannot be extracted at the same time, the existing methods do not perform well in detecting objects with fewer samples. In addition, these methods cannot obtain a highly accurate detecting bounding box. This paper presents a Multi-level Feature Pyramids method based on M2det. Because the feature layer has multi-scale and multi-level architecture, the feature layer containing more information and obvious features can be extracted. Moreover, an attention mechanism is used to improve the accuracy of local boundary boxes in the dataset. Experimental results show that the proposed method is better than the current state-of-the-art methods.

합성곱 신경망 및 영상처리 기법을 활용한 피부 모공 등급 예측 시스템 (A Prediction System of Skin Pore Labeling Using CNN and Image Processing)

  • 이태희;황우성;최명렬
    • 전기전자학회논문지
    • /
    • 제26권4호
    • /
    • pp.647-652
    • /
    • 2022
  • 본 논문은 사용자들에 의해 촬영된 피부이미지를 가공하여 데이터 세트를 구축하고, 제안한 영상처리 기법에 의해 모공 특징이미지를 생성하여, CNN(Convolution Neural Network) 모델 기반의 모공 상태 등급 예측 시스템을 구현한다. 본 논문에서 활용하는 피부이미지 데이터 세트는, 피부미용 전문가의 육안 분류 기준에 근거하여, 모공 특징에 대한 등급을 라벨링 하였다. 제안한 영상처리 기법을 적용하여 피부이미지로 부터 모공 특징 이미지를 생성하고, 모공 특징 등급을 예측하는 CNN 모델의 학습을 진행하였다. 제안한 CNN 모델에 의한 모공 특징은 전문가의 육안 분류 결과와 유사한 예측 결과를 얻었으며, 비교 모델(Resnet-50)에 의한 결과보다 적은 학습시간과 높은 예측결과를 얻었다. 본 논문의 본론에서는 제안한 영상처리 기법과 CNN 적용의 결과에 대해 서술하며, 결론에서는 제안한 방법에 대한 결과와 향후 연구방안에 대해 서술한다.

ResNet 모델을 이용한 눈 주변 영역의 특징 추출 및 개인 인증 (Feature Extraction on a Periocular Region and Person Authentication Using a ResNet Model)

  • 김민기
    • 한국멀티미디어학회논문지
    • /
    • 제22권12호
    • /
    • pp.1347-1355
    • /
    • 2019
  • Deep learning approach based on convolution neural network (CNN) has extensively studied in the field of computer vision. However, periocular feature extraction using CNN was not well studied because it is practically impossible to collect large volume of biometric data. This study uses the ResNet model which was trained with the ImageNet dataset. To overcome the problem of insufficient training data, we focused on the training of multi-layer perception (MLP) having simple structure rather than training the CNN having complex structure. It first extracts features using the pretrained ResNet model and reduces the feature dimension by principle component analysis (PCA), then trains a MLP classifier. Experimental results with the public periocular dataset UBIPr show that the proposed method is effective in person authentication using periocular region. Especially it has the advantage which can be directly applied for other biometric traits.

랜덤 변환에 대한 컨볼루션 뉴럴 네트워크를 이용한 특징 추출 (Feature Extraction Using Convolutional Neural Networks for Random Translation)

  • 진태석
    • 한국산업융합학회 논문집
    • /
    • 제23권3호
    • /
    • pp.515-521
    • /
    • 2020
  • Deep learning methods have been effectively used to provide great improvement in various research fields such as machine learning, image processing and computer vision. One of the most frequently used deep learning methods in image processing is the convolutional neural networks. Compared to the traditional artificial neural networks, convolutional neural networks do not use the predefined kernels, but instead they learn data specific kernels. This property makes them to be used as feature extractors as well. In this study, we compared the quality of CNN features for traditional texture feature extraction methods. Experimental results demonstrate the superiority of the CNN features. Additionally, the recognition process and result of a pioneering CNN on MNIST database are presented.

Convolutional Neural Network Based Image Processing System

  • Kim, Hankil;Kim, Jinyoung;Jung, Hoekyung
    • Journal of information and communication convergence engineering
    • /
    • 제16권3호
    • /
    • pp.160-165
    • /
    • 2018
  • This paper designed and developed the image processing system of integrating feature extraction and matching by using convolutional neural network (CNN), rather than relying on the simple method of processing feature extraction and matching separately in the image processing of conventional image recognition system. To implement it, the proposed system enables CNN to operate and analyze the performance of conventional image processing system. This system extracts the features of an image using CNN and then learns them by the neural network. The proposed system showed 84% accuracy of recognition. The proposed system is a model of recognizing learned images by deep learning. Therefore, it can run in batch and work easily under any platform (including embedded platform) that can read all kinds of files anytime. Also, it does not require the implementing of feature extraction algorithm and matching algorithm therefore it can save time and it is efficient. As a result, it can be widely used as an image recognition program.

Low Resolution Rate Face Recognition Based on Multi-scale CNN

  • Wang, Ji-Yuan;Lee, Eung-Joo
    • 한국멀티미디어학회논문지
    • /
    • 제21권12호
    • /
    • pp.1467-1472
    • /
    • 2018
  • For the problem that the face image of surveillance video cannot be accurately identified due to the low resolution, this paper proposes a low resolution face recognition solution based on convolutional neural network model. Convolutional Neural Networks (CNN) model for multi-scale input The CNN model for multi-scale input is an improvement over the existing "two-step method" in which low-resolution images are up-sampled using a simple bi-cubic interpolation method. Then, the up sampled image and the high-resolution image are mixed as a model training sample. The CNN model learns the common feature space of the high- and low-resolution images, and then measures the feature similarity through the cosine distance. Finally, the recognition result is given. The experiments on the CMU PIE and Extended Yale B datasets show that the accuracy of the model is better than other comparison methods. Compared with the CMDA_BGE algorithm with the highest recognition rate, the accuracy rate is 2.5%~9.9%.

깊은 신경망 기반 대용량 텍스트 데이터 분류 기술 (Large-Scale Text Classification with Deep Neural Networks)

  • 조휘열;김진화;김경민;장정호;엄재홍;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제23권5호
    • /
    • pp.322-327
    • /
    • 2017
  • 문서 분류 문제는 오랜 기간 동안 자연어 처리 분야에서 연구되어 왔다. 우리는 기존 컨볼루션 신경망을 이용했던 연구에서 나아가, 순환 신경망에 기반을 둔 문서 분류를 수행하였고 그 결과를 종합하여 제시하려 한다. 컨볼루션 신경망은 단층 컨볼루션 신경망을 사용했으며, 순환 신경망은 가장 성능이 좋다고 알려져 있는 장기-단기 기억 신경망과 회로형 순환 유닛을 활용하였다. 실험 결과, 분류 정확도는 Multinomial Naïve Bayesian Classifier < SVM < LSTM < CNN < GRU의 순서로 나타났다. 따라서 텍스트 문서 분류 문제는 시퀀스를 고려하는 것 보다는 문서의 feature를 추출하여 분류하는 문제에 가깝다는 것을 확인할 수 있었다. 그리고 GRU가 LSTM보다 문서의 feature 추출에 더 적합하다는 것을 알 수 있었으며 적절한 feature와 시퀀스 정보를 함께 활용할 때 가장 성능이 잘 나온다는 것을 확인할 수 있었다.

SSD 알고리즘 기반 MI-FL을 적용한 회전 불변의 다중 객체 검출 시스템 구현 (Implementation of Rotating Invariant Multi Object Detection System Applying MI-FL Based on SSD Algorithm)

  • 박수빈;임혜연;강대성
    • 한국정보기술학회논문지
    • /
    • 제17권5호
    • /
    • pp.13-20
    • /
    • 2019
  • 최근 CNN을 기반으로 한 객체 검출 기술의 연구가 활발하다. 객체 검출 기술은 자율주행차, 지능형 영상분석 등에서 중요한 기술로 사용된다. 본 논문에서는 CNN 기반의 객체 검출기 중 하나인 SSD(Single Shot Multibox Detector)에 MI-FL(Moment Invariant-Feature Layer)을 적용하여 회전 변형에 강인한 객체 검출 시스템을 제안한다. 먼저 VGG 네트워크를 기반으로 입력 이미지의 특징을 추출한다. 그 후 총 6개의 특징 계층(Feature layer)을 적용하여 객체의 위치 정보와 종류를 예측해 경계 박스들을 생성한다. 그 후 NMS 알고리즘을 이용해 가장 객체일 확률이 높은 경계 박스를 얻는다. 하나의 객체 경계 박스가 정해지면 MI-FL을 이용해 해당 영역의 불변 모멘트 특징을 추출하여 미리 저장하고 학습한다. 이후 검출 과정에서 미리 저장해둔 불면모멘트 특징 정보를 이용해 검출함으로써 회전된 이미지에 대해 기존 방법보다 더 강인한 검출이 가능하다. 기존의 SSD와 MI-FL을 적용한 SSD의 비교를 통해 약 4~5%의 성능 향상을 확인하였다.