• 제목/요약/키워드: Deep Convolution Neural Network

검색결과 254건 처리시간 0.023초

ADD-Net: Attention Based 3D Dense Network for Action Recognition

  • Man, Qiaoyue;Cho, Young Im
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.21-28
    • /
    • 2019
  • Recent years with the development of artificial intelligence and the success of the deep model, they have been deployed in all fields of computer vision. Action recognition, as an important branch of human perception and computer vision system research, has attracted more and more attention. Action recognition is a challenging task due to the special complexity of human movement, the same movement may exist between multiple individuals. The human action exists as a continuous image frame in the video, so action recognition requires more computational power than processing static images. And the simple use of the CNN network cannot achieve the desired results. Recently, the attention model has achieved good results in computer vision and natural language processing. In particular, for video action classification, after adding the attention model, it is more effective to focus on motion features and improve performance. It intuitively explains which part the model attends to when making a particular decision, which is very helpful in real applications. In this paper, we proposed a 3D dense convolutional network based on attention mechanism(ADD-Net), recognition of human motion behavior in the video.

심층신경망을 이용한 레이더 영상 학습 기반 초단시간 강우예측 (Very short-term rainfall prediction based on radar image learning using deep neural network)

  • 윤성심;박희성;신홍준
    • 한국수자원학회논문집
    • /
    • 제53권12호
    • /
    • pp.1159-1172
    • /
    • 2020
  • 본 연구에서는 강우예측을 위해 U-Net과 SegNet에 기반한 합성곱 신경망 네트워크 구조에 장기간의 국내 기상레이더 자료를 활용하여 심층학습기반의 강우예측을 수행하였다. 또한, 기존 외삽기반의 강우예측 기법인 이류모델의 결과와 비교 평가하였다. 심층신경망의 학습 및 검정을 위해 2010부터 2016년 동안의 기상청 관악산과 광덕산 레이더의 원자료를 수집, 1 km 공간해상도를 갖는 480 × 480의 픽셀의 회색조 영상으로 변환하여 HDF5 형태의 데이터를 구축하였다. 구축된 데이터로 30분 전부터 현재까지 10분 간격의 연속된 레이더 영상 4개를 이용하여 10분 후의 강수량을 예측하도록 심층신경망 모델을 학습하였으며, 학습된 심층신경망 모델로 60분의 선행예측을 수행하기 위해 예측값을 반복 사용하는 재귀적 방식을 적용하였다. 심층신경망 예측모델의 성능 평가를 위해 2017년에 발생한 24개의 호우사례에 대해 선행 60분까지 강우예측을 수행하였다. 임계강우강도 0.1, 1, 5 mm/hr에서 평균절대오차와 임계성공지수를 산정하여 예측성능을 평가한 결과, 강우강도 임계 값 0.1, 1 mm/hr의 경우 MAE는 60분 선행예측까지, CSI는 선행예측 50분까지 참조 예측모델인 이류모델이 보다 우수한 성능을 보였다. 특히, 5 mm/hr 이하의 약한 강우에 대해서는 심층신경망 예측모델이 이류모델보다 대체적으로 좋은 성능을 보였지만, 5 mm/hr의 임계 값에 대한 평가결과 심층신경망 예측모델은 고강도의 뚜렷한 강수 특징을 예측하는 데 한계가 있었다. 심층신경망 예측모델은 예측시간이 길어질수록 공간 평활화되는 경향이 뚜렷해지며, 이로 인해 강우 예측의 정확도가 저하되었다. 이류모델은 뚜렷한 강수 특성을 보존하기 때문에 강한 강도 (>5 mm/hr)에 대해 심층신경망 예측모델을 능가하지만, 강우 위치가 잘못 이동하는 경향이 있다. 본 연구결과는 이후 심층신경망을 이용한 레이더 강우 예측기술의 개발과 개선에 도움이 될 수 있을 것으로 판단된다. 또한, 본 연구에서 구축한 대용량 기상레이더 자료는 향후 후속연구에 활용될 수 있도록 개방형 저장소를 통해 제공될 예정이다.

심층신경망의 더블 프루닝 기법의 적용 및 성능 분석에 관한 연구 (Application and Performance Analysis of Double Pruning Method for Deep Neural Networks)

  • 이선우;양호준;오승연;이문형;권장우
    • 융합정보논문지
    • /
    • 제10권8호
    • /
    • pp.23-34
    • /
    • 2020
  • 최근 인공지능 딥러닝 분야는 컴퓨팅 자원의 높은 연산량과 가격문제로 인해 상용화에 어려움이 존재했다. 본 논문은 더블 프루닝 기법을 적용하여 심층신경망 모델들과 다수의 데이터셋에서의 성능을 평가하고자 한다. 더블 프루닝은 기본의 네트워크 간소화(Network-Slimming)과 파라미터 프루닝(Parameter-Pruning)을 결합한다. 이는 기존의 학습에 중요하지 않는 매개변수를 절감하여 학습 정확도를 저해하지 않고 속도를 향상시킬 수 있다는 장점이 있다. 다양한 데이터셋 학습 이후에 프루닝 비율을 증가시켜, 모델의 사이즈를 감소시켰다. NetScore 성능 분석 결과 MobileNet-V3가 가장 성능이 높게 나타났다. 프루닝 이후의 성능은 Cifar 10 데이터셋에서 깊이 우선 합성곱 신경망으로 구성된 MobileNet-V3이 가장 성능이 높았고, 전통적인 합성곱 신경망으로 이루어진 VGGNet, ResNet또한 높은 폭으로 성능이 증가함을 확인하였다.

A motion classification and retrieval system in baseball sports video using Convolutional Neural Network model

  • Park, Jun-Young;Kim, Jae-Seung;Woo, Yong-Tae
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권8호
    • /
    • pp.31-37
    • /
    • 2021
  • 본 연구에서는 CNN(Convolution Neural Network) 모델을 이용하여 야구 경기 영상에서 투구나 스윙과 같은 특정 영상이 출현하는 장면을 자동으로 분류하여 효과적으로 검색하는 방법을 제안한다. 또한, 특정 동작의 분류 결과와 경기 기록을 연계한 영상 장면 검색시스템을 제안한다. 제안 시스템의 효율성을 검정하기 위하여 2018년부터 2019년까지 진행된 한국프로야구 경기 영상을 대상으로 특정 장면별로 분류하는 실험을 진행하였다. 야구 경기 영상에서 투구 장면을 분류하는 실험에서는 경기별로 약 90%의 정확도를 보였다. 그리고 경기 영상 내에 포함된 스코어보드를 추출하여 경기 기록과 연계하는 영상 장면 검색 실험에서는 경기별로 약 80% 정도의 정확도를 보였다. 본 연구 결과는 한국프로야구 경기에서 과거 경기 영상을 체계적으로 분석하여 경기력 향상을 위한 전략 수립을 위하여 효과적으로 사용할 수 있으리라 기대한다.

CUDA를 이용한 Convolutional Neural Network의 효율적인 구현 (Efficient Implementation of Convolutional Neural Network Using CUDA)

  • 기철민;조태훈
    • 한국정보통신학회논문지
    • /
    • 제21권6호
    • /
    • pp.1143-1148
    • /
    • 2017
  • 현재 인공지능과 딥 러닝이 사회적인 이슈로 떠오르고 있는 추세이며, 다양한 분야에 이 기술들을 응용하고 있다. 인공지능 분야의 여러 알고리즘들 중에서 각광받는 방법 중 하나는 Convolutional Neural Network이다. Convolutional Neural Network를 적은 양의 데이터에서 이용하거나, Layer의 구조가 복잡하지 않은 경우에는 학습시간이 길지 않아 속도에 크게 신경 쓰지 않아도 되지만, 학습 데이터의 크기가 크고, Layer의 구조가 복잡할수록 학습시간이 상당히 오래 걸린다. 이로 인해 GPU를 이용하여 병렬처리를 하는 방법을 많이 사용하는데, 본 논문에서는 CUDA를 이용한 Convolutional Neural Network를 구현하였으며, 비교에 사용한 Framework/Program들 보다 학습속도가 빨라지고 큰 데이터를 학습 시키는데 더욱 효율적으로 진행하도록 한다.

Quality grading of Hanwoo (Korean native cattle breed) sub-images using convolutional neural network

  • Kwon, Kyung-Do;Lee, Ahyeong;Lim, Jongkuk;Cho, Soohyun;Lee, Wanghee;Cho, Byoung-Kwan;Seo, Youngwook
    • 농업과학연구
    • /
    • 제47권4호
    • /
    • pp.1109-1122
    • /
    • 2020
  • The aim of this study was to develop a marbling classification and prediction model using small parts of sirloin images based on a deep learning algorithm, namely, a convolutional neural network (CNN). Samples were purchased from a commercial slaughterhouse in Korea, images for each grade were acquired, and the total images (n = 500) were assigned according to their grade number: 1++, 1+, 1, and both 2 & 3. The image acquisition system consists of a DSLR camera with a polarization filter to remove diffusive reflectance and two light sources (55 W). To correct the distorted original images, a radial correction algorithm was implemented. Color images of sirloins of Hanwoo (mixed with feeder cattle, steer, and calf) were divided and sub-images with image sizes of 161 × 161 were made to train the marbling prediction model. In this study, the convolutional neural network (CNN) has four convolution layers and yields prediction results in accordance with marbling grades (1++, 1+, 1, and 2&3). Every single layer uses a rectified linear unit (ReLU) function as an activation function and max-pooling is used for extracting the edge between fat and muscle and reducing the variance of the data. Prediction accuracy was measured using an accuracy and kappa coefficient from a confusion matrix. We summed the prediction of sub-images and determined the total average prediction accuracy. Training accuracy was 100% and the test accuracy was 86%, indicating comparably good performance using the CNN. This study provides classification potential for predicting the marbling grade using color images and a convolutional neural network algorithm.

작물 분류에서 시공간 특징을 고려하기 위한 2D CNN과 양방향 LSTM의 결합 (Combining 2D CNN and Bidirectional LSTM to Consider Spatio-Temporal Features in Crop Classification)

  • 곽근호;박민규;박찬원;이경도;나상일;안호용;박노욱
    • 대한원격탐사학회지
    • /
    • 제35권5_1호
    • /
    • pp.681-692
    • /
    • 2019
  • 이 논문에서는 작물 분류를 목적으로 작물의 시공간 특징을 고려할 수 있는 딥러닝 모델 2D convolution with bidirectional long short-term memory(2DCBLSTM)을 제안하였다. 제안 모델은 우선 작물의 공간 특징을 추출하기 위해 2차원의 합성곱 연산자를 적용하고, 추출된 공간 특징을 시간 특징을 고려할 수 있는 양방향 LSTM 모델의 입력 자료로 이용한다. 제안 모델의 분류 성능을 평가하기 위해 안반덕에서 수집된 다중시기 무인기 영상을 이용한 밭작물 구분 사례 연구를 수행하였다. 비교를 목적으로 기존 딥러닝 모델인 2차원의 공간 특징을 이용하는 2D convolutional neural network(CNN), 시간 특징을 이용하는 LSTM과 3차원의 시공간 특징을 이용하는 3D CNN을 적용하였다. 하이퍼 파라미터의 영향 분석을 통해, 시공간 특징을 이용함으로써 작물의 오분류 양상을 현저히 줄일 수 있었으며, 제안 모델이 공간 특징이나 시간 특징만을 고려하는 기존 딥러닝 모델에 비해 가장 우수한 분류 정확도를 나타냈다. 따라서 이 연구에서 제안된 모델은 작물의 시공간 특징을 고려할 수 있기 때문에 작물 분류에 효과적으로 적용될 수 있을 것으로 기대된다.

암호화와 DnCNN을 활용한 문서 복원능력 향상에 관한 연구 (An Enhancement Method of Document Restoration Capability using Encryption and DnCNN)

  • 장현희;하성재;조기환
    • 사물인터넷융복합논문지
    • /
    • 제8권2호
    • /
    • pp.79-84
    • /
    • 2022
  • 본 논문은 문서의 보안과 손실 및 오염에 대하여 복원능력을 향상시키는 방안을 제안한다. 이를 위해서 암호화로 DnCNN(DeNoise Convolution Neural Network)을 제시한다. 암호화 방법을 구현하기 위하여 2D이미지정보를 광학에 사용되는 공간주파수 전달함수(Spatial Frequency Transfer Function)의 수학적 모델을 적용한다. 공간 주파수 전달함수를 사용하여 광학적 간섭 패턴을 암호화로 사용하고 공간 주파수 전달함수의 수학적 변수를 복호화하는 암호로 사용하는 방법을 제안하였다. 또한, 딥러닝을 적용한 DnCNN 방법을 적용하여 노이즈 제거하여 복원 성능을 개선한다. 실험결과, 65%의 정보 손실이 있는 경우에도 Pre-Training DnCNN Deep Learning을 적용한 결과 공간 주파수 전달함수만을 활용한 복원 결과 와 비교하여 PSNR(Peak Signal-to-noise ratio)을 11% 이상 우수한 성능을 확인할 수 있다. 또한, CC(Correlation Coefficient)의 특성도 16% 이상 우수한 결과를 보이고 있다.

딥러닝 기술을 이용한 캐비테이션 자동인식에 대한 연구 (A Study on Autonomous Cavitation Image Recognition Using Deep Learning Technology)

  • 지바한;안병권
    • 대한조선학회논문집
    • /
    • 제58권2호
    • /
    • pp.105-111
    • /
    • 2021
  • The main source of underwater radiated noise of ships is cavitation generated by propeller blades. After the Cavitation Inception Speed (CIS), noise level at all frequencies increases severely. In determining the CIS, it is based on the results observed with the naked eye during the model test, however accuracy and consistency of CIS values are becoming practical issues. This study was carried out with the aim of developing a technology that can automatically recognize cavitation images using deep learning technique based on a Convolutional Neural Network (CNN). Model tests on a three-dimensional hydrofoil were conducted at a cavitation tunnel, and tip vortex cavitation was strictly observed using a high-speed camera to obtain analysis data. The results show that this technique can be used to quantitatively evaluate not only the CIS, but also the amount and rate of cavitation from recorded images.

컨볼루션 신경망과 전이 학습을 이용한 버섯 영상 인식 (Mushroom Image Recognition using Convolutional Neural Network and Transfer Learning)

  • 강은철;한영태;오일석
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제24권1호
    • /
    • pp.53-57
    • /
    • 2018
  • 독버섯 중독 사건이 종종 발생한다. 본 논문은 딥러닝 기술을 활용한 버섯 인식 시스템을 제안한다. 딥러닝 기법 중 하나인 컨볼루션 신경망을 사용하였다. 컨볼루션 신경망을 학습하기 위해 이미지 크롤링을 이용하여 38종의 버섯에 대해 1478장의 영상을 수집하였다. 수집한 데이터셋을 가지고 AlexNet, VGGNet, GoogLeNet을 비교 실험하였으며, 클래스 수 확장에 따른 비교 실험, 전이 학습을 사용한 비교실험을 하였다. 실험 결과 1순위 정확도는 82.63%, 5순위 정확도는 96.84%라는 성능을 얻었다.