• 제목/요약/키워드: Convolution Kernel

검색결과 87건 처리시간 0.049초

자이로 센서와 노출시간이 다른 두 장의 영상을 이용한 비균일 디블러 기법 (Non-uniform Deblur Algorithm using Gyro Sensor and Different Exposure Image Pair)

  • 류호형;송병철
    • 방송공학회논문지
    • /
    • 제21권2호
    • /
    • pp.200-209
    • /
    • 2016
  • 본 논문에서는 촬영 시 발생하는 블러 현상을 효율적으로 제거하기 위해 IMU 센서와 노출시간이 길고, 짧은 두 영상을 이용한 비균일 디블러 알고리즘을 제안한다. 종래 센서 정보를 이용한 블러 커널 추정 기법들은 센서 정보의 한계로 인해 성능이 만족스럽지 못하다. 그 한계를 극복하기 위해 우리는 노출시간이 서로 다른 여러 영상들을 이용한 커널 개선 과정을 제안하여, 추정된 커널의 정확도를 향상시킨다. 또한 종래 비균일 디블러 기법들이 블러 커널이 커질수록 심한 화질 열화를 겪는 문제점을 해결하기 위해 본 논문은 호모그래피 기반 잔여 디콘볼루션을 제안하여 디콘볼루션 과정에서 발생하는 링형 현상과 같은 화질 열화를 최소화한다. 실험 결과를 통해 제안 알고리즘의 화질이 기존 기법에 비해 주관적/객관적으로 현저하게 우수함을 볼 수 있다.

RGB-csb를 활용한 제한된 CNN에서의 정확도 분석 및 비교 (Accuracy Analysis and Comparison in Limited CNN using RGB-csb)

  • 공준배;장민석;남광우;이연식
    • 한국전자통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.133-138
    • /
    • 2020
  • 본 논문은 대부분의 변형된 CNN(: Convolution Neural Networks)에서 사용하지 않는 첫 번째 컨볼루션 층(convolution layer)을 사용해 정확도 향상을 노리는 방법을 소개한다. GoogLeNet, DenseNet과 같은 CNN에서 첫 번째 컨볼루션 층에서는 기존방식(3×3 컨볼루션연산 및 배규정규화, 활성화함수)만을 사용하는데 이 부분을 RGB-csb(: RGB channel separation block)로 대체한다. 이를 통해 RGB값을 특징 맵에 적용시켜 정확성을 향상시킬 수 있는 선행연구 결과에 추가적으로, 기존 CNN과 제한된 영상 개수를 사용하여 정확도를 비교한다. 본 논문에서 제안한 방법은 영상의 개수가 적을수록 학습 정확도 편차가 커 불안정하지만 기존 CNN에 비해 정확도가 평균적으로 높음을 알 수 있다. 영상의 개수가 적을수록 평균적으로 약 2.3% 높은 정확도를 보였으나 정확도 편차는 5% 정도로 크게 나타났다. 반대로 영상의 개수가 많아질수록 기존 CNN과의 평균 정확도의 차이는 약 1%로 줄어들고, 각 학습 결과의 정확도 편차 또한 줄어든다.

균형적인 신체활동을 위한 맞춤형 AI 운동 추천 서비스 (Customized AI Exercise Recommendation Service for the Balanced Physical Activity)

  • 김창민;이우범
    • 융합신호처리학회논문지
    • /
    • 제23권4호
    • /
    • pp.234-240
    • /
    • 2022
  • 본 논문은 직종별 근무 환경에 따른 상대적 운동량을 고려한 맞춤형 AI 운동 추천 서비스 방법을 제안한다. 가속도 및 자이로 센서를 활용하여 수집된 데이터를 18가지 일상생활의 신체활동으로 분류한 WISDM 데이터베이스를 기반으로 전신, 하체, 상체의 3가지 활동으로 분류한 후 인식된 활동 지표를 통해 적절한 운동을 추천한다. 본 논문에서 신체활동 분류를 위해서 사용하는 1차원 합성곱 신경망(1D CNN; 1 Dimensional Convolutional Neural Network) 모델은 커널 크기가 다른 다수의 1D 컨볼루션(Convolution) 계층을 병렬적으로 연결한 컨볼루션 블록을 사용한다. 컨볼루션 블록은 하나의 입력 데이터에 다층 1D 컨볼루션을 적용함으로써 심층 신경망 모델로 추출할 수 있는 입력 패턴의 세부 지역 특징을 보다 얇은 계층으로도 효과적으로 추출 할 수 있다. 제안한 신경망 모델의 성능 평가를 위해서 기존 순환 신경망(RNN; Recurrent Neural Network) 모델과 비교 실험한 결과 98.4%의 현저한 정확도를 보였다.

영상기반의 화재 검출에 효과적인 CNN 심층학습의 커널 특성에 대한 연구 (A Study of Kernel Characteristics of CNN Deep Learning for Effective Fire Detection Based on Video)

  • 손금영;박장식
    • 한국전자통신학회논문지
    • /
    • 제13권6호
    • /
    • pp.1257-1262
    • /
    • 2018
  • 본 논문에서는 보안 감시 카메라 영상을 활용하여 화재 검출을 위한 효과적인 심층학습 방안을 제안한다. AlexNet 모델을 기준으로 효과적인 화재 검출을 위한 커널 크기와 커널 이동 간격의 변화에 따른 분류 성능을 비교 분석한다. 학습을 위한 데이터셋은 정상과 화재 2가지 클래스로 분류한다, 정상 영상에는 구름과 안개 낀 영상을 포함하고, 화재 영상에는 연기와 화염을 각각 포함한다. AlexNet 모델의 첫 번째 계층의 커널 크기와 이동 간격에 따른 분류 성능 분석 결과 커널의 크기는 크고, 이동 간격은 작을수록 화재 분류 성능이 우수한 것을 확인할 수 있다.

GPGPU 기반 Convolutional Neural Network의 효율적인 스레드 할당 기법 (Efficient Thread Allocation Method of Convolutional Neural Network based on GPGPU)

  • 김민철;이광엽
    • 예술인문사회 융합 멀티미디어 논문지
    • /
    • 제7권10호
    • /
    • pp.935-943
    • /
    • 2017
  • 많은 양의 데이터 기반으로 학습하는 neural network 중 이미지 분류나 음성 인식 등에 사용되어 지고 있는 CNN(Convolution neural network)는 현재까지도 우수한 성능을 가진 구조로 계속적으로 발전되고 있다. 제한된 자원을 가진 임베디드 시스템에서 활용하기에는 많은 어려움이 있다. 그래서 미리 학습된 가중치를 사용하지만 여전히 한계점이 있기 때문에 이를 해결하기 위해 GPU의 범용 연산을 위해서 사용하는 GP-GPU(General-Purpose computing on Graphics Processing Units)를 활용하는 추세다. CNN은 단순하고 반복적인 연산을 수행하기 때문에 SIMT(Single Instruction Multiple Thread)기반의 GPGPU에서 스레드 할당과 활용 방법에 따라 연산 속도가 많이 달라진다. 스레드로 Convolution 연산과 Pooling 연산을 수행할 때 쉬어야 하는 스레드가 발생하는 데 이러한 문제를 해결하기 위해 남은 스레드가 다음 피쳐맵과 커널 계산에 활용되는 방법을 사용함으로써 연산 속도를 증가시켰다.

컨볼루션 신경망의 특징맵을 사용한 객체 추적 (Object Tracking using Feature Map from Convolutional Neural Network)

  • 임수창;김도연
    • 한국멀티미디어학회논문지
    • /
    • 제20권2호
    • /
    • pp.126-133
    • /
    • 2017
  • The conventional hand-crafted features used to track objects have limitations in object representation. Convolutional neural networks, which show good performance results in various areas of computer vision, are emerging as new ways to break through the limitations of feature extraction. CNN extracts the features of the image through layers of multiple layers, and learns the kernel used for feature extraction by itself. In this paper, we use the feature map extracted from the convolution layer of the convolution neural network to create an outline model of the object and use it for tracking. We propose a method to adaptively update the outline model to cope with various environment change factors affecting the tracking performance. The proposed algorithm evaluated the validity test based on the 11 environmental change attributes of the CVPR2013 tracking benchmark and showed excellent results in six attributes.

구문 트리 가지치기 및 소멸 인자 조정을 통한 트리 커널 기반 단백질 간 상호작용 추출 성능 향상 (Performance Enhancement of Tree Kernel-based Protein-Protein Interaction Extraction by Parse Tree Pruning and Decay Factor Adjustment)

  • 최성필;최윤수;정창후;맹성현
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제37권2호
    • /
    • pp.85-94
    • /
    • 2010
  • 본 논문에서는 기존의 연구에서 시도되었던 것과는 달리, 복잡하고 추출하기가 어려운 다양한 형태의 자질 및 단서 정보가 필요 없는 합성곱 구문 트리 커널 기반의 단백질 간 상호작용 추출 기법을 소개한다. 이 기법의 특징은 단백질 이름 쌍을 포함한 상호작용 포함 후보 문장에 대한 구문 트리만을 이용하여 추출을 시도한다는 것이며 부가적인 자질이나 커널 함수가 불필요하다는 장점이 있다. 이를 기반으로 본 논문의 연구 성과는 다음과 같다. 첫째, 단백질 간 상호작용 추출에 있어서 구문 트리 커널을 적용할 경우 불필요한 문맥 정보를 효과적으로 제거하는 구문 트리 가지치기 작업이 필수적임을 기존 연구 결과와의 성능 비교로써 증명한다. 둘째, 동일한 학습 조건에서 구문 트리 커널의 소멸 인자(decay factor)는 평활 인자(smoothing factor)로서 중요한 역할을 하며, 성능 변화의 핵심 요소임을 보인다. 특히 학습 집합의 규모에 따라서 소멸인자가 성능에 미치는 영향력이 상이한 패턴으로 나타남을 제시하였다. 결론적으로 기존의 최신 연구결과로서 주장한 "단일 커널보다 혼합 커널의 성능이 더 뛰어나다"라는 가설이 항상 성립하는 것은 아니라는 것을 합성곱 구문 트리 커널 단독으로 적용하여 높은 성능을 나타냄으로써 보여주었다. 동일한 조건으로 수행한 실험에서 기존의 두 연구 결과에 비해 19.8%, 14%의 성능 개선을 나타내었다.

MDCT에서의 Convolution Kernel 종류에 따른 공간 영역 필터링의 영상 평가 (Evaluation to Obtain the Image According to the Spatial Domain Filtering of Various Convolution Kernels in the Multi-Detector Row Computed Tomography)

  • 이후민;유병규;권대철
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제31권1호
    • /
    • pp.71-81
    • /
    • 2008
  • CT 영상은 커널의 종류와 재구성 방법에 따라 다양하게 나타나며, 관심 영역의 CT감약계수 및 노이즈는 정밀도에 영향을 준다. 커널의 종류에 따른 노이즈, 공간분해능 및 MTF를 측정하여 영상을 평가하였다. 다중채널CT 스캐너를 이용하여 팬텀 및 복부를 스캔 하였고, 커널은 B10(very smooth), B20(smooth), B30(medium smooth), B40(medium), B50(medium sharp), B60(sharp), B70(very sharp), B80(ultra sharp)으로 재구성하여 물, 공기, 간의 실질 조직, 근육, 지방 부위를 ROI 기능을 이용하여 평균의 CT감약계수와 표준편차인 노이즈를 정량적으로 측정하여 영상을 비교하였다. 그 결과CT 감약계수는 물($1.1{\sim}1.8\;HU$), 공기($-998{\sim}-1,000\;HU$)이고, 물에서의 노이즈($5.4{\sim}44.8\;HU$), 공기($3.6{\sim}31.4\;HU$)이다. 인체에서 간 실질 조직과 지방, 근육의 CT 감약계수와 노이즈를 커널에 따라 측정하였다. 지방의 CT 감약계수($-2.2{\sim}0.8\;HU$), 간의 실질 조직에서 CT감약계수($60.4{\sim}62.2\;HU$), 노이즈($7.6{\sim}63.8\;HU$), 근육의 CT감약계수($53.3{\sim}54.3\;HU$), 노이즈($10.4{\sim}70.7\;HU$) 사이에서 분포하였고, 커널이 높아질수록 노이즈도 증가하였다. 영상의 질을 높이기 위해서는 검사부위에 따라 노이즈를 감소하기 위해 적절한 커널을 선택하여 CT 검사를 하여야 한다.

  • PDF

Convolution Kernel의 종류에 따른 CT 감약계수 및 노이즈 측정에 관한 연구 (A Method to Obtain the CT Attenuation Coefficient and Image Noise of Various Convolution Kernels in the Computed Tomography)

  • 권대철;유병규;이종석;장근조
    • 대한디지털의료영상학회논문지
    • /
    • 제9권1호
    • /
    • pp.21-30
    • /
    • 2007
  • 영상 획득과 재구성 방법에 따라 CT 감약계수는 다양성을 보이고 관심 영역의 노이즈는 정밀도에 영향을 준다. 인체에서 간 실질조직과 위장의 물의 CT 감약계수와 노이즈를 커널에 따라 측정하였다. 다중채널 CT 스캐너를 이용하여 복부를 스캔 하였고, 커널은 B10 (very smooth), B20 (smooth), B30 (medium smooth), B40 (medium), B50 (medium sharp), B60 (sharp), B70 (very sharp), B80 (ultra sharp)으로 재구성하여 간의 실질 조직과 물이 들어 있는 위장 부위를 ROI 기능을 이용하여 평균의 CT감약계수와 표준편차인 노이즈를 측정하여 영상을 비교하였다. 간의 실질 조직에서 CT감약계수는 커널에 따라 60.4에서 69.2 HU사이에서 분포하여 차이가 없었으나, 노이즈는 커널(7.6$\sim$63.8 HU)이 높아질수록 증가하였다. 물의 CT감약계수는 -2.2 HU에서 0.8 HU사이에서 측정되었고, 노이즈는 커널(10.1$\sim$82.4 HU)이 높아질수록 증가하였다. 영상의 질을 높이기 위해서는 검사 부위에 따라 노이즈를 감소하기 위해 적절한 커널을 선택하여 CT 검사를 하여야 한다.

  • PDF

Pose Estimation with Binarized Multi-Scale Module

  • Choi, Yong-Gyun;Lee, Sukho
    • International journal of advanced smart convergence
    • /
    • 제7권2호
    • /
    • pp.95-100
    • /
    • 2018
  • In this paper, we propose a binarized multi-scale module to accelerate the speed of the pose estimating deep neural network. Recently, deep learning is also used for fine-tuned tasks such as pose estimation. One of the best performing pose estimation methods is based on the usage of two neural networks where one computes the heat maps of the body parts and the other computes the part affinity fields between the body parts. However, the convolution filtering with a large kernel filter takes much time in this model. To accelerate the speed in this model, we propose to change the large kernel filters with binarized multi-scale modules. The large receptive field is captured by the multi-scale structure which also prevents the dropdown of the accuracy in the binarized module. The computation cost and number of parameters becomes small which results in increased speed performance.