• 제목/요약/키워드: 특징맵

검색결과 269건 처리시간 0.026초

MMAD와 SIFT를 이용한 디스패리티 맵 생성 (Estimation of Disparity Map using MMAD and SIFT)

  • 신도경;문영식
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2007년도 가을 학술발표논문집 Vol.34 No.2 (C)
    • /
    • pp.510-515
    • /
    • 2007
  • 2차원 영상으로부터 3차원 정보를 획득하기 위해서는 disparity map의 정확한 계산이 요구된다. Disparity map을 구하기 위한 기존의 알고리즘은 크게 상관도 기반 방법과 특징 기반 방법으로 분류되는데, 본 논문에서는 이들 각 방법에 대한 분석을 통해서 좀 더 정확한 disparity map을 구하는 방법을 모색한다. 이를 위해 스테레오 카메라로부터 획득된 2차원 영상에서 건물에 대한 깊이 정보 추출을 위해 SIFT 기법을 이용한 disparity map 생성 알고리즘을 제안한다. 제안된 기법은 수정된 MAD인 MMAD(Modified Mean of Absolute Differences) 알고리즘을 새로 제안하여 영역 기반의 유사도 측정을 기반으로 하면서 특징 기반 방법의 하나인 SIFT를 적용하여 거짓 정합(false matching)에 의한 에러를 줄이고 폐색(occlusion) 영역에 대한 오류를 보정한 disparity map을 생성하는데 초점을 둔다.

  • PDF

얼굴 검출을 위한 Gabor 특징 기반의 웨이블릿 분해 방법 (Gabor-Features Based Wavelet Decomposition Method for Face Detection)

  • 이정문;최찬석
    • 산업기술연구
    • /
    • 제28권B호
    • /
    • pp.143-148
    • /
    • 2008
  • A real-time face detection is to find human faces robustly under the cluttered background free from the effect of occlusion by other objects or various lightening conditions. We propose a face detection system for real-time applications using wavelet decomposition method based on Gabor features. Firstly, skin candidate regions are extracted from the given image by skin color filtering and projection method. Then Gabor-feature based template matching is performed to choose face cadidate from the skin candidate regions. The chosen face candidate region is transformed into 2-level wavelet decomposition images, from which feature vectors are extracted for classification. Based on the extracted feature vectors, the face candidate region is finally classified into either face or nonface class by the Levenberg-Marguardt back-propagation neural network.

  • PDF

컨볼루션 신경망의 특징맵을 사용한 객체 추적 (Object Tracking using Feature Map from Convolutional Neural Network)

  • 임수창;김도연
    • 한국멀티미디어학회논문지
    • /
    • 제20권2호
    • /
    • pp.126-133
    • /
    • 2017
  • The conventional hand-crafted features used to track objects have limitations in object representation. Convolutional neural networks, which show good performance results in various areas of computer vision, are emerging as new ways to break through the limitations of feature extraction. CNN extracts the features of the image through layers of multiple layers, and learns the kernel used for feature extraction by itself. In this paper, we use the feature map extracted from the convolution layer of the convolution neural network to create an outline model of the object and use it for tracking. We propose a method to adaptively update the outline model to cope with various environment change factors affecting the tracking performance. The proposed algorithm evaluated the validity test based on the 11 environmental change attributes of the CVPR2013 tracking benchmark and showed excellent results in six attributes.

Siamese Network의 특징맵을 이용한 객체 추적 알고리즘 (Object Tracking Algorithm using Feature Map based on Siamese Network)

  • 임수창;박성욱;김종찬;류창수
    • 한국멀티미디어학회논문지
    • /
    • 제24권6호
    • /
    • pp.796-804
    • /
    • 2021
  • In computer vision, visual tracking method addresses the problem of localizing an specific object in video sequence according to the bounding box. In this paper, we propose a tracking method by introducing the feature correlation comparison into the siamese network to increase its matching identification. We propose a way to compute location of object to improve matching performance by a correlation operation, which locates parts for solving the searching problem. The higher layer in the network can extract a lot of object information. The lower layer has many location information. To reduce error rate of the object center point, we built a siamese network that extracts the distribution and location information of target objects. As a result of the experiment, the average center error rate was less than 25%.

중첩 블록 단위 종단간 이미지 압축 방법 (Overlapped Block-wise End-to-End Image Compression Method)

  • 김민섭;이종석;심동규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.155-157
    • /
    • 2020
  • 본 논문은 딥러닝 기반의 중첩 블록 단위 이미지 압축 방법에 대하여 제안한다. 이미지를 블록 단위로 나누어 압축을 진행하며, 그 과정에서 생길 수 있는 블록화 현상을 제거하기 위해 블록의 주변부를 압축에 이용한다. 이로 인한 추가적인 부하를 제거하기 위해 복호화에 필요한 부하 영역을 제거한 뒤, 복호화기에서 특징맵들을 병합하여, 제거한 영역에 대해 주변 블록의 정보를 사용하여 복호화를 진행한다. 압축을 진행하고자 하는 이미지의 크기에 따라 급격하게 증가하는 요구 메모리를 이미지의 크기에 상관 없이 고정된 작은 메모리로 이미지 압축을 진행할 수 있다는 장점이 있다. 실험 결과로써 4K 이미지를 통해서 복원된 화질과 메모리의 사용량을 측정한 결과, 동일한 화질을 유지함과 동시에, 기존 방법대비 약 500배 적은 메모리 사용량을 보인다.

  • PDF

Mask R-CNN 과 zi2zi 모델을 활용하여 탐지된 객체의 스타일을 변환시키는 신경망 모델 (Neural network model for detected object style transformation using Mask R-CNN and zi2zi)

  • 조인수;최동빈;박용범
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.562-565
    • /
    • 2021
  • 스타일 변환 모델은 이미지 전체나 이미지 내에서 사용자가 지정한 영역을 대상으로 스타일을 변환시킨다. 이런 방식은 이미지 내의 다수의 객체에 대해 스타일 변환을 시행할 때 일일이 영역을 지정해 줘야 한다는 불편함과 결과물의 전체 해상도가 떨어진다는 한계를 가지고 있다. 본 논문에서는 이런 한계들을 극복하기 위해 객체탐지 모델과 스타일변환 모델을 연동한 객체스타일변환모델을 제안하고 모델 간 연동방법에 대해 자세히 서술한다. 객체탐지모델인 Mask R-CNN 을 통해 필요한 객체를 탐지하고 탐지한 객체의 특징맵들을 스타일변환 모델인 zi2zi 의 입력 값으로 전달하여 이미지 내의 필요한 객체들만 스타일변환이 이루어지도록 모델이 동작한다. 이러한 모델은 기존에 있는 두 모델을 재사용함으로써 모델을 처음부터 새로 설계할 필요가 없다는 장점이 있으며, 공개된 다양한 모델들을 서로 융합하여 사용할 수 있는 방법을 제시하는데 도움을 줄 것이다.

실시간 음성 모니터링을 위한 오토인코더 기반 FTAE 설계 및 구현 (The Design and Implementation of Autoencoder-Based FTAE for Real-Time Audio Monitoring)

  • 양진환;최혁순;박정현;김성식;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.741-744
    • /
    • 2024
  • 본 연구에서는 음성 전처리 기법인 푸리에 변환의 높은 시간 복잡도로 인해 많은 계산 자원을 요구한다는 단점을 보완하기 위한 FTAE(Fourier Transform Auto Encoder)를 설계하고 구현한다. FTAE는 음성 데이터를 입력으로 받아 Early Fusion 특징맵을 출력하도록 설계된 오토인코더 기반 신경망이다. 학습 결과 FTAE의 최종 Training Loss는 0.1479를 나타냈다. 기존 푸리에 변환 기반 Early Fusion 방법과의 성능 비교 실험 결과 FTAE 방법은 Accuracy 0.905, F1-Score 0.905, 탐지 소요 시간 17초의 성능을 보였다. FTAE 방법은 Early Fusion 방법에 비해 Accuracy와 F1-Score는 0.065 하락했지만, 탐지 소요 시간은 약 72배 빠른 결과를 보여주었다.

3차원 특징볼륨을 이용한 깊이영상 생성 모델 (Depth Map Estimation Model Using 3D Feature Volume)

  • 신수연;김동명;서재원
    • 한국콘텐츠학회논문지
    • /
    • 제18권11호
    • /
    • pp.447-454
    • /
    • 2018
  • 본 논문은 컨볼루션 신경망으로 이루어진 학습 모델을 통해 스테레오 영상의 깊이영상 생성 알고리즘을 제안한다. 제안하는 알고리즘은 좌, 우 시차 영상을 입력으로 받아 각 시차영상의 주요 특징을 추출하는 특징 추출부와 추출된 특징을 이용하여 시차 정보를 학습하는 깊이 학습부로 구성된다. 우선 특징 추출부는 2D CNN 계층들로 이루어진 익셉션 모듈(xception module) 및 ASPP 모듈(atrous spatial pyramid pooling) module을 통해 각각의 시차영상에 대한 특징맵을 추출한다. 그 후 각 시차에 대한 특징 맵을 시차에 따라 3차원 형태로 쌓아 3D CNN을 통해 깊이 추정 가중치를 학습하는 깊이 학습부를 거친 후 깊이 영상을 추정한다. 제안하는 알고리즘은 객체 영역에 대해 기존의 다른 학습 알고리즘들 보다 정확한 깊이를 추정하였다.

계층 간 특징 복원-예측 네트워크를 통한 피라미드 특징 압축 (Pyramid Feature Compression with Inter-Level Feature Restoration-Prediction Network)

  • 김민섭;심동규
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.283-294
    • /
    • 2022
  • 딥 러닝 네트워크에서 사용되는 특징 맵은 일반적으로 영상보다 데이터가 크며 특징 맵을 전송하기 위해서는 영상의 압축률보다 더 높은 압축률이 요구된다. 본 논문은 딥러닝 기반의 영상처리에서 객체의 크기에 대한 강인성을 가지는 FPN 구조의 네트워크에서 사용되는 피라미드 특징 맵을 높은 압축률로 전송하기 위해 제안한 복원-예측 네트워크를 통해 전송된 일부 계층의 피라미드 특징 맵으로 전송하지 않은 계층의 피라미드 특징 맵을 예측하며, 압축으로 인한 손상을 복원하는 구조를 제안한다. 제안한 방법의 COCO 데이터셋 2017 Train images에 대한 객체 탐지의 성능은 rate-precision 그래프에서 VTM12.0을 통해 특징 맵을 압축한 결과 대비 BD-rate 31.25%의 성능향상을 보였고, PCA와 DeepCABAC을 통한 압축을 수행한 방법 대비 BD-rate 57.79%의 성능향상을 보였다.

직각 교차 실린더 매핑과 영상 분할 기반 환경 모델링을 이용한 파노라마 네비게이션 (Panoramic Navigation using Orthogonal Cross Cylinder Mapping and Image-Segmentation Based Environment Modeling)

  • 류승택;조청운;윤경현
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제30권3_4호
    • /
    • pp.138-148
    • /
    • 2003
  • 최근에는 가상 공간을 현실감 있는 영상으로 실시간 렌더링하기 위한 방법으로 모델기반 표현방법 대신 영상 기반 표현 방법을 사용하여 탐색 영상을 생성하는 연구가 활발히 진행중이다. 본 논문에서는 영상 기반 탐색 시스템을 구현하기 위해 새로운 방법인 직각 교차 실린더 매핑과 분할기반 환경 모델 링 방법을 제안한다. 직각 교차 실린더란 두 개의 실린더를 직교하여 교차된 부분만을 표현한 물체를 말한다. 직각 교차 실린더 매핑 방법은 일반적인 환경 맵에서 발생하는 왜곡 현상을 제거하고 환경 맵에서 하나의 픽셀이 차지하는 환경 영역이 거의 일정하다는 특징을 가진다. 이러한 직각 교차 실린더 매핑 방법은 고정된 시점에서 완전 시야를 갖는 영상을 얻어 낼 수 있으나 시점이 변경된 영상을 표현하기 어렵다. 이를 위해 환경을 구성하는 물체들을 기준으로 환경 맵을 분할하고 분할된 물체의 특성에 따라 깊이 값을 설정하는 영상 분할을 통한 환경 모델 링 방법을 사용한다. 이 방법은 환경 맵에 적용하기 용이하며 다중 환경 맵을 사용 시 자세한 환경 모델 링이 가능하다.