• Title/Summary/Keyword: Image pyramid

Search Result 195, Processing Time 0.025 seconds

Color Image Enhancement using Laplacian Pyramid (라플라시안 피라미드를 이용한 컬러 영상의 화질 개선)

  • Baek Yeul-Min;Kim Hyoung-Joon;Lee Jin-Aeon;Oh Sang-Guen;Kim Whoi-Yul
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2006.06b
    • /
    • pp.355-357
    • /
    • 2006
  • 본 논문에서는 라플라시안 피라미드를 이용하여 컬러 영상의 밝기 및 색상을 개선하는 방법을 제안한다. 제안하는 방법은 입력 영상을 라플라시안 피라미드로 구성한 후 저해상도 근사 영상을 이용하여 영상의 전체적인 밝기를 개선하고 대역 통과 영상들을 이용하여 대비를 개선한 후 입력 영상의 밝기 값에 따라 적응적으로 색상을 재현함으로써 최종적으로 컬러 영상의 화질을 개선한다. 실험 결과 제안하는 방법은 영상 조명 특성에 강인한 화질 개선 성능을 보여주었으며 동영상에 적응시에도 자연스러운 화질 개선 결과를 얻을 수 있었고 실시간 처리가 가능한 수행 속도를 보여주었다.

  • PDF

Deep Learning Image-based Indoor Positioning System using Pyramid Beacon in Smartphone Augmented Reality Environment (스마트폰 증강현실 환경에서 피라미드 비콘을 활용한 딥러닝 영상기반 실내측위 시스템)

  • An, Hyeon Woo;Moon, Namme
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2019.10a
    • /
    • pp.1094-1097
    • /
    • 2019
  • 디지털화된 현실 환경을 증강현실속에서 투영시키기 위해선 증강현실 디바이스의 측위가 필수적이다. 하지만 대부분의 측위 방식이 측위 대상 디바이스에 대해 별도의 하드웨어나 센서를 요구하는데 이를 스마트폰 환경에서 충족시키기란 매우 힘든 일이다. 이에 본 논문은 스마트폰 환경에서 별도의 하드웨어를 요구하지 않는 딥러닝 영상기반 실내 측위 시스템을 제안한다. 제안하는 시스템은 측위를 위하여 설계된 피라미드형의 비콘을 활용하며 실시간에 가까운 피드백을 구현하기 위해 딥러닝 기법을 활용한 탐지를 진행한다. 본 논문에서는 상기한 두 개의 요소를 포함한 제안 시스템의 구성요소들을 설명하고 학습 방법과 비콘의 자세 측정 방법, 최종 측위 프로세스 등 전반적인 측위 프로세스를 설명한다.

Study on the Laplacian pyramid method of medical image using GPU (GPU를 이용한 의료영상의 라플라시안 피라미드 방법에 관한 연구)

  • Kim, Jaehyuk;Lee, Jun-Dong;Yang, Gil-Mo;Kim, Dongho;Kim, Soonseok;Lee, Kangwoo;Lee, Yonghee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2015.10a
    • /
    • pp.1491-1493
    • /
    • 2015
  • 본 논문에서는 GPU를 이용하여 x-ray영상의 질을 개선시키기 위해 라플라시안 피라미드 방법을 제시한다. 의료영상에서 중요시하는 특징의 추출을 위해 원영상을 다중레벨의 부영상으로 신호를 분해하며, 각 레벨에서 가우시안 스무딩 함수를 사용하여 영상의 대비를 확장시킨다. 분해된 영상을 기반으로 전체영상을 재구성하여 영상의 질을 향상시키게 된다. 이러한 과정은 많은 계산을 필요로하며, 효과적이고 바른 처리를 위해 GPU를 사용한다., 결과에서 GPU를 이용한 cuda 프로그램이 효과적으로 동작하며, 영상의 질을 향상시킴을 보인다.

Vehicle Image Recognition Using Deep Convolution Neural Network and Compressed Dictionary Learning

  • Zhou, Yanyan
    • Journal of Information Processing Systems
    • /
    • v.17 no.2
    • /
    • pp.411-425
    • /
    • 2021
  • In this paper, a vehicle recognition algorithm based on deep convolutional neural network and compression dictionary is proposed. Firstly, the network structure of fine vehicle recognition based on convolutional neural network is introduced. Then, a vehicle recognition system based on multi-scale pyramid convolutional neural network is constructed. The contribution of different networks to the recognition results is adjusted by the adaptive fusion method that adjusts the network according to the recognition accuracy of a single network. The proportion of output in the network output of the entire multiscale network. Then, the compressed dictionary learning and the data dimension reduction are carried out using the effective block structure method combined with very sparse random projection matrix, which solves the computational complexity caused by high-dimensional features and shortens the dictionary learning time. Finally, the sparse representation classification method is used to realize vehicle type recognition. The experimental results show that the detection effect of the proposed algorithm is stable in sunny, cloudy and rainy weather, and it has strong adaptability to typical application scenarios such as occlusion and blurring, with an average recognition rate of more than 95%.

Enhancement of MSFC-Based Multi-Scale Features Compression Network with Bottom-UP MSFF in VCM (VCM 의 바텀-업 MSFF 를 이용한 MSFC 기반 멀티-스케일 특징 압축 네트워크 개선)

  • Dong-Ha Kim;Gyu-Woong Han;Jun-Seok Cha;Jae-Gon Kim
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.11a
    • /
    • pp.116-118
    • /
    • 2022
  • MPEG-VCM(Video Coding for Machine)은 입력된 이미지/비디오의 특징(feature)를 압축하는 Track 1 과 입력 이미지/비디오를 직접 압축하는 Track 2 로 나뉘어 표준화가 진행 중이다. 본 논문은 Track 1 의 비전임무 네트워크로 사용하는 Detectron2 의 FPN(Feature Pyramid Network)에서 추출한 멀티-스케일 특징을 효율적으로 압축하는 MSFC 기반의 압축 모델의 개선 기법을 제시한다. 제안기법은 해상도를 줄여서 단일-스케일 압축맵을 압축하는 기존의 압축 모델에서 저해상도 특징맵을 고해상도 특징맵에 바텀-업(Bottom-Up) 구조로 합성하여 단일-스케일 특징맵을 구성하는 바텀-업 MSFF 를 가지는 압축 모델을 제시한다. 제안방법은 기존의 모델 보다 BPP-mAP 성능에서 1 ~ 2.7%의 개선된 BD-rate 성능을 보이며 VCM 의 이미지 앵커(image anchor) 대비 최대 -85.94%의 BD-rate 성능향상을 보인다.

  • PDF

Real-Time Detection of Large Objects using Image Pyramid (이미지 피라미드를 이용한 큰 객체 실시간 탐지)

  • Joo, Gwonil;Son, Seungwook;Ahn, Hanse;Chung, Yongwha;Park, Daihee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2020.11a
    • /
    • pp.709-712
    • /
    • 2020
  • 영상 처리 응용을 위해 개발된 대부분의 CNN 기반 객체 탐지 기법은 mAP 를 올리기 위해 작은 객체 탐지에 더 주력하는 경향이 있다. 본 연구에서는 이미지 피라미드를 통한 서로 다른 해상도의 탐지 결과를 앙상블을 하여 작은 객체의 탐지 성능은 유지하면서 큰 객체의 탐지 성능을 향상시키고자 한다. 또한, 기존 NMS 방식의 문제점을 파악하고 새로운 NMS 방식인 G-NMS 를 제안한다. COCO 데이터로 실험 결과 서로 다른 해상도의 탐지 결과 앙상블을 통하여 30fps 이상의 실시간 탐지를 만족하면서 큰 객체에 대한 AP 가 0.5~1.5% 상승되었음을 확인하였다. 제안한 G-NMS 방식 적용시 큰 객체에 대한 AR 이 2.6~3.8% 상승되었으며, 작은 객체를 포함한 전체 mAP 가 0.7~0.9% 상승되었음을 확인하였다.

Compression of Multiscale Features of FPN for VCM (VCM 을 위한 FPN 다중 스케일 특징 압축)

  • Kim, Dong-Ha;Yoon, Yong-Uk;Lee, Jooyoung;Jeong, Se-Yoon;Kim, Jae-Gon;Jeong, Dae-Gwon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.143-145
    • /
    • 2022
  • MPEG-VCM(Video Coding for Machine)은 입력된 비디오 특징(feature)를 압축하는 Track1 과 입력 영상을 직접 압축하는 Track2 로 나뉘어 표준화가 진행중이다. 본 논문은 VCM Track 1 에 해당하는 Detectron2 FPN(Feature Pyramid Network)에서 추출한 다중 스케일 특징맵을 VVC 로 압축하는 MSFC(Multi-Scale Feature Compression)을 구조를 제안한다. 본 논문의 MSFC 에서는 다중 스케일 특징을 결합하여 부호화/복호화하는 기존의 구조에서 특징맵의 해상도를 줄여 압축하는 개선된 MSFC 를 제시한다. 제안 방법은 VCM 의 Track2 의 영상 앵커(image anchor) 보다 우수한 BPP-mAP 성능을 보이고 최대 -84.98%의 BD-rate 성능향상을 보인다.

  • PDF

Image Retrieval Using Combination of Color and Multiresolution Texture Features (칼라 및 다해상도 질감 특징 결합에 의한 영상검색)

  • Chun Young-deok;Sung Joong-ki;Kim Nam-chul
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.30 no.9C
    • /
    • pp.930-938
    • /
    • 2005
  • We propose a content-based image retrieval(CBIR) method based on an efncient combination of a color feature and multiresolution texture features. As a color feature, a HSV autocorrelograrn is chosen which is blown to measure spatial correlation of colors well. As texture features, BDIP and BVLC moments are chosen which is hewn to measure local intensity variations well and measure local texture smoothness well, respectively. The texture features are obtained in a wavelet pyramid of the luminance component of a color image. The extracted features are combined for efficient similarity computation by the normalization depending on their dimensions and standard deviation vectors. Experimental results show that the proposed method yielded average $8\%\;and\;11\%$ better performance in precision vs. recall than the method using BDIPBVLC moments and the method using color autocorrelograrn, respectively and yielded at least $10\%$ better performance than the methods using wavelet moments, CSD, color histogram. Specially, the proposed method shows an excellent performance over the other methods in image DBs contained images of various resolutions.

3D Object's shape and motion recovery using stereo image and Paraperspective Camera Model (스테레오 영상과 준원근 카메라 모델을 이용한 객체의 3차원 형태 및 움직임 복원)

  • Kim, Sang-Hoon
    • The KIPS Transactions:PartB
    • /
    • v.10B no.2
    • /
    • pp.135-142
    • /
    • 2003
  • Robust extraction of 3D object's features, shape and global motion information from 2D image sequence is described. The object's 21 feature points on the pyramid type synthetic object are extracted automatically using color transform technique. The extracted features are used to recover the 3D shape and global motion of the object using stereo paraperspective camera model and sequential SVD(Singuiar Value Decomposition) factorization method. An inherent error of depth recovery due to the paraperspective camera model was removed by using the stereo image analysis. A 30 synthetic object with 21 features reflecting various position was designed and tested to show the performance of proposed algorithm by comparing the recovered shape and motion data with the measured values.

Application of Area Based Matching for the Automation of Interior Orientation (내부표정의 자동화를 위한 영역중심 영상정합기법 적용)

  • 유복모;염재홍;김원대
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.17 no.4
    • /
    • pp.321-330
    • /
    • 1999
  • Automation of observation and positioning of fiducial marks is made possible with the application of image matching technique, developed through the cooperative research effort of computer vision and digital photogrammetry. The major problem in such automation effort is to minimize the computing time and to increase the positional accuracy. Except for scanning and ground control surveying, the interior orientation process was automated in this study, through the development of an algorithm which applies the image matching and image processing techniques. The developed system was applied to close-range photogrammetry and the analysis of the results showed 54% improvement in processing time. For fiducial mark observation during interior orientation, the Laplacian of Gaussian transformation and the Hough transformation were applied to determine the accurate position of the center point, and the correlation matching and the least squares matching method were then applied to improve the accuracy of automated observation of fiducial marks. Image pyramid concept was applied to reduce the computing time of automated positioning of fiducial mark.

  • PDF