• 제목/요약/키워드: Image Pyramid

검색결과 197건 처리시간 0.053초

계층적 Pyramid구조와 MAP 추정 기법을 이용한 Texture 영상 합성 기법 (An Image Synthesis Technique Based on the Pyramidal Structure and MAP Estimation Technique)

  • 정석윤;이상욱
    • 대한전자공학회논문지
    • /
    • 제26권8호
    • /
    • pp.1238-1246
    • /
    • 1989
  • In this paper, a texture synthesis technique based on the NCAR(non-causal auto-regressive) model and the pyramid structure is proposed. In order to estimate the NCAR model parameters accurately from a noisy texture, the MAP(maximum a posteriori) estimation technique is also employed. In our approach, since the input texture is decomposed into the Laplacian oyramid planes first and then the NCAR model is applied to each plane, we are able to obtain a good synthesized texture even if the texture exhibits some non-random local structure or non-homogenity. The usrfulness of the proposed method is demonstrated with seveal real textures in the Brodatz album. Finally, the 2-dimensional MAP estimation technique can be used to the image restoration for noisy images as well as a texture image synthesis.

  • PDF

크기 및 회전 불변 영역 특징을 이용한 이미지 유사성 검색 (Image Similarity Retrieval using an Scale and Rotation Invariant Region Feature)

  • 유승훈;김현수;이석룡;임명관;김덕환
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제36권6호
    • /
    • pp.446-454
    • /
    • 2009
  • 다양한 영역 검출 및 형태 특징 추출 방법 중에서 MSER과 SIFT를 응용한 방법들이 컴퓨터비전 분야에 많이 사용된다. 하지만 기존의 SIFT를 이용한 특징 추출 방법은 자기 변화에 민감한 특성을 지니며, MSER 방법은 이미지의 크기 변화에 민감하고, 이미지 유사성 검색에 그대로 적용하기에는 어려움이 많다. 본 논문에서는 스케일 피라미드, MSER 그리고 어파인(affine) 정규화 과정 등을 이용한 영역 특징 서술자를 제안한다. 제안한 방법은 어파인 정규화 방법과 스케일 피라미드를 사용하기 때문에 이미지의 크기, 회전 및 자기 변화에 불변하다. 다양한 이미지들을 이용하여 실험하고, 실험 결과에서 제안한 방법이 SIFT, PCA-SIFT, CE-SIFT 그리고 SURF 방법에 비해서 각각 20%, 38%, 11%, 24% 이상 좋은 이미지 검색 성능을 보이고 있다.

DP-LinkNet: A convolutional network for historical document image binarization

  • Xiong, Wei;Jia, Xiuhong;Yang, Dichun;Ai, Meihui;Li, Lirong;Wang, Song
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권5호
    • /
    • pp.1778-1797
    • /
    • 2021
  • Document image binarization is an important pre-processing step in document analysis and archiving. The state-of-the-art models for document image binarization are variants of encoder-decoder architectures, such as FCN (fully convolutional network) and U-Net. Despite their success, they still suffer from three limitations: (1) reduced feature map resolution due to consecutive strided pooling or convolutions, (2) multiple scales of target objects, and (3) reduced localization accuracy due to the built-in invariance of deep convolutional neural networks (DCNNs). To overcome these three challenges, we propose an improved semantic segmentation model, referred to as DP-LinkNet, which adopts the D-LinkNet architecture as its backbone, with the proposed hybrid dilated convolution (HDC) and spatial pyramid pooling (SPP) modules between the encoder and the decoder. Extensive experiments are conducted on recent document image binarization competition (DIBCO) and handwritten document image binarization competition (H-DIBCO) benchmark datasets. Results show that our proposed DP-LinkNet outperforms other state-of-the-art techniques by a large margin. Our implementation and the pre-trained models are available at https://github.com/beargolden/DP-LinkNet.

ATM 망에서 피라미드 구조를 이용한 2계층 영상부호화 (Two-Layer Video Coding Using Pyramid Structure for ATM Networks)

  • 홍승훈;김인권;박래홍
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1995년도 학술대회
    • /
    • pp.97-100
    • /
    • 1995
  • In transmission of image sequences over ATM networks, the packet loss problem and channel sharing efficiency are important. As a possible solution two-layer video coding methods have been proposed. These methods transmit video information over the network with different levels of protection with respect to packets loss. In this paper, a two-layer coding method using pyramid structure is proposed and several realizations of two-layer video coding methods are presented and their performances are compared.

고해상도 광학영상과 SAR 영상 간 자동 변위량 추정 (Automatic Estimation of Geometric Translations Between High-resolution Optical and SAR Images)

  • 한유경;변영기;김용일
    • 대한공간정보학회지
    • /
    • 제20권3호
    • /
    • pp.41-48
    • /
    • 2012
  • 고해상도 위성영상을 공간정보 분야에 효과적으로 활용하기 위해서는 다중센서와 다시기 영상 데이터를 공간분석에 함께 사용하여 이들 데이터의 장점을 최대한 활용하는 것이 중요하다. 본 연구에서는 고해상도의 다중센서자료를 동시에 활용하기 위해, 영상 간 존재하는 변위량을 자동으로 추정하여 다중센서 영상 간 기하보정을 수행하는 새로운 영상정합기법을 개발하였다. 영상의 취득 방식과 방사적 특성이 다른 광학영상과 SAR 영상 간의 유사도를 효과적으로 계산하기 위하여 기하적, 방사적 전처리 과정을 수행하였고, 두 영상 간 변위량 측정은 상호정보기법을 통해 계산하였다. 또한, 변위량 측정방식의 계산 효율과 정확도 향상을 위하여 영상 피라미드 방식을 적용하여 상위 피라미드 영상부터 차례로 x, y 방향에 대한 변위량을 최적화기법을 통해 추정하였다. 이러한 과정을 피라미드의 최하부인 원영상에까지 반복적으로 수행함으로써 두 영상 간 정밀한 변위량을 추정하였으며, 수동으로 추출된 검사점을 통해 제안기법에 대한 정확도 평가를 수행한 결과, 영상간 변위량에 대한 고려만으로도 약 5m 이내 (RMSE)의 기하보정 정확도를 도출할 수 있었다.

팔레트를 가지는 칼라 영상의 점진적 전송을 위한 새로운 피라미드 자료 구조 (A new pyramid structure for progressive transmission of palletized color images)

  • 조영우;김영모
    • 한국정보처리학회논문지
    • /
    • 제3권6호
    • /
    • pp.1624-1635
    • /
    • 1996
  • PC통신과 WWW에서 팔레트를 가지는 칼라 영상의 사용량이 많아지고 있으나 대부 분의 영상 압축과 점진적 전송을 위한 방법은 그레이 레벨 영상을 위해서 고안되어 져 왔다. 개발된 대부분의 방식은 그레이 레벨 영상의 화소들 사이에 존재하는 공간 적 상관성을 이용하는 것으로서 각 화소 사이의 상관 관계가 거의 존재하지 않은 팔 레트 영상에는 적합하지가 않다. 따라서 팔레트 영상을 위한 새로운 방법의 개발이 필요하며 본 논문에서는 팔레트 영상의 압축과 점진적 전송을 위한 새로운 피라미드 구조를 제안하였다. 제안한 피라미드 구조에서 상위 마디의 색상은 하위 마디 중에서 가장 많은 부분을 차지하는 색상이 되며 각각의 마디는 형태 부호와 색상부호로서 나 타내어진다. 제안한 방법에서는 영상의 공간적 상관성을 이용하지 않기 때문에 팔레 트 영상의 압축과 전송에 이상적으로 이용될 수 있으며 실험 결과를 통해서 이를 확 인할 수 있다.

  • PDF

Single Low-Light Ghost-Free Image Enhancement via Deep Retinex Model

  • Liu, Yan;Lv, Bingxue;Wang, Jingwen;Huang, Wei;Qiu, Tiantian;Chen, Yunzhong
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권5호
    • /
    • pp.1814-1828
    • /
    • 2021
  • Low-light image enhancement is a key technique to overcome the quality degradation of photos taken under scotopic vision illumination conditions. The degradation includes low brightness, low contrast, and outstanding noise, which would seriously affect the vision of the human eye recognition ability and subsequent image processing. In this paper, we propose an approach based on deep learning and Retinex theory to enhance the low-light image, which includes image decomposition, illumination prediction, image reconstruction, and image optimization. The first three parts can reconstruct the enhanced image that suffers from low-resolution. To reduce the noise of the enhanced image and improve the image quality, a super-resolution algorithm based on the Laplacian pyramid network is introduced to optimize the image. The Laplacian pyramid network can improve the resolution of the enhanced image through multiple feature extraction and deconvolution operations. Furthermore, a combination loss function is explored in the network training stage to improve the efficiency of the algorithm. Extensive experiments and comprehensive evaluations demonstrate the strength of the proposed method, the result is closer to the real-world scene in lightness, color, and details. Besides, experiments also demonstrate that the proposed method with the single low-light image can achieve the same effect as multi-exposure image fusion algorithm and no ghost is introduced.

심층신경망을 이용한 PCB 부품의 검지 및 인식 (Detection of PCB Components Using Deep Neural Nets)

  • 조태훈
    • 반도체디스플레이기술학회지
    • /
    • 제19권2호
    • /
    • pp.11-15
    • /
    • 2020
  • In a typical initial setup of a PCB component inspection system, operators should manually input various information such as category, position, and inspection area for each component to be inspected, thus causing much inconvenience and longer setup time. Although there are many deep learning based object detectors, RetinaNet is regarded as one of best object detectors currently available. In this paper, a method using an extended RetinaNet is proposed that automatically detects its component category and position for each component mounted on PCBs from a high-resolution color input image. We extended the basic RetinaNet feature pyramid network by adding a feature pyramid layer having higher spatial resolution to the basic feature pyramid. It was demonstrated by experiments that the extended RetinaNet can detect successfully very small components that could be missed by the basic RetinaNet. Using the proposed method could enable automatic generation of inspection areas, thus considerably reducing the setup time of PCB component inspection systems.

데스크톱 3D 홀로그램 피라미드에서 피라미드 단면 사이 사용자 이동에 따른 끊김 없는(seamless viewing control) 뷰 생성 (Seamless Viewing Control by User Movement Between Pyramid Sections in Desktop 3D Hologram Pyramid)

  • 황선주;남양희
    • 한국콘텐츠학회논문지
    • /
    • 제21권3호
    • /
    • pp.1-9
    • /
    • 2021
  • 홀로그램 피라미드는 플로팅 홀로그램의 응용으로, 착용형 장비 없이 다각도에서 3D 홀로그램을 감상할 수 있게 하는 장치이다. 저렴하고 제작이 간단하다는 장점으로 교육, 프로토타이핑, 쇼케이스 등 다양한 분야에서 사용되고 있다. 그 중에서도 데스크톱형 홀로그램은 기존의 홀로그램 피라미드의 크기를 키워 더욱 선명하고 크게 홀로그램을 감상할 수 있게 하였다. 하지만 다각도에서 홀로그램 피라미드를 감상할 수 있음에도 불구하고, 피라미드의 각각의 면이 이어지는 곳에서 홀로그램을 감상할 경우, 홀로그램이 끊기거나 왜곡되는 현상이 있다. 뿐만 아니라, 기존 홀로그램 피라미드에 투사되는 영상은 단순히 각각의 면에 홀로그램을 90도씩 회전시킨 4개의 뷰를 투사하도록 제작되어 있기 때문에, 사용자가 다양한 각도에서 홀로그램을 감상하더라도 4개의 각도에서 바라본 뷰 밖에 보지 못한다. 본 논문에서는 이러한 문제를 해결하기 위해 사용자의 위치를 추적하여 사용자의 시선 각도에 해당하는 홀로그램 영상을 생성 후, 역으로 왜곡하여 투영된 홀로그램이 왜곡되지 않는 방법을 제안하고, 기존의 홀로그램 피라미드 영상을 사용한 결과와 새롭게 제안한 방법을 적용한 결과를 비교 하였다.

계층 구조와 텍스쳐 특징을 이용한 위성 영상의 분류 (Classification of satellite image using pyramid structure and texture features)

  • 엄기문;김정호;김정기;이쾌희
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 1992년도 하계학술대회 논문집 A
    • /
    • pp.449-452
    • /
    • 1992
  • Before performing an adaptive stereo matching using satellite images, classification is needed as a preprocessing step. This paper describes that classification of three land cover types : river, mountain, and agricultural fields. We proposed that classification algorithm using pyramid structure and texture features. Results of applying the proposed algorithm to satellite image improved classification accuracy.

  • PDF