• 제목/요약/키워드: Histogram of Gradient

검색결과 116건 처리시간 0.022초

HOG 기반의 적응적 평활화를 이용한 스캔된 영상의 하프톤 잡음 제거 (Halftone Noise Removal in Scanned Images using HOG based Adaptive Smoothing Filter)

  • 허규성;백열민;김회율
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.316-324
    • /
    • 2012
  • 본 논문에서는 영상의 그래디언트의 히스토그램 (HOG)에 기반한 적응적 평활화 필터를 이용하여 스캔된 하프톤 문서의 하프톤 잡음 제거 방법을 제안한다. 하프톤 잡음은 잡음의 편차가 커서 에지 영역과 유사한 특성을 나타내므로 일반적인 에지 보존 평활화 필터를 적용할 경우에는 잡음 제거 효과가 떨어진다. 또한 인쇄물에 주로 사용되는 집중형 도트 방식의 하프톤은 컬러 영상에서 채널간의 간섭 현상으로 인해 모아레 패턴을 생성한다. 따라서 본 논문에서는 스캔된 하프톤 문서의 하프톤 잡음과 모아레 패턴을 효과적으로 제거하기 위해 하프톤 잡음의 방향성에 기반한 적응적 평활화 필터 방법을 제안한다. 하프톤 잡음의 경우 영상의 에지와 달리 등방성을 가지므로 영상을 블록 단위로 나누어 지배적인 에지의 크기와 방향성을 살핌으로써 적응적 평활화 필터를 구성할 수 있다. 실험 결과, 제안하는 방법은 다양한 인쇄 매체를 통해 생성된 하프톤 문서에 대하여 효과적으로 하프톤 잡음을 제거하면서도 영상의 에지를 보존하는 것을 확인할 수 있었다.

모션 히스토리 영상 및 기울기 방향성 히스토그램과 적출 모델을 사용한 깊이 정보 기반의 연속적인 사람 행동 인식 시스템 (Depth-Based Recognition System for Continuous Human Action Using Motion History Image and Histogram of Oriented Gradient with Spotter Model)

  • 음혁민;이희진;윤창용
    • 한국지능시스템학회논문지
    • /
    • 제26권6호
    • /
    • pp.471-476
    • /
    • 2016
  • 본 논문은 깊이 정보를 기반으로 모션 히스토리 영상 및 기울기 방향성 히스토그램과 적출 모델을 사용하여 연속적인 사람 행동들을 인식하는 시스템을 설명하고 연속적인 행동 인식 시스템에서 인식 성능을 개선하기 위해 행동 적출을 수행하는 적출 모델을 제안한다. 본 시스템의 구성은 전처리 과정, 사람 행동 및 적출 모델링 그리고 연속적인 사람 행동 인식으로 이루어져 있다. 전처리 과정에서는 영상 분할과 시공간 템플릿 기반의 특징을 추출하기 위하여 Depth-MHI-HOG 방법을 사용하였으며, 추출된 특징들은 사람 행동 및 적출 모델링 과정을 통해 시퀀스들로 생성된다. 이 생성된 시퀀스들과 은닉 마르코프 모델을 사용하여 정의된 각각의 행동에 적합한 사람 행동 모델과 제안된 적출 모델을 생성한다. 연속적인 사람 행동 인식은 연속적인 행동 시퀀스에서 적출 모델에 의해 의미 있는 행동과 의미 없는 행동을 분할하는 행동 적출과 의미 있는 행동 시퀀스에 대한 모델의 확률 값들을 비교하여 연속적으로 사람 행동들을 인식한다. 실험 결과를 통해 제안된 모델이 연속적인 행동 인식 시스템에서 인식 성능을 효과적으로 개선하는 것을 검증한다.

Sub Oriented Histograms of Local Binary Patterns for Smoke Detection and Texture Classification

  • Yuan, Feiniu;Shi, Jinting;Xia, Xue;Yang, Yong;Fang, Yuming;Wang, Rui
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권4호
    • /
    • pp.1807-1823
    • /
    • 2016
  • Local Binary Pattern (LBP) and its variants have powerful discriminative capabilities but most of them just consider each LBP code independently. In this paper, we propose sub oriented histograms of LBP for smoke detection and image classification. We first extract LBP codes from an image, compute the gradient of LBP codes, and then calculate sub oriented histograms to capture spatial relations of LBP codes. Since an LBP code is just a label without any numerical meaning, we use Hamming distance to estimate the gradient of LBP codes instead of Euclidean distance. We propose to use two coordinates systems to compute two orientations, which are quantized into discrete bins. For each pair of the two discrete orientations, we generate a sub LBP code map from the original LBP code map, and compute sub oriented histograms for all sub LBP code maps. Finally, all the sub oriented histograms are concatenated together to form a robust feature vector, which is input into SVM for training and classifying. Experiments show that our approach not only has better performance than existing methods in smoke detection, but also has good performance in texture classification.

위성영상의 감독분류를 위한 훈련집합의 특징 선택에 관한 연구 (Feature Selection of Training set for Supervised Classification of Satellite Imagery)

  • 곽장호;이황재;이준환
    • 대한원격탐사학회지
    • /
    • 제15권1호
    • /
    • pp.39-50
    • /
    • 1999
  • 위성에서 관측된 다 대역 위성영상 데이터를 이용목적에 따라 분류하기 위해서는 복잡한 처리과정과 많은 시간을 필요로 하며, 감독분류시 훈련 데이터의 선택과 고려되는 다양한 특징 값들은 분류 정확도를 좌우할 만큼 민감한 특성을 나타내고 있다. 따라서 본 논문에서는 훈련데이터의 선택과 다양한 특징 값들 중 실제 영상분류에 기여도가 높은 특징을 추출하기 위하여 퍼지 기반의 $\gamma$모델을 이용한 분류네트웍을 구성하였다. 훈련집합 선택시 분류하고자 하는 지역의 밝기 분포도, 텍스쳐 특징 그리고 NDVI(Normalized Difference Vegetation Index)를 분류에 사용될 특징으로 선택하였고, 분류네트웍 출력 값의 오류가 최소화 되도록 Gradient Desoent 방법을 이용하여 각 노드의 $\gamma$파라미터를 훈련시키는 과정을 채택하였다. 이러한 훈련을 통하여 얻어진 파라미터를 이용하면 각 노드의 연결특성을 알 수 있으며, 다양한 입력 노드의 특징들 중 영상분류에 기여도가 적은 특징들을 추출하여 제거할 수 있다.

그래디언트 라돈변환을 이용한 만화영상의 외곽 경계사각형 검출 (Out-Boundary Rectangle Detection in Comic Images Using the Gradient Radon Transform)

  • 김동근;양승범;황치정
    • 한국멀티미디어학회논문지
    • /
    • 제14권4호
    • /
    • pp.538-545
    • /
    • 2011
  • 최근, 인터넷에 다양한 컨텐츠가 있으며, 특히 만화영상은 인기 있는 디지털 컨텐츠 중의 하나이다. 이러한 만화영상은 대부분 스캐너에 의해 스캔되며, 크기, 기울기, 경계선 부분의 여백 등이 정규화되어 있지 않다. 이와 같은 정규화 과정은 만화영상 분석에서 매우 중요한 단계로, 만화영상의 외곽 경계사각형을 검출하는 방법으로 정규화를 수행할 수 있다. 본 논문에서는 그래디언트 라돈 변환을 사용하여 만화영상에서 외곽의 경계사각형을 검출하는 방법을 제안한다. 만화영상에서 경계 사각형의 변의 후보인 선분을 검출하기 위하여 그래디언트 정보를 이용한 라돈 변환을 적용하고, 후보 선분과 지역 히스토그램을 이용하여 최종 외곽의 경계사각형 검출하였다. 제안 방법으로 만화 영상에서 효과적으로 외곽의 경계사각형을 검출함을 실험으로 보였다.

Application of An Adaptive Self Organizing Feature Map to X-Ray Image Segmentation

  • Kim, Byung-Man;Cho, Hyung-Suck
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2003년도 ICCAS
    • /
    • pp.1315-1318
    • /
    • 2003
  • In this paper, a neural network based approach using a self-organizing feature map is proposed for the segmentation of X ray images. A number of algorithms based on such approaches as histogram analysis, region growing, edge detection and pixel classification have been proposed for segmentation of general images. However, few approaches have been applied to X ray image segmentation because of blur of the X ray image and vagueness of its edge, which are inherent properties of X ray images. To this end, we develop a new model based on the neural network to detect objects in a given X ray image. The new model utilizes Mumford-Shah functional incorporating with a modified adaptive SOFM. Although Mumford-Shah model is an active contour model not based on the gradient of the image for finding edges in image, it has some limitation to accurately represent object images. To avoid this criticism, we utilize an adaptive self organizing feature map developed earlier by the authors.[1] It's learning rule is derived from Mumford-Shah energy function and the boundary of blurred and vague X ray image. The evolution of the neural network is shown to well segment and represent. To demonstrate the performance of the proposed method, segmentation of an industrial part is solved and the experimental results are discussed in detail.

  • PDF

Object Tracking with Sparse Representation based on HOG and LBP Features

  • Boragule, Abhijeet;Yeo, JungYeon;Lee, GueeSang
    • International Journal of Contents
    • /
    • 제11권3호
    • /
    • pp.47-53
    • /
    • 2015
  • Visual object tracking is a fundamental problem in the field of computer vision, as it needs a proper model to account for drastic appearance changes that are caused by shape, textural, and illumination variations. In this paper, we propose a feature-based visual-object-tracking method with a sparse representation. Generally, most appearance-based models use the gray-scale pixel values of the input image, but this might be insufficient for a description of the target object under a variety of conditions. To obtain the proper information regarding the target object, the following combination of features has been exploited as a corresponding representation: First, the features of the target templates are extracted by using the HOG (histogram of gradient) and LBPs (local binary patterns); secondly, a feature-based sparsity is attained by solving the minimization problems, whereby the target object is represented by the selection of the minimum reconstruction error. The strengths of both features are exploited to enhance the overall performance of the tracker; furthermore, the proposed method is integrated with the particle-filter framework and achieves a promising result in terms of challenging tracking videos.

Infrared Target Recognition using Heterogeneous Features with Multi-kernel Transfer Learning

  • Wang, Xin;Zhang, Xin;Ning, Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권9호
    • /
    • pp.3762-3781
    • /
    • 2020
  • Infrared pedestrian target recognition is a vital problem of significant interest in computer vision. In this work, a novel infrared pedestrian target recognition method that uses heterogeneous features with multi-kernel transfer learning is proposed. Firstly, to exploit the characteristics of infrared pedestrian targets fully, a novel multi-scale monogenic filtering-based completed local binary pattern descriptor, referred to as MSMF-CLBP, is designed to extract the texture information, and then an improved histogram of oriented gradient-fisher vector descriptor, referred to as HOG-FV, is proposed to extract the shape information. Second, to enrich the semantic content of feature expression, these two heterogeneous features are integrated to get more complete representation for infrared pedestrian targets. Third, to overcome the defects, such as poor generalization, scarcity of tagged infrared samples, distributional and semantic deviations between the training and testing samples, of the state-of-the-art classifiers, an effective multi-kernel transfer learning classifier called MK-TrAdaBoost is designed. Experimental results show that the proposed method outperforms many state-of-the-art recognition approaches for infrared pedestrian targets.

The Effectiveness of Volumetric Modulated arc Radiotherapy to Treat Patients with Metastatic Spinal Tumors

  • Park, Hyo-Kuk;Kim, Sungchul
    • International Journal of Contents
    • /
    • 제13권4호
    • /
    • pp.12-15
    • /
    • 2017
  • Among the possible stereotactic body radiation therapy (SBRT) modalities used to treat patients with metastatic spinal tumors, this study compared Cyberknife, tomotherapy, and volumetric modulated arc radiotherapy (VMAT). We established treatment plans for each of them modality and quantitatively analyzed the dose evaluation factors of the dose-volume histogram (DVH) for all spinal bones, focusing on the tumor and spinal cord, in order to examine the usefulness of VMAT. For the treatment planning dose, the mean dose ($D_{max}$) and $D_{5%}$ showed statistical differences in the target dose, but no difference was shown in the spinal cord dose. For the DVH indices, tomotherapy showed the best performance was the best in terms of uniformity index, while VMAT showed better performance was better than the other two modalities in terms of the conformity index and the dose gradient index. VMAT had a much shorter treatment time than Cyberknife and tomotherapy. These findings suggest that VMAT FFF is the most effective therapy for SBRT of patients with metastatic spinal tumors for whom a high dose of radiation is prescribed.

실시간 처리를 위한 ROI가 적용된 HOG 기반 보행자 인식 구현 (Implementation of Pedestrian Recognition Based on HOG using ROI for Real Time Processing)

  • 이주영
    • 전기전자학회논문지
    • /
    • 제18권4호
    • /
    • pp.581-585
    • /
    • 2014
  • 본 논문은 ROI가 적용된 HOG 특징을 적용한 보행자 인식에 대해서 제안한다. 기존의 HOG 방법은 높은 인식률을 갖지만 처리 속도가 느린 단점이 존재한다. 처리 속도가 느린 기존의 HOG 방법에 ROI를 적용하여 불필요한 영역에 대한 연산을 줄여 처리 속도를 향상시켰다. ROI 영역을 설정하기 위해 영상 전체를 연산하는 홀수 프레임과 설정된 ROI 영역만을 연산하는 짝수 프레임을 조합한 구조를 사용하였다. 구현 결과 본 논문에서 제안하는 방법은 기존의 방법과 동일한 정확도를 유지하면서 처리 속도측면에서 약 20% 향상된 초당 8.3 프레임의 성능을 보였다.