• 제목/요약/키워드: Histogram-based Classification

검색결과 96건 처리시간 0.039초

재발량 분석을 이용한 음향 상황 인지 (Acoustic scene classification using recurrence quantification analysis)

  • 박상욱;최우현;고한석
    • 한국음향학회지
    • /
    • 제35권1호
    • /
    • pp.42-48
    • /
    • 2016
  • 동일한 장소에서도 매우 다양한 음향이 발생하고, 서로 다른 장소에서도 유사한 음향이 발생하기 때문에 훈련 데이터가 적거나, 훈련 단계에서 일부 음향만 고려된 경우 음향 상황 인지 성능을 보장할 수 없다. 이러한 문제점을 해결하기 위한 방법으로 Bag of Words (BOW) 기반 히스토그램 특징이 소개되었다. 하지만 BOW 기반 히스토그램 특징은 일정 시간동안 발생한 음향의 분포를 이용하기 때문에 음향이 발생한 순차적인 정보는 고려할 수 없다. 음향 상황 인지에서 일정 시간 동안 발생한 음향의 주기성과 지속성은 상황을 인지하는데 중요한 정보가 될 수 있다. 따라서 본 논문에서는 재발량 분석을 이용하여 주기성과 지속성에 대한 특징을 추출하였다. 인식 실험에서 재발량 분석을 통해 추출된 특징을 함께 사용한 경우 기존 방법들 보다 향상된 성능을 확인했다.

가중치 기반 Bag-of-Feature와 앙상블 결정 트리를 이용한 정지 영상에서의 인간 행동 인식 (Human Action Recognition in Still Image Using Weighted Bag-of-Features and Ensemble Decision Trees)

  • 홍준혁;고병철;남재열
    • 한국통신학회논문지
    • /
    • 제38A권1호
    • /
    • pp.1-9
    • /
    • 2013
  • 본 논문에서는 CS-LBP (Center-Symmetric Local Binary Pattern) 특징과 공간 피라미드를 이용한 BoF (Bag of Features)를 생성하고 이를 랜덤 포레스트(Random Forest) 분류기에 적용하여 인간의 행동을 인식하는 알고리즘을 제안한다. BoF를 생성하기 위해 영상을 균일한 패치로 나누고, 각 패치 마다 CS-LBP 특징을 추출한다. 행동 분류 성능을 향상시키기 위해 패치들마다 추출한 특징벡터들에 대해 K-mean 클러스터링을 적용하여 코드 북을 생성한다. 본 논문에서는 영상의 지역적인 특성을 고려하기 위해 공간 피라미드 방법을 적용하고 각 공간 레벨에서 추출된 BoF에 대해 가중치를 적용하여 최종적으로 하나의 특징 벡터로 결합한다. 행동 분류를 위해 결정트리의 앙상블로 이루어진 랜덤 포레스트는 학습 단계에서 각 행동 클래스를 위한 분류 모델을 만든다. 가중 BoF가 적용된 랜덤 포레스트는 다양한 인간 행동 영상을 포함하고 있는 Standford Actions 40 데이터를 성공적으로 분류하였다. 또한 기존 방법에 비해 분류 성능이 유사하거나 우수하며, 한 장의 영상에 대해 빠른 인식속도를 보였다.

화소값의 구간별 양자화 값 상관관계를 이용한 텍스춰 기술자 (Texture Descriptor Using Correlation of Quantized Pixel Values on Intensity Range)

  • 복거철
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권3호
    • /
    • pp.229-234
    • /
    • 2018
  • 텍스춰는 영상을 분류하거나 분할하는데 사용되는 유용한 특징이다. 기존에 제안되었던 LBP는 텍스춰 영상의 지역적인 특징을 간단한 연산을 통해 성공적으로 추출하는 기법으로서 많은 응용 분야에서 높은 성능을 보인 것으로 확인되었지만 오직 화소값의 차이만을 토대로 특징을 기술하기 때문에 잡음에 약하고 특히 이웃화소의 수가 증가함에 따라 특징벡터의 차원이 기하급수적으로 증가하는 문제점으로 인해 멀티스테일 텍스춰 기술자로서 사용하기에는 제약이 크다. 본 논문은 이런 LBP의 단점을 극복하기 위하여 화소값의 범위를 구간별로 양자화하여 양자화영상의 화소값의 상관관계를 3차원 히스토그램으로 표현하는 기법을 제시한다. 이와 같이 3차원 히스토그램을 이용하여 화소값 사이의 상관 관계를 추출하면 특징벡터의 차원이 선형적으로 증가하는 특성을 가지므로 멀티스케일 텍스춰 기술자로 다양하게 응용될 수 있다. 제안하는 방법을 텍스춰 실험영상을 통해 실험한 결과 텍스춰를 분류하는 문제에 있어서 LBP와 비교하여 유의 수준의 성능의 향상을 확인하였다.

Classification of Man-Made and Natural Object Images in Color Images

  • Park, Chang-Min;Gu, Kyung-Mo;Kim, Sung-Young;Kim, Min-Hwan
    • 한국멀티미디어학회논문지
    • /
    • 제7권12호
    • /
    • pp.1657-1664
    • /
    • 2004
  • We propose a method that classifies images into two object types man-made and natural objects. A central object is extracted from each image by using central object extraction method[1] before classification. A central object in an images defined as a set of regions that lies around center of the image and has significant color distribution against its surrounding. We define three measures to classify the object images. The first measure is energy of edge direction histogram. The energy is calculated based on the direction of only non-circular edges. The second measure is an energy difference along directions in Gabor filter dictionary. Maximum and minimum energy along directions in Gabor filter dictionary are selected and the energy difference is computed as the ratio of the maximum to the minimum value. The last one is a shape of an object, which is also represented by Gabor filter dictionary. Gabor filter dictionary for the shape of an object differs from the one for the texture in an object in which the former is computed from a binarized object image. Each measure is combined by using majority rule tin which decisions are made by the majority. A test with 600 images shows a classification accuracy of 86%.

  • PDF

Hybrid Neural Classifier Combined with H-ART2 and F-LVQ for Face Recognition

  • Kim, Do-Hyeon;Cha, Eui-Young;Kim, Kwang-Baek
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.1287-1292
    • /
    • 2005
  • This paper presents an effective pattern classification model by designing an artificial neural network based pattern classifiers for face recognition. First, a RGB image inputted from a frame grabber is converted into a HSV image which is similar to the human beings' vision system. Then, the coarse facial region is extracted using the hue(H) and saturation(S) components except intensity(V) component which is sensitive to the environmental illumination. Next, the fine facial region extraction process is performed by matching with the edge and gray based templates. To make a light-invariant and qualified facial image, histogram equalization and intensity compensation processing using illumination plane are performed. The finally extracted and enhanced facial images are used for training the pattern classification models. The proposed H-ART2 model which has the hierarchical ART2 layers and F-LVQ model which is optimized by fuzzy membership make it possible to classify facial patterns by optimizing relations of clusters and searching clustered reference patterns effectively. Experimental results show that the proposed face recognition system is as good as the SVM model which is famous for face recognition field in recognition rate and even better in classification speed. Moreover high recognition rate could be acquired by combining the proposed neural classification models.

  • PDF

신경 회로망을 이용한 자궁 경부 세포진 영상의 영역 분할에 관한 연구 (A Study on Segmentation of Uterine Cervical Pap-Smears Images Using Neural Networks)

  • 김선아;김백섭
    • 대한의용생체공학회:의공학회지
    • /
    • 제22권3호
    • /
    • pp.231-239
    • /
    • 2001
  • This paper proposes a region segmenting method for the Pap-smear image. The proposed method uses a pixel classifier based on neural network, which consists of four stages : preprocessing, feature extraction, region segmentation and postprocessing. In the preprocessing stage, brightness value is normalized by histogram stretching. In the feature extraction stage, total 36 features are extracted from $3{\times}3$ or $5{\times}5$ window. In the region segmentation stage, each pixel which is associated with 36 features, is classified into 3 groups : nucleus, cytoplasm and background. The backpropagation network is used for classification. In the postprocessing stage, the pixel, which have been rejected by the above classifier, are re-classified by the relaxation algorithm. It has been shown experimentally that the proposed method finds the nucleus region accurately and it can find the cytoplasm region too.

  • PDF

Character Segmentation in Chinese Handwritten Text Based on Gap and Character Construction Estimation

  • Zhang, Cheng Dong;Lee, Guee-Sang
    • International Journal of Contents
    • /
    • 제8권1호
    • /
    • pp.39-46
    • /
    • 2012
  • Character segmentation is a preprocessing step in many offline handwriting recognition systems. In this paper, Chinese characters are categorized into seven different structures. In each structure, the character size with the range of variations is estimated considering typical handwritten samples. The component removal and merge criteria are presented to remove punctuation symbols or to merge small components which are part of a character. Finally, the criteria for segmenting the adjacent characters concerning each other or overlapped are proposed.

HOG 특징 기반 SVM 을 활용한 화물차 분류 시스템 (Truck Classification System Using HOG Feature - based SVM)

  • 강건우;강석주
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2018년도 하계학술대회
    • /
    • pp.345-346
    • /
    • 2018
  • 차종 별 교통량 자료는 도로의 유지관리나 분석 등의 행정 처리 업무에 필요한 기본 자료임과 동시에 각종 연구에 활용된다. 본 시스템은 그 일환으로서 화물차나 일반차량을 구분하여 특정 도로의 화물차 비율이나 교통량을 파악하는데 활용할 수 있다. 머신 러닝 알고리즘 중에서 높은 성능을 보이는 Support Vector Machine (SVM) 알고리즘을 이용하여 도로 위의 일반차량과 화물차를 구분하였다. 우선, 화물차와 일반차량의 차이를 구분하고자 각각의 영상에 대해 Histogram of Oriented Gradients (HOG) 기반 특징점을 추출하고 이에 따라 1 차원 벡터로 표현된 데이터를 SVM 으로 분류하여 구분한다.

  • PDF

LBG 알고리즘 기반의 의상 색상 유사성 판별 (Distinction of Color Similarity for Clothes based on the LBG Algorithm)

  • 주형돈;홍민;조위덕;문남미;최유주
    • 인터넷정보학회논문지
    • /
    • 제9권5호
    • /
    • pp.117-130
    • /
    • 2008
  • 본 논문은 LBG 알고리즘을 이용하여 다양한 조명에 노출된 의상들의 색상 유사성을 안정적으로 판단하는 방법을 제안한다. 색상 유사성 판별을 위하여 기존에 대표적으로 사용되어왔던 히스토그램 인터섹션이나 누적 히스토그램 방법은 조명 변화에 민감하게 반응하여, 동일한 의상 색상이라 할지라도 서로 다른 조명환경에서는 서로 상이한 색상 판별 결과를 나타낸다. 본 논문에서는 조명에 의한 영향을 줄이고 색상 자체의 분포 특성을 분석하기 위하여 조명조건의 변화에도 일관된 특성을 유지하는 색조와 채도 컬러 성분에 대한 분포 특성을 분석한다. 색조와 채도에 의해 정의되는 2차원 공간에서 각 의상 영상에 대한 색상 분포를 분석하기 위하여 LBG 알고리즘에 의한 비모수적 클러스터링 기법을 적용하고, 클러스터링 결과 얻어진 두 영상의 클러스터 사이의 평균 유클리디안 거리 값을 계산하여 이를 색상 유사성을 판단하는 유사 값으로 정의한다. 제안 기법의 안정성을 입증하기 위하여 서로 다른 조명 환경에서 촬영된 12벌의 의상에 대하여 기존 히스토그램 분석 기법을 기반으로 한 색상 유사성 판별 결과와 제안 기법의 적용 결과를 비교하였다. 실험 결과 제안기법은 동일한 의상 쌍과 상이한 의상 쌍에 대하여 구분을 지을 수 있는 객관적 기준 정의가 용이하였고, 기준에 따른 의상의 동일성 판별 실험에서 91.6%의 판별 성공률을 얻었다.

  • PDF

서포트 벡터 머신 기반 비디오 조각파일 분류 (Support Vector Machines-based classification of video file fragments)

  • 강현석;이영석
    • 한국산학기술학회논문지
    • /
    • 제16권1호
    • /
    • pp.652-657
    • /
    • 2015
  • BitTorrent는 다수의 파일 공유자들로부터 조각파일을 전송 받아 하나의 완전한 파일을 완성할 수 있는 파일 공유 및 전송과 관련된 혁신적인 프로토콜이다. 그러나, 불법 또는 저작권과 관련된 비디오 데이터들이 임의로 배포되는 범죄행위가 발생하는 것이 현실이다. BitTorrent 상에 데이터에 대한 저작권 단속의 어려움은 데이터의 전송형태가 완전한 파일 형식이 아닌 조각 파일 형태로 전송된다는 점이다. 따라서, BitTorrent에서 얻어진 조각파일에서 디지털 콘텐츠를 복원하고, 저작권 위반 여부를 판단하기 위해서는 디지털 콘텐츠의 파일 형식에 대한 분류 과정이 선행 되어야 한다. 본 연구에서는 디지털 파일의 형식을 분류하기 위한 방법으로서 조각파일의 히스토그램 차분을 특징 벡터로 하는 SVM 분류기를 제안 하였다. 제안한 분류기는 3종류의 비디오 파일 형식에 적용하여 분류율로 성능을 평가하였다.