• 제목/요약/키워드: visual descriptor

검색결과 67건 처리시간 0.02초

Performance Improvement of Classifier by Combining Disjunctive Normal Form features

  • Min, Hyeon-Gyu;Kang, Dong-Joong
    • International Journal of Internet, Broadcasting and Communication
    • /
    • 제10권4호
    • /
    • pp.50-64
    • /
    • 2018
  • This paper describes a visual object detection approach utilizing ensemble based machine learning. Object detection methods employing 1D features have the benefit of fast calculation speed. However, for real image with complex background, detection accuracy and performance are degraded. In this paper, we propose an ensemble learning algorithm that combines a 1D feature classifier and 2D DNF (Disjunctive Normal Form) classifier to improve the object detection performance in a single input image. Also, to improve the computing efficiency and accuracy, we propose a feature selecting method to reduce the computing time and ensemble algorithm by combining the 1D features and 2D DNF features. In the verification experiments, we selected the Haar-like feature as the 1D image descriptor, and demonstrated the performance of the algorithm on a few datasets such as face and vehicle.

휴대 단말을 위하여 개선된 Speeded Up Robust Features(SURF) 알고리듬의 성능 측정 및 분석 (Performance Evaluation and Analysis of Modified Speeded Up Robust Features(SURF) for Mobile Phones)

  • 서정진;윤경로
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2011년도 추계학술대회
    • /
    • pp.276-279
    • /
    • 2011
  • 최근 스마트폰의 카메라를 이용한 시각 검색(Visual Search) 어플리케이션(Application)을 많은 사람들이 이용하고 있고, 이러한 시각 검색 어플리케이션은 여러 가지 특징 추출 방법을 사용하고 있다. 본 논문에서는 특징 추출 방법 중 하나인 Speeded Up Robust Features (SURF)를 사용하여 모바일 환경에 적합한 특징 추출 및 정합 방법에 대하여 기술한다. 모바일 기기들은 기존의 일반 PC환경에 비해 비교적 낮은 성능의 하드웨어 조건을 가지고 있다. 하지만 SURF 특징점 추출 방법 및 정합 방법은 계산량이 많고 복잡하여 실시간 및 모바일 환경에 사용하기엔 제약이 따른다. 모바일 환경에서 높은 성능을 내기 위해 기술자(Descriptor) 차원 감소와 라플라시안(Laplacian) 부호를 이용한 정합, 그리고 최적의 거리 비율로 정합하는 방법을 제안한다.

  • PDF

Region Division for Large-scale Image Retrieval

  • Rao, Yunbo;Liu, Wei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제13권10호
    • /
    • pp.5197-5218
    • /
    • 2019
  • Large-scale retrieval algorithm is problem for visual analyses applications, along its research track. In this paper, we propose a high-efficiency region division-based image retrieve approaches, which fuse low-level local color histogram feature and texture feature. A novel image region division is proposed to roughly mimic the location distribution of image color and deal with the color histogram failing to describe spatial information. Furthermore, for optimizing our region division retrieval method, an image descriptor combining local color histogram and Gabor texture features with reduced feature dimensions are developed. Moreover, we propose an extended Canberra distance method for images similarity measure to increase the fault-tolerant ability of the whole large-scale image retrieval. Extensive experimental results on several benchmark image retrieval databases validate the superiority of the proposed approaches over many recently proposed color-histogram-based and texture-feature-based algorithms.

그래프 컷 커널을 이용한 스테레오 대응 (Stereo Correspondence Using Graphs Cuts Kernel)

  • 이용환;김영섭
    • 반도체디스플레이기술학회지
    • /
    • 제16권2호
    • /
    • pp.70-74
    • /
    • 2017
  • Given two stereo images of a scene, it is possible to recover a 3D understanding of the scene. This is the primary way that the human visual system estimates depth. This process is useful in applications like robotics, where depth sensors may be expensive but a pair of cameras is relatively cheap. In this work, we combined our interests to implement a graph cut algorithm for stereo correspondence, and performed evaluation against a baseline algorithm using normalized cross correlation across a variety of metrics. Experimental trials revealed that the proposed descriptor exhibited a significant improvement, compared to the other existing methods.

  • PDF

MPEG-7 시각 기술자와 멀티 클래스 SVM을 이용한 의료 영상 분류와 검색 (Medical Image Classification and Retrieval using MPEG-7 Visual Descriptors and Multi-Class SVM(Support Vector Machine))

  • 심정희;고병철;남재열
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 춘계학술발표대회
    • /
    • pp.135-138
    • /
    • 2008
  • 본 논문은 의료 영상에 대한 효과적인 분류와 검색을 위한 알고리즘을 제안한다. 영상 분류와 검색을 위해서 MPEG-7 표준 기술자인 색 구조 기술자와 경계선 히스토그램 기술자를 사용해 영상들에 대한 특징 값을 추출한다. 이렇게 구해진 특징 값들을 의료 영상의 분류와 검색에 적용해 본 결과 비교적 낮은 성능을 보여줌을 확인하고 앞서 구해진 특징 값들을 교사 학습 방법인 SVM(Support Vector Machine)과 비교사 학습 방법인 FCM(Fuzzy C-means Clustering)에 적용시켰다. 기존 연구에서는 SVM과 FCM의 통합으로 의료 영상에 대한 분류와 검색을 시행하였지만 본 논문에서 실험한 결과 SVM과 MPEG-7 시각 기술자 중에 하나인 EHD(Edge Histogram Descriptor)를 가중치 선형 결합하여 실험한 결과가 더 정확한 분류와 높은 검색 성능을 나타냄을 확인하였다.

장면 전환 기법을 이용한 동영상 검색 시스템 설계 (Design of Moving Picture Retrieval System using Scene Change Technique)

  • 김장희;강대성
    • 대한전자공학회논문지SP
    • /
    • 제44권3호
    • /
    • pp.8-15
    • /
    • 2007
  • 최근 멀티미디어 데이터를 효율적으로 전송, 저장 관리 및 검색하는 기술이 중요한 핵심 기술로 대두되고 있다. 그 중에서 멀티미디어 정보 검색의 경우 사용자가 원하는 정보를 표현할 수 있는 사용자 인터페이스 기술과 원하는 정보를 사용자에게 신속하고 정확하게 보여주는 기술의 필요성이 증대하고 있다. 본 논문에서는 MPEG으로 압축된 영상 정보에서 장면의 전환점인 컷을 효과적으로 검출하여 동영상을 분할하는 기법을 제안한다. 컷 검출(Cut detection)은 MPEG 비디오 시퀀스에서 동영상을 분할하는 가장 기본적이면서 중요한 기초 작업이며, 비디오 색인 및 검색을 위한 첫 번째 단계이다. 기존의 방법들은 프레임간을 비교하기 때문에 물체의 빠른 움직임이나 카메라의 움직임, 후레쉬의 섬광 등 화면 변화에 따라 오검출이 생기는 단점이 있다. 제안하는 컷 검출 기법은 먼저 입력영상을 DCT의 DC를 이용하여 샷을 검출한다. 이렇게 검출된 샷으로 데이터베이스를 구성하고, MPEG-7의 시각 기술자 중 HMMD 컬러 모델과 에지 히스토그램을 사용하여 영상에서 특징을 추출하였다. 그리고 제안하는 매칭 기법에 따라 단계별 검색을 수행하였다. 이 실험을 통해서 기존 방법들보다 높은 검색률을 보이는 개선된 동영상 분할 시스템을 설계하였다.

다중 클래스 SVM과 주석 코드 배열을 이용한 의료 영상 자동 주석 생성 (Medical Image Automatic Annotation Using Multi-class SVM and Annotation Code Array)

  • 박기희;고병철;남재열
    • 정보처리학회논문지B
    • /
    • 제16B권4호
    • /
    • pp.281-288
    • /
    • 2009
  • 본 논문은 의료 영상 중 X-ray 영상에 대한 효과적인 분류와 자동 주석 생성을 위한 방법을 제안한다. X-ray 영상은 일반 자연 영상과는 다르게 영상 내에 중요한 의미를 가지고 있는 관심 영역과 어두운 단색의 배경으로 구성된 특징을 가지고 있음으로 본 논문에서는, 영상의 중요영역에서 해리스 코너 검출기를 이용한 색 구조 기술자(H-CSD)로 색 특징을 추출하고, 질감 특징을 위해 경계선 히스토그램 기술자(EHD)를 사용하였다. 추출된 두 개의 특징 벡터들은 각각 다중 클래스 Support Vector Machine에 적용되어 20개의 카테고리 중 하나로 영상을 분류한다. 마지막으로, 영상은 미리 정의된 카테고리들의 계층적인 관계와 우선 순위에 기반하여 주석 코드 배열(Annotation Code Array)을 부여 받고 이를 이용하여 다수의 최적 키워드를 얻으며 갖게 된다. 실험에서는 제안한 주석 생성방법을 관련 연구 방법과 비교하여 성능이 개선 되었음을 보여주고 있다.

최인접 거리 비율 정합을 이용한 영상 특징점 선택 방법 (Image Feature Point Selection Method Using Nearest Neighbor Distance Ratio Matching)

  • 이준우;정재협;강종욱;나상일;정동석
    • 전자공학회논문지
    • /
    • 제49권12호
    • /
    • pp.124-130
    • /
    • 2012
  • 본 논문에서는 현재 진행 중인 MPEG(Motion Picture Experts Group, ISO/IEC JTC1 SC29 WG11)의 표준화 작업 중 CDVS(Compact Descriptor for Visual Search)의 CE-7(Core Experiment)인 특징점 선택에 대한 방법을 제안한다. 서술자의 경량화를 위해서는 영상으로부터 추출된 많은 수의 특징점들 중에서 영상 정합에 사용될 중요한 특징점들을 선택해야 한다. 본 논문에서는 최 인접 거리 비율 정합(Nearest Neighbor distance ratio matching) 방법에 의해 영상 정합 단계에서 사용되지 않고 버려지는 특징점들을 미리 추출 단에서 제거하는 방법 제안하였다. 제안된 방법을 통하여 적은 비트 전송률을 요하는 시스템에서 특징점의 낭비를 피할 수 있고 결과적으로 추가적인 특징점을 사용할 수 있으므로 전체적인 성능 향상을 얻을 수 있었다. 제안된 알고리즘을 통하여 Pair-wise 정합 실험에서 기존의 Test Model 대비 최고 2.3%의 성공율(True positive rate)의 향상을 보였다.

컬러와 모양 정보를 이용한 캐릭터 이미지 검색 (Charactor Image Retrieval Using Color and Shape Information)

  • 이동호;유광석;김회율
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.50-60
    • /
    • 2000
  • 본 논문에서는 캐릭터 이미지 검색에 가장 적합한 컬러와 모양 정보를 표현하는 새로운 복합 특징량을 제안한다. 제안된 방법은 YCbCr 컬러 모델에서 얻어진 Y이미지에 대해서는 회전, 이동, 크기 변화에 불변한 Zernike 모멘트를 사용하여 모양 정보를 추출하고, Cb 및 Cr 이미지로부터 DCT계수를 사용하여 색상 정보를 추출하여 캐릭터 이미지를 검색한다. 이 방법은 인간의 시각적인 특성을 잘 표현하는 방법으로서 36개의 적은 특징량으로 높은 검색효율을 나타내기 때문에 대용량 데이터베이스와 같은 웹 검색과 애니메이션 검색에 적합한 방법이다. 캐릭터 이미지 3,834개를 대상으로 실험하였으며 MPEG-7 컬러/질감, 기술자들의 성능 평가에 사용된 ANMRR(Average of Normalized Modified Retrieval Rank)과 모션/모양 기술자들의 성능 평가에 사용된 BEP(Bull's Eye Performance)를 사용하여 캐릭터 이미지 검색에서 우수한 성능을 타나냄을 실험으로 확인하였다.

  • PDF

장면 전환 기법을 이용한 동영상 검색 시스템의 하드웨어 구현 (Hardware Implementation of Moving Picture Retrieval System Using Scene Change Technique)

  • 김장희;강대성
    • 대한전자공학회논문지SP
    • /
    • 제45권3호
    • /
    • pp.30-36
    • /
    • 2008
  • 멀티미디어 정보는 다매체, 다특징, 다표현, 대용량성의 특징과 함께 그 양 또한 급속도로 증가하고 있다. 따라서 급격히 늘어난 방대한 정보로부터 필요한 정보를 검색하는 검색 시스템이 요구되고 있으며, 이러한 색인 및 검색 시스템이 실시간으로 처리되는 것이 필요하다. 동영상의 내용 기반 검색을 위하여 가장 일반적으로 사용할 수 있는 정보는 영상정보이다. 영상정보는 주로 비디오를 장면 분할할 때에 사용되며 이를 통하여 구조적인 비디오 브라우징을 할 수 있다. 비디오를 샷으로 구분하는 작업을 비디오 분할(video segmentation)이라고 하며, 비디오 분할을 위해 장면의 전환점인 컷을 검출하는 작업을 컷 검출(cut detection)이라고 한다. 본 연구에서는 MPEG-7 시각 기술자인 HMMD 컬러 모델과 에지 히스토그램 기술자를 사용하여 동영상 분할을 하였다. HMMD 컬러 공간은 다른 공간에 비해 인간의 색 지각에 매우 밀접한 것으로 나타난다. 본 논문에서는 이러한 검색 시스템을 하드웨어로 구현하였다.