• Title/Summary/Keyword: Visual Feature Extraction

검색결과 141건 처리시간 0.026초

시각 특징과 퍼지 적분을 이용한 내용기반 영상 검색 (Content-Based Image Retrieval Using Visual Features and Fuzzy Integral)

  • 송영준;김남;김미혜;김동우
    • 한국콘텐츠학회논문지
    • /
    • 제6권5호
    • /
    • pp.20-28
    • /
    • 2006
  • 본 논문은 공간주파수 특징들과 다중 해상도 특징들을 가진 웨이블렛 영역에서 추출된 각 대역의 시각 특징 추출과 이들의 퍼지 적분 조합에 대하여 제안하였다. 칼라 양자화 이후에 똑같은 칼라의 빈도를 취함으로써 기존의 칼라 히스토그램 인터섹션 방법의 단점인 양자화 에러를 줄일 수 있게 칼라 특징을 표현한다. 또한 유사도는 서로 독립적인 특성을 갖는 호모그램, 칼라, 에너지 특징을 퍼지 측도와 퍼지 적분을 사용하여 조합한다. 1,000개의 칼라 영상에 대하여 실험을 하였고, 제안된 방법이 기존 방법들보다 객관적이고 주관적인 성능에서 우수함을 보였다.

  • PDF

A Novel Two-Stage Training Method for Unbiased Scene Graph Generation via Distribution Alignment

  • Dongdong Jia;Meili Zhou;Wei WEI;Dong Wang;Zongwen Bai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제17권12호
    • /
    • pp.3383-3397
    • /
    • 2023
  • Scene graphs serve as semantic abstractions of images and play a crucial role in enhancing visual comprehension and reasoning. However, the performance of Scene Graph Generation is often compromised when working with biased data in real-world situations. While many existing systems focus on a single stage of learning for both feature extraction and classification, some employ Class-Balancing strategies, such as Re-weighting, Data Resampling, and Transfer Learning from head to tail. In this paper, we propose a novel approach that decouples the feature extraction and classification phases of the scene graph generation process. For feature extraction, we leverage a transformer-based architecture and design an adaptive calibration function specifically for predicate classification. This function enables us to dynamically adjust the classification scores for each predicate category. Additionally, we introduce a Distribution Alignment technique that effectively balances the class distribution after the feature extraction phase reaches a stable state, thereby facilitating the retraining of the classification head. Importantly, our Distribution Alignment strategy is model-independent and does not require additional supervision, making it applicable to a wide range of SGG models. Using the scene graph diagnostic toolkit on Visual Genome and several popular models, we achieved significant improvements over the previous state-of-the-art methods with our model. Compared to the TDE model, our model improved mR@100 by 70.5% for PredCls, by 84.0% for SGCls, and by 97.6% for SGDet tasks.

웨이브릿 계수의 퍼지 동질성과 고주파 에너지를 이용한 영상 검색용 특징벡터 추출 (Visual Feature Extraction for Image Retrieval using Wavelet Coefficient’s Fuzzy Homogeneity and High Frequency Energy)

  • 박원배;류은주;송영준
    • 한국콘텐츠학회논문지
    • /
    • 제4권1호
    • /
    • pp.18-23
    • /
    • 2004
  • 본 논문에서는 공간주파수 특성과 다중 해상도 특성을 모두 갖는 웨이브릿 변환을 이용하여 각 대역의 특성에 맞는 비주얼 특징을 추출하고 이를 내용기반 영상 검색에 이용하는 새로운 방법을 제시하였다. 웨이브릿 변환된 영상의 최저주파 대역은 원 영상의 근사한 형태로 공간 정보를 충분히 활용할 수 있다. 이를 위해 웨이브릿 계수값과 각 계수간의 공간 정보를 모두 고려한 퍼지 동질성(FH : Fuzzy Homogeneity)를 이용하여 L개의 특징 벡터를 추출하였고, 나머지 고주파 대역의 에너지 값을 이용하여 3개의 특징 벡터를 추출하여 이를 영상 데이터베이스에 저장한다. 질의 시에는 L개의 FH 벡터 중 가장 크기가 큰 10개의 값과 3개의 고주파 대역의 에너지 값을 이용하여 가장 유사한 영상을 검색하였다. 90개의 텍스쳐 영상을 사용해 실험한 결과 좋은 정확성을 보였다.

  • PDF

Novel Intent based Dimension Reduction and Visual Features Semi-Supervised Learning for Automatic Visual Media Retrieval

  • kunisetti, Subramanyam;Ravichandran, Suban
    • International Journal of Computer Science & Network Security
    • /
    • 제22권6호
    • /
    • pp.230-240
    • /
    • 2022
  • Sharing of online videos via internet is an emerging and important concept in different types of applications like surveillance and video mobile search in different web related applications. So there is need to manage personalized web video retrieval system necessary to explore relevant videos and it helps to peoples who are searching for efficient video relates to specific big data content. To evaluate this process, attributes/features with reduction of dimensionality are computed from videos to explore discriminative aspects of scene in video based on shape, histogram, and texture, annotation of object, co-ordination, color and contour data. Dimensionality reduction is mainly depends on extraction of feature and selection of feature in multi labeled data retrieval from multimedia related data. Many of the researchers are implemented different techniques/approaches to reduce dimensionality based on visual features of video data. But all the techniques have disadvantages and advantages in reduction of dimensionality with advanced features in video retrieval. In this research, we present a Novel Intent based Dimension Reduction Semi-Supervised Learning Approach (NIDRSLA) that examine the reduction of dimensionality with explore exact and fast video retrieval based on different visual features. For dimensionality reduction, NIDRSLA learns the matrix of projection by increasing the dependence between enlarged data and projected space features. Proposed approach also addressed the aforementioned issue (i.e. Segmentation of video with frame selection using low level features and high level features) with efficient object annotation for video representation. Experiments performed on synthetic data set, it demonstrate the efficiency of proposed approach with traditional state-of-the-art video retrieval methodologies.

YCbCr 농도 대비를 이용한 입술특징 추출 (Lip Feature Extraction using Contrast of YCbCr)

  • 김우성;민경원;고한석
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.259-260
    • /
    • 2006
  • Since audio speech recognition is affected by noise in real environment, visual speech recognition is used to support speech recognition. For the visual speech recognition, this paper suggests the extraction of lip-feature using two types of image segmentation and reduced ASM. Input images are transformed to YCbCr based images and lips are segmented using the contrast of Y/Cb/Cr between lip and face. Subsequently, lip-shape model trained by PCA is placed on segmented lip region and then lip features are extracted using ASM.

  • PDF

바이모달 음성인식기의 시각 특징 추출을 위한 색상 분석자 SVM을 이용한 입술 위치 검출 (Lip Detection using Color Distribution and Support Vector Machine for Visual Feature Extraction of Bimodal Speech Recognition System)

  • 정지년;양현승
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권4호
    • /
    • pp.403-410
    • /
    • 2004
  • 바이모달 음성인식기는 잡음 환경하 음성인식 성능을 향상하기 위해 고안되었다. 바이모달 음 성인식기에 있어 영상을 통한 시각 특징 추출은 매우 중요한 역할을 하며 이를 위한 입술 위치 검출은 시각 특징 추출을 위한 중요한 선결 과제이다 본 논문은 색상분포와 SVM을 이용하여 시각 특징 추출을 위한 입술 위치 검출 방법을 제안하였다. 제안된 방법은 얼굴색/입술 색상 분포를 학습하여 이로부터 입술의 초기 위치를 빠르게 찾아내고 SVM을 이용하여 입술의 정확한 위치를 찾음으로써 정확하고 빠르게 입술의 위치를 찾도록 하였으며 실험을 통해 바이모달 인식기에 적용하기에 적합함을 알 수 있었다.

Framework for Content-Based Image Identification with Standardized Multiview Features

  • Das, Rik;Thepade, Sudeep;Ghosh, Saurav
    • ETRI Journal
    • /
    • 제38권1호
    • /
    • pp.174-184
    • /
    • 2016
  • Information identification with image data by means of low-level visual features has evolved as a challenging research domain. Conventional text-based mapping of image data has been gradually replaced by content-based techniques of image identification. Feature extraction from image content plays a crucial role in facilitating content-based detection processes. In this paper, the authors have proposed four different techniques for multiview feature extraction from images. The efficiency of extracted feature vectors for content-based image classification and retrieval is evaluated by means of fusion-based and data standardization-based techniques. It is observed that the latter surpasses the former. The proposed methods outclass state-of-the-art techniques for content-based image identification and show an average increase in precision of 17.71% and 22.78% for classification and retrieval, respectively. Three public datasets - Wang; Oliva and Torralba (OT-Scene); and Corel - are used for verification purposes. The research findings are statistically validated by conducting a paired t-test.

사상채질 분류를 위한 안면부내 특징 요소 추출 (Facial Features Extraction for Sasang Constitution Classification)

  • 배나영;안택원;조동욱;이화섭
    • 사상체질의학회지
    • /
    • 제17권2호
    • /
    • pp.46-51
    • /
    • 2005
  • 1. Objectives The purpose of this study is to objectify the diagnosis of Sasang Constitution. Using the methods of this study, it will improve to classificate Sasang Constitution. 2. Methods 1) Automatic feature extraction of human frontal faces for Sasang Constitution classification. 2) Color feature extraction of human frontal faces (1)Erosion filtering (skin-white, the other-black) (2) Median median 3. Results and Conclusions Observing a person's shape has been the major method for Sasang Constitution classification, which usually has been dependent upon doctor's intuition as of these days. We are developing an automatic system which provides objective basic data for Sasang Constitution classification. For this, in this paper, firstly, the signal processing techniques are applied to automatic feature extraction of human frontal faces for Sasang Constitution classification. The experiment is conducted to verify the effectiveness of the proposed system.

  • PDF

회전무관 3D Star Skeleton 특징 추출 (Rotation Invariant 3D Star Skeleton Feature Extraction)

  • 전성국;홍광진;정기철
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제36권10호
    • /
    • pp.836-850
    • /
    • 2009
  • 포즈인식은 최근에 유비쿼터스 환경, 행위 예술, 로봇 제어 등에서 그 필요성이 증가되고 있는 분야로써, 컴퓨터비전, 패턴인식 등에서 활발히 연구되고 있다. 하지만 기존의 포즈인식 연구들은 사람의 회전이나 이동에 따라서 불안정한 인식률을 보인다는 단점을 갖고 있다. 이는 포즈 인식을 위해 추출한 특징이 사람의 회전, 이동 등의 다양한 변수에 영향을 크게 받기 때문이다. 이를 극복하기 위하여 본 논문에서는, 다 시점(multi-view) 환경에서의 3D Star Skeleton과 주성분 분석(principal component analysis: PCA)에 기반한 사람의 회전에 강건한 특징 추출을 제안한다. 제안된 시스템은 포즈의 특징 추출을 위해 다 시점 환경 기반의 visual hull을 생성하는 과정에서 획득 가능한 깊이 정보를 표현하는 8개의 projection map을 입력데이터로 사용한다. 이를 통해 포즈의 3D 정보를 반영하는 3D Star Skeleton을 구성하고 주성분 분석 기반의 회전에 강건한 특징을 추출한다. 실험결과에서는 다양하게 회전된 사람으로부터 생성된 3D Star Skeleton에서 특징을 추출하고 다양한 인식기를 통해 포즈인식을 해보았으며, 제안된 특징 추출 방법이 사람의 회전에 강건함을 알 수 있었다.

이동로봇의 불확실성을 고려한 안정한 시각 랜드마크의 자동 추출 (Automatic Extraction of Stable Visual Landmarks for a Mobile Robot under Uncertainty)

  • 문인혁
    • 제어로봇시스템학회논문지
    • /
    • 제7권9호
    • /
    • pp.758-765
    • /
    • 2001
  • 본 논문에서는 랜드마트 정보 없이 장해물의 위치 정도 지도만 주어졌을 때 스테레오 시작(stereo vision)을 가진 이동로봇이 관측위치와 조명의 변화에도 강인한 시각 특징을 랜드마크로써 추출하는 수법을 제안한다. 장해물의편평한 면사에서 보다 안쪽영역에 존재하는 특징이 관측위치의 변화에 영향을 덜 받기 때문에 안쪽 영역에 존재하는 수직선 세그먼트(vertical line segment) 특징을 랜드마크로 선택한다. 그러나 선택된 특징에서는 로봇의 이동과 관측이 오차에 의해 불확실성(uncertainty)이 포함되어 있기 때문에 추정해야만 한다. 이를 위해 영역기반 스테레오 정합과 특징기반 스테레오 정합법을 이용하여 정합된 특징을 선택하고 확장 칼만필터(Extended Kalman Filter)를 이용여 선택된 특징의 위치, 길이를 추정하여 랜드마크로써 등록한다. 실내 이동환경에서의 실험을 통해 제안된 수법의 유용성을 보인다.

  • PDF