• 제목/요약/키워드: visual descriptor

검색결과 67건 처리시간 0.022초

칼라와 에지 정보를 이용한 내용기반 영상 검색 (Contents-based Image Retrieval Using Color & Edge Information)

  • 박동원;안성옥
    • 컴퓨터교육학회논문지
    • /
    • 제8권1호
    • /
    • pp.81-91
    • /
    • 2005
  • 본 논문에서는 칼라와 에지 정보를 이용한 내용기반 영상검색 기법을 제안하였다. 기존의 RGB 공간 정보를 이용하기 보다는, 시각적 인식에 보다 중점을 둔 HSI칼라 공간에서 고찰하였다. 비슷한 류의 색을 대표색으로 통합 표현하여, 개선된 칼라 정보 이용법을 본 연구에서 제안하였다. 또한 칼라 정보만을 이용했을 때의 시스템 성능상의 결점을 보완하기 위하여, 효율적인 에지 디텍션 기법을 함께 사용하였다. 칼라와 에지 기법을 통합함에 있어서, 각각의 기법에 적절한 가중치를 배분함으로써 시스템 성능을 실험적으로 향상시켰다.

  • PDF

영상기반 자동항법을 위한 실시간 위치인식 및 지도작성 (Real-time Simultaneous Localization and Mapping (SLAM) for Vision-based Autonomous Navigation)

  • 임현;임종우;김현진
    • 대한기계학회논문집A
    • /
    • 제39권5호
    • /
    • pp.483-489
    • /
    • 2015
  • 본 논문에서는 넓은 지역에서의 영상기반 자동 항법을 위한 실시간 위치인식 및 지도작성 방법을 제안한다. 한 대의 카메라에서 입력된 영상으로부터 제안된 방법은 6 자유도 카메라 자세와 3 차원 특징점 위치를 연속적으로 계산한다. 제안된 방법은 넓은 지역을 주행하며 촬영된 영상에 적용하여 그 위치와 환경지도를 성공적으로 작성하였이다. 본 논문에서는 이진기술자(binary descriptor)와 수치-위상(metric-topological)지도 표현법을 사용하여 GPU 나 영상의 축소 없이 실시간 성능과 광범위한 지역에서의 회귀점 검출(loop detection)을 하였다. 제안된 방법은 여러 환경에서 촬영된 영상과, 해당 영상의 GPS 기준값과 비교하여 평가하였다.

모바일 플랫폼에서 다중 특징 기반의 이미지 검색 (Image Retrieval using Multiple Features on Mobile Platform)

  • 이용환;조한진;이준환
    • 디지털융복합연구
    • /
    • 제12권6호
    • /
    • pp.237-243
    • /
    • 2014
  • 본 논문에서는 다양한 검색 환경과 모바일 디바이스의 센서 정보를 활용한 모바일 이미지 검색 방법을 제안하고 안드로이드 플랫폼에서 구동하는 검색 시스템을 구현하였다. 설계 개발 시스템은 JPEG 이미지를 대상으로 산업계 표준 메타데이터인 EXIF 속성과 시각적 특징을 결합한 새로운 검색 기술자이며, 검색을 위한 특징 추출 및 유사도 평가 알고리즘을 모바일 환경에 최적화한 이미지 검색 모듈이다. 실험을 통해, 대용량 이미지 데이터셋을 대상으로 안드로이드 폰에서 효율적인 이미지 검색을 수행하였음을 보였다.

Visual Servoing을 위한 3차원 물체의 인식 및 자세 추정 (Recognition and Pose Estimation of 3-D Objects for Visual Servoing)

  • 양재호;정문호;박민용
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2006년도 제37회 하계학술대회 논문집 D
    • /
    • pp.1931-1932
    • /
    • 2006
  • 로봇이 어떤 물체를 인지하고 그 물체에 대해 어떤 작업을 하고자 할 때 특정 물체의 인식 문제, 3차원 정보를 획득하는 문제, 자세를 추정하는 문제 등 해결해야 될 문제들이 있다. 물체를 인식하는 과정에서는 주위 배경과 물체의 크기의 변화, 회전, 가려짐 등으로 인해 물체 인식을 어렵게 만드는 요소들이 있다. 2차원 이미지를 통해 3차원 정보를 추출하는 과정은 일반적으로 두 대의 카메라를 이용하여 스테레오 이미지를 통해 얻는다. 이 때 좌우 영상간의 매칭의 과정이 필요하다. 자세 추정의 문제는 카메라 좌표와 물체의 좌표간의 관계를 알아야 한다. Visual Servoing을 어렵게 만드는 많은 요인들이 있으며 본 논문에서는 물체의 크기, 회전, 이동에 불변인 디스크립터(descriptor)를 사용하는 SIFT(Scale Invariant Feature Transform)를 통해 3차원 물체의 인식과 자세를 추정하는 방법을 제시한다. 또한 자세 추정을 위해 2차원 Keypoint들의 매칭을 3차원 정보를 통해 검증하는 방법을 제시한다. (SIFT에 의해 추출된 point를 Keypoint라 명한다.)

  • PDF

MPEG-7 시각 정보 기술자의 특성을 반영한 효율적인 멀티미디어 데이타 비트맵 인덱싱 방법 (An Efficient Bitmap Indexing Method for Multimedia Data Reflecting the Characteristics of MPEG-7 Visual Descriptors)

  • 정진국;낭종호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권1호
    • /
    • pp.9-20
    • /
    • 2005
  • 최근 멀티미디어 정보를 기술하기 위한 표준인 MPEG-7이 제안되어 이미지/동영상 검색 시스템과 간은 응용분야에서 사용되기 시작하였다. 그러나 MPEG-7 시각 정보 기술자들은 대부분 고차원으로 표현이 되고, 고차원에서 발생되는 문제인 "Curse of dimensionality" 때문에 기존의 인덱싱 방법(예를 들면 트리 구조를 이용하는 다차원 인덱싱 방법, 차원을 줄이는 방법, 양자화 등의 압축 기법을 이용하는 방법 등)으로는 효율적인 검색을 할 수 없다. 본 논문에서는 MPEG-7 시각 정보 기술자들의 특징을 반영한 효율적인 인덱싱 방법을 제안한다. 제안된 방법에서는 기술자를 속성 히스토그램으로 변형하고 히스토그램의 자 빈 값을 이진 형태로 표현하여 비트열을 생성하며, 이러한 비트열들을 이용하여 비트맵 인덱스를 구성한다. 질의 오브젝트가 입력되면 비트맵 인덱스를 이용하여 결과에 포함될 가능성이 있는 후보 오브젝트 리스트를 생성하게 되는데 즉, 각 오브젝트의 인덱스와 질의 오브젝트의 비트열에 대한 XOR(Exclusive OR) 연산을 수행하여서 후보 오브젝트 리스트를 생성한다. 그리고 이 리스트에 있는 오브젝트들에 대해서만 L1-norm과 같은, 기술자를 위해 사용되는 비교 연산식을 수행하여 최종 결과 오브젝트들을 사용자에게 보여주게 된다. 본 논문에서 제안하는 알고리즘은 단순한 비트 연산을 통해 검색 결과에 포함될 가능성이 있는 오브젝트들을 추출해낼 수 있기 때문에 빠른 시간 내에 검색을 마칠 수 있도록 해준다. 실험에 의하면 제안한 방법을 이용하는 경우, 90% 이상의 정확도를 유지하면서 검색 시간에서는 순차 검색에 비해 15배 이상의 속도 향상을 보임을 알 수 있었다.

객체의 모양과 색상특징을 이용한 내용기반 영상검색 기법 (A Content-Based Image Retrieval Technique Using the Shape and Color Features of Objects)

  • 박종현;박순영;오일환
    • 한국통신학회논문지
    • /
    • 제24권10B호
    • /
    • pp.1902-1911
    • /
    • 1999
  • 본 논문에서는 객체들의 공간적 특성이 반영된 시각적인 특징벡터를 이용한 내용기반 영상검색 알고리즘을 제안한다. 제안된 검색 기법은 여러 색상으로 이루어진 객체들을 표현하기 위하여 가우시안 혼성 모델을 적용하여 모델의 최대유사 파라미터는 EM 알고리즘을 사용하여 추정한다. GMM을 기반으로 하여 분할된 각 객체들로부터 Fourier descriptor의 색상 히스토그램을 사용하여 모양과 색상 특징을 추출하게 된다. 영상 검색은 두 단계로 구성되는데 첫 단계에서는 공간적인 모양 특성을 추출하여 모양이 유사한 객체들을 후보 영상으로 압축하게 되며 마지막으로 객체의 색상 히스토그램에 의하여 검색이 수행된다. 실험 결과 제안된 알고리즘은 분할된 객체의 공간적, 시각적 특징을 이용하여 효율적으로 검색을 수행할 수 있음을 보여준다.

  • PDF

Post-Processing for JPEG-Coded Image Deblocking via Sparse Representation and Adaptive Residual Threshold

  • Wang, Liping;Zhou, Xiao;Wang, Chengyou;Jiang, Baochen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권3호
    • /
    • pp.1700-1721
    • /
    • 2017
  • The problem of blocking artifacts is very common in block-based image and video compression, especially at very low bit rates. In this paper, we propose a post-processing method for JPEG-coded image deblocking via sparse representation and adaptive residual threshold. This method includes three steps. First, we obtain the dictionary by online dictionary learning and the compressed images. The dictionary is then modified by the histogram of oriented gradient (HOG) feature descriptor and K-means cluster. Second, an adaptive residual threshold for orthogonal matching pursuit (OMP) is proposed and used for sparse coding by combining blind image blocking assessment. At last, to take advantage of human visual system (HVS), the edge regions of the obtained deblocked image can be further modified by the edge regions of the compressed image. The experimental results show that our proposed method can keep the image more texture and edge information while reducing the image blocking artifacts.

치매노인의 통증사정에 대한 자가보고 도구의 타당도, 신뢰도 및 효율성 검증 (Validity, Reliability and Efficiency of Pain Self-report Scale in Elderly with Dementia)

  • 류언나;박경숙
    • 성인간호학회지
    • /
    • 제23권2호
    • /
    • pp.111-122
    • /
    • 2011
  • Purpose: The aim on this study was to establish the validity, reliability and efficiency of a Pain Self-Report Scale for elderly with dementia and compare these results with an observational pain rating scale. Methods: Study subjects were 136 elderly with dementia who were residents in a nursing home, geriatric hospital, or day care center. The subject's pain was measured by five self-report scales and observational scale. DS-DAT (discomfort scale-dementia of the Alzheimer's type) was used for pain behavior observational measure. Cognitive state was assessed using the MMSE (Mini-Mental State Examination). Results: Observational rating correlated moderately with self-report (r=.225~.585, p<.05) and tended to underestimate pain intensity. Test-retest reliability was high for all five self-report scales, and the correlation between these scales was very strong (r=.735~.856, p<.05). Comprehension rate of VDS (verbal descriptor scale) was 88.3%, and NRS (numeric rating scale) 69.9%, FPS (face pain scale) 66.9%, HVAS (horizontal visual analog scale) and VVAS (vertical visual analog scale) 65.4%. Conclusion: Nurses should not apply observational scales routinely in demented patients as many of these are capable of reporting their own pain. Self-report, the highest standard of pain measurement can be reliably performed in a large proportion of demented elderly.

차별적인 영상특징들에 적응 가능한 융합구조에 의한 도로상의 물체추적 (Traffic Object Tracking Based on an Adaptive Fusion Framework for Discriminative Attributes)

  • 김삼용;오세영
    • 전자공학회논문지SC
    • /
    • 제43권5호
    • /
    • pp.1-9
    • /
    • 2006
  • 대부분의 영상을 이용한 물체추적은 적용환경을 단순화하거나 특정한 영상특징만을 적용할 수 있는 제한된 환경에서 잘 동작하기 때문에 이러한 물체추적방법은 지능자동차의 운전자보조시스템이 적용되는 복잡하고 동적인 교통 환경에서 원하는 물체를 추적하기는 어렵다. 이와 같은 물체간의 부분적인 교합이 존재하고 배경과 물체들이 동시에 동적으로 변하는 복잡한 환경에서는 물체의 색상, 외관, 외형 등과 같은 다양한 영상특징들을 적절하게 융합할 수 있는 구조가 요구된다. 본 논문에서는 기존의 파티클 필터를 이용한 적응형 융합구조[1]와 SIFT[2]를 이용한 영상특징 기술자를 강인한 영상특징으로 사용하고 시점 배경의 동적인 변화에 적응할 수 있도록 학습함으로써 추적의 강건성과 적응성을 향상시킨다. 제안된 알고리듬은 운전자 보조 시스템에서의 차량, 보행자, 자전거와 같은 도로상의 물체추적에 적용하였다.

다채널 Gabor 필터와 Log-Polar 변환을 사용한 내용기반 영상 검색 (Multichannel Gabor Filler and Log-Polar Transform for Content-Based Image Retrieval)

  • 박현;문영식
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 하계종합학술대회 논문집(3)
    • /
    • pp.181-184
    • /
    • 2000
  • In this paper, we propose new features for describing texture images by using multi-channel Gabor filter and log-polar transform based on human visual system (HVS). Gabor features are extracted by the mean and standard deviation of energy in Gabor response, followed by Fourier series extension. Log-polar features are extracted by log-polar transform and projection. The proposed texture descriptor performs reasonably well with less number of features than other texture descriptors, which has been verified by experiments using some texture images of MPEG-7 data set.

  • PDF