• 제목/요약/키워드: visual descriptor

검색결과 67건 처리시간 0.025초

사용자 선호도와 시각적 기술자를 이용한 사용자 프로파일 기반 이미지 추천 알고리즘 (Image recommendation algorithm based on profile using user preference and visual descriptor)

  • 김덕환;양준식;조원희
    • 정보처리학회논문지D
    • /
    • 제15D권4호
    • /
    • pp.463-474
    • /
    • 2008
  • 정보 기술과 인터넷의 발전은 멀티미디어 컨텐츠의 양에 있어서 폭발적인 성장을 가져 왔으며 이러한 멀티미디어 컨텐츠 양의 증가는 이용자의 요구에 맞는 멀티미디어 컨텐츠 추천에 대한 필요성을 더 증가 시켰다. 현재까지 일반상품과 멀티미디어 컨텐츠 추천을 위한 기법에는 협업필터링 (CF: Collaborative Filtering)이 있다. 하지만 기존의 CF 기법은 이미지가 갖고 있는 시각적 특징을 제대로 표현하지 못하고 있으며, 입력 데이터의 희박성 (Sparsity) 문제와 신상품 추천 문제 그리고 선호도의 동적인 변화 문제를 포함하고 있기 때문에 이미지 컨텐츠 추천에는 적합하지 않다. 이와 같은 기존의 CF기법의 단점을 해결하기 위해서 본 논문에서는 새로운 이미지 추천 방법으로 FBCF (Feature Based Collaborative Filtering) 기법을 제안한다. FBCF 기법은 시각적 특징을 선호도에 따라 군집화한 새로운 사용자 프로파일 구성방법을 제시하며, 선호도 피드백을 통하여 구매자의 현재 성향을 추천에 반영할 수 있다. 실제 모바일 이미지 데이터를 사용한 실험에서 FBCF 기법이 기존의 CF 기법보다 400% 향상된 성능을 보임을 확인할 수 있다.

디테일 디스크립터를 이용한 이미지 영역 분석과 개선에 관한 연구 (A study on image region analysis and image enhancement using detail descriptor)

  • 임재성;정영탁;이지혁
    • 한국산학기술학회논문지
    • /
    • 제18권6호
    • /
    • pp.728-735
    • /
    • 2017
  • 디지털 디바이스가 범용적으로 보급되면서, 영상을 획득하는 과정에서 다량의 부가적 백색 잡음 노이즈(additive white Gaussian noise, AWGN)가 발생하고 있다. 대부분 알려져 있는 대표적인 디노이징 기법들은 노이즈를 제거하는 것에 초점을 맞추고 있어, 영상정보를 포함하는 디테일 성분들이 노이즈를 제거가 되는 과정에서 비례적으로 없어지게 된다. 그러므로, 제안하는 알고리즘은 영상 디테일을 보존하면서 효과적으로 노이즈를 제거하는 방법을 제시하고자 한다. 제안하는 방법에서는, 노이즈의 랜덤성을 이용하여 엣지 강도 및 엣지 연결성을 이용하여 의미 있는 디테일 성분을 분리하는 것을 목적으로 한다. 결과적으로, 노이즈 수준이 높아져도, 제안하는 방법은 연결된 디테일성분을 효과적으로 추출하기 때문에 타 벤치마크 방법에 비해 나은 디노이징 결과를 보여준다. 또한, 실험결과에서 보듯이, 제안하는 방법은 다양한 노이즈 수준에서도 타 벤치마크 방법들에 비교하여 제안하는 방법은 SSIM(structural similarity index), PSNR(peak signal-to-noise ratio)측면에서 각각 우수한 수치를 보여주었다. 높은 수치의 SSIM의 결과로 알 수 있듯이, 결과 영상들이 인간의 시각인지체계(human visual system, HVS)를 반영하고 있는 것을 확증해 주고 있다.

비-파라미터 기반의 움직임 분류를 통한 비디오 검색 기법 (Video retrieval method using non-parametric based motion classification)

  • 김낙우;최종수
    • 대한전자공학회논문지SP
    • /
    • 제43권2호
    • /
    • pp.1-11
    • /
    • 2006
  • 본 논문에서는 샷(shot) 기반 비디오 색인 구조에서 비-파라미터(non-parametric) 기반의 움직임 분류를 통한 비디오 영상 검색 기법을 제안한다. 본 논문에서 제안하는 비디오 검색 시스템은 장면 전환 기법을 통해 얻은 샷 단위의 짧은 비디오로부터 대표 프레임과 움직임 정보를 취득한 후, 이를 통해 시각적 특징과 움직임 특징을 추출하여 유사도를 비교함으로써 시-공간적 특징을 이용한 실시간 검색이 가능하도록 구현되었다. 비-파라미터 기반의 움직임 특징의 추출은 MPEG 압축 스트림으로부터 정규화된 움직임 벡터계(界)를 추출한 후, 각각의 정규화된 움직임 벡터를 여러 개의 각도 빈(bin)으로 양자화하고 이의 평균과 분산, 방향 등을 고려함으로써 효과적으로 이루어진다. 대표 프레임에서의 시각 특징 검출을 위해서는 에지 기반의 공간 기술자를 이용하였다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 시스템이 매우 효과적임을 잘 나타내고 있다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용한다.

모바일 시각 검색 시스템의 성능 향상을 위하여 개선된 Speeded Up Robust Features(SURF) 알고리듬 (Modified Speeded Up Robust Features(SURF) for Performance Enhancement of Mobile Visual Search System)

  • 서정진;윤경로
    • 방송공학회논문지
    • /
    • 제17권2호
    • /
    • pp.388-399
    • /
    • 2012
  • 본 논문에서는 지역 특징 추출 방법 중 하나인 SURF를 개선시켜 모바일 환경에 적합한 특징 추출 및 정합 방법에 대하여 기술한다. 모바일 환경에서 최적의 성능을 내기 위해 크게 세 가지 방법을 제안한다. 첫 번째는 SURF 기술자의 차원을 축소시키는 방법이다. 기존의 64차원과 여러 차원의 기술자들의 성능을 비교 분석한다. 두 번째로 고속 헤시안 검출기에서 헤시안 행렬의 대각합을 통해 계산되는 라플라시안 부호를 사용하여 정합 성능을 높인다. 즉, 부호가 같으면 같은 특성의 특징점으로 여겨 정합하고 그렇지 않으면 정합하지 않는다. 세 번째는 특징점간의 거리 측정 시 사용하는 거리 비율을 실험하고, 실험을 통해 얻어진 거리 비율을 사용하여 정합의 성능을 높였다. 마지막으로, 기존의 시스템과 제안한 시스템의 성능을 비교하여 제안한 시스템의 성능 향상을 검증하고, 제안한 시스템이 비교적 정합률의 성능 저하 없이 응답속도를 크게 개선함을 보였다.

Pain measurement in oral and maxillofacial surgery

  • Sirintawat, Nattapong;Sawang, Kamonpun;Chaiyasamut, Teeranut;Wongsirichat, Natthamet
    • Journal of Dental Anesthesia and Pain Medicine
    • /
    • 제17권4호
    • /
    • pp.253-263
    • /
    • 2017
  • Regardless of whether it is acute or chronic, the assessment of pain should be simple and practical. Since the intensity of pain is thought to be one of the primary factors that determine its effect on a human's overall function and sense, there are many scales to assess pain. The aim of the current article was to review pain intensity scales that are commonly used in dental and oral and maxillofacial surgery (OMFS). Previous studies demonstrated that multidimensional scales, such as the McGill Pain Questionnaire, Short form of the McGill Pain Questionnaire, and Wisconsin Brief Pain Questionnaire were suitable for assessing chronic pain, while unidimensional scales, like the Visual Analogue Scales (VAS), Verbal descriptor scale, Verbal rating scale, Numerical rating Scale, Faces Pain Scale, Wong-Baker Faces Pain Rating Scale (WBS), and Full Cup Test, were used to evaluate acute pain. The WBS is widely used to assess pain in children and elderly because other scales are often difficult to understand, which could consequently lead to an overestimation of the pain intensity. In dental or OMFS research, the use of the VAS is more common because it is more reliable, valid, sensitive, and appropriate. However, some researchers use NRS to evaluate OMFS pain in adults because this scale is easier to use than VAS and yields relatively similar pain scores. This review only assessed pain scales used for post-operative OMFS or dental pain.

Content Based Dynamic Texture Analysis and Synthesis Based on SPIHT with GPU

  • Ghadekar, Premanand P.;Chopade, Nilkanth B.
    • Journal of Information Processing Systems
    • /
    • 제12권1호
    • /
    • pp.46-56
    • /
    • 2016
  • Dynamic textures are videos that exhibit a stationary property with respect to time (i.e., they have patterns that repeat themselves over a large number of frames). These patterns can easily be tracked by a linear dynamic system. In this paper, a model that identifies the underlying linear dynamic system using wavelet coefficients, rather than a raw sequence, is proposed. Content based threshold filtering based on Set Partitioning in a Hierarchical Tree (SPIHT) helps to get another representation of the same frames that only have low frequency components. The main idea of this paper is to apply SPIHT based threshold filtering on different bands of wavelet transform so as to have more significant information in fewer parameters for singular value decomposition (SVD). In this case, more flexibility is given for the component selection, as SVD is independently applied to the different bands of frames of a dynamic texture. To minimize the time complexity, the proposed model is implemented on a graphics processing unit (GPU). Test results show that the proposed dynamic system, along with a discrete wavelet and SPIHT, achieve a highly compact model with better visual quality, than the available LDS, Fourier descriptor model, and higher-order SVD (HOSVD).

A Real-time Pedestrian Detection based on AGMM and HOG for Embedded Surveillance

  • Nguyen, Thanh Binh;Nguyen, Van Tuan;Chung, Sun-Tae
    • 한국멀티미디어학회논문지
    • /
    • 제18권11호
    • /
    • pp.1289-1301
    • /
    • 2015
  • Pedestrian detection (PD) is an essential task in various applications and sliding window-based methods utilizing HOG (Histogram of Oriented Gradients) or HOG-like descriptors have been shown to be very effective for accurate PD. However, due to exhaustive search across images, PD methods based on sliding window usually require heavy computational time. In this paper, we propose a real-time PD method for embedded visual surveillance with fixed backgrounds. The proposed PD method employs HOG descriptors as many PD methods does, but utilizes selective search so that it can save processing time significantly. The proposed selective search is guided by restricting searching to candidate regions extracted from Adaptive Gaussian Mixture Model (AGMM)-based background subtraction technique. Moreover, approximate computation of HOG descriptor and implementation in fixed-point arithmetic mode contributes to reduction of processing time further. Possible accuracy degradation due to approximate computation is compensated by applying an appropriate one among three offline trained SVM classifiers according to sizes of candidate regions. The experimental results show that the proposed PD method significantly improves processing speed without noticeable accuracy degradation compared to the original HOG-based PD and HOG with cascade SVM so that it is a suitable real-time PD implementation for embedded surveillance systems.

A Study on Feasibility of Dual-Channel 3DTV Service via ATSC-M/H

  • Kim, Byung-Yeon;Bang, Min-Suk;Kim, Sung-Hoon;Choi, Jin-Soo;Kim, Jin-Woong;Kang, Dong-Wook;Jung, Kyeong-Hoon
    • ETRI Journal
    • /
    • 제34권1호
    • /
    • pp.17-23
    • /
    • 2012
  • This paper analyzes the feasibility of a new 3DTV broadcasting service scenario via Advanced Television Systems Committee Mobile/Handheld (ATSC-M/H). We suggest a dual-channel system in which a left-view image is encoded by MPEG-2 with HD quality and a small-sized right-view image is encoded by AVC. Also, the left view is transmitted through ATSC main channel and the right view is transmitted through ATSC-M/H channel. Although the transport stream formats of two channels are different from each other, we demonstrate that it is possible for the ATSC 2.0 decoder to synchronize the display of the left and right views when both encoders use a common wall clock and time stamp. We also propose a program specific information descriptor which guarantees full compatibility with the conventional 2D HDTV and emerging mobile TV services. Finally, we provide the results of subjective visual quality assessment of the proposed system in support of its 3DTV service quality.

Novel Method for Face Recognition using Laplacian of Gaussian Mask with Local Contour Pattern

  • Jeon, Tae-jun;Jang, Kyeong-uk;Lee, Seung-ho
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권11호
    • /
    • pp.5605-5623
    • /
    • 2016
  • We propose a face recognition method that utilizes the LCP face descriptor. The proposed method applies a LoG mask to extract a face contour response, and employs the LCP algorithm to produce a binary pattern representation that ensures high recognition performance even under the changes in illumination, noise, and aging. The proposed LCP algorithm produces excellent noise reduction and efficiency in removing unnecessary information from the face by extracting a face contour response using the LoG mask, whose behavior is similar to the human eye. Majority of reported algorithms search for face contour response information. On the other hand, our proposed LCP algorithm produces results expressing major facial information by applying the threshold to the search area with only 8 bits. However, the LCP algorithm produces results that express major facial information with only 8-bits by applying a threshold value to the search area. Therefore, compared to previous approaches, the LCP algorithm maintains a consistent accuracy under varying circumstances, and produces a high face recognition rate with a relatively small feature vector. The test results indicate that the LCP algorithm produces a higher facial recognition rate than the rate of human visual's recognition capability, and outperforms the existing methods.

MPEG-4 컨텐츠 저작 시스템 설계 및 개발 (The Design and Development of MPEG-4 Contents Authoring System)

  • 차경애;김희선;김상욱
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권4호
    • /
    • pp.309-316
    • /
    • 2001
  • MPEG-4 컨텐츠는 다양한 시청각 객체들로 구성되고, 사용자 상호작용에 대한 정의를 포함하여 동적인 씬 구성과 변화를 가능하게 한다. 또한 시청각 씬을 컨텐츠 단위로 표현하기 위해서 씬을 기술하는 디스크립션을 가진다. 이것은 씬을 구성하는 각 멀티미디어 객체들의 시공간적인 위치와 그들 사이의 관계를 표현하는 기술 언어이다. 본 논문에서는 멀티미디어 씬의 시공간적 관계를 시각적으로 저작할 수 있는 환경을 제공하고 이를 MPEG-4 씬 디스크립션, 객체 디스크립터 등의 스트리밍 MPEG-4 컨텐츠로 자동 생성하는 MPEG-4 컨텐츠 저작 시스템을 제안하고 그 개발 결과를 보인다.

  • PDF