• 제목/요약/키워드: Segmentation model

검색결과 1,047건 처리시간 0.037초

실감형 컨텐츠를 위한 향상된 동작 인식 리모트 컨트롤러 (Improved Motion-Recognizing Remote Controller for Realistic Contents)

  • 박건혁;김상기;임성훈;한갑종;최승문;최승진;어홍준;조선영
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.396-401
    • /
    • 2009
  • 본 연구에서는 실감형 컨텐츠를 위한 리모트 컨트롤러의 하드웨어 및 소프트웨어적 개선점을 살펴본다. 보이스코일 모터와 진동 모터를 모두 사용한 진동 촉감 제공 방법을 제시하며, 마커의 크기 및 카메라 파라미터 최적화를 통한 위치 추적 시스템의 성능 향상을 살펴보고 효율적인 세그멘테이션 및 비전 데이터 추가를 통한 동작 인식의 개선점을 살펴본다. 또한, 제시된 컨트롤러의 실감형 컨텐츠에 대한 적용 가능성을 살펴본다.

  • PDF

Detection of Multiple Salient Objects by Categorizing Regional Features

  • Oh, Kang-Han;Kim, Soo-Hyung;Kim, Young-Chul;Lee, Yu-Ra
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권1호
    • /
    • pp.272-287
    • /
    • 2016
  • Recently, various and effective contrast based salient object detection models to focus on a single target have been proposed. However, there is a lack of research on detection of multiple objects, and also it is a more challenging task than single target process. In the multiple target problem, we are confronted by new difficulties caused by distinct difference between properties of objects. The characteristic of existing models depending on the global maximum distribution of data point would become a drawback for detection of multiple objects. In this paper, by analyzing limitations of the existing methods, we have devised three main processes to detect multiple salient objects. In the first stage, regional features are extracted from over-segmented regions. In the second stage, the regional features are categorized into homogeneous cluster using the mean-shift algorithm with the kernel function having various sizes. In the final stage, we compute saliency scores of the categorized regions using only spatial features without the contrast features, and then all scores are integrated for the final salient regions. In the experimental results, the scheme achieved superior detection accuracy for the SED2 and MSRA-ASD benchmarks with both a higher precision and better recall than state-of-the-art approaches. Especially, given multiple objects having different properties, our model significantly outperforms all existing models.

스테레오 영상을 이용한 헬멧의 자세 및 위치 추정 (Attitude and Position Estimation of a Helmet Using Stereo Vision)

  • 신옥식;허세종;박찬국
    • 한국항공우주학회지
    • /
    • 제38권7호
    • /
    • pp.693-701
    • /
    • 2010
  • 본 논문에서는 스테레오 카메라 시스템을 이용하여 헬멧의 자세 및 위치를 추정하는 알고리즘을 제안한다. 본 논문에서 구축한 시스템은 두 대의 CCD카메라와 헬멧 그리고 적외선 LED, 영상편집 보드로 구성된다. 이 중 15개의 적외선 LED는 헬멧에 서로 다른 길이로 삼각형 패턴으로 고정되어, 헬멧의 자세 및 위치를 결정하기 위한 특징점이 된다. 본 논문에서 제안한 알고리즘은 특징점 추출, 투영 재구성, 모델 인덱싱 과정으로 구성되며, 단위 쿼터니언(UQ, Unit Quaternion)을 이용하여 자세 및 위치를 추정한다. UQ를 이용하여 회전행렬를 구하면, 회전 행렬이 유니터리 행렬(Unitary Matrix)이 되는 것을 보장할 수 있다. 제안된 알고리즘은 시뮬레이션과 실제 실험 데이터를 이용하여 그 성능을 검증하였다.

Sparse 표현을 이용한 X선 흡수 영상 개선 (X-ray Absorptiometry Image Enhancement using Sparse Representation)

  • 김형일;엄원용;노용만
    • 한국멀티미디어학회논문지
    • /
    • 제15권10호
    • /
    • pp.1205-1211
    • /
    • 2012
  • 대사성 골 질환인 골다공증(Osteoporosis)의 조기 진단을 위해 X 선 영상에서 골 밀도를 측정하는 방법이 최근 연구되고 있다. 골 밀도는 X 선 영상에서 뼈가 분리되고, 분리된 영역에서의 픽셀에 의해 BMD가 측정되는데, 개선된 영상에서의 정밀한 뼈 추출이 주요한 요소이므로 X 선 영상의 개선은 골다공증의 조기 진단을 위해 필수적이다. 본 논문에서는 sparse 표현을 도입하여 다중(multiple) 잡음을 갖는 X 선 영상을 개선시키는 방법을 제안한다. 실험을 통해 제안한 방법의 결과가 기존의 방법인 웨이블릿 BayesShrink 잡음 제거 방법 및 일반적 sparse 표현 모델의 잡음 제거 방법의 결과에 비해 개선됨을 CNR(Contrast to Noise Ratio) 및 cut-view를 통해 확인하였다.

Real-Time 2D-to-3D Conversion for 3DTV using Time-Coherent Depth-Map Generation Method

  • Nam, Seung-Woo;Kim, Hye-Sun;Ban, Yun-Ji;Chien, Sung-Il
    • International Journal of Contents
    • /
    • 제10권3호
    • /
    • pp.9-16
    • /
    • 2014
  • Depth-image-based rendering is generally used in real-time 2D-to-3D conversion for 3DTV. However, inaccurate depth maps cause flickering issues between image frames in a video sequence, resulting in eye fatigue while viewing 3DTV. To resolve this flickering issue, we propose a new 2D-to-3D conversion scheme based on fast and robust depth-map generation from a 2D video sequence. The proposed depth-map generation algorithm divides an input video sequence into several cuts using a color histogram. The initial depth of each cut is assigned based on a hypothesized depth-gradient model. The initial depth map of the current frame is refined using color and motion information. Thereafter, the depth map of the next frame is updated using the difference image to reduce depth flickering. The experimental results confirm that the proposed scheme performs real-time 2D-to-3D conversions effectively and reduces human eye fatigue.

Kinect 디바이스에서 피부색과 깊이 정보를 융합한 여러 명의 얼굴 검출 알고리즘 (Face Detection Algorithm using Kinect-based Skin Color and Depth Information for Multiple Faces Detection)

  • 윤영지;진성일
    • 한국콘텐츠학회논문지
    • /
    • 제17권1호
    • /
    • pp.137-144
    • /
    • 2017
  • 얼굴 검출은 복잡한 배경 내에서 다양한 얼굴의 자세로 인해 여전히 어려운 문제에 직면하고 있다. 본 논문은 피부색과 깊이 정보를 기반으로 한 한명 또는 여러 명의 얼굴을 검출하는 효과적인 알고리즘을 제안한다. 먼저 우리는 컬러 영상에서 가우시안 혼합 모델을 이용한 피부색 검출 방법에 대해 소개한다. 그리고 Kinect V2의 깊이 센서를 이용하여 획득한 3차원의 깊이 정보는 배경으로부터 사람의 몸을 분할할 때 유용하다. 그리고 레이블링 과정에서 여러 개의 특징을 이용하여 얼굴이 아닌 영역은 성공적으로 제거된다. 실험 결과를 통해 제안한 얼굴 검출 알고리즘은 다양한 조건과 복잡한 배경에서 얼굴이 효과적으로 검출되는 것을 확인할 수 있다.

객체검출에서의 개선된 투영 그림자 제거 (An Improved Cast Shadow Removal in Object Detection)

  • 빈흐타한;정선태;김유성;김재민
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2009년도 춘계 종합학술대회 논문집
    • /
    • pp.889-894
    • /
    • 2009
  • Accompanied by the rapid development of Computer Vision, Visual surveillance has achieved great evolution with more and more complicated processing. However there are still many problems to be resolved for robust and reliable visual surveillance, and the cast shadow occurring in motion detection process is one of them. Shadow pixels are often misclassified as object pixels so that they cause errors in localization, segmentation, tracking and classification of objects. This paper proposes a novel cast shadow removal method. As opposed to previous conventional methods, which considers pixel properties like intensity properties, color distortion, HSV color system, and etc., the proposed method utilizes observations about edge patterns in the shadow region in the current frame and the corresponding region in the background scene, and applies Laplacian edge detector to the blob regions in the current frame and the background scene. Then, the product of the outcomes of application determines whether the blob pixels in the foreground mask comes from object blob regions or shadow regions. The proposed method is simple but turns out practically very effective for Gaussian Mixture Model, which is verified through experiments.

  • PDF

Extraction of User Preference for Video Stimuli Using EEG-Based User Responses

  • Moon, Jinyoung;Kim, Youngrae;Lee, Hyungjik;Bae, Changseok;Yoon, Wan Chul
    • ETRI Journal
    • /
    • 제35권6호
    • /
    • pp.1105-1114
    • /
    • 2013
  • Owing to the large number of video programs available, a method for accessing preferred videos efficiently through personalized video summaries and clips is needed. The automatic recognition of user states when viewing a video is essential for extracting meaningful video segments. Although there have been many studies on emotion recognition using various user responses, electroencephalogram (EEG)-based research on preference recognition of videos is at its very early stages. This paper proposes classification models based on linear and nonlinear classifiers using EEG features of band power (BP) values and asymmetry scores for four preference classes. As a result, the quadratic-discriminant-analysis-based model using BP features achieves a classification accuracy of 97.39% (${\pm}0.73%$), and the models based on the other nonlinear classifiers using the BP features achieve an accuracy of over 96%, which is superior to that of previous work only for binary preference classification. The result proves that the proposed approach is sufficient for employment in personalized video segmentation with high accuracy and classification power.

Physical Properties Analysis of Mango using Computer Vision

  • Yimyam, Panitnat;Chalidabhongse, Thanarat;Sirisomboon, Panmanas;Boonmung, Suwanee
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2005년도 ICCAS
    • /
    • pp.746-750
    • /
    • 2005
  • This paper describes image processing techniques that can detect, segment, and analyze the mango's physical properties such as size, shape, surface area, and color from images. First, images of mangoes taken by a digital camera are analyzed and segmented. The segmentation is done based on constructed hue model of the sample mangoes. Some morphological and filtering techniques are then applied to clean noises before fitting spline curve on the mango boundary. From the clean segmented image, the mango projected area can be computed. The shape of the mango is then analyzed using some structuring models. Color is also spatially analyzed and indexed in the database for future classification. To obtain the surface area, the mango is peeled. The scanned image of its peels is then segmented and filtered using similar approach. With calibration parameters, the surface area could then be computed. We employed the system to evaluate physical properties of a mango cultivar called "Nam Dokmai". There were sixty mango samples in three various sizes graded by an experienced farmer's eyes and hands. The results show the techniques could be a good alternative and more feasible method for grading mango comparing to human's manual grading.

  • PDF

IMT-2000용 광대역 단일 패치 마이크로스트립 안테나 (A Novel Broadband Single-Patch Microstrip Antenna for IMT-2000)

  • 유태훈;이승엽;박한규
    • 한국통신학회논문지
    • /
    • 제25권6A호
    • /
    • pp.833-838
    • /
    • 2000
  • 본 논문에서는 IMT-2000 시스템에 응용될 수 있는 새로운 구조의 광대역 단일 패치 안테나를 제안하였다. 이 안테나는 사각형 금속 패치의 두 방사 모서리에 역시 사각형의 스티브가 각각 연결되어 있는 작고 간결한 구조이면서도 IMT-2000에 할당된 주파수 대역을 포함하는 광대역 특성을 나타내었다. 세그멘테이션 방법과 공동 모델을 함께 사용하여 안테나의 특성을 이론적으로 해석하였고, 실험 결과를 통해 비교.분석하였다. 제안된 구조로 제작된 안테나의 대역폭은 정재파비(VSWR) 2.0 이하를 기준으로 할 때, 230 MHz(11.9%)로 측정되었으며, 스티브가 달려 있지 않은 사각형 패치 안테나(4.5%)에 비해 대역폭이 2.65배만큼 넓어졌음을 확인하였다.

  • PDF