• 제목/요약/키워드: Scene Component Analysis

검색결과 36건 처리시간 0.032초

축구 동영상에서의 장면 구조 분석에 기반한 자동적인 하이라이트 장면 검출 (Automatic Detection of Highlights in Soccer videos based on analysis of scene structure)

  • 박기태;문영식
    • 정보처리학회논문지B
    • /
    • 제14B권1호
    • /
    • pp.1-4
    • /
    • 2007
  • 본 논문에서는 축구 동영상으로부터 자동적으로 하이라이트 장면들을 검출하는 방법을 제안한다. 축구 동영상에서 하이라이트 장면들은 슈팅 장면들이나 골 장면들로 정의 될 수 있다. 우리는 축구 동영상에 대한 구조적 분석을 통해서 일반적으로 골 포스트(goal posts) 영역 주위에서 하이라이트 장면들이 나타나는 것과 하이라이트 장면 이후에는 TV 카메라가 축구 선수들이나 관중석을 확대해서 보여주는 것을 확인할 수 있었다. 본 논문에서 축구 동영상으로부터 하이라이트 장면들을 검출하기 위한 과정은 세 단계로 구성된다. 첫 번째 단계는 통계적인 문턱치(statistical threshold)를 이용한 그라운드(playing field) 영역을 추출한다. 두 번째 단계는 골 포스트를 찾기 위해서 그라운드 영역과 그라운드가 아닌 영역들의 경계선 부분을 검출한다. 그리고 마지막 단계에서는 축구 선수나 관객들의 확대 장면을 검출하기 위해서 그라운드가 아닌 영역들에 대해서 connected component labeling 기법을 적용하여 한 장면 내에서 그라운드가 아닌 영역들의 비율을 계산한다. 본 논문에서는 하이라이트 장면 검출에 대한 성능을 평가하기 위하여 정확률(precision)과 재현율(recall)을 사용하고, 실험을 통하여 제안된 방법이 정확률 95.2%, 재현율 854%로 축구 동영상에서 하이라이트 장면을 효과적으로 검출할 수 있음을 확인하였다.

컬러 영상의 조명성분 분석을 통한 문자인식 성능 향상 (Improved Text Recognition using Analysis of Illumination Component in Color Images)

  • 치미영;김계영;최형일
    • 한국컴퓨터정보학회논문지
    • /
    • 제12권3호
    • /
    • pp.131-136
    • /
    • 2007
  • 본 논문에서는 컬러영상에 존재하는 문자들을 효율적으로 추출하기 위한 새로운 접근 방법을 제안한다. 빛 또는 조명성분의 영향에 의해 획득된 영상 내에 존재하는 반사성분은 문자 또는 관심객체들의 경계가 모호해 지거나 관심객체와 배경이 서로 혼합 되었을 경우, 문자추출 및 인식을 함에 있어서 오류를 포함시킬 수 있다. 따라서 영상 내에 존재하는 반사성분을 제거하기 위해 먼저. 컬러영상으로부터 Red컬러 성분에 해당하는 히스토그램에서 두개의 pick점을 검출한다. 이후 검출된 두 개의 pick점들 간의 분포를 사용하여 노말 또는 편광 영상에 해당하는지를 판별한다. 노말 영상의 경우 부가적인 처리를 거치지 않고 문자에 해당하는 영역을 검출하며, 편광 영상에 해당하는 경우 반사성분을 제거하기 위해 호모모픽필터링 방법을 적용하여 반사성분에 해당하는 영역을 제거한다. 이후 문자영역을 검출하기 위해 최적전역임계화방식을 적용하여 전경과 배경을 분리하였으며 문자영역 추출 및 인식의 성능을 향상시켰다. 널리 사용되고 있는 문자 인식기를 사용하여 제안한 방식 적용 전과 후의 인식결과를 비교하였다. 편광영상에서 제안된 방법 적용 후, 문자인식을 한 경우 인식률이 향상되었다.

  • PDF

입술영역 분할을 위한 CIELuv 칼라 특징 분석 (Analysis of CIELuv Color feature for the Segmentation of the Lip Region)

  • 김정엽
    • 한국멀티미디어학회논문지
    • /
    • 제22권1호
    • /
    • pp.27-34
    • /
    • 2019
  • In this paper, a new type of lip feature is proposed as distance metric in CIELUV color system. The performance of the proposed feature was tested on face image database, Helen dataset from University of Illinois. The test processes consists of three steps. The first step is feature extraction and second step is principal component analysis for the optimal projection of a feature vector. The final step is Otsu's threshold for a two-class problem. The performance of the proposed feature was better than conventional features. Performance metrics for the evaluation are OverLap and Segmentation Error. Best performance for the proposed feature was OverLap of 65% and 59 % of segmentation error. Conventional methods shows 80~95% for OverLap and 5~15% of segmentation error usually. In conventional cases, the face database is well calibrated and adjusted with the same background and illumination for the scene. The Helen dataset used in this paper is not calibrated or adjusted at all. These images are gathered from internet and therefore, there are no calibration and adjustment.

독립성분해석을 이용한 Saliency map 모델 구현 (Implementation of saliency map model using independent component analysis)

  • 손준일;이민호;신장규
    • 센서학회지
    • /
    • 제10권5호
    • /
    • pp.286-291
    • /
    • 2001
  • 논문에서는 임의의 시각계에서 인간과 유사한 시각 응시점을 선택하기 위한 Saliency map 모델을 제안한다. 제안하는 모델은 영상의 에지 정보를 시각 응시점 결정을 위한 특징 기저로 이용한다. 자연 정지 흑백 영상에서 상호 독립적인 에지 성분들을 찾는데 가장 좋은 방법이라고 알려진 독립성분해석 방법을 이용한다. 인간 시각계에서 시각 수용체의 비균일 분포를 고려하기 위해 카메라와 같은 시각 센서로 받은 영상을 직접 이용하는 대신에 입력 영상으로 다중 해상도를 갖는 계층 영상을 이용한다. 컴퓨터를 이용한 시뮬레이션으로부터 제안한 Saliency map을 이용하여 주어진 임의의 이미지에 대한 시각 응시점을 구한다.

  • PDF

에지 및 국부적 최소/최대 변환을 이용한 자연 이미지로부터 텍스트 영역 검출 (Text Region Detection using Edge and Regional Minima/Maxima Transformation from Natural Scene Images)

  • 박종천;이근왕
    • 한국산학기술학회논문지
    • /
    • 제10권2호
    • /
    • pp.358-363
    • /
    • 2009
  • 자연이미지로부터 텍스트 영역 검출은 다양한 응용분야에 활용됨으로 이 분야의 많은 연구가 필요하다. 최근의 연구 방법은 에지 및 연결요소 기반 방법을 결합하는 다양한 알고리즘을 이용하여 텍스트 영역을 검출하고 있다. 그러므로 본 논문은 이러한 결합방법으로 에지 및 국부적 최소/최대 변환 방법을 이용하여 텍스트 영역을 검출하는 알고리즘을 제안한다. 명도 이미지로부터 에지 및 국부적 최소/최대 연결성분을 검출하고, 에지 및 국부적 최소/최대 연결성분을 레이블화한다. 레이블된 영역을 분석하여 텍스트 후보 영역을 검출하고, 검출된 각각의 텍스트 후보 영역을 결합하여 단일 텍스트 후보 이미지를 생성한다. 텍스트 후보 개별문자의 인접성 및 유사도를 비교하여 검증함으로서 최종적인 텍스트 영역을 검출한다. 실험결과 제안한 알고리즘은 에지 요소 및 국부적 최소/최대 연결요소 검출 방법을 결합하여 자연 이미지로부터 텍스트 영역 검출의 정확도 및 재현률을 향상할 수 있었다.

Separation of Single Channel Mixture Using Time-domain Basis Functions

  • Jang, Gil-Jin;Oh, Yung-Hwan
    • The Journal of the Acoustical Society of Korea
    • /
    • 제21권4E호
    • /
    • pp.146-155
    • /
    • 2002
  • We present a new technique for achieving source separation when given only a single charmel recording. The main idea is based on exploiting the inherent time structure of sound sources by learning a priori sets of time-domain basis functions that encode the sources in a statistically efficient manner. We derive a learning algorithm using a maximum likelihood approach given the observed single charmel data and sets of basis functions. For each time point we infer the source parameters and their contribution factors. This inference is possible due to the prior knowledge of the basis functions and the associated coefficient densities. A flexible model for density estimation allows accurate modeling of the observation, and our experimental results exhibit a high level of separation performance for simulated mixtures as well as real environment recordings employing mixtures of two different sources. We show separation results of two music signals as well as the separation of two voice signals.

Separation of Single Channel Mixture Using Time-domain Basis Functions

  • 장길진;오영환
    • 한국음향학회지
    • /
    • 제21권4호
    • /
    • pp.146-146
    • /
    • 2002
  • We present a new technique for achieving source separation when given only a single channel recording. The main idea is based on exploiting the inherent time structure of sound sources by learning a priori sets of time-domain basis functions that encode the sources in a statistically efficient manner. We derive a learning algorithm using a maximum likelihood approach given the observed single channel data and sets of basis functions. For each time point we infer the source parameters and their contribution factors. This inference is possible due to the prior knowledge of the basis functions and the associated coefficient densities. A flexible model for density estimation allows accurate modeling of the observation, and our experimental results exhibit a high level of separation performance for simulated mixtures as well as real environment recordings employing mixtures of two different sources. We show separation results of two music signals as well as the separation of two voice signals.

헤드램프의 시계성 평가를 위한 야간 도로 영상 재현 알고리즘 (An reproduction algorithm of nighttime road-image for visibility evaluation of headlamps)

  • 이철희;하영호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 추계종합학술대회 논문집(4)
    • /
    • pp.69-72
    • /
    • 2000
  • This study proposes a new calculation method for generating real nighttime lamp-lit images. In order to improve the color appearance in the prediction of a nighttime lamp-lighted scene, the lamp-lit image is synthesized based on spectral distribution using the estimated local spectral distribution of the headlamps and the surface reflectance of every object. The principal component analysis method is introduced to estimate the surface color of an object, and the local spectral distribution of the headlamps is calculated based on the illuminance data and spectral distribution of the illuminating headlamps. HID and halogen lamps are utilized to create beam patterns and captured road scenes are used as background images to simulate actual headlamp-lit images on a monitor. As a result, the reproduced images presented a color appearance that was very close to a real nighttime road image illuminated by single and multiple headlamps.

  • PDF

모바일 비디오기기 위에서의 중요한 객체탐색을 위한 문맥인식 특성벡터 선택 모델 (Context Aware Feature Selection Model for Salient Feature Detection from Mobile Video Devices)

  • 이재호;신현경
    • 인터넷정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.117-124
    • /
    • 2014
  • 모바일 기기를 사용한 실시간 비디오 영상처리분야의 중요 객체탐색 및 추적의 문제에 있어서 난제는 복잡한 배경속에서 전경을 구분해 내는 일이다. 본 논문에서는 기계학습을 위한 특성벡터 선정의 문제를 위한 문맥인식 모델을 제시하여 잡음제거를 위한 기계학습기반의 구분자를 구현하였다. 수학적으로 NP-hard로 알려진 가장 가까운 이웃을 사용한 문맥인식 특성벡터 선정 알고리즘의 구현에 있어서, 본 논문은 연산횟수를 줄인 유사방법론에 대해 자세히 거론하였다. 또한, 문맥인식 성격을 가미한 특성벡터 선정을 통해 얻어진 특성 공간에서의 향상된 분리성에 대해 주성분 분석을 통해 엄밀한 분석결과를 제시하였다. 전반적인 성능 향상의 정도를 계측하기 위해 다양한 기계학습 방법론, 예를 들어, 다층신경망, 지원벡터기계, 나이브베이지안, 회귀분석 등을 사용해 비교결과를 제시하였다. 본 논문에서 제시한 방법론의 성능과 계산상 자원사용에 대한 내용을 결론으로 서술하였다.

실감의 가상 걸음을 위한 발판타입 이동인터페이스의 네비게이션 알고리즘 (A Navigation Algorithm using a Locomotion Interface with Programmable Foot Platforms for Realistic Virtual Walking)

  • 윤정원;류제하
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제12권6호
    • /
    • pp.358-366
    • /
    • 2006
  • 본 논문은 2개의 6자유도 제어가능 발판타입 플랫폼으로 이뤄진 이동인터페이스를 이용한 새로운 네비게이션 알고리즘을 제시하고 있다. 제안된 이동인터페이스는 2개의 플랫폼 위에 사람이 위치한 상태에서 사람의 걸음 모션을 센서시스템으로 예측하여 플랫폼 위에서 지속적인 걸음이 가능하도록 플랫폼을 제어하고 사용자 걸음 모션 정보를 가상환경에서의 네비게이션 입력정보로 사용한다. 따라서, 제안된 이동인터페이스는 사용자의 실제 걸음을 유도하고 걸음 동안 사용자에게 실감의 시각 피드백 제공으로 몰입감을 가지고 가상환경과 전신 운동의 상호작용을 할 수 있도록 허락한다. 이때, 가상환경 상에서 자연스런 네비게이션이 가능하도록 보행 분석에 사용되는 걸음 조건들을 사용하여 플랫폼 위에서의 자연스런 걸음 및 가상환경시스템에서의 자연스런 네비게이션이 가능토록 알고리즘을 제시하였다. 제안된 네비게이션 알고리즘 평가를 위해 3차원 객체모델러, 화면 매니져, 통신 매니져로 구성된 가상도시를 구축하여 발판타입 이동인터페이스에 네비게이션 알고리즘을 적용하였다. 실험 결과 평지 및 경사에서 사용자의 자연스런 걸음 및 시각 피드백이 가능함을 알 수 있었고, 제안된 이동인터페이스 및 네비게이션 알고리즘을 통해 다양한 형상의 가상지면에서 실감의 네비게이션이 가능함을 확인하였다.