• 제목/요약/키워드: 구간 히스토그램

검색결과 72건 처리시간 0.023초

웨이블렛 변환을 적용한 장면전환의 cut과 fade검출 (Cut and Fade Detection of Scene Change Using Wavelet transform)

  • 이명은;박종현;박순영;방만원;조완현
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.207-210
    • /
    • 2000
  • 본 논문에서는 신호를 해석하는데 유용한 웨이블렛 변환을 적용하여 장면전환 요소 중 cut과 fade를 검출하는 알고리즘을 제안한다. 제안된 방법은 웨이블렛 저대역 부밴드로부터 각 프레임의 히스토그램을 구한 후 이전 프레임과 현재 프레임사이의 히스토그램 차를 구하여 이 값이 임계값 이상이면 급격한 장면전환(abrut shot transition)인 cut으로 분류한다. 다음으로 페이드인(fade in)이나 페이드 아웃(fade out)등 컷의 지점이 불분명한 점진적 장면전환(gradual scene transition)을 검출하기 위하여 고대역 부밴드에서 추출한 에지성분에 모멘트를 계산하여 인접한 프레임 사이의 변동율을 분석하여 값이 증가하면 페이드 인을 검출하고 반면에 감소하면 페이드 아웃을 검출하게된다. 성능평가를 위하여 실제의 비디오 분할에 적용한 결과 웨이블렛 적용 방법론이 매우 높은 Precision을 갖는다는 것을 알 수 있으며 윤곽정보에 모멘트 정보를 더함으로써 기존의 방법보다 정확한 페이드(fade) 구간을 검출할 수 있었다.

  • PDF

스마트폰에서의 시공간적 중요도기반 비디오 요약 (Spatiotemporal Saliency-Based Video Abstract on a Smartphone)

  • 이원범;박인규
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2012년도 하계학술대회
    • /
    • pp.388-389
    • /
    • 2012
  • 본 논문에서는 동영상을 시공간적 중요도 기반으로 요약하는 기법을 제안한다. 동영상 내에서 각 프레임의 중요도를 평가하여 높은 우선순위를 가지는 구간들의 집합으로 요약을 수행한다. 화면내의 얼굴면적의 비율, 영상의 복잡도를 통하여 각 프레임이 가지는 공간적 중요도를 분석하고 인접한 프레임간의 비교를 통해 밝기 히스토그램과 움직임(motion)의 양을 추정함으로써 시간적 중요도를 구한다. 에지 보존 스무딩 필터를 밝기 히스토그램에 적용하여 장면 전환을 검출한다. 분리된 장면들로 과분할 구조를 가지는 계층적 트리를 생성하여 사용자가 요구한 재생길이를 가지는 동영상을 자동으로 저작한다. 본 논문에서는 동영상 분석 및 저작을 제한적인 환경인 스마트폰에서 효과적으로 작동하도록 구현 및 최적화를 수행하였다.

  • PDF

음성인식기 성능 향상을 위한 영상기반 음성구간 검출 및 적응적 문턱값 추정 (Visual Voice Activity Detection and Adaptive Threshold Estimation for Speech Recognition)

  • 송태엽;이경선;김성수;이재원;고한석
    • 한국음향학회지
    • /
    • 제34권4호
    • /
    • pp.321-327
    • /
    • 2015
  • 본 연구에서는 음성인식기 성능향상을 위한 영상기반 음성구간 검출방법을 제안한다. 기존의 광류기반 방법은 조도변화에 대응하지 못하고 연산량이 많아서 이동형 플렛홈에 적용되는 스마트 기기에 적용하는데 어려움이 있고, 카오스 이론 기반 방법은 조도변화에 강인하지만 차량 움직임 및 입술 검출의 부정확성으로 인해 발생하는 오검출이 발생하는 문제점이 있다. 본 연구에서는 기존 영상기반 음성구간 검출 알고리즘의 문제점을 해결하기 위해 지역 분산 히스토그램(Local Variance Histogram, LVH)과 적응적 문턱값 추정 방법을 이용한 음성구간 검출 알고리즘을 제안한다. 제안된 방법은 조도 변화에 따른 픽셀 변화에 강인하고 연산속도가 빠르며 적응적 문턱값을 사용하여 조도변화 및 움직임이 큰 차량 운전자의 발화를 강인하게 검출할 수 있다. 이동중인 차량에서 촬영한 운전자의 동영상을 이용하여 성능을 측정한 결과 제안한 방법이 기존의 방법에 비하여 성능이 우수함을 확인하였다.

Alignment Marker 고속 인식 및 위치 보정 방법 (A Fast Way for Alignment Marker Detection and Position Calibration)

  • 문창배;김현수;김현용;이동원;김태훈;정해;김병만
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제5권1호
    • /
    • pp.35-42
    • /
    • 2016
  • 얼라인(Align) 보정은 제품 생산 전/후 빈번하게 사용되는 머신비전 기술 중 하나이다. 본 논문에서는 생산품에 각인된 마커(Marker) 또는 생산품에 존재하는 유니크한 패턴을 이용하여 생산품의 각도와 위치를 고속으로 판별하고 보정하는 방법을 제안하였다. 본 논문에서 사용한 방법은 템플릿매칭(Template Matching)의 속도를 개선한 적분 히스토그램(Integral Histogram)의 변형을 이용하여 후보들을 추출하고, 클러스터링을 적용하여 후보들을 축소하는 방법을 적용 후 마커의 각도와 위치를 판별하는 방법을 제안하였다. 실험결과, 클러스터링을 적용하기 전 보다 클러스터링을 적용 후 약 5s 719ms 개선된 것을 알 수 있었고, 각도 판별에서도 우수한 성능을 보임을 확인할 수 있었다.

화소값의 구간별 양자화 값 상관관계를 이용한 텍스춰 기술자 (Texture Descriptor Using Correlation of Quantized Pixel Values on Intensity Range)

  • 복거철
    • 한국정보전자통신기술학회논문지
    • /
    • 제11권3호
    • /
    • pp.229-234
    • /
    • 2018
  • 텍스춰는 영상을 분류하거나 분할하는데 사용되는 유용한 특징이다. 기존에 제안되었던 LBP는 텍스춰 영상의 지역적인 특징을 간단한 연산을 통해 성공적으로 추출하는 기법으로서 많은 응용 분야에서 높은 성능을 보인 것으로 확인되었지만 오직 화소값의 차이만을 토대로 특징을 기술하기 때문에 잡음에 약하고 특히 이웃화소의 수가 증가함에 따라 특징벡터의 차원이 기하급수적으로 증가하는 문제점으로 인해 멀티스테일 텍스춰 기술자로서 사용하기에는 제약이 크다. 본 논문은 이런 LBP의 단점을 극복하기 위하여 화소값의 범위를 구간별로 양자화하여 양자화영상의 화소값의 상관관계를 3차원 히스토그램으로 표현하는 기법을 제시한다. 이와 같이 3차원 히스토그램을 이용하여 화소값 사이의 상관 관계를 추출하면 특징벡터의 차원이 선형적으로 증가하는 특성을 가지므로 멀티스케일 텍스춰 기술자로 다양하게 응용될 수 있다. 제안하는 방법을 텍스춰 실험영상을 통해 실험한 결과 텍스춰를 분류하는 문제에 있어서 LBP와 비교하여 유의 수준의 성능의 향상을 확인하였다.

혼합형태 심볼릭 데이터의 군집분석방법 (A Divisive Clustering for Mixed Feature-Type Symbolic Data)

  • 김재직
    • 응용통계연구
    • /
    • 제28권6호
    • /
    • pp.1147-1161
    • /
    • 2015
  • 오늘날 데이터는 p-차원의 공간에서 점들로써 표현되는 전통적인 형태를 벗어나 시그널(signal), 함수, 이미지(image), 모양(shape) 등과 같은 다양한 형태의 자료들이 데이터로써 고려되고 분석되고있다. 그러한 종류의 새로운 종류의 데이터 중 하나로 심볼릭 데이터(symbolic data)를 고려할 수 있다. 심볼릭 데이터는 구간(interval), 히스토그램(histogram), 목록(list), 통계표, 분포, 또는 모형 등과 같은 다양한 형태들을 가질 수 있다. 지금까지의 연구가 주로 심볼릭 데이터의 각각의 형태별 자료를 고려했다면, 본 연구에서는 이를 확장하여 수집된 히스토그램과 멀티모달의 혼합된 형태로 이루어진 자료에 대한 계층 분할적 군집분석방법을 소개하고 이를 업종별 산업재해자료의 분석을 위해 이용한다.

객체영역의 컬러비와 모멘트를 이용한 내용기반 영상검색 (Content-based Image Retrieval using Color Ratio and Moment of Object Region)

  • 김은경;오준택;김욱현
    • 정보처리학회논문지B
    • /
    • 제9B권4호
    • /
    • pp.501-508
    • /
    • 2002
  • 본 논문에서는 영상 내에 존재하는 객체영역의 컬러비와 모멘트를 이용한 영상검색을 제안한다. 객체는 영상의 중심에 위치한다는 가설 하에 미리 정의한 중심영역의 우세컬러를 기반으로 수평-수직 투영을 이용하여 객체영역과 배경영역을 분할함으로써 최적의 공간정보를 획득한다. 또한 영상 내 객체의 회전 및 크기에 불변한 특성을 가지기 위해 컬러비와 모멘트를 특징정보로 이용하며 유사성 측정은 컬러 히스토그램의 구간별 연관성을 고려하기 위해 변형된 히스토그램 인터섹션을 이용한다. 실험결과 제안한 방법이 기존의 영역분할에 의한 방법보다 효율적인 결과를 보였다.

대역별 웨이블릿 계수특성을 이용한 장면전환점 검출기법 (Cut Detection Algorithm Using the Characteristic Of Wavelet Coefficients in Each Subband)

  • 문영호;노정진;유지상
    • 한국통신학회논문지
    • /
    • 제29권10C호
    • /
    • pp.1414-1424
    • /
    • 2004
  • 본 논문에서는 동영상의 장면전환점 중 급진적인 장면전환점인 컷(cut)과 점진적인 장면전환점인 페이드(fade)와 디졸브(dissolve) 구간을 웨이블릿 변환영역에서 검출하는 알고리즘을 제안한다. 웨이블렷 변환을 이용한 기존의 연구들은 공간영역과 변환영역 각각의 특징을 이용하여 장면전환점을 검출한다. 그러나 본 논문은 입력된 컬러영상을 먼저 YW 공간으로 변환하고, Y 성분에 대해 리프팅기법을 적용하여 2 레벨 웨이블릿 변환 후, 변환영역에서 공간영역의 특징이 유지되는 저주파 부대역을 히스토그램 비교하고, 나머지 고주파 부대역에서 추출된 에지 정보를 전체(global), 부분(semi-global), 국부(local) 영역으로 정의하여 웨이블릿 에지 히스토그램 비교를 한다. 모의실험 결과 기존의 방법보다 recall에서는 약 17%, precision에서는 약 18%의 성능향상을 보였으며 점진적인 장면 전환점인 페이드와 디졸브 구간 검출에도 좋은 성능을 나타내었다.

통계적 기법을 이용한 장면 전환 검출 (Scene Change Detection by Statistical Method)

  • 박진형;장동식;송광섭;유헌우
    • 한국경영과학회:학술대회논문집
    • /
    • 대한산업공학회/한국경영과학회 2000년도 춘계공동학술대회 논문집
    • /
    • pp.676-678
    • /
    • 2000
  • 본 연구에서는 다양한 동영상내에서 장면전환 검출(Scene Change Detection(SCD))을 하기 위한 임계값 설정시, 전체 동영상을 임의적으로 120개의 프레임 단위로 구분 짓고 120개의 frame을 한 블록으로 하여 각 블록내의 프레임들로부터 얻어진 밝기 히스토그램 사이의 차이값을 데이터로 하여 통계적 기법으로 접근, 차이값의 평균과 표준편차를 이용한 각 블록내의 신뢰구간을 구함으로써 신뢰구간을 벗어나는 프레임은 SCD가 발생한 것으로 생각하였다. 또한 점진적 장면 전환검출시에는 점진적 장면 전환의 특징인 차이값의 분포를 이용하여 장면 전환 검출을 시도하였다. 따라서 SCD를 하기 위하여 사용되어지던 임계값 설정이 동영상에 따라 자동적으로 변화함으로써 임계값 설정의 어려움을 극복하여, 좀더 효율적인 SCO를 이루었으며, 정확도 면에서 급진적/점진적 장면 전환 검출율이 90% 이상의 결과를 보였다.

  • PDF

구간값 퍼지집합을 이용한 그레이 영상에서의 임계값 선택방법 (Threshold Selection Method in Gray Images Based on Interval-Valued Fuzzy Sets)

  • 손창식;정환묵;서석태;권순학
    • 한국지능시스템학회논문지
    • /
    • 제17권4호
    • /
    • pp.443-450
    • /
    • 2007
  • 본 논문에서는 주어진 영상의 그레이 레벨에 대한 통계적 정보와 구간값 퍼지집합에 기반을 둔 새로운 임계값 선택 방법을 제안한다. 제안한 임계값 선택 방법에서 구간값 퍼지집합은 영상의 픽셀과 그들이 속하는 영역, 즉 물체와 배경 간의 관계를 더욱 명확하게 나타내기 위해서 사용되고, 통계적 정보는 구간값 퍼지집합의 규칙과 파티션을 결정하기 위해서 이용된다. 제안한 방법의 타당성을 보이기 위해 다양한 형태의 히스토그램을 가진 5개의 테스트 영상들을 기존의 임계값 선택방법인 Otsu 방법과 Huang과 Wang의 방법과 비교하였다.