• 제목/요약/키워드: Video Scene Detection

검색결과 190건 처리시간 0.025초

장면전환 검출과 클러스터링을 이용한 비디오 개요 추출 (Video Abstracting Using Scene Change Detection and Clustering)

  • 신성윤;강일고;이양원
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2002년도 추계종합학술대회
    • /
    • pp.583-587
    • /
    • 2002
  • 비디오를 시청하기 위하여 원하는 비디오를 선택하고자 할 때 사용자들은 비디오의 전반적인 내용을 알 수 있는 방법이 많지 않다. 따라서 비디오 시청을 원하는 사용자들에게 비디오의 전반적인 개요를 보여주어 선택 할 수 있는 방법이 요구된다. 본 논문에서는 전환 검출 방법과 샷 클러스터링을 이용한 비디오 개요 추출 방법을 제시한다. 장면전환 검출 방법은 컬러 히스토그램과 $\times$2 히스토그램을 합성한 방법을 이용하여 추출하도록 한다. 클러스터링은 히스토그램의 차이값을 측정과 샷 병합 알고리즘을 통해 수행하도록 한다.

  • PDF

동영상 검색을 위한 고속 장면 전환 검출 (High-speed scene change detection for video indexing)

  • 나윤정;하명환;이상길
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵
    • /
    • pp.109-114
    • /
    • 1999
  • 동영상을 효율적으로 검색하기 위해서 동영상을 장면 단위로 분할하는 과정이 필요하다 이 논문에서는 동영상에서 장면이 전환되는 지점을 빠르게 검출하는 방법을 제안한다. 먼저 MPEG 압축 영상에 대하여 시간적 표본화를 통하여 추출된 압축 영역의 데이터를 사용하여 장면 전환의 후보 구간들을 정하고, 다음으로 이들 구간 안에서 각 프레임의 화소값을 얻고, 이를 사용하여 정확한 장면 전환 지점을 찾아낸다. 제안된 방법은 빠른 검출 속도와 함께 높은 정확성을 갖는다. 또한 카메라 플래시 때문에 장면 전환으로 잘못 검출되는 것을 방지할 수 있는 방법을 제안한다.

  • PDF

MPEG 압축 영상에서의 고속 특징 요소 추출을 이용한 장면 전환 검출과 키 프레임 선택 (Scene Change Detection and Key Frame Selection Using Fast Feature Extraction in the MPEG-Compressed Domain)

  • 송병철;김명준;나종범
    • 방송공학회논문지
    • /
    • 제4권2호
    • /
    • pp.155-163
    • /
    • 1999
  • 본 논문은 새로운 장면 전환 검출과 키 프레임 선태 기법을 제안하였다. 이를 위해 본 논문에서는 MPEG 압축 동영상에서 직접 DC 영상 및 에지(edge) 영상을 추출하여 이용하는데, 공간 영역으로 변환 후 에지 연상을 추출할 경우 계산량이 많다는 문제점이 있다. 따라서 본 논문에서는 그 계산량을 줄이기 위해 DCT 블록 당 5개의 저 대역 AC 계수들만을 이용하여 축소된 에지 영상을 고속으로 추출하는 방법을 제안하고, 이를 바탕으로 AC 예측(prediction)을 이용한 고속 에지 추출 기법도 추가적으로 제안하였다. 화질 측면에서 전자가 후자보다 약간 우수하지만, 두 방법 모두 영상의 중요한 에지 특징들을 잘 추출할 수 있다. 이와 같이 얻어진 에지 영상 및DC 영상을 이용하여 에지 에너지 다이어그램(dege energy diagram)과 히스토그램(histogram)을 구하여 급진적인 장면 전환 및 페이드(fade), 디졸브(dissolve) 같은 점진적인 장면 전환을 정확하게 검출함을 모의 실험을 통해 확인하였다. 또한 공간 영역에서 구한 에지 영상들에 비해 제안한 방법들에 의한 에지 영상들이 점진적인 장면 검출에 있어 훨씬 적은 계산량으로 비슷한 성능을 보임을 확인하였다. 마지막으로 HVS(human visual system)에 기반하여 각 장면에서 키 프레임을 선택하는 방법도 제안하였다. 위에서 얻어진 에지 및 DC 영상을 이용하기 때문에 optical flow를 이용하는 기존 방법에 비해 적은 계산량으로 의미 있는 키 프레임을 선택할 수 있었다.

  • PDF

수술 동영상의 비식별화를 위한 개인식별정보 자동 검출 시스템 설계 및 구현 (Design and Implementation of Automated Detection System of Personal Identification Information for Surgical Video De-Identification)

  • 조영탁;안기옥
    • 융합보안논문지
    • /
    • 제19권5호
    • /
    • pp.75-84
    • /
    • 2019
  • 최근 의료정보기술 분야에서 비디오는 풍부한 임상정보를 포함하는 특징으로 인하여 새로운 서비스 창출 및 연구개발을 위한 중요한 데이터로서 그 가치를 새롭게 평가받고 있다. 그러나 임상정보는 개인정보를 포함하고 있어, 생명윤리 혹은 연구 윤리에 대한 고려가 필요하다. 따라서 비디오 또한 의료영상으로서 비식별화가 요구되지만 기존 방법은 주로 정형데이터와 정지영상에 특화되어 기존의 방법을 그대로 적용하기 어려운 문제가 있다. 본 논문에서는 개인정보 비식별화 처리 시스템과의 연동을 고려하여 비디오 내에서 개인식별정보를 검출하는 자동화 시스템을 제안한다. 제안 시스템은 장면분할과 체내외 영역 검출의 전처리 후에 텍스트 및 사람검출을 통한 인덱싱과정을 수행한다. 검출된 개인식별 인덱스 정보는 비식별화를 수행하는 외부 시스템 및 시각화를 위한 메타데이터로 제공된다. 제안 시스템의 효용성을 검증하기 위하여 프로토타입을 구현하고 실제 수술비디오를 대상으로 인덱싱 속도를 측정하였다. 그 결과 입력 비디오의 재생시간 대비 2배 이상의 빠른 작업속도를 보였으며, 수술교육콘텐츠 제작 및 학술용 반자동 편집시스템의 사례를 통해 빠른 의사결정을 보조할 수 있음을 확인하였다.

장면 전환 기법을 이용한 동영상 검색 시스템의 하드웨어 구현 (Hardware Implementation of Moving Picture Retrieval System Using Scene Change Technique)

  • 김장희;강대성
    • 대한전자공학회논문지SP
    • /
    • 제45권3호
    • /
    • pp.30-36
    • /
    • 2008
  • 멀티미디어 정보는 다매체, 다특징, 다표현, 대용량성의 특징과 함께 그 양 또한 급속도로 증가하고 있다. 따라서 급격히 늘어난 방대한 정보로부터 필요한 정보를 검색하는 검색 시스템이 요구되고 있으며, 이러한 색인 및 검색 시스템이 실시간으로 처리되는 것이 필요하다. 동영상의 내용 기반 검색을 위하여 가장 일반적으로 사용할 수 있는 정보는 영상정보이다. 영상정보는 주로 비디오를 장면 분할할 때에 사용되며 이를 통하여 구조적인 비디오 브라우징을 할 수 있다. 비디오를 샷으로 구분하는 작업을 비디오 분할(video segmentation)이라고 하며, 비디오 분할을 위해 장면의 전환점인 컷을 검출하는 작업을 컷 검출(cut detection)이라고 한다. 본 연구에서는 MPEG-7 시각 기술자인 HMMD 컬러 모델과 에지 히스토그램 기술자를 사용하여 동영상 분할을 하였다. HMMD 컬러 공간은 다른 공간에 비해 인간의 색 지각에 매우 밀접한 것으로 나타난다. 본 논문에서는 이러한 검색 시스템을 하드웨어로 구현하였다.

Thermal Image Mosaicking Using Optimized FAST Algorithm

  • Nguyen, Truong Linh;Han, Dong Yeob
    • 한국측량학회지
    • /
    • 제35권1호
    • /
    • pp.41-53
    • /
    • 2017
  • A thermal camera is used to obtain thermal information of a certain area. However, it is difficult to depict all the information of an area in an individual thermal image. To form a high-resolution panoramic thermal image, we propose an optimized FAST (feature from accelerated segment test) algorithm to combine two or more images of the same scene. The FAST is an accurate and fast algorithm that yields good positional accuracy and high point reliability; however, the major limitation of a FAST detector is that multiple features are detected adjacent to one another and the interest points cannot be obtained under no significant difference in thermal images. Our proposed algorithm not only detects the features in thermal images easily, but also takes advantage of the speed of the FAST algorithm. Quantitative evaluation shows that our proposed technique is time-efficient and accurate. Finally, we create a mosaic of the video to analyze a comprehensive view of the scene.

MPEG 비디오 스트림에서 줄거리 특성에 기초한 장면 경계 검출 방법 (A Scene Boundary Detection Scheme based on Story Line for MPEG Video Streams)

  • 이숙경;낭종호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제27권1호
    • /
    • pp.1-12
    • /
    • 2000
  • 비디오 데이타 스트림을 tit (shot) 혹은 장면 (scene) 단위로 나누는 자동 비디오 인덱싱 기법은 VoD나 디지털 비디오 라이브러리와 같이 비디오 데이타를 이용하는 응용 분야를 개발하기 위하여 꼭 필요한 기능이다. 본 논문에서는 줄거리(stary line)를 갖는 영화나 드라마와 같은 비디오 데이타에서의 장면 단위 인덱싱을 위해 장면의 경계를 자동으로 검출하는 방법을 제안한다. 일반적으로 영화에서 시간적으로 인접한 두 샷이 유사할 때 샷의 중간 부분은 움직임에 따라 변하는데 똑같은 움직임이 반복되지 않는다는 특성을 가진다. 제안한 검출 방법에서는 이러한 특성을 이용하여 각 샷의 처음과 마지막 프레임을 대표 프레임으로 선택하고 이들의 칼라 히스토그램으로 샷을 추상화한다. 이렇게 추상화한 샷에 대하여 영화에서의 장면은 일반적으로 비슷한 내용의 샷이 반복된다는 특성을 이용하여 장면의 경계를 검출하였는데, 하나의 장면에 해당하는 샷들을 묶어줄 때 시간적으로 인접한 이전 샷들과의 유사도만 측정하는 간단한 방법을 사용하였다. 본 논문에서 제안한 영화나 드라마에 대한 장면 경계 검출 방법은 MPEG 형식의 비디오 데이타를 이용한 디지털 라이브러리 등의 구축에 유용하게 사용될 수 있을 것이다.

  • PDF

폭발장면 자동 검출을 위한 저급 수준 비디오 특징의 추상화 (Abstraction Mechanism of Low-Level Video Features for Automatic Retrieval of Explosion Scenes)

  • 이상혁;낭종호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.389-401
    • /
    • 2001
  • 본 논문에서는 MPEG형식의 영화 데이터를 대상으로 폭발 장면 자동 추출을 위한 저급 수준 비디오 내용정보의 추상화 방법을 제안하고, 실제 구현을 통하여 그 유용성을 보인다. 제안한 추상화 방법은 폭발시 발생하는 불꽃의 색이 노란색 톤을 가진다는 사실과, 불꽃이 나타나는 프레임은 같은 tit에 속하는 이웃한 프레임과는 화면 구성이 달라지게 되므로 움직임 에너지 값이 커지게 된다는 사실을 바탕으로 한다. 이를 위해서 샷 단위의 인덱싱을 자동적으로 수행하고 각 샷의 첫 번째 프래임을 키 프레임으로 하다. 이를 위해서 샷 단위의 인덱싱을 자동적으로 수행하고 각 샷의 첫 번째 프레임을 키 프레임으로 선택한 후 영역별 주 색깔(Dominant Color)를 추출한다. 이때 색 공간은 양자화를 통한 512색 중 노란색 톤을 가지는 48 색 범위로 정의한다. 이후 매 샷마다 첫 번째 프레임과 이웃한 프레임의 에지 이미지(Edge Image)를 추출하여 이들의 차이로써 움직임 에너지(Motion Energy)를 얻는다. 이 두 가지 정보, 즉 노란색 톤을 가지는 색 정보와, 같은 장면 내의 다른 샷의 움직임 에너지에 비해 큰 값의 움직임 에너지를 갖는 샷을 폭발장면이 포함된 장면으로 검출한다. 실험 결과에 의하면 검색 결과는 주어진 임계값에 의존적이나, Recall과 Precision에서 80% 이상의 검출률을 보이고 있다. 그러나 일반적인 폭발 장면은 찾기에는 노란색 불꽃을 보이지 않는 예외적인 경우가 발생하여 이를 추출하는데 어려움이 있었다. 앞으로 이러한 문제점등은 기존의 오디오 정보를 이용한 폭발 장면 검출 방법과 함께 이용함으로써 해결되어질 수 있을 것이다.

  • PDF

YOLOv5 based Anomaly Detection for Subway Safety Management Using Dilated Convolution

  • Nusrat Jahan Tahira;Ju-Ryong Park;Seung-Jin Lim;Jang-Sik Park
    • 한국산업융합학회 논문집
    • /
    • 제26권2_1호
    • /
    • pp.217-223
    • /
    • 2023
  • With the rapid advancement of technologies, need for different research fields where this technology can be used is also increasing. One of the most researched topic in computer vision is object detection, which has widely been implemented in various fields which include healthcare, video surveillance and education. The main goal of object detection is to identify and categorize all the objects in a target environment. Specifically, methods of object detection consist of a variety of significant techniq ues, such as image processing and patterns recognition. Anomaly detection is a part of object detection, anomalies can be found various scenarios for example crowded places such as subway stations. An abnormal event can be assumed as a variation from the conventional scene. Since the abnormal event does not occur frequently, the distribution of normal and abnormal events is thoroughly imbalanced. In terms of public safety, abnormal events should be avoided and therefore immediate action need to be taken. When abnormal events occur in certain places, real time detection is required to prevent and protect the safety of the people. To solve the above problems, we propose a modified YOLOv5 object detection algorithm by implementing dilated convolutional layers which achieved 97% mAP50 compared to other five different models of YOLOv5. In addition to this, we also created a simple mobile application to avail the abnormal event detection on mobile phones.

Adaptive Video-Dissolve Detection Method Based on Correlation Between Two Scenes

  • Won, Jong-Un;Park, Jae-Gark;Chung, Yoon-su;Park, Kil-Houm
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -3
    • /
    • pp.1519-1522
    • /
    • 2002
  • In this paper, we propose a new adaptive dissolve detection method based on the analysis of a dissolve modeling error that is the difference between an ideally modeled dissolve curve without any correlation and an actual variance curve with a correlation. The dissolve modeling error is determined based on a correlation between two scenes and variances for each scene. First, Candidate regions are extracted by using the characteristics of a parabola that is downward convex, then the candidate region will be verified based on a dissolve modeling error. If a dissolve modeling error on a candidate region is less than a threshold that is defined by a dissolve modeling error with a target correlation, the candidate region should be a dissolve region with a correlation less than the target correlation. The threshold is adaptively determined based on the variances between the candidate regions and the target correlation. By considering the correlation between neighbor scenes, the proposed method is able to be a semantic scene-change detector. The proposed algorithm was tested on various types of data and its performance proved to be more accurate and reliable when compared with other commonly used methods

  • PDF