• 제목/요약/키워드: Video Scene Detection

검색결과 190건 처리시간 0.021초

뉴스 비디오 데이터에서의 가중치를 이용한 효율적 장면변환 검출 알고리즘 (The Efficient Cut Detection Algorithm Using the Weight in News Video Data)

  • 정영은;이동섭;신성윤;전근환;배석찬;이양원
    • 한국정보처리학회논문지
    • /
    • 제6권2호
    • /
    • pp.282-291
    • /
    • 1999
  • 뉴스 비디오 데이터베이스 시스템을 구축하기 위해서는 장면변환 검출 기법이 매우 중요하다. 일반적인 분할기법으로 컬러히스토그램, $\chi$2 히스토그램, 그리고 Bin_to_Bin difference(B2B) 기법이 주로 이용되고 있다. 본 논문에서는 NTSC 표준에 따른 가중치를 적용하여 보다 효율적인 장면변환 검출 알고리즘을 제안한다. 제안된 방법은 컬러 히스토그램에서 RGB의 값들을 각각 따로 계산함으로써 히스토그램 구성 및 비교에 필요한 계산시간을 단축하며, $\chi$2 히스토그램에서의 차이 값을 강조하여 임계치 선택을 용이하게 하는 장점을 제공한다. 이 알고리즘의 일반적인 성능 평가를 위하여 본 논문에서는 KBS, MBC, SBS, CNN 및 NHK의 뉴스 비디오들을 실험 도메인으로 하여 이용한다. 실험 결과에서, 제안한 방법은 기존 방법들보다 장면변환 검출에 더 효율적임을 알 수 있고, 임계값들을 자동적으로 할 수 있는 기반을 제시한다.

  • PDF

Computer Vision-based Continuous Large-scale Site Monitoring System through Edge Computing and Small-Object Detection

  • Kim, Yeonjoo;Kim, Siyeon;Hwang, Sungjoo;Hong, Seok Hwan
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.1243-1244
    • /
    • 2022
  • In recent years, the growing interest in off-site construction has led to factories scaling up their manufacturing and production processes in the construction sector. Consequently, continuous large-scale site monitoring in low-variability environments, such as prefabricated components production plants (precast concrete production), has gained increasing importance. Although many studies on computer vision-based site monitoring have been conducted, challenges for deploying this technology for large-scale field applications still remain. One of the issues is collecting and transmitting vast amounts of video data. Continuous site monitoring systems are based on real-time video data collection and analysis, which requires excessive computational resources and network traffic. In addition, it is difficult to integrate various object information with different sizes and scales into a single scene. Various sizes and types of objects (e.g., workers, heavy equipment, and materials) exist in a plant production environment, and these objects should be detected simultaneously for effective site monitoring. However, with the existing object detection algorithms, it is difficult to simultaneously detect objects with significant differences in size because collecting and training massive amounts of object image data with various scales is necessary. This study thus developed a large-scale site monitoring system using edge computing and a small-object detection system to solve these problems. Edge computing is a distributed information technology architecture wherein the image or video data is processed near the originating source, not on a centralized server or cloud. By inferring information from the AI computing module equipped with CCTVs and communicating only the processed information with the server, it is possible to reduce excessive network traffic. Small-object detection is an innovative method to detect different-sized objects by cropping the raw image and setting the appropriate number of rows and columns for image splitting based on the target object size. This enables the detection of small objects from cropped and magnified images. The detected small objects can then be expressed in the original image. In the inference process, this study used the YOLO-v5 algorithm, known for its fast processing speed and widely used for real-time object detection. This method could effectively detect large and even small objects that were difficult to detect with the existing object detection algorithms. When the large-scale site monitoring system was tested, it performed well in detecting small objects, such as workers in a large-scale view of construction sites, which were inaccurately detected by the existing algorithms. Our next goal is to incorporate various safety monitoring and risk analysis algorithms into this system, such as collision risk estimation, based on the time-to-collision concept, enabling the optimization of safety routes by accumulating workers' paths and inferring the risky areas based on workers' trajectory patterns. Through such developments, this continuous large-scale site monitoring system can guide a construction plant's safety management system more effectively.

  • PDF

동영상 카투닝 시스템을 위한 자동 프레임 추출 기법 (Auto Frame Extraction Method for Video Cartooning System)

  • 김대진;구떠올라
    • 한국콘텐츠학회논문지
    • /
    • 제11권12호
    • /
    • pp.28-39
    • /
    • 2011
  • 멀티미디어 산업의 발달과 함께 디지털 콘텐츠 시장의 확산을 가져오고 있다. 그 중 인터넷 만화와 같은 디지털 만화 시장의 확장은 급속하게 커지고 있어서, 콘텐츠의 부족과 다양성 때문에 동영상 카투닝에 대한 연구가 계속되고 있다. 지금까지는 동영상 카투닝은 비사실적 렌더링과 말풍선에 초점이 맞추어졌으나, 이러한 것들을 적용하기 위해서는 카투닝 서비스에 적합한 프레임 추출이 우선시 되어야만 한다. 기존의 방법으로는 동영상의 장면전환이 일어나는 샷(shot)안의 프레임을 추출하여, 사용자가 지정한 영역을 임의의 색상으로 렌더링(Rendering)하는 시스템이 있다. 하지만 이러한 방법은 사람의 손을 거치는 반자동적인 방법으로서 정확한 프레임 추출을 위해 사람의 손을 거쳐야하는 단점이 있다. 따라서 본 논문에서는 이러한 문제점을 해결하고, 보다 정확한 카투닝에 적용할 프레임을 추출하기 위해 오디오 및 비디오 분리를 통한 방법을 제안한다. 먼저 동영상으로부터 오디오와 비디오를 분리한다. 오디오는 먼저 MFCC와 영교차율의 특징을 추출하고, 이 특징 정보를 미리 학습된 데이터와 GMM 분류기를 통하여 음악, 음성, 음악+음성으로 분류한 후 음성 영역을 설정한다. 비디오는 히스토그램을 이용한 방법과 같은 일반적인 장면전환 프레임을 추출 후 얼굴 검색을 통해서 만화에서 의미가 있는 프레임을 추출한다. 그 후 음성 영역내에 얼굴이 존재하는 장면전환 프레임이나 일정 시간동안 음성이 지속되는 영역 중 장면전환 프레임을 추출하여 동영상 카투닝에 적합한 프레임을 자동으로 추출한다.

압축비디오에서 인트라픽쳐 부분 복호화를 이용한 샷 움직임 분류 (Shot Motion Classification Using Partial Decoding of INTRA Picture in Compressed Video)

  • 김강욱;권성근
    • 한국멀티미디어학회논문지
    • /
    • 제14권7호
    • /
    • pp.858-865
    • /
    • 2011
  • 압축 상태에서 비디오 구조화 및 분류를 하기 위해서는 먼저 압축된 비디오에서 장면전환을 검출해서 비디오를 샷(shot)으로 분리하고 샷내 움직임 정보에 따라 샷을 특징화해야 한다. 장면전환을 검출하는 방법에는 DC 영상의 분산값 이나 복원영상의 에지 픽셀의 분포를 이용한 방법, P-픽쳐의 인트라 블록의 개수를 이용한 방법 등이 있으며 움직임에 따른 샷의 특징 분류는 움직임 벡터의 각 성분들의 평균값을 이용하는 것이 일반적인 방법이다. 그러나 움직임 벡터를 이용한 샷 움직임 분류 방법은 움직임 벡터 자체가 블록의 국부적(local) 움직임을 나타내는 것이므로 글로벌(global)한 카메라 동작을 예측하기 위해서는 많은 제약이 있다. 따라서 본 논문에서는 이러한 것을 보완하기 위해서 MPEG으로 압축된 비디오에서 인트라 프레임을 부분적으로 복호화 하고 빠른 1차원적인 연산을 통해 수평 및 수직 방향으로 평균 밝기 값의 변화 방향을 추정하여 좀더 정확히 샷내 카메라의 움직임을 분류하고자 한다.

압축영역에서의 대표프레임 추출 및 영역분할기반 비디오 검색 기법 (Key Frame Extraction and Region Segmentation-based Video Retrieval in Compressed Domain)

  • 강응관;김성주;송호근;최종수
    • 한국통신학회논문지
    • /
    • 제24권9B호
    • /
    • pp.1713-1720
    • /
    • 1999
  • 본 논문에서는 동영상 압축 부호화에 대한 표준안인 MPEG 기반의 압축 비디오 시퀀스로부터 DCT DC 계수를 추출하고, 이들로 구성된 DC 이미지로부터 AHIM (Accumulative Histogram Intersection Measure)을 이용하여 장면 전환 검출을 수행한 후 대표 프레임을 추출하는 방법을 제시한다. 또한, 추출된 대표 프레임을 두 단계를 거쳐 데이터베이스의 색인 정보로 저장한 후, 입력되는 질의 영상에 대해 사용자가 원하는 검색 결과를 제시하는 방법에 대해 제안한다. 즉 전처리 과정으로 추출된 대표 프레임에 대해 영역 분할을 한 후, 첫 번째 단계에서 수평 투영된 결과를 히스토그램 분포 특성으로 변환시켜 데이터베이스의 색인 정보로 저장한다. 두 번째 단계에서는 영상의 모멘트 특성을 거리함수 값으로 변환시킨다. 실험 결과 제안된 방법이 검색에 있어 우수한 성능을 갖추고 또한 상당한 양의 처리 시간과 메모리 공간을 줄일 수 있음을 확인하였다. 향후 제안한 방법은 색상과 같은 다른 색인 정보와 결합할 경우, 보다 나은 영상 색인과 검색 수단을 제공할 것이다.

  • PDF

장면 전환 기법을 이용한 동영상 검색 시스템 설계 (Design of Moving Picture Retrieval System using Scene Change Technique)

  • 김장희;강대성
    • 대한전자공학회논문지SP
    • /
    • 제44권3호
    • /
    • pp.8-15
    • /
    • 2007
  • 최근 멀티미디어 데이터를 효율적으로 전송, 저장 관리 및 검색하는 기술이 중요한 핵심 기술로 대두되고 있다. 그 중에서 멀티미디어 정보 검색의 경우 사용자가 원하는 정보를 표현할 수 있는 사용자 인터페이스 기술과 원하는 정보를 사용자에게 신속하고 정확하게 보여주는 기술의 필요성이 증대하고 있다. 본 논문에서는 MPEG으로 압축된 영상 정보에서 장면의 전환점인 컷을 효과적으로 검출하여 동영상을 분할하는 기법을 제안한다. 컷 검출(Cut detection)은 MPEG 비디오 시퀀스에서 동영상을 분할하는 가장 기본적이면서 중요한 기초 작업이며, 비디오 색인 및 검색을 위한 첫 번째 단계이다. 기존의 방법들은 프레임간을 비교하기 때문에 물체의 빠른 움직임이나 카메라의 움직임, 후레쉬의 섬광 등 화면 변화에 따라 오검출이 생기는 단점이 있다. 제안하는 컷 검출 기법은 먼저 입력영상을 DCT의 DC를 이용하여 샷을 검출한다. 이렇게 검출된 샷으로 데이터베이스를 구성하고, MPEG-7의 시각 기술자 중 HMMD 컬러 모델과 에지 히스토그램을 사용하여 영상에서 특징을 추출하였다. 그리고 제안하는 매칭 기법에 따라 단계별 검색을 수행하였다. 이 실험을 통해서 기존 방법들보다 높은 검색률을 보이는 개선된 동영상 분할 시스템을 설계하였다.

비디오 편집 모델에 기반한 적응적 디졸브 검출 방법 (Adaptive dissolve detection based on video editing model)

  • 원종운;이광호
    • 한국산업정보학회논문지
    • /
    • 제8권1호
    • /
    • pp.18-25
    • /
    • 2003
  • 본 논문에서는 비디오 편집 모델에 기반한 디졸브 모델의 특성에 따른 디졸브 검출 방법을 제안한다. 제안된 방법은 각각의 디졸브 구간이 가지는 특성을 반영하기 때문에 디졸브 검출에 적응적이다. 제안된 방법은 2단계로 구성된다. 첫 번째 단계에서는 디졸브 구간의 후보 영역을 찾는다. 동영상의 각 프레임의 분산으로 얻어지는 분산 곡선에서 디졸브 구간은 아래로 볼록한 포물선으로 나타난다. 따라서 분산 곡선의 1차와 2차 미분을 이용하여 디졸브 구간에 대응하는 포물선의 후보 영역을 찾는다. 두 번째 단계에서는 각각의 후보 영역에 대해 디졸브 영역을 검증한다. 후보 영역에서 디졸브 모델에 대응하는 포물선의 골의 분산을 추정하여 디졸브를 판별한다. 골의 분산은 이웃한 두 장면의 분산의 함수로 나타남으로 다양한 분산에서 나타나는 디졸브를 적응적으로 검출할 수 있다. 제안된 방법은 다양한 디졸브를 포함하는 동영상을 대상으로 기존의 방법과 비교 실험하였다. 실험 결과 제안한 방법은 분산의 변화에 상관없이 디졸브를 정확히 검출하였으며 기존의 방법 보다 우수한 결과를 얻었다.

  • PDF

저지연 영상 통신을 위한 화면 비트율 제어 기법 (Frame Bit-rate Control Method for Low Delay Video Communication)

  • 김은희;박민철;문주희;권재철
    • 방송공학회논문지
    • /
    • 제12권6호
    • /
    • pp.574-584
    • /
    • 2007
  • 멀티미디어 통신, 영상전화 등 실시간 멀티미디어 서비스가 대중화됨에 따라 동영상 데이터의 저지연 및 고품질 전송에 대한 요구가 중요해지고 있다. 동영상 압축 기술 중에서 비트율 제어 기법은 압축된 데이터의 효율적인 전송과 재생된 영상의 화질을 결정하는데 중요한 역할을 한다. 본 논문은 기존의 VBR과 CBR 부호화 방식을 결합하여 모든 화면의 비트발생량을 제한된 범위내로 제어하는 기술을 제안하여 모든 화면에 대해 부분적 장면 전환 검출을 수행하고 완벽한 VBR 전송이 보장되지 않는 환경에서 저지연 전송 및 고품질의 영상이 유지되게 하며 또한 순간 데이터 처리 속도의 부담도 완화할 수 있게 한다. 실험 결과, 제안한 알고리즘은 실시간 응용에 있어서 기존 TMN8알고리즘에 비해 더욱 효율적인 비트율 제어를 제공한다는 것을 볼 수 있다.

모바일 비디오기기 위에서의 중요한 객체탐색을 위한 문맥인식 특성벡터 선택 모델 (Context Aware Feature Selection Model for Salient Feature Detection from Mobile Video Devices)

  • 이재호;신현경
    • 인터넷정보학회논문지
    • /
    • 제15권6호
    • /
    • pp.117-124
    • /
    • 2014
  • 모바일 기기를 사용한 실시간 비디오 영상처리분야의 중요 객체탐색 및 추적의 문제에 있어서 난제는 복잡한 배경속에서 전경을 구분해 내는 일이다. 본 논문에서는 기계학습을 위한 특성벡터 선정의 문제를 위한 문맥인식 모델을 제시하여 잡음제거를 위한 기계학습기반의 구분자를 구현하였다. 수학적으로 NP-hard로 알려진 가장 가까운 이웃을 사용한 문맥인식 특성벡터 선정 알고리즘의 구현에 있어서, 본 논문은 연산횟수를 줄인 유사방법론에 대해 자세히 거론하였다. 또한, 문맥인식 성격을 가미한 특성벡터 선정을 통해 얻어진 특성 공간에서의 향상된 분리성에 대해 주성분 분석을 통해 엄밀한 분석결과를 제시하였다. 전반적인 성능 향상의 정도를 계측하기 위해 다양한 기계학습 방법론, 예를 들어, 다층신경망, 지원벡터기계, 나이브베이지안, 회귀분석 등을 사용해 비교결과를 제시하였다. 본 논문에서 제시한 방법론의 성능과 계산상 자원사용에 대한 내용을 결론으로 서술하였다.

비-파라미터 기반의 움직임 분류를 통한 비디오 검색 기법 (Video retrieval method using non-parametric based motion classification)

  • 김낙우;최종수
    • 대한전자공학회논문지SP
    • /
    • 제43권2호
    • /
    • pp.1-11
    • /
    • 2006
  • 본 논문에서는 샷(shot) 기반 비디오 색인 구조에서 비-파라미터(non-parametric) 기반의 움직임 분류를 통한 비디오 영상 검색 기법을 제안한다. 본 논문에서 제안하는 비디오 검색 시스템은 장면 전환 기법을 통해 얻은 샷 단위의 짧은 비디오로부터 대표 프레임과 움직임 정보를 취득한 후, 이를 통해 시각적 특징과 움직임 특징을 추출하여 유사도를 비교함으로써 시-공간적 특징을 이용한 실시간 검색이 가능하도록 구현되었다. 비-파라미터 기반의 움직임 특징의 추출은 MPEG 압축 스트림으로부터 정규화된 움직임 벡터계(界)를 추출한 후, 각각의 정규화된 움직임 벡터를 여러 개의 각도 빈(bin)으로 양자화하고 이의 평균과 분산, 방향 등을 고려함으로써 효과적으로 이루어진다. 대표 프레임에서의 시각 특징 검출을 위해서는 에지 기반의 공간 기술자를 이용하였다. 실험 결과는 영상 색인 및 검색에 있어서 제안된 시스템이 매우 효과적임을 잘 나타내고 있다. 데이터베이스 내 영상의 색인을 위해서는 R*-tree 구조를 이용한다.