• 제목/요약/키워드: object-based video coding

검색결과 65건 처리시간 0.027초

객체 탐지와 행동인식을 이용한 영상내의 비정상적인 상황 탐지 네트워크 (Abnormal Situation Detection on Surveillance Video Using Object Detection and Action Recognition)

  • 김정훈;최종혁;박영호;나스리디노프 아지즈
    • 한국멀티미디어학회논문지
    • /
    • 제24권2호
    • /
    • pp.186-198
    • /
    • 2021
  • Security control using surveillance cameras is established when people observe all surveillance videos directly. However, this task is labor-intensive and it is difficult to detect all abnormal situations. In this paper, we propose a deep neural network model, called AT-Net, that automatically detects abnormal situations in the surveillance video, and introduces an automatic video surveillance system developed based on this network model. In particular, AT-Net alleviates the ambiguity of existing abnormal situation detection methods by mapping features representing relationships between people and objects in surveillance video to the new tensor structure based on sparse coding. Through experiments on actual surveillance videos, AT-Net achieved an F1-score of about 89%, and improved abnormal situation detection performance by more than 25% compared to existing methods.

Experiment on Intermediate Feature Coding for Object Detection and Segmentation

  • Jeong, Min Hyuk;Jin, Hoe-Yong;Kim, Sang-Kyun;Lee, Heekyung;Choo, Hyon-Gon;Lim, Hanshin;Seo, Jeongil
    • 방송공학회논문지
    • /
    • 제25권7호
    • /
    • pp.1081-1094
    • /
    • 2020
  • With the recent development of deep learning, most computer vision-related tasks are being solved with deep learning-based network technologies such as CNN and RNN. Computer vision tasks such as object detection or object segmentation use intermediate features extracted from the same backbone such as Resnet or FPN for training and inference for object detection and segmentation. In this paper, an experiment was conducted to find out the compression efficiency and the effect of encoding on task inference performance when the features extracted in the intermediate stage of CNN are encoded. The feature map that combines the features of 256 channels into one image and the original image were encoded in HEVC to compare and analyze the inference performance for object detection and segmentation. Since the intermediate feature map encodes the five levels of feature maps (P2 to P6), the image size and resolution are increased compared to the original image. However, when the degree of compression is weakened, the use of feature maps yields similar or better inference results to the inference performance of the original image.

SHVC 비디오 기반 포인트 클라우드 밀도 스케일러빌리티 방안 (Density Scalability of Video Based Point Cloud Compression by Using SHVC Codec)

  • 황용해;김준식;김규헌
    • 방송공학회논문지
    • /
    • 제25권5호
    • /
    • pp.709-722
    • /
    • 2020
  • 포인트 클라우드는 수많은 점의 집합으로 이루어진 데이터로 2차원 평면에서 벗어나 3차원 공간에서 3D 객체를 표현하는 것이 가능하다. 각 점은 기본적으로 3차원 공간의 좌표 정보가 필요하고 추가적으로 색 (Color), 반사율 (Reflectance) 같은 속성을 가질 수 있도록 구성되어 있다. 이처럼 3D 포인트 클라우드 표현에는 2D 영상보다 많은 데이터를 사용하고 있기에, 이를 사용자에게 효율적으로 제공하기 위해서는 고효율의 압축 기술 연구가 필요하며, 현재 국제 표준 기구인 MPEG에서는 포인트 클라우드 콘텐츠 압축 방법으로 2D 비디오 압축 기술을 사용한 Video-based Point Cloud Compression (V-PCC) 기술이 연구되고 있다. 이러한 고효율의 포인트 클라우드 압축방식에도 불구하고 단말의 성능이나 네트워크 환경 등의 문제로 인해 서비스가 제한되는 상황이 발생할 수 있다. 2D 영상의 경우 Scalable High efficiency Video Coding (SHVC) 혹은 Dynamic Adaptive Streaming over HTTP (DASH) 등의 다양한 기술을 사용하여 이러한 문제를 해결하고 있다. 이에 본 논문에서는 V-PCC 구조에 SHVC를 적용하여, 밀도 스케일러빌리티 기능을 가진 포인트 클라우드 압축 방안을 제안하는 것으로 이러한 문제를 해결하고자 한다.

H.264 표준에서 가중된 다중 참조 블록을 이용한 효율적인 VLC 표 예측 방법 (An Efficient VLC Table Prediction Scheme for H.264 Using Weighting Multiple Reference Blocks)

  • 허진;오관정;호요성
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.39-42
    • /
    • 2005
  • H.264, a recently proposed international video coding standard, has adopted context-based adaptive variable length coding (CAVLC) as the entropy coding tool in the baseline profile. By combining an adaptive variable length coding technique with context modeling, we can achieve a high degree of redundancy reduction. However, CAVLC in H.264 has weakness that the correct prediction rate of the variable length coding (VLC) table is low in a complex area, such as the boundary of an object. In this paper, we propose a VLC table prediction scheme considering multiple reference blocks; the same position block of the previous frame and the neighboring blocks of the current frame. The proposed algorithm obtains the new weighting values considering correctness of the VLC table for each reference block. Using this method, we can enhance the prediction rate of the VLC table and reduce the bit-rate.

  • PDF

인공지능 기반 멀티태스크를 위한 비디오 코덱의 성능평가 방법 (Evaluation of Video Codec AI-based Multiple tasks)

  • 김신;이예지;윤경로;추현곤;임한신;서정일
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.273-282
    • /
    • 2022
  • MPEG 내 VCM 그룹은 머신을 위한 비디오 코덱을 표준화하는 것으로 목표로 하고 있다. VCM 그룹은 객체 탐지, 객체 분할, 객체 추적 등 3가지의 머신비전 태스크를 포함한 데이터 세트와 데이터 세트 별 기준 데이터인 Anchor를 제공하고 있으며, 평가 템플릿을 이용하여 후보 기술군과 Anchor의 압축 대비 머신비전 성능을 비교할 수 있다. 하지만 성능 비교는 머신비전 태스크 별로 분리하여 수행되고 있으며, 다수의 머신비전 태스크에 대한 성능 평가를 수행할 수 있는 비트스트림을 생성할 수 있는 데이터는 별도로 제공하고 있지 않다. 본 논문에서는 인공 지능 기반 멀티 태스크를 위한 비디오 코덱의 성능 평가 방안에 대해 제안한다. 하나의 비트스트림의 크기 척도인 픽셀 당 비트수(BPP, Bits Per Pixel) 와 각 태스크의 정확도 결과인 Mean Average Precision(mAP)를 기반으로 산술 평균, 가중 평균, 조화 평균 등 총 3가지의 멀티 태스크 성능 평가 지표를 제안하며 mAP 결과를 기반으로 성능 결과를 비교하고자 한다. 멀티 태스크에서 태스크 별 mAP 결과 값의 범위의 차이가 있을 수 있으며 차이로 인해 생길 수 있는 성능 평가와 관련된 문제를 방지하고자 정규화한 mAP 기반 멀티 태스크 성능 결과를 산출하고 평가하고자 한다.

파노라믹 영상 모델에 근거한 파라메트릭 비디오 압축 (Parametric Video Compression Based on Panoramic Image Modeling)

  • 심동규
    • 대한전자공학회논문지SP
    • /
    • 제43권4호
    • /
    • pp.96-107
    • /
    • 2006
  • 본 논문에서는 파노라믹 영상 모델링에 근거한 비디오 압축 전송 방법을 제안한다. 제안한 방법은 회전 카메라에 입력되는 영상에서 배경 영상과 움직이는 물체로 분리하고 차영상을 추출하여 압축/전송하는 방법을 사용한다. 제안한 비디오 압축 시스템은 초기화 과정에서 전송된 파노라믹 영상으로부터 배경영상을 합성할 수 있도록 파라메터 만을 전송하게 된다. 본 논문 에서는 정확한 배경 합성을 위한 정확한 카메라 모델링 기반 파노라믹 영상 합성법을 제시하며, 이를 바탕으로 비디오 압축에 응용하는 방법을 제안하였다. 제안한 비디오 압축방법에 의하여 기존의 JPEG-2000이나 MPEG-4 비디오 압축 방법에 비하여 PSNR 관점에서 $2{\sim}4dB$ 효율적임을 보였다.

Multiresolution Wavelet-Based Disparity Estimation for Stereo Image Compression

  • Tengcharoen, Chompoonuch;Varakulsiripunth, Ruttikorn
    • 제어로봇시스템학회:학술대회논문집
    • /
    • 제어로봇시스템학회 2004년도 ICCAS
    • /
    • pp.1098-1101
    • /
    • 2004
  • The ordinary stereo image of an object consists of data of left and right views. Therefore, the left and right image pairs have to be transmitted simultaneously in order to display 3-dimentional video at the remote site. However, due to the twice data in comparing with a monoscopic image of the same object, it needs to be compressed for fast transmission and resource saving. Hence, it needs an effective coding algorithm for compressing stereo image. It was found previously that compressing left and right frames independently will achieve the compression ratio lower than compressing by utilizing the spatial redundancy between both frames. Therefore, in this paper, we study the stereo image compression technique based on the multiresolution wavelet transform using varied disparity-block size for estimation and compensation. The size of disparity-block in the stereo pair subbands are scaling on a coarse-to-fine wavelet coefficients strategy. Finally, the reference left image and residual right image after disparity estimation and compensation are coded by using SPIHT coding. The considered method demonstrates good performance in both PSNR measures and visual quality for stereo image.

  • PDF

PC 기반 MPEG-4 비디오 코덱 구현을 위한 하드웨어 아키텍쳐 (Hardware Architecture for PC-based MPEG-4 Video CODEC)

  • 곽진석;임영권;박상규;김진웅
    • 방송공학회논문지
    • /
    • 제2권2호
    • /
    • pp.86-93
    • /
    • 1997
  • 현재 급속히 성장하고 있는 다양한 멀티미디어 응용 분야들은 기존의 MPEG-1 및 MPEG-2에서는 제공할 수 없는 객체 기반의 영상 표현 및 조작 등의 새로운 기능들을 요구하고 있다. 이러한 기능들을 수용하기 위해 표준화가 진행 중인 MPEG-4 비디오는 하나의 영상을 여러개의 객체들로 분할한 뒤 각각의 영상 객체들을 독립적으로 부호화 함으로써 각 객체에 대한 사용자의 용이한 조작을 허용한다. 반면에 MPEG-4 비디오의 복잡하고 융통성 있는 구조는 VLSI 기술을 이용한 전용 하드웨어의 구현을 매우 어렵게 하며, 프로그램이 가능한 범용 DSP로 구현할 경우에도 높은 압축율을 제공하기 위해 요구되는 많은 계산량으로 인해 성능면에서 큰 제약을 받는다. 본 논문에서는 많은 계산량을 요구하는 동시에 융통성 있는 구조를 갖는 MPEG-4 비디오 코덱을 구현하기 위한 방법으로 프로그램이 가능한 고성능 DSP와 많은 계산량이 요구되는 움직임추정 및 보상을 수행하기 위한 전용 칩으로 구성된 하드웨어 아키텍쳐를 제안한다.

  • PDF

머신 비전을 위한 열 적외선 영상의 객체 기반 압축 기법 (Object-based Compression of Thermal Infrared Images for Machine Vision)

  • 이예지;김신;임한신;추현곤;정원식;서정일;윤경로
    • 방송공학회논문지
    • /
    • 제26권6호
    • /
    • pp.738-747
    • /
    • 2021
  • 오늘날 딥러닝 기술의 향상으로 영상 분류, 객체 탐지, 객체 분할, 객체 추적 등 컴퓨터 비전 분야 또한 큰 발전을 이루고 있다. 지능적 감시, 로봇, 사물 인터넷, 자율주행 자동차 등 딥러닝 기술이 결합된 다양한 응용 기술들은 실제 산업에 적용되고 있으며, 이에 따라 사람의 소비를 위한 영상 데이터 뿐만 아니라 머신 비전을 위한 영상 데이터의 효율적인 압축 방식에 대한 필요성이 대두되고 있다. 본 논문에서는 머신 비전을 위한 열 적외선 영상의 객체 기반 압축 기법을 제안한다. 효율적인 영상 압축과 신경망의 좋은 성능을 유지하기 위해 본 논문에서는 신경망의 객체 탐지 결과와 객체 크기에 따라 입력 영상을 객체 부분과 배경 부분으로 나누어 서로 다른 압축률로 부호화를 수행하는 방법을 제안한다. 제안하는 방법은 VVC로 영상 전체를 압축하는 방식보다 BD-rate 값이 최대 -19.83%로 압축 효율이 뛰어나다는 것을 확인할 수 있다.

저 전송률 비디오 부호화 환경에서 잔상 현상의 제거 기술에 관한 연구 (Trailing Artifact Avoidance for Low Bit-Rate Video Coders)

  • 조용호;이신욱;장의선
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2005년도 추계종합학술대회
    • /
    • pp.327-330
    • /
    • 2005
  • In this paper, we proposed that technique for reducing trailing artifact in MPEG-4 video. low bit-rate video is occured trailng artifact which remain part of moving object. Because MEMC doesn't work well in the degraded video. The proposed trailing artifact reduction approach has at its core three main steps. First step is to detect trailing artifact. Second step is applied intra block coding to remove trailing artifact. Finally, bit-rate control algorithm is used. Experimental result using an MPEG-4 based encoder indicate that the proposed method has overhead(bits) of about 2 percent and proposed method effective reduce or eliminate trailing artifact

  • PDF