• 제목/요약/키워드: performance video

검색결과 2,476건 처리시간 0.029초

16K 초고화질 360도 영상에서의 사용자 시점 기반 타일 스트리밍 성능 검증 (Performance Analysis of Viewport-dependent Tiled Streaming on 16K Ultra High-quality 360-degree Video)

  • 정종범;이순빈;김인애;류은석
    • 인터넷정보학회논문지
    • /
    • 제22권3호
    • /
    • pp.1-8
    • /
    • 2021
  • 가상 현실 공간에서 head-mounted display(HMD)를 통한 실감형 미디어를 제공하기 위해서는 초고화질 및 초고해상도의 전방위 360도 영상 전송이 필요하고, 이는 높은 대역폭 및 연산량을 요구한다. 이를 극복하기 위해 360도 영상에 대한 타일 기반 분할 기법을 사용하여 사용자 시점 기반 선택적 스트리밍 기법이 사용될 수 있다. 본 논문은 16K 초고화질 360도 영상 및 종래에 널리 쓰이는 4K 360도 영상에서의 사용자 시점 기반 타일 스트리밍 기법의 성능 평가를 소개한다. 16K 초고화질 360도 영상에 타일 스트리밍 기법을 적용하였을 때, 영상 전체 부호화 및 전송 방법 대비 42.47%의 bjotegaard delta rate(BD-rate) 절감을 확인하였고, 4K 360도 영상 타일 스트리밍 시 26.41%의 BD-rate 절감이 이루어지는 것을 확인하였다. 따라서, 타일 스트리밍이 초고해상도 영상에 더 효율적임을 확인하였다.

VOD 시스템에서의 가변 비트율 MPEG 비디오 저장 및 검색 기법의 성능 평가 (Performance Evaluation of VBR MPEG Video Storage and Retrieval Schemes in a VOD System)

  • 전용희;박정숙
    • 한국멀티미디어학회논문지
    • /
    • 제4권1호
    • /
    • pp.13-28
    • /
    • 2001
  • 주문형 비디오 시스템에서, 비디오 데이터는 일반적으로 자기 디스크 배열에 저장된다. 데이터 검색을 위한 실시간 요구사항을 제공하기 위하여 연속적인 매체의 전달이 시간적으로 보장되도록 비디오 스트림들이 클라이언트들에게 연속적으로 전달되어야 한다. 프로세서와 네트워크의 증가된 성능에 비교하면, 자기 디스크 시스템의 성능은 단지 약간만 개선되었을 뿐이다. 저장 시스템의 성능을 개선하기 위하여 더스크 배열 시스템이 제안되어 사용되고 있다. 배열 시스템은 디스크들을 병렬로 배치하고 데이터를 동시에 검색함으로써 입출력 성능을 개선한다. 본 논문에서는, VOD 시스템에서의 비디오 데이터를 접근하기 위하여 고정 시간 길이(CTL : Constant Time Length)와 고정 데이터 길이 (CDL: Constant Data Length) 두 가지 액세스 정책을 고려하였다. 디스크 스케줄링 정책도 그 두 개의 범주로 분류하고, 데이터 액세스 정책과 디스크 스케줄링 정책을 동시에 고려한 통합 환경에서, 디스크 배열의 동기화 정도에 따른 최대 허용 비디오 스트림수에 대하여 비교하였다. 비교된 스케쥴링 정책 중에서 LOOK이 제일 우수함을 보여주고 있고, 동기화 정도별로는 동기화가 커질수록 이득이 있었다. CTL과 CDL의 성능 비교에서는 CTL이 최대 허용 스트림 수 측면에서 약간 우수한 성능을 보여줌을 확인할 수 있었다.

  • PDF

패킷 손실시 H.264 SVC의 무기준법 영상 화질 평가 방법 (No-Referenced Video-Quality Assessment for H.264 SVC with Packet Loss)

  • 김현태;김요한;신지태;원석호
    • 한국통신학회논문지
    • /
    • 제36권11C호
    • /
    • pp.655-661
    • /
    • 2011
  • 다양한 네트워크 환경에서 적응적인 서비스 품질을 제공할 수 있는 H.264 SVC 전송에 대한 연구가 활발하다. 본 논문은 H.264 SVC의 무기준법 객관적 화질 평가 방법으로서, H.264 SVC의 계층성을 이용한 품질 평가 지표를 제안한다. 제안하는 지표는 패킷 손실의 위치에 따라 움직임 벡터, 계층적 예측 구조에 의한 에러 전파 패턴, 양자화 파라미터, 영향을 받은 영상프레임 수 등 에러를 반영한 인지적 화질 평가를 예측한다. 제안하는 품질평가 지표는 사람의 인지적인 영상 품질을 반영한 객관적 지표이며 이 지표를 주관적 화질평가 결과인 DMOS와의 상관관계를 통해 성능을 검증하였다.

Extracting Graphics Information for Better Video Compression

  • Hong, Kang Woon;Ryu, Won;Choi, Jun Kyun;Lim, Choong-Gyoo
    • ETRI Journal
    • /
    • 제37권4호
    • /
    • pp.743-751
    • /
    • 2015
  • Cloud gaming services are heavily dependent on the efficiency of real-time video streaming technology owing to the limited bandwidths of wire or wireless networks through which consecutive frame images are delivered to gamers. Video compression algorithms typically take advantage of similarities among video frame images or in a single video frame image. This paper presents a method for computing and extracting both graphics information and an object's boundary from consecutive frame images of a game application. The method will allow video compression algorithms to determine the positions and sizes of similar image blocks, which in turn, will help achieve better video compression ratios. The proposed method can be easily implemented using function call interception, a programmable graphics pipeline, and off-screen rendering. It is implemented using the most widely used Direct3D API and applied to a well-known sample application to verify its feasibility and analyze its performance. The proposed method computes various kinds of graphics information with minimal overhead.

A Method for Identification of Harmful Video Images Using a 2-Dimensional Projection Map

  • Kim, Chang-Geun;Kim, Soung-Gyun;Kim, Hyun-Ju
    • Journal of information and communication convergence engineering
    • /
    • 제11권1호
    • /
    • pp.62-68
    • /
    • 2013
  • This paper proposes a method for identification of harmful video images based on the degree of harmfulness in the video content. To extract harmful candidate frames from the video effectively, we used a video color extraction method applying a projection map. The procedure for identifying the harmful video has five steps, first, extract the I-frames from the video and map them onto projection map. Next, calculate the similarity and select the potentially harmful, then identify the harmful images by comparing the similarity measurement value. The method estimates similarity between the extracted frames and normative images using the critical value of the projection map. Based on our experimental test, we propose how the harmful candidate frames are extracted and compared with normative images. The various experimental data proved that the image identification method based on the 2-dimensional projection map is superior to using the color histogram technique in harmful image detection performance.

An Optimized e-Lecture Video Search and Indexing framework

  • Medida, Lakshmi Haritha;Ramani, Kasarapu
    • International Journal of Computer Science & Network Security
    • /
    • 제21권8호
    • /
    • pp.87-96
    • /
    • 2021
  • The demand for e-learning through video lectures is rapidly increasing due to its diverse advantages over the traditional learning methods. This led to massive volumes of web-based lecture videos. Indexing and retrieval of a lecture video or a lecture video topic has thus proved to be an exceptionally challenging problem. Many techniques listed by literature were either visual or audio based, but not both. Since the effects of both the visual and audio components are equally important for the content-based indexing and retrieval, the current work is focused on both these components. A framework for automatic topic-based indexing and search depending on the innate content of the lecture videos is presented. The text from the slides is extracted using the proposed Merged Bounding Box (MBB) text detector. The audio component text extraction is done using Google Speech Recognition (GSR) technology. This hybrid approach generates the indexing keywords from the merged transcripts of both the video and audio component extractors. The search within the indexed documents is optimized based on the Naïve Bayes (NB) Classification and K-Means Clustering models. This optimized search retrieves results by searching only the relevant document cluster in the predefined categories and not the whole lecture video corpus. The work is carried out on the dataset generated by assigning categories to the lecture video transcripts gathered from e-learning portals. The performance of search is assessed based on the accuracy and time taken. Further the improved accuracy of the proposed indexing technique is compared with the accepted chain indexing technique.

영화 비디오를 위한 클러스터링 기반의 계층적 장면 구조 구축 (Clustering-based Hierarchical Scene Structure Construction for Movie Videos)

  • 최익원;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권5호
    • /
    • pp.529-542
    • /
    • 2000
  • 최근 들어 멀티 미디어 정보의 사용이 급격히 증가하면서, 여러 미디어 형태 중 비디오가 많은 각광을 받으며, 다른 타입의 모든 미디어 정보를 하나의 자료 흐름으로 묶고 있다. 디지털 비디오의 실용 가능성은 크게 증대되고 있으나 비디오의 방대한 길이와 비구조적 형식 때문에 효과적인 비디오의 접근은 어려운 실정이다. 따라서 최근에 개발되는 영상과 비디오 정보 관리 시스템은 본 논문에서 제안하는 사용자의 최소 상호 작용과 비디오 구조의 명확한 정의를 필요로 한다. 본 논문에서는 사용자가 쉽게 비디오 내용을 요약한 형태로 보고, 임의로 접근 할 수 있도록 클러스터링 기반 비디오 계층 구조 구축 시스템을 제시한다. 제안된 시스템은 크게 샷 경계면 검출과 계층 구조 구축 단계로 이루어진다. 샷 경계면 검출 단계에서는 복수 특징들을 추출하고, 이웃한 프레임 쌍들에 대한상호관계를 고려한 시간 적응적 필터링 기법을 이용하여 오판될 수 있는 왜곡 성분을 제거함으로써 성능을 향상시켰다. 처리된 복수 특징들은 임계치를 필요로 하지 않는 k-means 클러스터링의 입력으로 사용되어 샷 경계면을 검출한다. 결과인 순차적인 샷 리스트는 시간 지역성과 장면 구조를 효과적으로 모델링하는 특성을 가진 지능적 비감독 클러스터링 기법에 의해 계층 구조로 표현된다. 실험은 정적 영화 비디오와 동적 영화 비디오를 대상으로 수행하였으며, 샷 경계면 검출에서는 평균적으로 95%의 정확성을 보였으며 장면 경계면 검출을 하는 비디오 계층 구조 구축에서도 어느 정도 정확한 장면 경계면 검출 결과를 보였다.

  • PDF

신경망 기반 비디오 압축을 위한 레이턴트 정보의 방향 이동 및 보상 (Latent Shifting and Compensation for Learned Video Compression)

  • 김영웅;김동현;정세윤;최진수;김휘용
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.31-43
    • /
    • 2022
  • 전통적인 비디오 압축은 움직임 예측, 잔차 신호 변환 및 양자화를 통한 하이브리드 압축 방식을 기반으로 지금까지 발전해왔다. 최근 인공 신경망을 통한 기술이 빠르게 발전함에 따라, 인공 신경망 기반의 이미지 압축, 비디오 압축 연구 또한 빠르게 진행되고 있으며, 전통적인 비디오 압축 코덱의 성능과 비교해 높은 경쟁력을 보여주고 있다. 본 논문에서는 이러한 인공 신경망 기반 비디오 압축 모델의 성능을 향상시킬 수 있는 새로운 방법을 제시한다. 기본적으로는 기존 인공 신경망 기반 비디오 압축 모델들이 채택하고 있는 변환 및 복원 신경망과 엔트로피 모델(Entropy model)을 이용한 율-왜곡 최적화(Rate-distortion optimization) 방법을 사용하며, 인코더 측에서 디코더 측으로 압축된 레이턴트 정보(Latent information)를 전송할 때 엔트로피 모델이 추정하기 어려운 정보의 값을 이동시켜 전송할 비트량을 감소시키고, 손실된 정보를 추가로 전송함으로써 손실된 정보에 대한 왜곡을 보정한다. 이러한 방법을 통해 기존의 인공 신경망 기반 비디오 압축 기술인 MFVC(Motion Free Video Compression) 방법을 개선하였으며, 실험 결과를 통해 H.264를 기준으로 계산한 BDBR (Bjøntegaard Delta-Bitrate) 수치(%)로 MFVC(-14%) 보다 두 배 가까운 비트량 감축(-27%)이 가능함을 입증하였다. 제안된 방법은 MFVC 뿐 아니라, 레이턴트 정보와 엔트로피 모델을 사용하는 신경망 기반 이미지 또는 비디오 압축 기술에 광범위하게 적용할 수 있다는 장점이 있다.

동영상 내용 분석을 위한 관심 객체 추출 (Segmentation of Objects of Interest for Video Content Analysis)

  • 박소정;김민환
    • 한국멀티미디어학회논문지
    • /
    • 제10권8호
    • /
    • pp.967-980
    • /
    • 2007
  • 동영상에서의 관심 객체를 추출하는 것은 비디오 내용 분석과 비디오 검색 및 압축의 성능을 개선시키는데 큰 역할을 한다. 관심 객체는 단순히 사람 눈의 시선을 끄는 대상물이 아니라 내용전개의 중심이 되거나 제작자가 표현하려고 하는 핵심 객체를 의미한다. 이러한 관심 객체는 움직이는 객체뿐만 아니라 정지해 있는 객체도 될 수 있으나, 사람의 관심을 절차적으로 표현하는 것이 어렵기 때문에 관심 객체를 명확하게 정의하기가 곤란하다. 이에, 본 논문에서는 동영상 샷에서의 움직이는 객체의 위치, 크기, 움직임 패턴의 변화에 대한 조건을 정의하여 필터링에 의해 사람의 관심을 끄는 움직임 관심 객체를 추출하는 방법을 제시하고, 아울러 동영상 샷에서 정지되어 있는 객체에 대해서도 컬러/텍스처 특이성, 위치, 크기, 출현 빈도 등에 대한 조건을 정의하여 정지 관심 객체도 추출할 수 있는 방법을 제안한다. 제안한 방법을 50개의 동영상 샷에 대하여 실험한 결과, 사람이 선정한 움직임 및 정지 관심 객체를 84% 정도 추출할 수 있음을 확인할 수 있었다.

  • PDF

무선 네트워크에서 요구되는 평균 최대 신호 대 잡음비와 수신 비디오 데이터양을 고려하는 스케일러블 비디오 코딩 계층 선택 (Selection of Scalable Video Coding Layer Considering the Required Peak Signal to Noise Ratio and Amount of Received Video Data in Wireless Networks)

  • 이현노;김동회
    • 디지털콘텐츠학회 논문지
    • /
    • 제17권2호
    • /
    • pp.89-96
    • /
    • 2016
  • 비디오 부호화 기술 중 하나인 스케일러블 비디오 코딩은 공간적, 시간적, 화질적 스케일러빌리티를 조합함으로써 다양한 프레임율과 해상도 및 화질을 가지는 비디오 스트림을 생성할 수 있다. 상기의 스케일러블 비디오 코딩-부호화된 비디오 스트림은 하나의 기본계층과 다수의 향상계층을 이루고 있고 무선 기지국은 변화하는 무선 네트워크 환경에서 수신 단말들의 수신 전력에 따라서 적합한 계층을 선택하여 전송하기 때문에 스케일러블 비디오 코딩을 지원하는 수신 단말들은 자신의 수신 전력 상태에 따라 적합한 해상도 및 화질을 가지는 영상을 수신하여 볼 수 있다. 본 논문에서는 모의실험을 통하여 케일러블 비디오 코딩 계층 수에 따른 수신전력, 패킷 손실률, 최대 신호 대 잡음비, 비디오 화질 레벨, 수신 비디오 데이터의 양들에 대한 성능 분석을 수행한 후에 요구되는 최대 신호 대 잡음비를 만족하면서도 수신 비디오 데이터양을 최소화하는 비디오 계층 수를 선택하는 효율적인 방법을 제안한다.