• Title/Summary/Keyword: 비디오 기반 기술

Search Result 705, Processing Time 0.028 seconds

실시간 AV 전송을 위한 Audio/Video Bridging 기술

  • Wi, Jeong-Uk;Park, Yong-Seok;Park, Gyeong-Won;Song, Byeong-Cheol;Jeon, Won-Gi
    • Information and Communications Magazine
    • /
    • v.30 no.6
    • /
    • pp.69-76
    • /
    • 2013
  • 최근 홈 네트워크/정보가전 기술의 비약적인 발전과 고품질 멀티미디어 콘텐츠의 보급으로 인해 네트워크 기반의 멀티미디어 전송 시스템에 대한 요구가 증가하고 있다. 이러한 요구로 인해 고품질 오디오, 비디오 데이터를 이더넷 (Ethernet) 망을 이용하여 실시간 전송할 수 있는 Audio Video Bridging(AVB) 기술이 IEEE에서 표준화 되었다. AVB 기술은 네트워크를 통해 오디오 및 비디오 데이터뿐만 아니라, 각 장치들의 제어/관리를 위한 데이터도 동시에 전송할 수 있는 기술이다. 기술 개발 초기에는 네트워크 및 오디오 전문 업체를 중심으로 오디오 전송에 특화된 AoE(Audio over Ethernet) 기술 개발이 주를 이루고 있었으나, AVB 표준화가 완료된 2011년 이후부터 AVB가 적용된 제품이 개발되고 있다. 이에 본 고에서는 네트워크를 통해 멀티미디어 데이터를 전송할 때 필요한 핵심 요소기술과 개발 동향에 대해 살펴보고, IEEE 표준인 AVB 기술에 대해 알아본다.

Wireless Caching Techniques Based on Content Popularity for Network Resource Efficiency and Quality of Experience Improvement (네트워크 자원효율 및 QoE 향상을 위한 콘텐츠 인기도 기반 무선 캐싱 기술)

  • Kim, Geun-Uk;Hong, Jun-Pyo
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.21 no.8
    • /
    • pp.1498-1507
    • /
    • 2017
  • According to recent report, global mobile data traffic is expected to increase by 11 times from 2016 to 2020. Moreover, this growth is expected to be driven mainly by mobile video traffic which is expected to account for about 70% of the total mobile data traffic. To cope with enormous mobile traffic, we need to understand video traffic's characteristic. Recently, the repetitive requests of some popular content such as popular YouTube videos cause a enormous network traffic overheads. If we constitute a network with the nodes capable of content caching based on the content popularity, we can reduce the network overheads by using the cached content for every request. Through device-to-device, multicast, and helpers, the video throughput can improve about 1.5~2 times and prefix caching reduces the playback delay by about 0.2~0.5 times than the conventional method. In this paper, we introduce some recent work on content popularity-based caching techniques in wireless networks.

A Study on Precaching according to Push Technology for Audio and Video Data in NOD(News On Demand) System (NOD 시스템에서 오디오와 비디오 데이터 Push에 따른 Precaching 연구)

  • 박성호;김광문;송기욱;정기동
    • Proceedings of the Korea Multimedia Society Conference
    • /
    • 1998.04a
    • /
    • pp.323-327
    • /
    • 1998
  • 컴퓨터와 통신망 기술의 발전으로 많은 언론 기관에서 전자신문 서비스를 제공하고 있다. 그러나 현재 서비스되는 전자신문은 텍스트 위주의 정적인 정보를 주고 서비스 하며, 사용자가 필요한 정보를 찾아 다니는 pull 기술을 기반으로 서비스한다. 그리고 사용자 맞춤 기능을 제공하기 못하므로, 불필요한 정보를 사용자에게 전송함으로써 시스템 자원을 낭비하는 단점을 가지고 있다. 본 논문에서는 멀티미디어 데이터를 지원하는 NOD(News On Demand)시스템에서 텍스트 데이터 뿐아니라 오디오/비디오 데이터를 push 하므로써 서버의 load를 분배시키고 사용자에게 실시간성을 제공하는 NOD 분배 서버를 설계하고 프로토타입을 구현하였다. 특히 본 논문에서는 대용량 데이터인 오디오/비디오 데이터를 사용자 시스템으로 Push할 때, 사용자 시스템의 디스크 공간상태 등을 고려하여 실시간성을 유지할 수 있는 적정 Push 량을 시뮬레이션을 통해 측정하였다.

  • PDF

플랫폼 형태에 따른 N-Screen 서비스 분류 및 플랫폼 표준화

  • Yun, Yong-Ik
    • Broadcasting and Media Magazine
    • /
    • v.17 no.1
    • /
    • pp.78-85
    • /
    • 2012
  • 무선망과 인터넷 초고속화와 함께 비디오 스트리밍, 모바일 방송, IPTV 등 통방융합 환경에서의 비디오를 중심으로 한 멀티미디어 콘텐츠 서비스가 보편화되고 있다. 이러한, 이종의 접속망과 다양한 성능의 단말이 혼재하는 융합 콘텐츠 소비환경에서 스마트폰, Tablet PC, IPTV 등 다양한 단말기에서 비디오, 음악, 게임, 데이터 등의 콘텐츠를 끊김 없이 이용할 수 있는 서비스를 일반적으로 N-Screen 서비스라고 한다. 이렇게 단말간의 이동성을 제공하기 위해서는 다양한 플랫폼 형태에 따른 N-Screen 서비스 표준화가 필요하다. 또한, 다양한 스마트 스크린간의 끊김 없는 서비스 이용이 가능한 송수신 기술 및 네트워크 자원을 활용하는 서비스들과 인터넷 기반의 서비스들 간의 상호 연계를 위한 기술들의 표준화가 계속 진행되어야 한다. 본고에서는 이러한 차세대 네트워크 환경에서 N-Screen을 위한 플랫폼과 플랫폼 형태에 따른 N-Screen 서비스 분류에 대해 살펴본다.

A Study on Metadata for Images and Videos (이미지 및 비디오 메타데이터에 관한 연구)

  • Im, Eun-Ju;Kim, Seong-Hee
    • Proceedings of the Korean Society for Information Management Conference
    • /
    • 2005.08a
    • /
    • pp.117-124
    • /
    • 2005
  • 이미지와 비디오가 효율적으로 검색되고 이용되기 위해서는 메타데이터가 구조적으로 기술될 필요가 있다. 본 논문에서는 메타데이터 구축 체계의 기반으로 MPEG-7과 Plateau, ViMod에 대해 분석하였다. MPEG-7에서는 저작 및 생산, 이용, 컨텐츠의 구조적, 개념적 측면 등과 같은 다양한 관점에서 시청각 정보가 기술된다. Plateau는 다양한 응용 분야에 적합하도록 모델링 하였기 때문에 모델이 간단명료하고 응용분야에서는 전문성을 띠고 있으나 범용성이 부족하다는 단점이 있다. ViMod는 질의의 특성을 질의의 확실성, 질의의 차원성, 데이터 의존성 관점에서 정지영상과 비디오 영상으로 분류하고 그 하위 레벨을 내용 의존적인 영상과 내용 독립적인 영상으로 분류하였다.

  • PDF

영상과 비디오로부터의 가상 시점 영상 생성 기술

  • Baek, Hyeong-Seon;Park, In-Gyu
    • Broadcasting and Media Magazine
    • /
    • v.26 no.4
    • /
    • pp.11-22
    • /
    • 2021
  • 실감형 미디어를 구성하기 위해서는 다시점 영상 또는 비디오들로 구성된 대용량의 콘텐츠가 필수적이다. 이러한 콘텐츠는 다량의 카메라들을 목적에 따라 배치하여 획득하므로 영상 구성의 복잡성과 콘텐츠의 크기가 급격히 커진다는 문제점을 갖고 있다. 3D 미디어 환경에서 카메라의 개수를 최소화하면서도 목적에 맞게 다양한 시점을 제공할 수 있는 가상시점 영상 생성은 핵심적인 기술이다. 본 기고문에서는 다시점 영상과 비디오로부터 학습 기반의 가상 시점 영상 생성 연구들에 대해 체계적인 조사를 통해 그 결과를 다음과 같이 제시한다. 첫째, 가상 시점 영상 생성에 대한 배경 개념을 정의한다. 둘째, 제안하는 분류 방식에 따라 기존의 제안된 방법들을 상세하게 분석한다. 셋째, 가상 시점 영상 생성에 주로 사용되는 관련 데이터셋을 조사한다. 마지막으로는 각 연구들이 갖고 있는 특징들을 분석하고, 정량적, 정성적 평가 결과를 비교한다.

Pose Estimation Techniques for Humanoid Characters in FPS Gaming Environments (인간 캐릭터 포즈 식별: FPS 게임에서의 포즈 추정 기법)

  • Youjung Han;Minseop Lee;Minsu Cha;Jiyoung Woo
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2024.01a
    • /
    • pp.29-30
    • /
    • 2024
  • 본 논문은 Krafton의 PUBG: BATTLEGROUNDS 게임에서 플레이어 분류를 목표로 하며, 포즈 추정기술을 사용하여 일반 플레이어와 봇을 구분한다. 이는 게임에서 직접 수집한 비디오 데이터를 기반으로 하며, 다음과 같은 두 가지 접근 방식을 제안한다. 첫 번째 방법은 동작 시퀀스 분석을 통해, 사용자의 특정동작 패턴을 식별하고 로지스틱 회귀 모델을 활용해 사용자 유형을 분류한다. 두 번째 방법은 YOLO-pose 모델을 사용하여 비디오 데이터에서 키포인트를 추출하고, 이를 LSTM 모델에 적용하여 프레임별로 사용자의 유형을 분류한다. 이러한 이중 접근 방식은 게임의 공정성과 사용자 경험을 향상시키는 새로운 도구를 제공하며, 보다 안전한 게임 환경에 기여할 수 있다. 이 연구는 게임 산업뿐만 아니라 보안 및 모니터링 분야에서도 동작 분석에 대한 혁신적인 접근 방식으로 활용될 잠재력을 가지고 있다.

  • PDF

Multi-view Video Coding based on Grid-type Pyramid GOP Structure (격자 피라미드 GOP 구조 기반의 다시점 비디오 부호화 방법)

  • Oh, Kwan-Jung;Oh, Han;Ho, Yo-Sung;Choi, Byeong-Ho
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2005.11a
    • /
    • pp.25-28
    • /
    • 2005
  • 디지틸 멀티미디어 시대를 맞이하여 영상통신 기술이 급속히 발전함에 따라 보다 사실감과 몰입감을 줄 수 있는 3차원 입체 영상처리에 대한 관심이 커지고 있다. 최근 국내외 연구기관에서 다차원 멀티미디어 서비스 개발을 위한 연구가 활발히 진행되고 있으며, MPEG 표준화 그룹에서도 H.264/AVC 압축 방법을 이용한 다시점 비디오 부호화(multi-view video coding, MVC) 방법들이 제안되었다. 본 논문에서는 격자 피라미드 GOP 구조 기반의 다시점 비디오 부호화 방법에 대해 기술하였다. 이 방법은 현재 MPEG 표준화 그룹에서 권고된 ‘Anchor’ 방법에서 고려치 못한 인접 시점간의 공간적인 상관도를 효과적으로 활용하기 위해 격자 GOP구조를 제안했고, 각 시점에 대한 효율적인 부호화를 위해 계층적 피라미드 GOP 구조를 이용하였다. 또한, 공간적인 예측의 경우에 시점간의 전체 변이 (global disparity)를 고려하여 가변적인 탐색 범위를 이용하였다. 본 논문에서 제안한 방법은 현재 MPEG에서 성능 평가의 기준이 되는 ‘Anchor’ 방법에 비해 동일 비트율에서 0.5${\sim}$0.8 dB 정도의 성능 향상을 보였다.

  • PDF

multi-scale feature compression for VCM (VCM 을 위한 다중 스케일 특징 압축 방법)

  • Han, Heeji;Choi, Minseok;Jung, Soon-heung;Kwak, Sangwoon;Choo, Hyon-Gon;Cheong, Won-Sik;Seo, Jeongil;Choi, Haechul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.06a
    • /
    • pp.140-142
    • /
    • 2022
  • 최근 신경망 기반 기술들의 발달에 따라, 신경망 기술들은 충분히 높은 임무 수행 성능을 달성하고 있으며 사물인터넷, 스마트시티, 자율주행 등 다양한 환경을 고려한 응용 역시 활발히 연구되고 있다. 하지만 이러한 신경망의 임무 다양성과 복잡성은 더욱 많은 비디오 데이터가 요구되며 대역폭이 제한된 환경을 고려한 응용에서 이러한 비디오 데이터를 효과적으로 전송할 방법이 필요하다. 이에 따라 국제 표준화 단체인 MPEG 에서는 신경망 기계 소비에 적합한 비디오 부호화 표준 개발을 위해 Video Coding for Machines (VCM) 표준화를 진행하고 있다. 본 논문에서는 신경망의 특징 부호화 효율을 개선하기 위하여 VCM 을 위한 다중 스케일 특징 압축 방법을 제안한다. COCO2017 데이터셋의 검증 영상을 기반으로 제안방법을 평가한 결과, 압축된 특징의 크기는 원본 이미지의 0.03 배이며 6.8% 미만의 임무 정확도 손실을 보였다.

  • PDF

Structural similarity based efficient keyframes extraction from multi-view videos (구조적인 유사성에 기반한 다중 뷰 비디오의 효율적인 키프레임 추출)

  • Hussain, Tanveer;Khan, Salman;Muhammad, Khan;Lee, Mi Young;Baik, Sung Wook
    • The Journal of Korean Institute of Next Generation Computing
    • /
    • v.14 no.6
    • /
    • pp.7-14
    • /
    • 2018
  • Salient information extraction from multi-view videos is a very challenging area because of inter-view, intra-view correlations, and computational complexity. There are several techniques developed for keyframes extraction from multi-view videos with very high computational complexities. In this paper, we present a keyframes extraction approach from multi-view videos using entropy and complexity information present inside frame. In first step, we extract representative shots of the whole video from each view based on structural similarity index measurement (SSIM) difference value between frames. In second step, entropy and complexity scores for all frames of shots in different views are computed. Finally, the frames with highest entropy and complexity scores are considered as keyframes. The proposed system is subjectively evaluated on available office benchmark dataset and the results are convenient in terms of accuracy and time complexity.