• 제목/요약/키워드: 비디오 기반 기술

검색결과 705건 처리시간 0.028초

히스토그램 특징과 영역기반의 에지 특징에 의한 장면 전환 검출에 관한 연구 (A study on Scene-Change Detection Using Histogram Characteristic and Region-based Edge Characteristic)

  • 이득재;최기호
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2002년도 추계학술발표논문집
    • /
    • pp.110-113
    • /
    • 2002
  • 통신과 멀티미디어 기술의 발전으로 대용량의 멀티미디어 자료에 대한 효율적인 검색 방법이 대두되고 있다. 본 논문에서 다루고자 하는 동영상 장면전환 검출 연구는 멀티미디어 데이터베이스의 내용기반 비디오 정보검색 및 비디오 데이터 인덱싱 구현의 기반이 되는 첫번째 단계의 핵심적인 분야에 속한다. 비디오 데이터를 내용기반으로 처리 하기 위해서는 우선 비디오데이터를 연속성에 의한 유사 영역으로 분할하여야 한다. 동영상을 분할하기 위한 방법으로 비디오의 불연속점을 찾아내는 장면전환 검출이 널리 사용되어 이에 관한 연구가 활발하게 진행되고 있다. 본 논문에서는 기존의 방법인 히스토그램 방식과 에지검출 방식의 장단점을 비교하고 두 알고리즘의 장점을 혼합한 방식을 제안하였다. 영상을 1차로 히스토그램의 피크값과 계곡특징값을 이용하고 2차로 에지검출 방식으로 두 단계로 나누어 처리하여 속도향상과 정확도를 높이고자 하는 방법을 제안하였다. 그리고 실험을 통하여 기존의 방법들과의 비교 분석을 통하여 성능평가를 하고자 한다.

  • PDF

라이브 비디오 스트리밍을 지원하는 SIP기반 단말기의 소프트웨어 시스템 분석 (Analysis of software system for the SIP-based device supporting live video streaming)

  • 김혜선;황기태;이재문;김남윤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.85-87
    • /
    • 2004
  • 본 논문에서는 라이브 비디오 스트리밍을 지원하는 SIP 기반 단말기의 소프트웨어 구조와 설계에 대해 기술하였다. SiP 기반 단말기의 소프트웨어 시스템 구조를 분석하여 SIP 세션 설정 과정과 비디오 스트리밍 알고리즘을 설명하였으며 향후 연구로 임베디드 환경으로 포팅하기 위해 설계의 정확성을 검증하고 성능 평가를 위한 사전 실험을 수행하였다.

  • PDF

사용자 프로파일을 이용한 적응력 있는 비디오 브라우징 서비스 (Adaptive Video Browsing Service Using User Profile)

  • 고경철;신성윤;임정훈;이양원
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 2001년도 추계학술발표논문집
    • /
    • pp.308-313
    • /
    • 2001
  • 최근 인터넷의 급속한 성장과 빠른 보급, 정보통신 분야의 기술퓨전 현상들은 인터넷을 이용한 다양한 컨텐츠의 개발을 가속화시키고 있다. 특히 멀티미디어 스트리밍 기술은 일반 사용자들에게 동영상은 물론 풍부한 멀티미디어 데이터 전송을 통하여 능동적인 대화형 서비스를 제공할 수 있는 장점들을 가지고 있다. 본 논문에서는 사용자의 접속 횟수 및 접속시간 등의 빈도수에 따른 사용자 개인 가중치를 이용하여 사용자에게 보다 친숙하고 흥미를 유발할 수 있는 비디오 데이터 서비스를 제공하고자 하였으며, 카테고리 기반 및 키워드 기반에 따른 사용자 접근 정보를 이용하여 비디오 데이터를 분류하고 선별한 검색 서비스를 제공하고자 하였다. 또한 비디오 브라우징 시스템을 이용하여 사용자가 원하는 항목에 대한 비디오 검색을 장면 검색에서 샷 검색까지 프레임단위로 동영상을 이용하여 브라우징 할 수 있도록 하였으며, 해당 영역의 텍스트 및 관련 정보를 보다 세밀하고 정확하게 브라우징 할 수 있도록 정보를 제공하고자 하였다.

  • PDF

딥러닝 기반 비디오 캡셔닝의 연구동향 분석 (Analysis of Research Trends in Deep Learning-Based Video Captioning)

  • 려치;이은주;김영수
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제13권1호
    • /
    • pp.35-49
    • /
    • 2024
  • 컴퓨터 비전과 자연어 처리의 융합의 중요한 결과로서 비디오 캡셔닝은 인공지능 분야의 핵심 연구 방향이다. 이 기술은 비디오 콘텐츠의 자동이해와 언어 표현을 가능하게 함으로써, 컴퓨터가 비디오의 시각적 정보를 텍스트 형태로 변환한다. 본 논문에서는 딥러닝 기반 비디오 캡셔닝의 연구 동향을 초기 분석하여 CNN-RNN 기반 모델, RNN-RNN 기반 모델, Multimodal 기반 모델, 그리고 Transformer 기반 모델이라는 네 가지 주요 범주로 나누어 각각의 비디오 캡셔닝 모델의 개념과 특징 그리고 장단점을 논하였다. 그리고 이 논문은 비디오 캡셔닝 분야에서 일반적으로 자주 사용되는 데이터 집합과 성능 평가방안을 나열하였다. 데이터 세트는 다양한 도메인과 시나리오를 포괄하여 비디오 캡션 모델의 훈련 및 검증을 위한 광범위한 리소스를 제공한다. 모델 성능 평가방안에서는 주요한 평가 지표를 언급하며, 모델의 성능을 다양한 각도에서 평가할 수 있도록 연구자들에게 실질적인 참조를 제공한다. 마지막으로 비디오 캡셔닝에 대한 향후 연구과제로서 실제 응용 프로그램에서의 복잡성을 증가시키는 시간 일관성 유지 및 동적 장면의 정확한 서술과 같이 지속해서 개선해야 할 주요 도전과제와 시간 관계 모델링 및 다중 모달 데이터 통합과 같이 새롭게 연구되어야 하는 과제를 제시하였다.

장면 보존적인 뮤직비디오 생성을 위한 다단계 분할 매칭 기법 (Scene Conserved Music Video Generation Using the Multi-Level Segmentation)

  • 윤종철;이인권
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제12권3호
    • /
    • pp.27-33
    • /
    • 2006
  • 뮤직 비디오란 주어진 음악과 비디오가 동기화 된 형태의 창작물을 뜻한다. 기존의 뮤직비디오 제작방식에서는 만들어진 음악을 위해 영상 촬영에 전문적인 촬영 기술을 요구하였다. 본 논문에선 보다 쉬운 뮤직비디오 생성을 위하여 비디오와 음악의 특성을 분석하여 자동적인 뮤직비디오 생성시스템을 소개한다. 두 개체의 연속성을 보장하는 비교를 위해 우리는 각각의 객체의 흐름을 분석하고, 흐름의 유사성을 기준으로 분할하는 기법을 제시한다. 분할된 영상과 음악의 특성 비교를 통한 최적화된 매칭기법을 비롯하여, 보다 다양한 조각 생성을 위한 다중 레벨(multi-level)분할 기반의 매칭 기법을 소개한다. 본 논문의 기술을 사용하여, 일반인이 홈비디오 등을 사용하여 손쉽게 뮤직 비디오를 제작할 수 있다.

  • PDF

다중레벨(Multi-Level) 분할 매칭을 이용한 뮤직비디오 자동 생성 (Automatic Music Video Generation using the multi-level temporal segment matching)

  • 윤종철;이인권
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 한국컴퓨터종합학술대회 논문집 Vol.33 No.1 (A)
    • /
    • pp.94-96
    • /
    • 2006
  • 뮤직 비디오란 주어진 음악과 비디오가 동기화 된 형태의 창작물을 뜻한다. 기존의 뮤직비디오 제작방식에서는 만들어진 음악을 위해 영상 촬영에 전문적인 촬영 기술을 요구하였다. 본 논문에선 보다 쉬운 뮤직비디오 생성을 위하여 비디오와 음악의 특성을 분석하여 자동적인 뮤직비디오 생성시스템을 소개한다. 두 개체의 연속성을 보장하는 비교를 위해 우리는 각각의 객체의 흐름을 분석하고, 흐름의 유사성을 기준으로 분할하는 기법을 제시한다. 분할된 영상과 음악의 특성 비교를 통한 최적화된 매칭기법 을 비롯하여 보다 다양한 조각 생성을 위한 다중 레벨(multi-level)분할 기반의 매칭 기법을 소개한다. 본 논문의 기술을 사용하여, 일반인이 홈비디오 등을 사용하여 손쉽게 뮤직비디오를 제작할 수 있다.

  • PDF

디지털미디어프로세서 기반의 지능형 비디오 감시 시스템 구현 (Implementation of an Intelligent Video Surveillance System based on Digital Media Processor)

  • 김원호
    • 한국산학기술학회논문지
    • /
    • 제11권3호
    • /
    • pp.841-846
    • /
    • 2010
  • 본 논문은 지능형 비디오 감시 시스템의 설계 및 구현에 대하여 기술한다. 지능형 비디오 감시 시스템은 기존 CCTV를 활용한 비디오 감시 시스템에 비해 운영의 효율성이 뛰어나며 야간, 날씨 등의 운영환경에 무관하게 동작하는 장점을 가지고 있다. 시스템의 하드웨어는 디지털 미디어 프로세서와 비디오 인코더, 비디오 디코더 칩을 기반으로 설계하고 구현하였으며, 소프트웨어는 적외선 영상의 온도분포를 분석하고 화재와 같은 재난 상황을 실시간으로 검출하는 알고리즘을 구현하였다. 구현된 시제품의 시험 평가 결과, 제시된 요구 기능을 모두 만족하였으며 시스템의 실용성을 확인하였다.

생물학적 바이러스를 이용한 비디오 콘텐츠의 전염성 정보은닉 시스템 모델링 (Modeling of Infectious Information Hiding System for Video Contents using the Biological Virus)

  • 장봉주;이석환;권기룡
    • 전자공학회논문지CI
    • /
    • 제49권3호
    • /
    • pp.34-45
    • /
    • 2012
  • 본 논문은 생물학적 바이러스의 특성과 감염 경로 및 감염 절차를 이용한 전염성 정보은닉(infectious information hiding, IIH) 기술 기반의 비디오 콘텐츠 보호 시스템을 제안한다. 제안한 IIH 시스템에서는 비디오 콘텐츠 보호에 필요한 중요 정보들을 전염성 바이러스로 간주하며, 콘텐츠 및 코덱을 숙주 및 감염 매개체로 하는 새로운 패러다임의 비디오 콘텐츠 보호 기술을 제시하였다. 전염성 정보로써 병원체, 돌연변이 및 감염체 바이러스를 모델링 하였으며, 주요 기술도구로써 전염성 정보 인증, 커널 기반 IIH, 콘텐츠 기반 IIH 및 전염성 정보 생성 기술도구들을 정의하였다. 마지막으로 기존의 간단한 정보은닉 알고리즘들을 각각 커널기반 IIH 및 콘텐츠 기반 IIH로 간주하여 시뮬레이션 함으로써 제안한 IIH 시스템의 가능성을 검증하였다.

ATSC 3.0 LDM 및 스케일러블 비디오 코덱 기반 차세대 지상파 방송의 성능 비교 및 분석 (Performance Evaluation of ATSC 3.0 LDM and Scalable Video Codec Based Next Generation Terrestrial Broadcasting Systems)

  • 이재영;권선형;박성익;임보미;허남호;김흥묵
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 하계학술대회
    • /
    • pp.133-134
    • /
    • 2017
  • 본 논문에서는 차세대 방송 표준 ATSC (Advanced Television Systems Committee) 3.0 기반 LDM (Layered Division Multiplexing) 및 스케일러블 비디오 코덱 (Scalable Video Codec) 을 활용한 지상파 방송시스템 기술을 살펴보고 그 성능을 비교 분석한다. 코어 레이어 (Core Layer)와 인핸스드 레이어 (Enhanced Layer)로 구성된 LDM 기반 PLP (Physical Layer Pipe)에, 스케일러블 비디오 코딩이 적용된 베이스 레이어 (Base Layer)와 인핸스먼트 레이어 (Enhancement Layer) 스트림을 각각 전송함으로써 하나의 RF 채널에 두 개 이상의 서비스를 전달할 경우 채널 효율을 극대화 할 수 있다. 본 논문에서는 이동 및 고정용 서비스, 즉 두 개의 서비스를 전송할 때 제안된 LDM 및 스케일러블 비디오 코덱을 사용한 기술과 TDM (Time Division Multiplexing) 및 Simulcast 를 적용한 기술과의 성능 비교를 통해 제안된 기술의 우수성을 검증하고자 한다.

  • PDF

ATM 망에서의 마코프 모델기반 VBR MPEG 비디오 트래픽 기술자에 대한 새로운 Policing 방법 (A New Policing Method for Markovian Traffic Descriptors of VBR MPEG Video Sources over ATM Networks)

  • 유상조;홍성훈;김성대
    • 한국통신학회논문지
    • /
    • 제25권1A호
    • /
    • pp.142-155
    • /
    • 2000
  • 본 논문에서는 VBR MPEG 비디오 트래픽의 마코프 모델 기반 트래픽 기술자에 대해 효과적인 policing 방법을 제안한다. VBR 비디오 스퀀스에 대해 보다 효율적이고 정확한 자원할당 및QoS 예측을 위해 장면기반 마코프 모델을 이용한 트래픽 기술자를 사용하여 망에 그 트래픽 특성를 기술하고, 망에서는 이를 근거로 제안된 새로운 policing 알고리즘을 이용하여 모니터링을 수행한다. 마코프 모델의 안정상태 천이확률의 감시를 위해 장면상태 마다 대표성을 갖는 두 가지 감시 파라미터(평균 체류시간 및 평균 회귀시간)를 정의하여 이를 누적 평균의 형태로 모니터링 한다. 또한 장면상태의 프레임 타입별 평균 셀 발생률도 누적 평균을 이용하여 안정상태 값과 비교된다. Transient 구간에서의 변이를 고려하여 지수함수를 이용한 bounding 방법을 제시하였고, 이는 실제 비디오 시퀀스에 잘 맞는 것을 알 수 있다. 실험결과 미코프 모델 기반 트래픽 기술자에 대해 제안된 방법은 MPEG 비디오와같은 매우 복잡한 트래픽에 대해서도 효과적인 모니터링이 가능하며 부적합 트래픽에 대해서도 좋은 감시성능을 보임을 알 수 있다.

  • PDF