• 제목/요약/키워드: Video abstraction

검색결과 24건 처리시간 0.023초

동영상 요약 및 검색 시스템 (Full Motion Video Abstraction and Search System)

  • 정진국;박주현;낭종호;김경수;하명환;정병희
    • 방송공학회논문지
    • /
    • 제7권2호
    • /
    • pp.114-125
    • /
    • 2002
  • 자동으로 동영상을 요약하는 알고리즘과 고급 수준 내용 정보를 자동으로 추출하는 알고리즘은 현재 많은 연구가 진행되어 왔다. 하지만 동영상 요약이라는 것은 사용자의 특성에 따라 다양하게 나타날 수 있고, 고급 수준 내용 정보를 자동으로 추출하는 알고리즘 또한 100% 정확한 것은 아니기 때문에 이를 수정할 수 있는 도구가 필요하게 된다. 본 논문에서는 자동 알고리즘 수행 및 수동으로 수정할 수 있는 기능을 제공하기 위한 동영상 요약 및 검실 시스템을 구현했다. 동영상 요약 및 검색 시스템은 크게 서버 부분과 클라이언트 부분으로 나눌 수 있는데 서버 부분은 동영상을 요약하여 작은 동영상 파일을 만드는 부분과 검색을 위해 메타 데이터를 입력할 수 있는 부분으로 구성이 된다. 메타 데이터는 육하원칙에 따라 입력할 수 있도록 하였다. 클라이언트 부분은 서버에 의해 저장된 메타 데이터들을 이용하여 검색할 수 있는 부분과 동영상을 동적으로 요약하기 위한 부분으로 구성이 된다. 동영상 요약 부분은 MPEG-7 의 Summary Description Scheme에 맞추어서 서술된다. 본 논문에서 구현된 동영상 요약 및 검색 시스템은 대용량의 멀티미디어 데이터를 사용하는 경우 유용하게 쓰일 수 있을 것이다.

사용자의 요구를 반영하는 동영상 요약 알고리즘 (A Video Abstraction Algorithm Reflecting Various Users Requirement)

  • 정진국;홍승욱;낭종호;하명환;정병희;김경수
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제30권7_8호
    • /
    • pp.599-609
    • /
    • 2003
  • 자동으로 동영상을 요약하는 알고리즘은 다양한 방향으로 진행되어 왔다. 하지만 이러한 알고리즘들은 한가지 저금수준 내용정보만을 이용하여 동영상을 요약하였기 때문에 요약하는 사용자의 주관을 반영할 수 없다는 단점이 있다. 즉, 동영상 요약이라는 것은 내용에 대한 전반적인 이해에 바탕을 두고 중요한 샷을 선택하는 것이라고 정의할 수 있는데 이 경우에 중요한 샷이라고 결정하는 것은 요약자의 주관에 따라 달라질 수 있기 때문에 사용자의 주관을 반영한 수 없다는 것은 큰 단점으로 대두될 수 있다. 본 논문에서는 사용자의 요구를 반영하는 동영상 요약 알고리즘을 제시한다. 알고리즘에서는 일반적으로 많이 사용하는 동영상 요약에 대한 목적함수와 이들에 대한 가중치를 이용한다. 본 논문에서는 동영상 요약을 목적함수를 극대화 시킬 수 있는 샷들의 집합으로 정의하는데 이 경우 문제점으로 제시될 수 있는 것이 계산량이 많다는 것이다. 즉, n개의 샷을 가진 동영상에 대하여 2$^n$번의 계산량이 필요하기 때문에 전체 알고리즘의 수행 시간이 많아지는 것이다. 본 논문에서는 이러한 문제점을 해결하기 위하여 빠른 시간에 근사 샷들의 집합을 구할 수 있는 Simulated Annealing 알고리즘을 이용하였다. 실험 결과에 의하면 본 논문의 알고리즘은 요약자의 주관을 반영시킬 수 있고, Simulated Annealing 을 이용하여 빠른 시간에 원하는 요약을 할 수 있음을 확인하였다. 본 논문의 알고리즘은 동영상을 대상으로 하는 디지털 비디오 라이브러리와 같은 응용 분야에 이용할 수 있을 것이다.

장면전환검출을 이용한 교양비디오 개요 검색 시스템 (The Abstraction Retrieval System of Cultural Videos using Scene Change Detection)

  • 강오형;이지현;이양원
    • 정보처리학회논문지B
    • /
    • 제12B권7호
    • /
    • pp.761-766
    • /
    • 2005
  • 본 논문에서는 교양 비디오 데이터베이스 시스템을 구축하기 위한 비디오 모델을 제안한다. 먼저, 교양 비디오의 효율적인 색인화와 검색을 위하여 교양 비디오를 의미 있는 단위로 분할하는 효율적인 장면 전환 검출 기법을 사용하였다 비디오가 대용량이며 장시간의 재생이 필요하다는 특징 때문에 전체 비디오를 시청해야하는 문제점이 있다. 이 문제점을 해결하기 위해 교양 비디오의 개요를 추출하여 시청자들에게 시간을 절약할 수 있고, 비디오 선택의 폭을 넓히도록 하였다. 비디오 개요는 개요 생성 규칙을 설정하여 중요 이벤트가 발생한 장면들을 요약한 형태이다.

동영상 복사본 검출을 위한 MPEG-7 Video Signature 성능분석 (Analyzing Performance of MPEG-7 Video Signature for Video Copy Detection)

  • 유정수;류재석;낭종호
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제20권11호
    • /
    • pp.586-591
    • /
    • 2014
  • 최근 언제 어디서든 동영상 컨텐츠에 접근할 수 있게 됨으로써 배포된 영상은 쉽게 복사되고, 변형되고 재배포 되어 저작권 보호에 취약하다는 문제점을 내포하고 있다. 따라서 비디오 복사본의 유사도를 검출하고 측정하는 방법들이 요구되어진다. 본 논문에서는 복사본 검출 기술 중 MPEG에서 표준화 한 MPEG-7 Video Signature를 이용하여 다양한 변화를 갖는 동영상에서의 다양한 분별력 분석을 하였다. MPEG-7 Video Signature는 블록기반의 추상화 방식이므로 동영상의 영역 변화에 대해서 취약할 것이라고 가정하고 실험하였다. 분석한 결과 실제로 영역변화에 대해서 일반적으로 일어날 수 있는 강도에서도 매우 취약함을 볼 수 있었다.

샷의 타입을 이용한 뉴스 아카이브 시스템의 설계 및 구현 (Design and Implementation of a news Archive System using Shot Types)

  • 한근주;낭종호;하명환;정병희;김경수
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제7권5호
    • /
    • pp.416-428
    • /
    • 2001
  • 뉴스 아카이브 시스템을 구축하기 위하여서는 먼저 뉴스 비디오 스트림을 기사 단위로 인덱싱하고, 사용자가 기사 비디오를 모두 시청하지 않아도 그 내용을 이해할 수 있도록 하는 추상화 방법이 필요하다. 본 논문에서는 뉴스 비디오 스트림에 대하여 샷 타입을 이용하여 기사 단위로 인덱싱할 수 있는 새로운 기사 경계 검출 방법 및 기사 추상화 방법을 제안하다. 제안한 인덱싱 방법에서는 뉴스 비디오의 샷들을 앵커 샷, 인터뷰 샷, 연설 샷, 보도 샷, 그래픽 자료 샷 등으로 나눈다. 모든 기사는 앵커 샷으로 시작하고, 앵커 샷은 다른 샷에 비하여 길이가 길고 특별한 화면 구조를 가지고 있기 때문에 이를 이용하여 기사 단위의 인덱싱을 수행한다. 또한 각 기사에 대한 효과적인 추상화를 위하여 앵커 샷의 오른쪽 위에 있는 그래픽 데이타와 기사를 이루는 다른 샷들의 키 프레임들을 이용한 기사 포스터를 구성하는 방법을 제안하였다. 여러 종류의 뉴스 비디오 스트림에 대한 실험 결과에 의하면 본 논문에서 제안한 기사 경계 검출 알고리즘의 검출율(recall) 및 정확도 (precision)값이 각각 0.92 및 0.96 이상 됨을 알 수 있다. 또한 본 논문에서는 WWW상에서 수행되는 뉴스 아카이브 시스템의 프로토타입 시스템의 설계 및 구현에 대하여서도 설명한다.

  • PDF

대화형 방송 환경을 위한 동적 비디오 요약 (Dynamic Video Abstraction for Interactive Broadcasting Applications)

  • 김재곤;장현성;김진웅
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 1999년도 KOBA 방송기술 워크샵
    • /
    • pp.103-108
    • /
    • 1999
  • 방송 환경의 디지털화와 더불어 단순히 단방향 방송 정보만을 시청하던 기존의 방식을 넘어 사용자의 다양한 욕구를 수용할 수 있는 대화형 방송 서비스(interactive broadcasting service)가 시작되고 있다. 대화형 방송 환경에서는 특히 사용자 측에 제공된 방대한 양의 디지털 멀티미디어 자료에 대한 효과적인 접근이 요구되는데, 본 논문에서는 이를 위하여 방송 비디오를 효과적으로 브라우징(browsing) 및 검색하고 전체의 내용을 짧은 시간 내에 개관할 수 있도록 하는 동적 비디오 요약(dynamic video abstraction) 기법에 관하여 고찰한다. 동적 비디오 요약에 의한 요약 비디오(skim video)는 전체 비디오를 내용에 기반하여 효과적으로 표현할 수 있도록 동영상 내의 주요 구간만으로 구성된 것으로, 대화형 방송에서 새로운 형태의 프로그램 안내 및 사용자 저장 자료에 대한 브라우징 도구 등으로써 매우 유용하게 사용할 수 있다. 본 논문에서는 자동으로 비디오 요약을 구현하기 위한 접근 방법과 전체 기능 구성 및 각 기능들의 구현 방법에 대하여 기술한다.

  • PDF

폭발장면 자동 검출을 위한 저급 수준 비디오 특징의 추상화 (Abstraction Mechanism of Low-Level Video Features for Automatic Retrieval of Explosion Scenes)

  • 이상혁;낭종호
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제28권5호
    • /
    • pp.389-401
    • /
    • 2001
  • 본 논문에서는 MPEG형식의 영화 데이터를 대상으로 폭발 장면 자동 추출을 위한 저급 수준 비디오 내용정보의 추상화 방법을 제안하고, 실제 구현을 통하여 그 유용성을 보인다. 제안한 추상화 방법은 폭발시 발생하는 불꽃의 색이 노란색 톤을 가진다는 사실과, 불꽃이 나타나는 프레임은 같은 tit에 속하는 이웃한 프레임과는 화면 구성이 달라지게 되므로 움직임 에너지 값이 커지게 된다는 사실을 바탕으로 한다. 이를 위해서 샷 단위의 인덱싱을 자동적으로 수행하고 각 샷의 첫 번째 프래임을 키 프레임으로 하다. 이를 위해서 샷 단위의 인덱싱을 자동적으로 수행하고 각 샷의 첫 번째 프레임을 키 프레임으로 선택한 후 영역별 주 색깔(Dominant Color)를 추출한다. 이때 색 공간은 양자화를 통한 512색 중 노란색 톤을 가지는 48 색 범위로 정의한다. 이후 매 샷마다 첫 번째 프레임과 이웃한 프레임의 에지 이미지(Edge Image)를 추출하여 이들의 차이로써 움직임 에너지(Motion Energy)를 얻는다. 이 두 가지 정보, 즉 노란색 톤을 가지는 색 정보와, 같은 장면 내의 다른 샷의 움직임 에너지에 비해 큰 값의 움직임 에너지를 갖는 샷을 폭발장면이 포함된 장면으로 검출한다. 실험 결과에 의하면 검색 결과는 주어진 임계값에 의존적이나, Recall과 Precision에서 80% 이상의 검출률을 보이고 있다. 그러나 일반적인 폭발 장면은 찾기에는 노란색 불꽃을 보이지 않는 예외적인 경우가 발생하여 이를 추출하는데 어려움이 있었다. 앞으로 이러한 문제점등은 기존의 오디오 정보를 이용한 폭발 장면 검출 방법과 함께 이용함으로써 해결되어질 수 있을 것이다.

  • PDF

A Practical RTP Packetization Scheme for SVC Video Transport over IP Networks

  • Seo, Kwang-Deok;Kim, Jin-Soo;Jung, Soon-Heung;Yoo, Jeong-Ju
    • ETRI Journal
    • /
    • 제32권2호
    • /
    • pp.281-291
    • /
    • 2010
  • Scalable video coding (SVC) has been standardized as an extension of the H.264/AVC standard. This paper proposes a practical real-time transport protocol (RTP) packetization scheme to transport SVC video over IP networks. In combined scalability of SVC, a coded picture of a base or scalable enhancement layer is produced as one or more video layers consisting of network abstraction layer (NAL) units. The SVC NAL unit header contains a (DID, TID, QID) field to identify the association of each SVC NAL unit with its scalable enhancement layer without parsing the payload part of the SVC NAL unit. In this paper, we utilize the (DID, TID, QID) information to derive hierarchical spatio-temporal relationship of the SVC NAL units. Based on the derivation using the (DID, TID, QID) field, we propose a practical RTP packetization scheme for generating single RTP sessions in unicast and multicast transport of SVC video. The experimental results indicate that the proposed packetization scheme can be efficiently applied to transport SVC video over IP networks with little induced delay, jitter, and computational load.

미래 네트워크 제공을 위한 기계 학습 기반 스마트 서비스 추상화 계층 설계 (Design of Machine Learning based Smart Service Abstraction Layer for Future Network Provisioning)

  • ;;김경백;최덕재
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2016년도 추계학술발표대회
    • /
    • pp.114-116
    • /
    • 2016
  • Recently, SDN and NFV technology have been developed actively and provide enormous flexibility of network provisioning. The future network services would generally involve many different types of services such as hologram games, social network live streaming videos and cloud-computing services, which have dynamic service requirements. To provision networks for future services dynamically and efficiently, SDN/NFV orchestrators must clearly understand the service requirements. Currently, network provisioning relies heavily on QoS parameters such as bandwidth, delay, jitter and throughput, and those parameters are necessary to describe the network requirements of a service. However it is often difficult for users to understand and use them proficiently. Therefore, in order to maintain interoperability and homogeneity, it is required to have a service abstraction layer between users and orchestrators. The service abstraction layer analyzes ambiguous user's requirements for the desired services, and this layer generates corresponding refined services requirements. In this paper, we present our initial effort to design a Smart Service Abstraction Layer (SmSAL) for future network architecture, which takes advantage of machine learning method to analyze ambiguous and abstracted user-friendly input parameters and generate corresponding network parameters of the desired service for better network provisioning. As an initial proof-of-concept implementation for providing viability of the proposed idea, we implemented SmSAL with a decision tree model created by learning process with previous service requests in order to generate network parameters related to various audio and video services, and showed that the parameters are generated successfully.

폭발장면 자동 검출을 위한 저급 수준 비디오 정보의 추상화 방법 (An Abstraction Mechanism of Low-Level Video Features for Explosion Scene Retrievals)

  • 이상혁;남종호
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2000년도 봄 학술발표논문집 Vol.27 No.1 (B)
    • /
    • pp.526-528
    • /
    • 2000
  • 디지털 비디오 정보를 효율적으로 관리 검색하기 위한 내용 기반 검색 시스템을 위해서는 내용정보의 추상화가 필수적이다. 지금까지 비디오의 내용정보의 추상화, 특히 의미적 내용 정보의 추출은 사람에 의한 수동적인 방법에 의존한 것이 대부분이었다. 본 논문에서는 MPEGgudtlr의 영화 데이터를 대상으로 폭발 장면 자동 추출을 위한 저급 수준 비디오 내용정보의 추상화 방법을 제안하고, 실제 구현을 통하여 그 유용성을 보인다.

  • PDF