• 제목/요약/키워드: video information characteristics

검색결과 586건 처리시간 0.027초

링크드 데이터를 이용한 인터랙티브 요리 비디오 질의 서비스 시스템 (An Interactive Cooking Video Query Service System with Linked Data)

  • 박우리;오경진;홍명덕;조근식
    • 지능정보연구
    • /
    • 제20권3호
    • /
    • pp.59-76
    • /
    • 2014
  • 스마트 미디어 장치의 발달로 인하여 시공간적인 제약이 없이 비디오를 시청 가능한 환경이 제공됨에 따라 사용자의 시청행태가 수동적인 시청에서 능동적인 시청으로 계속해서 변화하고 있다. 사용자는 비디오를 시청하면서 비디오를 볼 뿐 아니라 관심 있는 내용에 대한 세부적인 정보를 검색한다. 그 결과 사용자와 미디어 장치간의 인터랙션이 주요 관심사로 등장하였다. 이러한 환경에서 사용자들은 일방적으로 정보를 제공해주는 것보다는 자신이 원하는 정보를 웹 검색을 통해 사용자 스스로 정보를 찾지 않고, 쉽고 빠르게 정보를 얻을 수 있는 방법의 필요성을 인식하게 되었으며 그에 따라 인터랙션을 직접 수행하는 것에 대한 요구가 증가하였다. 또한 많은 정보의 홍수 속에서 정확한 정보를 얻는 것이 중요한 이슈가 되었다. 이러한 사용자들의 요구사항을 만족시키기 위해 사용자 인터랙션 기능을 제공하고, 링크드 데이터를 적용한 시스템이 필요한 상황이다. 본 논문에서는 여러 분야 중에서 사람들이 가장 관심 있는 분야중 하나인 요리를 선택하여 문제점을 발견하고 개선하기 위한 방안을 살펴보았다. 요리는 사람들이 지속적인 관심을 갖는 분야이다. 레시피, 비디오, 텍스트와 같은 요리에 관련된 정보들이 끊임없이 증가하여 빅 데이터의 한 부분으로 발전하였지만 사용자와 요리 콘텐츠간의 인터랙션을 제공하는 방법과 기능이 부족하고, 정보가 부정확하다는 문제점을 가지고 있다. 사용자들은 쉽게 요리 비디오를 시청할 수 있지만 비디오는 단 방향으로만 정보를 제공하기 때문에 사용자들의 요구사항을 충족시키기 어렵고, 검색을 통해 정확한 정보를 얻는 것이 어렵다. 이러한 문제를 해결하기 위하여 본 논문에서는 요리 비디오 시청과 동시에 정보제공을 위한 UI(User Interface), UX(User Experience)를 통해 사용자의 편의성을 고려한 환경을 제시하고, 컨텍스트에 맞는 정확한 정보를 제공하기 위해 링크드 데이터를 이용하여 사용자와 비디오 간에 인터랙션을 위한 요리보조 서비스 시스템을 제안한다.

A Fast Kernel Regression Framework for Video Super-Resolution

  • Yu, Wen-Sen;Wang, Ming-Hui;Chang, Hua-Wen;Chen, Shu-Qing
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권1호
    • /
    • pp.232-248
    • /
    • 2014
  • A series of kernel regression (KR) algorithms, such as the classic kernel regression (CKR), the 2- and 3-D steering kernel regression (SKR), have been proposed for image and video super-resolution. In existing KR frameworks, a single algorithm is usually adopted and applied for a whole image/video, regardless of region characteristics. However, their performances and computational efficiencies can differ in regions of different characteristics. To take full advantage of the KR algorithms and avoid their disadvantage, this paper proposes a kernel regression framework for video super-resolution. In this framework, each video frame is first analyzed and divided into three types of regions: flat, non-flat-stationary, and non-flat-moving regions. Then different KR algorithm is selected according to the region type. The CKR and 2-D SKR algorithms are applied to flat and non-flat-stationary regions, respectively. For non-flat-moving regions, this paper proposes a similarity-assisted steering kernel regression (SASKR) algorithm, which can give better performance and higher computational efficiency than the 3-D SKR algorithm. Experimental results demonstrate that the computational efficiency of the proposed framework is greatly improved without apparent degradation in performance.

Distributed Video Compressive Sensing Reconstruction by Adaptive PCA Sparse Basis and Nonlocal Similarity

  • Wu, Minghu;Zhu, Xiuchang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권8호
    • /
    • pp.2851-2865
    • /
    • 2014
  • To improve the rate-distortion performance of distributed video compressive sensing (DVCS), the adaptive sparse basis and nonlocal similarity of video are proposed to jointly reconstruct the video signal in this paper. Due to the lack of motion information between frames and the appearance of some noises in the reference frames, the sparse dictionary, which is constructed using the examples directly extracted from the reference frames, has already not better obtained the sparse representation of the interpolated block. This paper proposes a method to construct the sparse dictionary. Firstly, the example-based data matrix is constructed by using the motion information between frames, and then the principle components analysis (PCA) is used to compute some significant principle components of data matrix. Finally, the sparse dictionary is constructed by these significant principle components. The merit of the proposed sparse dictionary is that it can not only adaptively change in terms of the spatial-temporal characteristics, but also has ability to suppress noises. Besides, considering that the sparse priors cannot preserve the edges and textures of video frames well, the nonlocal similarity regularization term has also been introduced into reconstruction model. Experimental results show that the proposed algorithm can improve the objective and subjective quality of video frame, and achieve the better rate-distortion performance of DVCS system at the cost of a certain computational complexity.

대화형 연산 후 수렴을 이용한 저장된 비디오의 효율적인 전송 스케줄 작성 방안 (An Efficient Scheme to write a Transmission Schedule using Convergence after Interactive Operations in a Stored Video)

  • 이재홍;김승환
    • 한국정보처리학회논문지
    • /
    • 제7권7호
    • /
    • pp.2050-2059
    • /
    • 2000
  • In a video-on-Demand(VOD) service, a server has to return to he normal playback quickly at a certain new frame position after interactive operations such as jump or last playback. In this paper, we propose an efficient scheme to write a transmission schedule for a playback restart of a video stream at a new frame position after interactive operations. The proposed scheme is based on convergence characteristics, that is transmission schedules with different playback startup frame position in a video stream meet each other at some frame position. The scheme applies a bandwidth smoothing from a new frame position to a convergence position without considering all remaining frames of a video stream. And then the scheme transmits video dta according to the new schedule from the new frame position to the convergence position, and then transmits the remaining video data according to the reference schedule from the convergence position, and then transmits the remaining video data according to the reference schedule from the convergence position to the last frame position. In this paper, we showed that there existed the convergence position corresponding to nay frame position in a video stream through many experiments based on MPEG-1 bit trace data. With the convergence we reduced the computational overhead of a bandwidth smoothing, which was applied to find a new transmission schedule after interactive operations. Also, storage overhead is greatly reduced by storing pre-calculated schedule information up to the convergence position for each I frame position of a video stream with video data off-line. By saving information on a transmission schedule off-line along with the video data and searching the schedule corresponding to the specified restarting frame position, we expect the possibility of normal playback of a video stream with small tolerable playback startup delay.

  • PDF

Video Segmentation and Key frame Extraction using Multi-resolution Analysis and Statistical Characteristic

  • Cho, Wan-Hyun;Park, Soon-Young;Park, Jong-Hyun
    • Communications for Statistical Applications and Methods
    • /
    • 제10권2호
    • /
    • pp.457-469
    • /
    • 2003
  • In this paper, we have proposed the efficient algorithm that can segment the video scene change using a various statistical characteristics obtained from by applying the wavelet transformation for each frames. Our method firstly extracts the histogram features from low frequency subband of wavelet-transformed image and then uses these features to detect the abrupt scene change. Second, it extracts the edge information from applying the mesh method to the high frequency subband of transformed image. We quantify the extracted edge information as the values of variance characteristic of each pixel and use these values to detect the gradual scene change. And we have also proposed an algorithm how extract the proper key frame from segmented video scene. Experiment results show that the proposed method is both very efficient algorithm in segmenting video frames and also is to become the appropriate key frame extraction method.

A network-adaptive SVC Streaming Architecture

  • ;임정연;이범식;김문철;함상진;김병선;이근식;박근수
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2006년도 학술대회
    • /
    • pp.257-260
    • /
    • 2006
  • In Video streaming environment, we must consider terminal and network characteristics, such as display resolution, frame rate, computational resource, network bandwidth, etc. The JVT (Joint Video Team) by ISO/IEC MPEG and ITU-TVCEG is currently standardizing Scalable Video Coding (SVC). This can represent video bitstreams in different sealable layers for flexible adaptation to terminal and network characteristics. This characteristic is very useful in video streaming applications. One fully scalable video can be extracted with specific target spatial resolution, temporal frame rate and quality level to match the requirements of terminals and networks. Besides, the extraction process is fast and consumes little computational resource, so it is possible to extract the partial video bitstream online to accommodate with changing network conditions etc. With all the advantages of SVC, we design and implement a network-adaptive SVC streaming system with an SVC extractor and a streamer to extract appropriate amounts of bitstreams to meet the required target bitrates and spatial resolutions. The proposed SVC extraction is designed to allow for flexible switching from layer to layer in SVC bitstreams online to cope with the change in network bandwidth. The extraction is made in every GOP unit. We present the implementation of our SVC streaming system with experimental results.

  • PDF

윤곽선과 컬러 분포를 이용한 비디오 분할과 비디오 브라우징 (Video Segmentation and Video Browsing using the Edge and Color Distribution)

  • 허승;김우생
    • 한국정보처리학회논문지
    • /
    • 제4권9호
    • /
    • pp.2197-2207
    • /
    • 1997
  • 본 논문에서는 비디오 프레임들의 윤곽선과 컬러 분포를 사용한 비디오를 분할 하는 방법을 제안하며 분할된 장면의 정보를 사용하여 비디오 브라우징을 구현하였다. 비디오를 분할하기 위한 방법으로는 HSV 162개의 색상을 가진 히스토그램과 자동 임계값으로 산출된 윤곽선을 사용하였고 각 장면들의 객체 위치와 색상 분포 등의 특성을 고려하였다. 검출된 장면들을 계층적인 브라우저와 장면 기반 브라우저를 사용해 비디오를 브라우징할 수 있도록 하였다. 또한 본 논문에서는 제안하는 장면 변화 검출 방법이 기존의 색상 분포만을 사용하는 히스토그램의 방법에 비해 움직임에 보다 견고하고, 빛의 영향을 최소화 할 수 있음을 다양한 종류의 비디오 데이터를 통해 보였다.

  • PDF

비디오 데이터의 색인과 검색 (Indexing and Retrieving of Video Data)

  • 허진용;박동원;안성옥
    • 공학논문집
    • /
    • 제3권1호
    • /
    • pp.107-116
    • /
    • 1998
  • 본 논문의 목적은 초고속 정보 통신망의 Client/Server 환경에서 MPEG 동영상을 멀티미디어 데이터베이스 관리 시스템에 저장하여 실시간 검색하고 이를 복원할 수 있는 환경을 개발하는 데 있다. 본 논문에서는 멀티미디어 데이터 전송에 필수적인 ATM 통신 환경 구축 및 MPEG-2 동영상과 ATM 망과의 연계동작 시스템을 구축하고, MPEG-2 TS 데이터를 분석하여 동영상 검색에 필수적인 I-프레임 및 키 프레임 추출 방법을 개발한다. 또한 추출한 키 프레임에 대한 색인을 부여할 수 있는 색인 편집기 및 색인을 통해 검색을 수행하는 동영상 검색기를 개발하며, 키 프레임 및 이와 관련된 색인을 관리할 수 있는 멀티미디어 데이터베이스 스키마를 설계 및 구축한다.

  • PDF

장면전환 탐지와 예측을 통한 비디오 자료의 전송 제어 (Transmission Control of Video Data through Prediction and Shot Transition Detection)

  • 이근수;김원
    • 인터넷정보학회논문지
    • /
    • 제5권6호
    • /
    • pp.59-66
    • /
    • 2004
  • 본 논문에서는 MPEG 비디오 데이터를 GoP 단위로 분할하여 장면전환 특성을 파악하고 그에 따라 칼만필터를 사용하여 비디오 데이터의 전송량을 예측하는 방법을 제안하고자 한다. 비디오 데이터의 정확한 장면전환을 파악하기 위해서 압축 도메인에서 고속으로 장면에 대한 정보를 검출하는 알고리즘을 사용하여 급진적 장면전환 유형과 점진적 장면전환 유형으로 분류하였다. 분류된 정보는 칼만필터의 세부 인자로 사용되어 비디오 데이터의 전송량을 예측한다. 본 논문에서 제안한 방법은 압축 도메인에서 장면전환 탐지와 비디오 데이터의 전송량을 예측하여 처리 시간을 감소시키고자 하였다. 세 종류의 서로 다른 비디오 데이터 911개의 1프레임을 사용한 실험에서 96.2- 97.6%로 전송량을 예측하였다.

  • PDF

Action Recognition Method in Sports Video Shear Based on Fish Swarm Algorithm

  • Jie Sun;Lin Lu
    • Journal of Information Processing Systems
    • /
    • 제19권4호
    • /
    • pp.554-562
    • /
    • 2023
  • This research offers a sports video action recognition approach based on the fish swarm algorithm in light of the low accuracy of existing sports video action recognition methods. A modified fish swarm algorithm is proposed to construct invariant features and decrease the dimension of features. Based on this algorithm, local features and global features can be classified. The experimental findings on the typical sports action data set demonstrate that the key details of sports action can be successfully retained by the dimensionality-reduced fusion invariant characteristics. According to this research, the average recognition time of the proposed method for walking, running, squatting, sitting, and bending is less than 326 seconds, and the average recognition rate is higher than 94%. This proves that this method can significantly improve the performance and efficiency of online sports video motion recognition.