• 제목/요약/키워드: Video Caption

검색결과 65건 처리시간 0.026초

영상 캡션 정보를 이용한 멀티미디어 데이터 검색 시스템의 설계 및 구현 (Design and Implementation of Multimedia Data Retrieval System using Image Caption Information)

  • 이현창;배상현
    • 한국정보통신학회논문지
    • /
    • 제8권3호
    • /
    • pp.630-636
    • /
    • 2004
  • 오디오 비디오 데이터의 활용이 증가함에 따라 멀티미디어 데이터의 내용에 대해 표현하려는 연구와 함께 멀티미디어 데이터의 내용이나 메타데이터를 저장하고, 검색하고, 조작하는 연구의 필요성이 증가하였다. 멀티미디어 데이터 표현은 사용자가 원하는 내용만을 쉽게 검색하고, 접근할 수 있도록 표현되고 저장되어야 한다. 본 논문은 멀티미디어 데이터가 포함된 문서를 검색하기 위해서 멀티미디어 데이터의 캡션(Caption) 정보를 이용하거나 문서 내용을 기반으로 멀티미디어 데이터를 검색 할 수 있는 시스템을 설계하고 구현하였다. 멀티미디어 데이터의 캡션 정보와 문서의 텍스트는 모두 키워드를 추출하기 위해 필터링(Filtering) 단계를 거치고, B+ 트리를 이용한 역 파일 구조를 사용하여 빠르고 대용량의 문서 검색을 할 수 있도록 하였다.

주석 및 내용 기반 검색을 지원하는 동영상 정보 관리 시스템의 개발 (Development of A Video Information Management System for Supporting Caption and Content-based Searches)

  • 전미경;허진용;김인홍;강현석
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 춘계학술발표논문집
    • /
    • pp.284-289
    • /
    • 1998
  • 본 논문에서는 동영상 정보의 효율적인 관리를 위해 주석 기반 검색과 내용 기반 검색을 통합적으로 지원하는 통합 동영상 데이터 모델(Integrated Video Data Model, IVDM)를 제안한다. IVDM은 동영상 자료를 계층적으로 구조화하여 상위 수준에서는 의미 단위와 세그먼트 단위로 주석 기반 검색을 지원하고, 하위 수준에서는 이미지 인덱싱을 이용한 내용 기반 검색을 지원한다. 우리는 이 IVDM을 이용하여 MPEG-2로 압축된 동영상 정보를 관리하는 시스템(Integrated Video Information Management System, IVIMS)을 개발한다.

  • PDF

텍스트-비디오 검색 모델에서의 캡션을 활용한 비디오 특성 대체 방안 연구 (A Study on the Alternative Method of Video Characteristics Using Captioning in Text-Video Retrieval Model)

  • 이동훈;허찬;박혜영;박상효
    • 대한임베디드공학회논문지
    • /
    • 제17권6호
    • /
    • pp.347-353
    • /
    • 2022
  • In this paper, we propose a method that performs a text-video retrieval model by replacing video properties using captions. In general, the exisiting embedding-based models consist of both joint embedding space construction and the CNN-based video encoding process, which requires a lot of computation in the training as well as the inference process. To overcome this problem, we introduce a video-captioning module to replace the visual property of video with captions generated by the video-captioning module. To be specific, we adopt the caption generator that converts candidate videos into captions in the inference process, thereby enabling direct comparison between the text given as a query and candidate videos without joint embedding space. Through the experiment, the proposed model successfully reduces the amount of computation and inference time by skipping the visual processing process and joint embedding space construction on two benchmark dataset, MSR-VTT and VATEX.

압축 MPEG 비디오 상에서의 자막 검출 및 추출 (Video Caption Extraction in MPEG compressed video)

  • 전승수;김정림;오상욱;설상훈
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2001년도 제14회 신호처리 합동 학술대회 논문집
    • /
    • pp.985-988
    • /
    • 2001
  • 본 논문은 DCT를 기반으로 하여 비디오 내에서 자막을 I-frame들로부터 추출하였다. 본 논문에서 제안하는 자막 검출 및 추출 방법은 자막이 주위 배경 화면과 그 대비 값이 크다는 점과 화면상에 일정한 시간동안 유지된다는 점을 이용하였다. 먼저 비디오 내에서 I-frame들의 DCT 값들로부터 주위 배경화면과 비교하여 그 대비 값이 큰 영역들을 표시하였다. 이로부터 자막의 시간적 특성과 공간적 특성을 이용하여 자막을 포함하는 프레임을 검출하여, 그 내에 있는 자막 영역을 추출하였다.

  • PDF

확장적 블록 정합 방법과 영역 보상법을 이용한 비디오 문자 영역 복원 방법 (A Method for Recovering Text Regions in Video using Extended Block Matching and Region Compensation)

  • 전병태;배영래
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제29권11호
    • /
    • pp.767-774
    • /
    • 2002
  • 기존의 원영상 복원 기술은 주로 신호 처리 분야에서 영상의 형성(formation), 저장 및 통신상에서 발생되는 왜곡 현상을 복원하는 연구가 많이 이루어 졌다. 원 영상 복원과 관련된 기존의 연구는 블록 정합(block matching algorithm)을 이용한 원영상 복원 방법이 있다. 이 방법은 오 정합(incorrect matching)이 발생하기 쉽고, 오 정합 시 에러가 전파되는 문제점이 있다. 그리고 장면 전환이 2회 이상 발생될 경우 장면 전환 지점과 지점 사이의 복원이 불가능하다는 문제점이 있다. 본 논문에서는 기존의 문제점들을 해결하기 위하여 확장적 블록 정합 방법(EBMA: Extended Block Matching Algorithm)과 영역 보상법(Region compensation method)을 이용한 원영상 복원 방법을 제안하고자 한다. 원영상 복원에 사용하기 위하여 비디오 사전 정보(장면 전환 정보, 카메라 모션 정보, 캡션 영역 정보)를 추출한다. 추출된 캡션 영역 정보를 이용하여 캡션 문자의 구성 요소 정보를 추출한다. 추출된 비디오 사전 정보를 이용하여 복원의 방향성을 결정하고, 복원의 방향성에 따라 문자의 구성 요소 단위로 확장적 블록 정합 방법과 영역 보상법을 이용하여 원영상 복원을 수행한다. 실험결과 확장적 블록 정합 방법은 빠른 물체의 움직임이나 복잡한 배경에 영향을 받지 않고 복원이 잘 되는 것을 알 수 있었다. 참조할 원영상이 없이 원영상 복원을 수행하는 영역 보상법의 복원 결과 또한 좋음을 볼 수 있었다.

내용 기반 검색을 위한 뉴스 비디오 키 프레임의 특징 정보 추출 (Extraction of Features in key frames of News Video for Content-based Retrieval)

  • 정영은;이동섭;전근환;이양원
    • 한국정보처리학회논문지
    • /
    • 제5권9호
    • /
    • pp.2294-2301
    • /
    • 1998
  • 본 논문은 방송사별 각 장면의 중요한 내용의 성격을 갖고 있는 특징을 방송사별 뉴스 비디오에서 추출하기 위한 것이다. 추출하고자 하는 특징의 요소는 방송사 구별을 위한 방송사 아이콘과 각 장면의 대표적 성격을 갖고 있는 아이콘, 각 장면내의 주요 내용을 대표하는 정보인 자막의 문장 추출이다. 본 논문에서 제안하는 방법은, 비디오 프레임으로 입력되는 영상을 YIQ칼라 공간으로 전환한 뒤 히스토그램 평활화 방법을 이용하여 입력 영상의 영역 구분을 명확하게 한 후에, 영상의 에지를 추출하고 수직과 수평선에 기반한 에지 히스토그램의 비교에 의하여 원하는 특징을 추출하는 것이다. 또한 히스토그램 차이값에 의해서 선택된 키 프레임들 중에서 뉴스 아이콘을 추출하고 아이콘에 의하여 각 장면을 분할 할 수 있는 방법을 제안하였다. 본 논문에서는 칼라 히스토그램이나 웨이블릿, 또는 객체의 움직임에 기반한 복잡한 방법대신 에지 히스토그램 비교 방법을 사용하여, 알고리즘을 간소화함으로써 계산 시간을 단축하였으며 특징 추출에도 좋은 결과를 나타냈다.

  • PDF

자막을 활용한 영어수업이 초등학생의 문자인지 능력과 어휘력에 미치는 효과 (Effects of Caption-Utilized English Classes on Primary School Students' Character Recognition and Vocabulary Ability)

  • 소숙;이제영;황치복
    • 한국콘텐츠학회논문지
    • /
    • 제18권7호
    • /
    • pp.423-431
    • /
    • 2018
  • 본 연구의 목적은 자막을 활용한 영어수업이 초등학생의 문자인지 능력과 어휘력에 미치는 효과를 실험연구를 통해 살펴보는 것이다. 연구 대상은 전북 지역, G 도시에 위치한 2개의 초등학교 학생으로, 자막이 포함된 동영상을 활용한 영어 수업을 받은 실험반과 자막 없이 동영상을 접한 비교반으로 구분하였다. 각 집단은 2달간 10차시의 수업을 받았으며, 이들을 대상으로 문자인지 능력과 어휘력 검사지를 통해 사전/사후 검사를 실시하고, 자막 활용이 효과를 독립표본 t-검정과 대응표본 t-검정을 통해 살펴보았다. 그 결과 문자인지 능력과 어휘력에 있어 두 집단 사이에 통계적으로 유의한 차이는 발견되지 않았으나, 실험집단의 사전, 사후 검사 결과 사이에는 통계적으로 유의한 차이가 발견되었다. 마지막으로, 연구 결과를 근거로 영어교육의 교육적 함의와 후속 연구를 위한 제언을 논의하였다.

스코어 정보를 이용한 농구 비디오의 자동요약 (Automatic Summarization of Basketball Video Using the Score Information)

  • 정철곤;김의진;이광국;김회율
    • 한국통신학회논문지
    • /
    • 제32권9C호
    • /
    • pp.881-887
    • /
    • 2007
  • 본 논문에서는 농구 비디오의 내용기반 자동 요약 방법을 제안하였다. 의미 있는 요약을 위해, 농구 비디오에 포함되어 있는 스코어 정보를 이용하였다. 스코어 정보는 비디오에 포함된 스코어 자막의 숫자들을 인식한 후, 인식된 스코어의 변화를 분석함에 의해 획득된다. 일반적으로 농구경기의 중요한 이벤트는 3점 슛, 일방적 리드, 역전 등이다. 제안된 요약방법은 스코어 정보를 활용해 이러한 이벤트들을 검출하였으며, 이를 기반으로 농구 비디오의 요약 및 하이라이트를 생성하였다.

A Hangeul Recognition Method Using Directional Edges in Open Captions

  • Jun, Seung-Chul;Kang, Myeong-Gyu;Park, Sung-Han
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 ITC-CSCC -2
    • /
    • pp.1157-1160
    • /
    • 2002
  • This paper proposes an efficient method to recognize Hangeul in video open captions. The open captions in news video can play an important role in the video indexing. The strokes of Korean character have a very strong horizontal and vertical directionality and some strokes appear repeatedly in each character. Based on this characteristics, in this paper, we propose an efficient algorithm to extract the character regions in open caption and recognize the characters based on these characteristics of Korean character. The simulation results demonstrate the efficiency of our algorithm in terms of computation time and recognition accuracy.

  • PDF

스코어 정보를 이용한 농구 비디오의 자동요약 (Automatic Summarization of Basketball Video Using the Score Information)

  • 정철곤;김의진;이광국;김회율
    • 한국통신학회논문지
    • /
    • 제32권8C호
    • /
    • pp.738-744
    • /
    • 2007
  • 본 논문에서는 농구 비디오의 내용기반 자동 요약 방법을 제안하였다. 의미 있는 요약을 위해, 농구 비디오에 포함되어 있는 스코어 정보를 이용하였다. 스코어 정보는 비디오에 포함된 스코어 자막의 숫자들을 인식한 후, 인식된 스코어의 변화를 분석함에 의해 획득된다. 일반적으로 농구경기의 중요한 이벤트는 3점 슛, 일방적 리드, 역전 등이다. 제안된 방법은 스코어 정보를 활용해 이러한 이벤트들을 검출하였으며, 이를 기반으로 농구 비디오의 요약 및 하이라이트를 생성하였다.