• 제목/요약/키워드: Video Caption

검색결과 65건 처리시간 0.024초

폐쇄자막을 기반한 자막기반 동영상 검색 시스템 (Video retrieval system based on closed caption)

  • 김효진;황인정;이은주;이응혁;민홍기
    • 융합신호처리학회 학술대회논문집
    • /
    • 한국신호처리시스템학회 2000년도 추계종합학술대회논문집
    • /
    • pp.57-60
    • /
    • 2000
  • 동영상 데이터와 같은 영상자료는 많은 활용분야를 가지고 있지만, 비정형성과 구조의 복잡성으로 인하여 손쉽게 검색을 하거나 재사용하는 데 있어서 많은 어려움을 가지고 있다. 본 논문에서는 동영상과 같은 멀티미디어 데이터를 구조적이고 체계화된 형태로 기술한 언어인 SMIL과 SAMI를 사용하여 동영상과 동기화 되어있는 폐쇄자막을 기반으로 동영상을 검색하는 시스템을 구현하였다. 사용자의 검색어를 입력받아 자막파일에서 검색어를 가지고 있는 문자열에서 시간 요소를 추출하여 해당하는 동영상 화면을 보여주는 구조를 가지고 있다.

  • PDF

시·공간 정보를 이용한 동영상의 인공 캡션 검출 (Detection of Artificial Caption using Temporal and Spatial Information in Video)

  • 주성일;원선희;최형일
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제1권2호
    • /
    • pp.115-126
    • /
    • 2012
  • 동영상에 포함되는 인공 캡션은 영상과 관계있는 의미정보를 포함한다. 이러한 영상을 표현하는 정보를 이용하기 위해 캡션을 추출하는 연구는 근래에 들어 활발히 진행되고 있다. 기존 방법들은 대부분 정지영상에서 캡션을 검출하였다. 하지만 동영상의 경우에는 유용한 시간정보가 있다. 따라서 본 연구는 이러한 시간정보를 사용한 캡션영역 검출방법을 제안한다. 먼저, 캡션후보영역 검출을 위해 문자출현맵을 생성하고, 후보영역 매칭 과정에서 지속후보영역을 검출한다. 검출된 지속후보영역의 소멸성 검사를 통해 캡션의 소멸 여부를 검출하고 소멸된 캡션 일 경우 시 공간정보에 의한 병합과정을 통해 캡션후보영역을 결정한다. 마지막으로 결정된 캡션후보영역을 검증하기 위하여 에지 방향 히스토그램을 이용한 신경망 인식기를 통하여 최종캡션영역을 검출한다. 실험을 위해 다양한 크기와 형태, 위치의 캡션을 포함하는 동영상에 대해 영역검출의 성능을 평가하고자 Recall과 Precision을 이용하여 제안하는 방법의 영역검출에 대한 효율성을 입증한다.

스포츠 중계를 위한 자막 인식 시스템 개발 (Development of a Video Caption Recognition System for Sport Event Broadcasting)

  • 오주현
    • 한국HCI학회:학술대회논문집
    • /
    • 한국HCI학회 2009년도 학술대회
    • /
    • pp.94-98
    • /
    • 2009
  • 메이저리그 야구 중계 등 해외 스포츠 중계제작에서 해결해야 할 문제 중 하나는 MPH(miles per hour)와 같이 영미식 단위로 표시된 자막을 국내 실정에 맞게 km/h 등으로 변환하는 것이다. 이를 위해 중계화면에 표시된 자막영역의 변화로부터 해당 자막이 표시되었음을 감지하고 숫자 정보를 인식하여 이를 국내실정에 맞는 SI 단위로 변환하는 스포츠 자막 인식 시스템을 개발하였다. 변환된 자막은 후단의 문자발생기 (CG) 시스템으로 전달되어 최종적으로 TV 화면에 표시된다. 일반적으로 문자 인식에 주로 사용되는 신경망(neural networks) 기반 방식은 사전에 유사 데이터를 이용한 신경망의 학습(training) 과정이 필수적으로 요구되며, 또한 학습에 사용된 데이터와 다른 모양의 자막이 예고 없이 사용되었을 경우 대처할 수 없다는 단점이 있다. 생방송이라는 사용 환경을 고려하여 새로운 폰트로 제작된 자막에도 신속하게 대처할 수 있는 템플릿 매칭(template matching) 방식을 사용하였다. 여러 가지 실험 영상으로 테스트한 결과 97% 이상의 정확한 인식 결과를 얻었으며, 정확성을 요하는 생방송의 특성상 매칭의 확신도(confidence)가 높지 않은 경우에는 작업자가 판단한 후 핫키를 이용하여 정확한 자막을 출력할 수 있게 하였다.

  • PDF

UHD 방송 표준 검증을 위한 시험 스트림 개발에 관한 연구 (Test Stream Generation Method for UHDTV Broadcasting Standard)

  • 김재일;배성포;양진영;권동현
    • 한국통신학회논문지
    • /
    • 제41권7호
    • /
    • pp.823-832
    • /
    • 2016
  • 본 논문에서는 UHD(Ultra High Definition) 방송 표준 수신기 검증을 위한 시험 스트림 제작 방법을 제안한다. 제안하는 시험 스트림은 비디오/오디오 시험 스트림, 시스템/자막 시험 스트림으로 구성된다. 비디오/오디오 시험 스트림은 HEVC (High Efficiency Video Coding) 비디오 표준 및 Dolby AC(Audio Coding)-3와 DTS(Digital Theater System)-HD(High Definition) 오디오 표준 시험에 사용 가능하며, 시스템/자막 시험 스트림은 PSIP(Program and System Information Protocol)과 자막 (Closed caption) 표준 수신기 검증 및 시험에 사용 가능하다. 개발된 HEVC 비디오 표준 시험 스트림은 신택스를 검증하기 위한 표준적합 시험 스트림과 에러 동작 검증을 위한 에러 시험 스트림으로 구분하여 제작하였다.

자막 정보를 이용한 야구경기 비디오의 자동요약 시스템 (An Automatic Summarization System of Baseball Game Video Using the Caption Information)

  • 유기원;허영식
    • 방송공학회논문지
    • /
    • 제7권2호
    • /
    • pp.107-113
    • /
    • 2002
  • 본 논문에서는 자동으로 야구 비디오를 요약하는 방법과 이를 구현한 소프트웨어 시스템을 제안한다. 제안된 시스템은 빠른 수행 속도와 정확성 높은 요약 결과를 추구한다. 이를 위해 압축비디오상의 특징 값에 기반 한 빠른 비디오 분할과 간단한 자막 인식을 수행하여 야구 경기에서 중요한 이벤트들을 검출한다. 또한, 본 시스템은 여러 레벨의 비디오 요약을 지원하기 위해 계층적 구조의 내용 기술을 지원한다.

블록 정합을 이용한 비디오 자막 영역의 원 영상 복원 방법 (A Method for Reconstructing Original Images for Captions Areas in Videos Using Block Matching Algorithm)

  • 전병태;이재연;배영래
    • 방송공학회논문지
    • /
    • 제5권1호
    • /
    • pp.113-122
    • /
    • 2000
  • 이미 방송된 비디오 영상으로부터 자막 영역을 제거하고 원 영상으로 복원할 필요가 종종 발생한다. 복원될 영상의 량이 적을 경우 수 작업에 의한 복원이 가능하나, 비디오 영상과 같이 복원할 영상이 많아질 경우에는 수 작업에 복원은 어렵다고 볼 수 있다. 따라서 자동으로 자막 영역을 원 영상으로 복원할 수 있는 방법이 필요하게 된다. 기존의 영상 복원에 관한 연구는 주로 블러링(blurring)된 영상을 주파수 필터를 사용하여 선명하게 복원하거나, 영상 통신을 위한 비디오 코딩 방법에 대한 연구가 많이 이루어졌다. 본 논문에서는 블록 정합 알고리즘(Block Matching Algorithm)을 이용하여 자막 영역을 복원하는 방법을 제안하고자한다. 자막 복원을 위한 사전 정보로 자막 영역 정보와 장면 전환 정보를 추출한다. 추출된 자막 정보로부터 자막의 시작 프레임, 끝 프레임, 자막 문자의 구성 요소 정보를 얻을 수 있다. 자막 정보(자막의 시작 프레임, 끝 프레임)와 장면 전환 정보를 이용하여 복원의 방향성 및 복원의 종점을 결정한다. 복원의 방향성에 따라 각 프레임마다 문자의 구성 요소에 대한 블록 정합을 수행하여 원 영상을 복원한다. 실험결과 비교적 움직임이 적은 영상에서는 복원이 잘 됨을 볼 수 있었으며, 복잡한 배경을 갖고 있는 영상의 경우도 복원됨을 볼 수 있었다.

  • PDF

뉴스 비디오 자막 추출 및 인식 기법에 관한 연구 (Study on News Video Character Extraction and Recognition)

  • 김종열;김성섭;문영식
    • 대한전자공학회논문지SP
    • /
    • 제40권1호
    • /
    • pp.10-19
    • /
    • 2003
  • 비디오 영상에 포함되어 있는 자막은 비디오의 내용을 함축적으로 표현하고 있기 때문에 비디오 색인 및 검색에 중요하게 사용될 수 시다. 본 논문에서는 뉴스 비디오로부터 폰트, 색상, 자막의 크기 등과 같은 사전 지식 없이도 자막을 효율적으로 추출하여 인식하는 방법을 제안한다. 문자 영역의 추출과정에서 문자영역은 뉴스 비디오의 여러 프레임에 걸쳐나 나오기 때문에 인길 프레임의 차영상을 통해서 동일한 자막 영역이 존재하는 프레임을 자동적으로 추출한 후, 이들의 시간적 평균영상을 만들어 인식에 사용함으로써 인식률을 향상한다. 또한, 평균 영상의 외각선 영상을 수평, 수직방향으로 투영한 값을 통해 문자 영역을 찾아 Region filling, K-means clustering을 적용하여 배경들을 완벽하게 제거함으로써 최종적인 자막 영상을 추출한다. 자막 인식과정에서는 문사 영역 추출과정에서 추출된 글자영상을 사용하여 white run, zero-one transition과 같은 비교적 간단한 특징 값을 추출하여 이를 비교함으로써 인식과정을 수행한다. 제한된 방법을 다양한 뉴스 비디오에 적용하여 문자영역 추출 능력과 인식률을 측정한 결과 우수함을 확인하였다.

미디어에 있어서의 자막기록의 의미와 전달성 - 공중파방송과 비디오 아트에서의 자막기록을 중심으로 - (Study on the meaning and delivery of caption recording in mass media - On the function of caption recording TV mass media and video art -)

  • 이지영
    • 한국기록관리학회지
    • /
    • 제3권2호
    • /
    • pp.78-96
    • /
    • 2003
  • 오늘날 미디어는 우리의 일상을 혁신하고 우리의 삶을 변혁시키는 위력을 갖게 되었다. 뉴미디어는 마샬 맥루한 (Marshall MacLuhan)의 말처럼 새로운 언어이며, 우리를 실재의 세계와 연결시켜주는 수단이며 또 그 자체가 실재의 세계이기도 하다. 이러한 뉴미디어의 세계에서 문자의 출현은 새로운 의미를 갖게 되었다. 미디어의 세계에 있어서 문자의 출현은 과거 무성시대 말기로부터 시작된 내용의 의미전달을 위한 자막의 역할을 뛰어 넘어 화면의 구성적 요소로서 역할을 하게 되었다. 이러한 구성적 요소로서의 자막 혹은 문자의 출현은 미학적 요소, 오락적 요소, 재현적 요소, 부언적 가치전도의 요소, 설명적 요소 등의 의미를 지니게 되었다. 과거 자막에서 보여주던 번역적 요소마저도 뉴미디어의 세계에서는 새로운 양식으로 탈바꿈하면서 계속전진을 계속하고 있다. 의미 전달을 위해서 영상 속의 문자는 의미론적인 입장에서의 변화나 연구가 계속될 뿐만 아니라 그 글꼴 등에서도 많은 변화와 의미를 지니게 되었다. 글꼴의 디자인은 미디어세계의 새로운 미학적 발상이며, 글꼴의 양식은 미디어 화면의 또 다른 생명력이라 할 수 있다. 그러므로 글꼴이 미디어에 미치는 영향에 대해 보다 구체적으로 살펴보고자 했다.

I 프레임에 기반한 MPEG 압축영상에서의 자막 탐지 (Localization of captions in MPEG compression images based on I frame)

  • 유태웅
    • 한국컴퓨터산업학회논문지
    • /
    • 제2권11호
    • /
    • pp.1465-1476
    • /
    • 2001
  • 실시간 자막 탐지는 비디오 인덱싱, 텍스트의 이해, 자동 자막 탐지시스템 등 수많은 응용 분야에서 요구된다. 본 논문은 I 프레임을 기반으로 MPEG 압축 동영상에서 자막을 탐지하는 알고리즘을 제안한다. 제안한 알고리즘은 자막 텍스춰 정보와 색체 정보를 사용하여 배경 영상으로부터 자막을 정확히 분리한다. 기존 알고리즘들은 압축 동영상으로부터 텍스트 영역을 추출하기 전에 압축을 먼저 해제하는데 제안한 알고리즘은 DCT 압축 도메인에서 직접 자막 텍스트 영역을 탐지한다.

  • PDF

장애인방송 기술개발 현황 (Status of Development of Broadcasting Technology for the Disabled)

  • 안충현
    • 전자통신동향분석
    • /
    • 제34권3호
    • /
    • pp.1-12
    • /
    • 2019
  • In the digital era, broadcasting plays a very large role as a means of communication, as it no longer merely provides information or entertainment media. Particularly in the case of the visually and hearing-impaired, broadcasting is the primary means of acquiring information, so its role as a public service needs to be expanded. The development of digital technology enables the quantitative expansion of traditional methods of disability broadcasting, i.e., closed caption, sign language, and descriptive video service, with an acceptable level of quality. In this study, we review the current trends of, and concerns related to, broadcasting services for disabled people, as well as technological trends, and proposals for increasing visibility and accessibility to broadcasting for hearing-impaired people.