• Title/Summary/Keyword: 자막 향상

Search Result 83, Processing Time 0.554 seconds

Video Caption Extraction and Image Enhancement (비디오 자막 추출 및 이미지 향상에 관한 연구)

  • 김소명;최영우;정규식
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2000.10b
    • /
    • pp.359-361
    • /
    • 2000
  • 본 논문에서는 비디오 자막 이미지를 인식하기 위해 필요한 영상 향상의 단계로서 다중 결합을 적용한다. 또한 다중 결합을 위한 동일한 자막의 판단 및 결합된 결과를 재평가하기 위한 방법을 제안한다. 입력된 칼라 이미지로부터 RLS(Run Length Smearing)가 적용된 에지 이미지를 얻고, 수직 및 수평 히스토그램 분포를 이용하여 자막과 자막 영역에 대한 정보를 추출한다. 프레임 내의 자막 영역의 중첩 정도를 이용하여 동일 자막을 판단하고, 동일한 자막을 갖는 프레임들끼리 다중 결합을 수행함으로써 향상된 이미지를 얻는다. 끝으로 결합된 영상에 대한 평가를 수행하여 잘못 결합된 이미지들로 인한 오류를 해결하고 재평가한다. 제안한 방법을 통해, 배경 부분의 잡영이 완화된 자막 이미지를 추출하여 인식의 정확성과 신뢰성을 높일 수 있었다. 또한 동일한 자막의 시작 프레임과 끝 프레임의 위치 파악은 디지털 비디오의 색인 및 검색에 효과적으로 이용될 수 있을 것이다.

  • PDF

Methods for Video Caption Extraction and Extracted Caption Image Enhancement (영화 비디오 자막 추출 및 추출된 자막 이미지 향상 방법)

  • Kim, So-Myung;Kwak, Sang-Shin;Choi, Yeong-Woo;Chung, Kyu-Sik
    • Journal of KIISE:Software and Applications
    • /
    • v.29 no.4
    • /
    • pp.235-247
    • /
    • 2002
  • For an efficient indexing and retrieval of digital video data, research on video caption extraction and recognition is required. This paper proposes methods for extracting artificial captions from video data and enhancing their image quality for an accurate Hangul and English character recognition. In the proposed methods, we first find locations of beginning and ending frames of the same caption contents and combine those multiple frames in each group by logical operation to remove background noises. During this process an evaluation is performed for detecting the integrated results with different caption images. After the multiple video frames are integrated, four different image enhancement techniques are applied to the image: resolution enhancement, contrast enhancement, stroke-based binarization, and morphological smoothing operations. By applying these operations to the video frames we can even improve the image quality of phonemes with complex strokes. Finding the beginning and ending locations of the frames with the same caption contents can be effectively used for the digital video indexing and browsing. We have tested the proposed methods with the video caption images containing both Hangul and English characters from cinema, and obtained the improved results of the character recognition.

A Method for Text Detection and Enhancement using Spatio-Temporal Information (시공간 정보를 이용한 자막 탐지 및 향상 기법)

  • Jeong, Jong-Myeon
    • Journal of the Korea Society of Computer and Information
    • /
    • v.14 no.8
    • /
    • pp.43-50
    • /
    • 2009
  • Text information in a digital video provides crucial information to acquire semantic information of the video. In the proposed method. text candidate regions are extracted from input sequence by using characteristics of stroke and text candidate regions are localized by using projection to produce text bounding boxes. Bounding boxes containing text regions are verified geometrically and each bounding box existing same location is tracked by calculating matching measure. which is defined as the mean of absolute difference between bounding boxes in the current frame and previous frames. Finally. text regions are enhanced using temporal redundancy of bounding boxes to produce final results. Experimental results for various videos show the validity of the proposed method.

Development of Emotion Subtitles Broadcast System based on Terrestrial UHD TV for the Hearing-Impaired (청각장애인을 위한 지상파 UHD 기반 감정표현 자막 송출 시스템 개발)

  • Lee, June;Ahn, Chunghyun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.141-144
    • /
    • 2021
  • 최근 지상파 UHD 방송에서는 자막을 비디오 패킷에 삽입하여 전달하는 기존 방식이 아닌 별도의 전송로로 전달하는 폐쇄형 자막(closed caption) 방식을 적용하고 있다. 또한 자막에는 문자 뿐만 아니라 이미지까지 포함하여 청각장애인의 프로그램 이해도를 높이는데 활용할 수 있다. 따라서 본 논문에서는 청각장애 시청자가 방송 콘텐츠 내용의 이해도를 향상시키기 위하여 지상파 UHD 방송에서 기존의 문자 자막과 움직이는 이미지 자막(=감정표현 자막)을 송출하여 동시에 표현할 수 있는 송출시스템을 제안한다.

  • PDF

High-speed caption processing technology using CUDA (CUDA 를 이용한 고속 자막 처리 기술)

  • Kim, Hyun soo;Kim, Dae yeol;Kwon, Seung-Cheol;Sohn, Chae-Bong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2015.07a
    • /
    • pp.102-105
    • /
    • 2015
  • 본 논문에서는 멀티미디어 및 수학 관련 알고리즘 분야에서 각광 받고 있는 CUDA(Compute Unified Device Architecture) 기법을 실시간 동영상 자막 처리에 이용 한다. 실시간 고화질 동영상 자막 처리의 낮은 속도를 개선하기 위한 방법 제안으로 써, 이의 함수 구성을 제안한다. 기존의 자막 처리 방식에서는 하나의 코어만을 이용하였다. 이 방법 대신에 CUDA 를 적용 함으로써, 더 많은 코어를 이용해 실시간 자막 처리의 지각적인 성능을 향상하였다. 삽입하고자 하는 자막에 대해 비트맵 이미지를 형성하고, 이의 정보를 처리한다. Intel $Core^{TM}$ i7-4710 MQ, GTX870 환경에서 실험하였으며, 실험 결과 C code 만으로 연산을 한 것 보다 CUDA code 가 약 88% 정도의 속도 향상이 있음을 보였다.

  • PDF

Implementation of an emotional subtitle editor for deaf and hearing impaired people (청각장애인을 위한 감성자막 편집기 구현)

  • Kim, Hyunsoon;Oh, Juhyun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.120-123
    • /
    • 2021
  • 디지털화와 기술의 급격한 발전으로 방송 서비스도 고품질 서비스를 보다 편리하게 이용할 수 있도록 진화하고 있다. 이러한 변화하는 방송 환경에서 비장애인 대비 소외계층의 정보 접근성을 높이기 위한 연구에 대한 필요성이 증가하고 있다. 이러한 연구의 일환으로 UHD 자막 방송 서비스를 개선하기 위한 연구인 '감성표현 자막 서비스 기술' 연구를 진행하였다. 감성표현 자막 서비스 기술은 단순한 텍스트의 전달이 아닌 이미지와 폰트 스타일을 포함한 다양한 시각적 표현을 통해 청각장애인의 방송 내용에 대한 이해도를 향상시키기 위한 기술이다. 본 논문에서는 이러한 감성표현 자막 서비스를 소개하고 해당 서비스를 가능하게 하는 관련 기술과 시스템 구현 결과에 대하여 다룬다. 지상파 UHD 방송을 대상으로 개선된 형태의 자막 서비스를 제공하기 위한 핵심 시스템인 감성자막 편집기를 개발하였다. 감성자막 편집기는 화자의 감정 정보 등을 입력, 편집하고 편집된 감성자막을 영상과 싱크를 맞추어 재생하는 기술과 감성자막을 UHD 송출시스템으로 전송하는 시스템이다.

  • PDF

Subtitle generation using Speech recognition (음성인식기술을 이용한 자막생성 연구)

  • AHN, Chung Hyun;Jang, In Sun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.06a
    • /
    • pp.48-49
    • /
    • 2016
  • 본 논문에서는 동영상, 팟캐스트 오로부터 자막을 생성하여 청각장애인의 미디어 접근권을 향상시키는 음성인식기술을 적용한 자막생성에 대하여 제안한다. 또한 레퍼런스 음성 DB 와 드라마, 팟캐스트 오디오로부터 생성된 자막의 정확도에 대해 평가하였다. 오디오를 이용하여 생성된 자막은 사극의 경우에는 다소 정확도가 낮게 평가되었으나, 전체적으로는 약 80%이상의 정확도를 갖는 것으로 파악되었다.

  • PDF

Design of Emotion Subtitles System based on Terrestrial UHD TV for the Hearing-Impaired (청각장애인을 위한 지상파 UHD 기반 감정표현 자막 수신 시스템 설계)

  • Song, Jinhyuk;Bae, Byungjun;Cho, Sukhee;Ahn, Chunghyun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.135-136
    • /
    • 2021
  • 최근 지상파 UHD 방송에서는 자막을 비디오 패킷에 삽입하여 전달하는 기존 방식이 아닌 별도의 전송로로 전달하는 폐쇄형 자막(closed caption) 방식을 적용하고 있다. 또한 자막에는 문자 뿐만 아니라 이미지까지 포함하여 청각장애인의 프로그램 이해도를 높이는데 활용할 수 있다. 따라서 본 논문에서는 청각장애 시청자가 방송 콘텐츠 내용의 이해도를 향상시키기 위하여 지상파 UHD 방송에서 기존의 문자 자막과 움직이는 이미지 자막(=감정표현 자막)을 수신하여 동시에 표현할 수 있는 수신시스템을 제안한다.

  • PDF

Synchronization of VOD Content and Captions Using Speech Recognition and Modified Dynamic Programming (음성인식과 변경된 동적계획법을 이용한 VOD 콘텐트와 자막의 동기화)

  • Oh, Juhyun
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.131-134
    • /
    • 2021
  • 지상파 방송에서는 청각장애인을 위해 폐쇄자막(closed caption) 서비스가 제공되고 있지만, 이를 저장하여 VOD 서비스 등에 제공하고자 할 때는 영상과의 비동기화(desynchronization) 문제로 인해 활용할 수 없는 문제가 있다. 본 논문에서는 이를 해결하기 위해 자동 음성인식(automatic speech recognition)과, 자막 동기화 문제에 맞게 변경된 동적계획법(modified dynamic programming)을 이용하는 방법을 제안한다. 문자열 정렬에서 삽입과 삭제 등 간격(gap)의 발생을 제어하는 제약조건과 그에 따른 점수 구조를 적용함으로써 문자열 정렬 성능을 개선한다. 또한 정렬된 폐쇄자막과 음성인식 문자열로부터 시간 동기정보를 복원하고 동기화된 자막을 생성하는 방법을 제안한다. 실제 TV 프로그램과 자막에 적용하여 기존 방법에 비해 성능의 향상이 있음을 확인하였다.

  • PDF

Effect of Pt-Co/C Cathode Catalyst on Electrochemical Durability of Membrane in PEMFC (PEMFC에서 Pt-Co/C Cathode 촉매가 고분자막의 전기화학적 내구성에 미치는 영향)

  • Sohyeong Oh;Dong Geun Yoo;Myoung Hwan Kim;Ji Young Park;Kwonpil Park
    • Korean Chemical Engineering Research
    • /
    • v.61 no.2
    • /
    • pp.189-195
    • /
    • 2023
  • As a PEMFC (Polymer Exchange Membrane Fuel Cell) cathode catalyst, Pt-Co/C has recently been widely used because of its improved durability. In a fuel cell, electrodes and electrolytes have a close influence on each other in terms of performance and durability. The effect on the electrochemical durability of the electrolyte membrane when Pt-Co/C was replaced in the Pt/C electrode catalyst was studied. The durability of Pt-Co/C MEA (Membrane Electrode Assembly) was higher than that of Pt/C MEA in the electrochemical accelerated degradation process of PEMFC membrane. As a result of analyzing the FER (Fluorine Emission Rate) and hydrogen permeability, it was shown that the degradation rate of the membrane of Pt-Co/C MEA was lower than that of Pt/C MEA. In the OCV (Open Circuit Voltage) holding process, the rate of decrease of the active area of the Pt-Co/C electrode was lower than that of the Pt/C electrode, and the amount of Pt deposited on the membrane was smaller in Pt-Co/C MEA than in Pt/C MEA. Pt inside the polymer membrane deteriorates the membrane by generating radicals, so the degradation rate of the membrane of Pt/C MEA with a high Pt deposition rate was higher than Pt-Co/C MEA. When the Pt-Co/C catalyst was used, the electrode durability was improved, and the amount of Pt deposited on the membrane was also reduced, thereby improving the electrochemical durability of the membrane.