• 제목/요약/키워드: Audio to Video Synchronization

검색결과 44건 처리시간 0.026초

타일드-디스플레이 시스템에서 실시간 동영상 상영기의 설계 및 구현 (Design and Implementation of a Realtime Video Player on Tiled-Display System)

  • 최기석;유정수;최정훈;낭종호
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제35권4호
    • /
    • pp.150-157
    • /
    • 2008
  • 본 논문에서는 높은 해상도를 제공하기 위하여 여러 대의 PC와 모니터를 연결한 타일드-디스 플레이(Tiled-Display) 시스템 상에서 동작하는 실시간 동영상 상영기를 설계 및 구현하였다. 제안한 동영상 상영기는 하나의 동영상을 기가 비트(Giga bit) 폐쇄 이더넷으로 연결된 여러 PC에 UDP 멀티캐스트를 사용하여 전송하고 각 수신기는 받은 동영상 데이타의 압축을 푼 후 이미지를 자신의 영역에 분할하여 시간적인 동기화를 맞추어서 재생할 수 있도록 설계되었다. 본 시스템은 미디어 데이타의 전송 중 발생하는 패킷 손실 및 지터(jitter) 문제를 동영상의 비트레이트에 따라서 방송량을 결정하는 흐름 제어 방법과 필요한 만큼 미리 받은 뒤 재생을 시작하는 버퍼링 방법을 통하여 해결하였으며, 서로 다른 PC의 상영기간의 동기화를 위하여 별도의 오버헤드 없이 시작 시간만 동기화하고 각 PC의 상영기들의 리퍼런스 클럭의 속도를 동일하도록 하여 안정적인 실시간 스트리밍 및 상영이 가능하도록 하였다. 또한 여러 전송포맷 및 압축 포맷을 지원하기 위하여 Microsoft DirectShow 구조상에서 구현되었다.

ATM 망에서 멀티미디어 동기화를 위한 DLB 기법 (The DLB Method for Multimedia Synchronization in the ATM Networks)

  • 구경옥;이병수;조용환
    • 한국통신학회논문지
    • /
    • 제22권4호
    • /
    • pp.842-854
    • /
    • 1997
  • 본 연구에서는 멀티미디어 데이터의 동기 셀 손실율을 줄이기 위해 개선된 Dual Leaky-Bucket 알고리즘을 제안하였다. 기존의 DLB 알고리즘은 동기셀에 대하여 어떠한 지원도 하지 않았으나 제안 알고리즘은 동기셀에 높은 우선순위를 부여한다. 본 연구에서는 동기셀의 손실율을 줄이기 위해 동기셀 검출기를 사용하였다. 동기셀 검출기는 수신셀을 검사하여 동기셀이며 1단계 Leaky-Bucket을 거치지 않고 바로 2단게 Leaky-Bucket으로 전달하게 된다. 이것은 동기셀에 우선순위를 주는 것과 유사한 효과를 보인다. On/Off와 Two-state MMPP로 모델링한 Audio와 Video 트래픽을 SLAM II 시뮬레이션 팩키지를 통해 시뮬레이션 한 결과 제안 알고리즘이 기존 알고리즘에 비하여 낮은 동기셀 손실율을 얻을 수 있음을 보였다. 멀티미디어 동기화를 위하여 개선된 DLB 알고리즘은 높은 우선순위를 요구하는 다른 임의의 셀에 대해서도 확장되어 적용할 수 있다.

  • PDF

교수와 학습자간의 행동 동기화를 이용한 웹 기반의 실시간 원격 강의 시스템 (A Web-based Remote Instruction System on Real-time using Action Synchronization between the Instructor and Learners)

  • 이부권;박규석;서영건
    • 한국멀티미디어학회논문지
    • /
    • 제3권6호
    • /
    • pp.611-616
    • /
    • 2000
  • 일반적으로 강의에서 가장 중요한 내용 전달 매체는 음성이며 다음으로 도큐먼트이다. 실제로 많은 원격 강의 기법에서 동영상을 제공하려고 하지만 네트워크 대역폭의 제한으로 인하여 만족할 만한 결과를 얻지 못하고 있다. 또한 특별한 브라우저를 사용하지 않고 웹 상에서 불특정 다수의 사용자들이 접근하도록 하기위해 웹 브라우저를 사용하고 있다 이와같이 동영상이나 음성과 같은 연속 미디어를 제공하기 위해서 네트워크의 제한으로 인하여 만족스럽지 못한 강의 내용을 제공하고 있으며, 웹 브라우저를 사용하게 되면 대체로 도큐먼트(웹 페이지) 위주의 강의 자료를 제공할 뿐이다. 따라서, 본 논문에서는 정보 전달 매체 중에서 가장 중요한 음성과 도큐먼트를 이용하여 웹 상에서 실시간 원격 강의 시스템을 제안한다. 여기에 사용된 부가기법으로는 교수와 학습자간의 웹 브라우저 동기화와 펜을 이용하며, 교수자는 자신의 컴퓨터를 이용하여 도큐먼트를 보면서 강의하고, 학습자는 교수자가 보고 있는 도큐먼트와 같은 것을 보면서 강의를 듣게 된다

  • PDF

멀티미디어 방송을 위한 SMIL 편집 시스템 구현 (Implementation of SMIL Editor for Multimedia Broadcasting)

  • 장대영;김창수;정회경
    • 한국정보통신학회논문지
    • /
    • 제8권3호
    • /
    • pp.622-629
    • /
    • 2004
  • 최근 디지털 방송 및 인터넷이 확산되면서, 다양한 멀티미디어 정보를 보다 자유롭게, 시간과 공간의 제약을 받지 않으면서 이용할 수 있게 되었다. 이러한 최근의 동향에 따라 오디오, 비디오와 같은 멀티미디어 데이터 표현에 대한 관심이 급증하면서 많은 사용자들은 멀티미디어 데이터를 통합한 서비스를 요구하게 되었다. 이에 따라 1998년 W3C에서 멀티미디어 객체의 표현 및 동기화 문제를 해결하기 위해 XML에 기반을 둔 SMIL(Synchronized Multimedia Integration Language)을 제안하였다. 이러한 멀티미디어 요소가 통합된 SMIL 문서는 플레이어를 통해 사용자와 상호 작용하는 멀티미디어 컨텐츠로서 단순히 오디오만 전달하는 인터넷 라디오 방송에 다양한 멀티미디어 요소를 접속하여 보다 않은 정보를 전달하며, 이를 통해 사용자 중심의 새로운 인터넷 라디오 방송 서비스를 창출할 수 있는 가능성이 마련되었다. 이에, 본 논문에서는 일반 사용자들이 손쉽게 멀티미디어 데이터들의 시간, 공간에 따른 배치 및 동기화를 표현하고 기술할 수 있도록 SMIL 문서 편집기를 설계 및 구현한 내용을 기술한다.

DMB 방송 수신을 위한 수신기의 멀티미디어 처리기 구현 (The implementation of Media Processing Part in the DMB receiver)

  • 박정훈;이상래
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2003년도 정기총회 및 학술대회
    • /
    • pp.187-190
    • /
    • 2003
  • In this paper, the efficient implementation technique of media processing part in the terrestrial and satellite DMB (Digital Multimedia Broadcasting) receiver is presented. To implement the unified multimedia Processor of DMB receiver, we investigated the characteristic of DMB service and the functionality of each processing part in the DMB receiver. To implement the synchronization between audio and video media, we present the general method to use the reference clock of the stream in the DMB receiver. Also we present the method to handle the bit error of the received bitstream within the wireless net work for robust media processor.

  • PDF

컴퓨터 영상회의 시스템을 위한 분산형과 집중형 스트림 연결 구조 비교 (Comparisons between Distributed Connections and Centralized Connections of Multimedia Streams for Computer-based Audio-Video Teleconferences)

  • 이경희;김두현;임헌규;임영환
    • 한국정보처리학회논문지
    • /
    • 제3권3호
    • /
    • pp.591-607
    • /
    • 1996
  • MuX서버는 다양한 멀티미디어 응용 프로그램 개발을 지원하기 위하여 멀티미디어 스트림의 생성 , 복제, 분할, 합성, 접합등의 멀티미디어 입출력을 위한 객체지향적이고 일관적인 인터페이스를 제공한다. 본 논문에서는 MuX의 요소객체를 이용하여 컴퓨터 영상회의 프로그램을 개발할 경우에 가능한 분산형과 집중형연결 구조에 대하여 지연, 동기 등 멀티미디어관련 성능에 따른 장단점을 비교 분석한다.

  • PDF

Design of 8K Broadcasting System based on MMT over Heterogeneous Networks

  • Sohn, Yejin;Cho, Minju;Paik, Jongho
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권8호
    • /
    • pp.4077-4091
    • /
    • 2017
  • This paper presents the design of a broadcasting scenario and system for an 8K-resolution content. Due to an 8K content is four times larger than the 4K content in terms of size, many technologies such as content acquisition, video coding, and transmission are required to deal with it. Therefore, high-quality video and audio for 8K (ultra-high definition television) service is not possible to be transmitted only using the current terrestrial broadcasting system. The proposed broadcasting system divides the 8K content into four 4K contents by area, and each area is hierarchically encoded by Scalable High-efficiency Video Coding (SHVC) into three layers: L0, L1, and L2. Every part of the 8K video content divided into areas and hierarchy is independently treated. These parts are transmitted over heterogeneous networks such as digital broadcasting and broadband networks after going through several processes of generating signal messages, encapsulation, and packetization based on MPEG media transport. We propose three methods of generating streams at the sending entity to merge the divided streams into the original content at the receiving entity. First, we design the composition information, which defines the presentation structure for displays. Second, a descriptor for content synchronization is included in the signal message. Finally, we define the rules for generating "packet_id" among the packet header fields and design the transmission scheduler to acquire the divided streams quickly. We implement the 8K broadcasting system by adapting the proposed methods and show that the 8K-resolution contents are stably received and serviced with a low delay.

시각적 어텐션을 활용한 입술과 목소리의 동기화 연구 (Lip and Voice Synchronization Using Visual Attention)

  • 윤동련;조현중
    • 정보처리학회 논문지
    • /
    • 제13권4호
    • /
    • pp.166-173
    • /
    • 2024
  • 본 연구에서는 얼굴 동영상에서 입술의 움직임과 음성 간의 동기화 탐지 방법을 제안한다. 기존의 연구에서는 얼굴 탐지 기술로 얼굴 영역의 바운딩 박스를 도출하고, 박스의 하단 절반 영역을 시각 인코더의 입력으로 사용하여 입술-음성 동기화 탐지에 필요한 시각적인 특징을 추출하였다. 본 연구에서는 입술-음성 동기화 탐지 모델이 음성 정보의 발화 영역인 입술에 더 집중할 수 있도록 사전 학습된 시각적 Attention 기반의 인코더 도입을 제안한다. 이를 위해 음성 정보 없이 시각적 정보만으로 발화하는 말을 예측하는 독순술(Lip-Reading)에서 사용된 Visual Transformer Pooling(VTP) 모듈을 인코더로 채택했다. 그리고, 제안 방법이 학습 파라미터 수가 적음에도 불구하고 LRS2 데이터 세트에서 다섯 프레임 기준으로 94.5% 정확도를 보임으로써 최근 모델인 VocaList를 능가하는 것을 실험적으로 증명하였다. 또, 제안 방법은 학습에 사용되지 않은 Acappella 데이터셋에서도 VocaList 모델보다 8% 가량의 성능 향상이 있음을 확인하였다.

T-DMB 프레임 분석 시뮬레이터 개발 및 교육활용에 관한 연구 (A Study on the Development of T-DMB Frame Analysis Simulator and its Utilization in Education)

  • 황인태;김한종
    • 실천공학교육논문지
    • /
    • 제7권1호
    • /
    • pp.31-37
    • /
    • 2015
  • T-DMB는 유럽의 Eureka-147 DAB (Digital Audio Broadcasting) 표준을 바탕으로 멀티미디어 방송이 가능하도록 표준을 추가하여 만든 서비스로 이동 중에 동영상 시청, 고품질오디오 청취, 교통정보서비스(TPEG) 등의 서비스를 제공하고 있다. T-DMB 전송 프레임은 SC 채널, FIC 채널, MSC 채널로 구성된다. 비디오, 오디오, 데이터와 같은 서비스는 MSC 채널에서 서브채널 형태로 전송되며 FIC 채널은 각 서비스와 서브채널에 관련된 정보를 전달한다. 본 연구에서는 학부, 대학원 및 교육원들에서 교육되고 있는 지상파 DMB (T-DMB) 시스템과 관련하여 T-DMB 수신기에서 수신한 T-DMB 전송 프레임을 PC로 전달하여 PC 상에서 수신된 T-DMB 전송 프레임을 분석하고 비쥬얼하게 나타내어 줌으로 T-DMB 시스템의 이해를 돕고 학습동기를 유발할 수 있도록 T-DMB 전송 프레임 분석 시뮬레이터를 C++를 이용하여 개발하고 이를 실험하였다.

SMIL을 기반으로 한 멀티미디어 네트워크 교육시스템 (Multimedia Network Teaching System based on SMIL)

  • 우뢰;조극양;방진숙;조태범;정회경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.524-527
    • /
    • 2008
  • 최근 디지털 및 인터넷이 보편화되고, 멀티미디어 처리 기술과 정보통신 기술이 발달함에 따라 인터넷을 이용한 교육의 수요는 급격히 증가하고 있다. 또한 다양한 멀티미디어 정보를 보다 자유롭게, 시간과 공간의 제약을 받지 않으면서 이용할 수 있게 되었다. 그러나 여러 종류의 오디오, 미디어와 같은 멀티미디어 데이터를 통합하여 표현하기 위한 요구가 확산되었다. 이에 따라 1998년 W3C에서 XML(eXtensible Markup Language)에 기반을 둔 SMIL(Synchronized Multimedia Integration Language)을 제안하였다. 이러한 멀티미디어 요소가 통합된 SMIL 문서는 플레이어를 통해 네트워크 교육 학습자와 상호 작용하는 멀티미디어 콘텐츠로서 단순히 오디오만 전달하는 인터넷 라디오 방송에 다양한 멀티미디어 요소를 추가하여 보다 많은 정보를 전달하며, 이를 통해 학습자 중심의 새로운 인터넷 라디오 방송 서비스를 창출할 수 있는 가능성이 마련되었다. 이에, 본 논문에서 제안한 시스템은 교사가 쉽게 멀티미디어 정보를 만들어 수업에 활용 할 수 있도록 한다. 학생들은 교사가 수업하는 오디오, 비디오 등 정보를 동시에 시청각할 수 있다. 그리고 채팅창을 통해서 문자로 실시간 교류할 수 있다. 또한, 수업 후에 학생들은 언제나 수업의 내용을 자율적으로 요청하고 볼 수 있다.

  • PDF