• 제목/요약/키워드: video signal processing

검색결과 289건 처리시간 0.025초

DCT 변환과 인간시각 칼라좌표계를 이용한 디지털 워터마킹 (Digital Watermarking using DCT and Color Coordinate of Human Vision)

  • 박성훈;김정엽;현기호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2002년도 하계종합학술대회 논문집(4)
    • /
    • pp.243-246
    • /
    • 2002
  • The proliferation of digitized media(audio, image and video) is creating a processing need for copyright enforcement schemes that protect copyright ownership. we argue that a watermark must be placed in perceptually significant components of a signal if it is to be robust to signal distortions and malicious attack. In this paper, RGB coordinate image is transformed into LUV coordinate, it include the characteristics of, Human vision and then the UV component is transformed into NxN block DCT transform. we propose a technique for embedding the watermark of visually recognizable mark into the middle frequency domain of image.

  • PDF

밝기 변화를 고려한 효율적인 장면전환 검출 알고리즘 (An Efficient Scene Change Detection Algorithm Considering Brightness Variation)

  • 김상현
    • 융합신호처리학회논문지
    • /
    • 제6권2호
    • /
    • pp.74-81
    • /
    • 2005
  • 디지털 미디어 데이터의 증가에 따라 디지털 미디어를 효과적으로 관리하고 사용하기 위하여 다양한 비디오 색인 및 비디오 시퀀스 정합을 위한 장면전환 검출 알고리즘이 제안되었다. 본 논문에서는 급격한 밝기 변화를 가지는 비디오 시퀀스에 대해서 효율적인 비디오 장면전환 검출 알고리즘을 제안한다. 급격한 밝기 변화를 고려한 비디오 색인의 정확도를 향상시키고 계산량을 줄이기 위해 제안한 알고리즘은 칼라 특성뿐만 아니라 에지 특성도 함께 사용하였으며 기존의 알고리즘에 비해 현저한 성능 향상을 보였다. 제안한 알고리즘은 먼저 칼라 히스토그램을 사용하여 후보 샷경계 지점을 추출하고 에지 정합과 밝기 보상을 이용하여 후보점들이 샷경계인지 밝기 변화인지를 결정한다. 장면내의 밝기 변화가 작은 경우 에지 정합과 밝기 보상은 샷경계에서만 일어난다. 실험 결과 제안한 방법은 기존의 방법에 비해 비슷한 계산량으로 현저히 향상된 성능과 효율을 보였다.

  • PDF

OSGi 서비스 플랫폼에서 원격 영상광고 송출 디지털 사이니지 시스템 개발 (Development of Digital Signage System for Remote Video Advertisement in OSGi Service Platform)

  • 정경용;정인재;이영실
    • 융합신호처리학회논문지
    • /
    • 제20권4호
    • /
    • pp.232-237
    • /
    • 2019
  • 최근 AR, VR 등의 첨단 기술과 결합되어 다양한 형태의 스마트 사이니지로 응용 범위가 확장되고 있다. 그러나 현재까지 디지털 사이니지 서비스는 높은 비용과 유지비로 인해 대기업, 관공서, 광고회사에 의해 제공되고 있으며, 뉴스와 광고의 점유율이 높은 상황이다. 이러한 서비스를 중소기업 및 소규모 리테일 매장에서 사용하기에는 값비싼 도입비용과 관리의 어려움이 있으며, 서비스, 솔루션 자체가 Top-Down 형태로 시장에 전개되고 있어 시장 보편화가 어려운 상황이다. 이에 본 논문에서는 OSGi 서비스 플랫폼에서 소규모 리테일 매장 등을 대상으로 점포 전면의 대형 쇼윈도(또는 유리창)를 빔 프로젝트 스크린으로 활용하여 영상 광고를 송출하고 이를 원격으로 설정, 관리 업데이트가 가능한 원격 영상광고 송출 디지털 사이니지 시스템 및 이를 위한 서비스를 제안하고자 한다.

휴대디지털 기기를 위한 소형화된 TV-out 비디오 프로세서의 구현 (Implementation of compact TV-out video processor for portable digital device)

  • 이성목;장원우;하주영;김주현;강봉순
    • 융합신호처리학회논문지
    • /
    • 제7권4호
    • /
    • pp.207-213
    • /
    • 2006
  • 본 논문은 TV 출력 기능이 필요한 휴대용 디지털 기기를 위한 소형화된 비디오 프로세서의 구현에 관한 것이다. 설계된 비디오 프로세서는 ITU-R(International Telecommunication Union-Radiocomunication) BT.470 표준을 모두 지원한다. 또한 설계된 시스템의 하드웨어 부담을 줄여 다양한 디지털 기기에 적용하기 위해 하드웨어 사이즈를 소형화 하는데 설계에 중점을 두었다. ITU-R BT.470 표준은 크게 NTSC, PAL, SECAM의 3가지로 구분되는데, NTSC와 PAL은 색차 신호를 전송하기 위해서 구조진폭변조(QAM)를 사용하고, SECAM은 주파수변조(FM)를 사용한다. SECAM 표준은 변조를 위해 pre-emphasis 필터와 anti-cloche 필터가 필요한데, 표준(ITU-R BT.470)에서 권장하는 anti-cloche 필터의 특성이 아주 예리해서 디지털로 설계하기가 용이하지 않다. 이에 본 논문에서는 anti-cloche 필터의 특성을 설계하기 쉽도록 바꾸고, 표준에서 요구하는 결과와 동일하도록 수정된 변조 방법을 제안한다. 각종 휴대용 디지털 기기는 내장 배터리로 동작되므로 소비전력을 줄이기 위하여 출력모드에 따른 파워소비를 가변하도록 하였다. 제안된 비디오 프로세서는 Altera사의 FPGA APEX20K1000EBC652-3과 삼성 LCD-TV를 이용하여 실시간 검증을 수행하였다.

  • PDF

Non-Iterative Threshold based Recovery Algorithm (NITRA) for Compressively Sensed Images and Videos

  • Poovathy, J. Florence Gnana;Radha, S.
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제9권10호
    • /
    • pp.4160-4176
    • /
    • 2015
  • Data compression like image and video compression has come a long way since the introduction of Compressive Sensing (CS) which compresses sparse signals such as images, videos etc. to very few samples i.e. M < N measurements. At the receiver end, a robust and efficient recovery algorithm estimates the original image or video. Many prominent algorithms solve least squares problem (LSP) iteratively in order to reconstruct the signal hence consuming more processing time. In this paper non-iterative threshold based recovery algorithm (NITRA) is proposed for the recovery of images and videos without solving LSP, claiming reduced complexity and better reconstruction quality. The elapsed time for images and videos using NITRA is in ㎲ range which is 100 times less than other existing algorithms. The peak signal to noise ratio (PSNR) is above 30 dB, structural similarity (SSIM) and structural content (SC) are of 99%.

퍼지 양자화를 이용한 초저전송률 동영상 부호기의 율제어 (Rate Control of Very Low Bit-Rate Video Coder using Fuzzy Quantization)

  • 양근호
    • 융합신호처리학회논문지
    • /
    • 제5권2호
    • /
    • pp.91-95
    • /
    • 2004
  • 본 연구에서는 H.263 부호기에서 양자화 변수의 추정을 위한 퍼지 제어기를 제안한다. 퍼지화 방법으로는 Mamdani법을 이용하였으며, 비퍼지화는 무게 중심법을 이용한다. 퍼지 입력변수로는 영상의 분산값, 엔트로피 및 현재의 움직임 벡터와 이전 영상의 움직임 벡터를 이용한다. 분산값과 엔트로피는 공간영역 특징을 반영하며, 움직임 벡터는 시간영역의 특징을 반영한다. 시각적인 특성에 적합하게 퍼지변수를 결정하며 퍼지 소속함수를 유도하여, 퍼지 규칙의 수를 줄이도록 FAM bank를 설계한다. 퍼지 양자화를 실제 동영상 압축에 적용함으로써 복원영상의 화질 특성이 향상되고, 율제어가 효과적으로 이루어지는 결과를 얻을 수 있음을 보인다.

  • PDF

검출된 얼굴 영역 안정화를 위한 하드웨어 구현 (Hardware Implementation for Stabilization of Detected Face Area)

  • 조호상;장경훈;강현중;강봉순
    • 융합신호처리학회논문지
    • /
    • 제13권2호
    • /
    • pp.77-82
    • /
    • 2012
  • 본 논문은 얼굴 검출 시스템에서 검출된 얼굴의 크기와 위치 정보를 이용한 얼굴 영역 안정화 알고리즘의 하드웨어 구현에 관한 것이다. adaboost 알고리즘을 이용한 얼굴 검출 시스템은 입력되는 영상을 이용하여 얼굴이라고 판단될 수 있는 템플릿 패턴, 얼굴 특징을 추출 하거나 미리 학습된 데이터와 비교하여 얼굴을 검출한다. 하지만 미세한 흔들림에도 얼굴 정보의 위치나 크기가 달라진다. 검출된 얼굴 영역의 안정화를 위해서 본 논문은 검출된 현재 얼굴 정보와 이전 프레임의 얼굴 정보를 기반으로 얼굴 영역의 흔들림을 줄이는 고주파 억제 필터, 얼굴 거리와 영역 비교, 얼굴 영역 확대-축소 연산을 이용한 얼굴 검출 안정화 하드웨어를 구현하여 실시간으로 피드백이 가능하도록 하였다.

Audio and Video Bimodal Emotion Recognition in Social Networks Based on Improved AlexNet Network and Attention Mechanism

  • Liu, Min;Tang, Jun
    • Journal of Information Processing Systems
    • /
    • 제17권4호
    • /
    • pp.754-771
    • /
    • 2021
  • In the task of continuous dimension emotion recognition, the parts that highlight the emotional expression are not the same in each mode, and the influences of different modes on the emotional state is also different. Therefore, this paper studies the fusion of the two most important modes in emotional recognition (voice and visual expression), and proposes a two-mode dual-modal emotion recognition method combined with the attention mechanism of the improved AlexNet network. After a simple preprocessing of the audio signal and the video signal, respectively, the first step is to use the prior knowledge to realize the extraction of audio characteristics. Then, facial expression features are extracted by the improved AlexNet network. Finally, the multimodal attention mechanism is used to fuse facial expression features and audio features, and the improved loss function is used to optimize the modal missing problem, so as to improve the robustness of the model and the performance of emotion recognition. The experimental results show that the concordance coefficient of the proposed model in the two dimensions of arousal and valence (concordance correlation coefficient) were 0.729 and 0.718, respectively, which are superior to several comparative algorithms.

Distributed Video Compressive Sensing Reconstruction by Adaptive PCA Sparse Basis and Nonlocal Similarity

  • Wu, Minghu;Zhu, Xiuchang
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제8권8호
    • /
    • pp.2851-2865
    • /
    • 2014
  • To improve the rate-distortion performance of distributed video compressive sensing (DVCS), the adaptive sparse basis and nonlocal similarity of video are proposed to jointly reconstruct the video signal in this paper. Due to the lack of motion information between frames and the appearance of some noises in the reference frames, the sparse dictionary, which is constructed using the examples directly extracted from the reference frames, has already not better obtained the sparse representation of the interpolated block. This paper proposes a method to construct the sparse dictionary. Firstly, the example-based data matrix is constructed by using the motion information between frames, and then the principle components analysis (PCA) is used to compute some significant principle components of data matrix. Finally, the sparse dictionary is constructed by these significant principle components. The merit of the proposed sparse dictionary is that it can not only adaptively change in terms of the spatial-temporal characteristics, but also has ability to suppress noises. Besides, considering that the sparse priors cannot preserve the edges and textures of video frames well, the nonlocal similarity regularization term has also been introduced into reconstruction model. Experimental results show that the proposed algorithm can improve the objective and subjective quality of video frame, and achieve the better rate-distortion performance of DVCS system at the cost of a certain computational complexity.

Temporal Anti-aliasing of a Stereoscopic 3D Video

  • Kim, Wook-Joong;Kim, Seong-Dae;Hur, Nam-Ho;Kim, Jin-Woong
    • ETRI Journal
    • /
    • 제31권1호
    • /
    • pp.1-9
    • /
    • 2009
  • Frequency domain analysis is a fundamental procedure for understanding the characteristics of visual data. Several studies have been conducted with 2D videos, but analysis of stereoscopic 3D videos is rarely carried out. In this paper, we derive the Fourier transform of a simplified 3D video signal and analyze how a 3D video is influenced by disparity and motion in terms of temporal aliasing. It is already known that object motion affects temporal frequency characteristics of a time-varying image sequence. In our analysis, we show that a 3D video is influenced not only by motion but also by disparity. Based on this conclusion, we present a temporal anti-aliasing filter for a 3D video. Since the human process of depth perception mainly determines the quality of a reproduced 3D image, 2D image processing techniques are not directly applicable to 3D images. The analysis presented in this paper will be useful for reducing undesirable visual artifacts in 3D video as well as for assisting the development of relevant technologies.

  • PDF