• 제목/요약/키워드: ENCODER

검색결과 1,918건 처리시간 0.026초

다차원 DCT를 이용한 비디오 부호화기 설계 (Design of video encoder using Multi-dimensional DCT)

  • 전수열;최우진;오승준;정세윤;최진수;문경애;홍진우;안창범
    • 방송공학회논문지
    • /
    • 제13권5호
    • /
    • pp.732-743
    • /
    • 2008
  • 본 논문은 H.264/AVC가 이전의 비디오 코덱에서 사용하는 8$\times$8 변환이 아닌 4$\times$4 변환을 도입하면서 인트라 및 인터 예측 성능을 높인 반면 공간적 압축도가 낮은 점을 개선하기 위한 다차원 변환 방법을 제안한다. 다차원 변환 방법은 H.264/AVC가 갖는 시간적 예측의 장점과 공간적 압축도를 동시에 충족시킬 수 있는 방법이다. 먼저 실험을 통해 다차원 DCT가 H.264/AVC의 2차원 정수 변환(Integer Transform)보다 에너지 압축율이 높다는 것을 보였다. 다차원 DCT를 위한 정수형 변환과 양자화기를 설계하였으며, H.264에서 사용하는 컨텍스트 기반 적응 가변 길이 코딩 (CAVLC)을 엔트로피 코더로 사용하여 다차원 부호화기를 설계하였다. 다차원 부호화기에는 다차원 변환에 따른 블록 주사 방식과 파라미터 갱신, 다차원 변환 모드 선택 등의 도구가 적용되었다. 실험 결과, 다차원 부호화기는 낮은 비트율에서 H.264/AVC와 유사한 압축 효율을 보였지만, 엔트로피와 0이 아닌 계수를 계산하여 비교한 통계적 성능 비교에서는 높은 성능을 보였다. 따라서, 다차원 부호화에 대한 추가적인 연구가 진행된다면 기존의 H.264/AVC의 성능을 보완할 수 있는 부호화 알고리즘으로서 발전할 수 있을 것이다.

고속 움직임 추정을 위한 움직임 추정 생략 기법 (Motion Estimation Skipping Technique for Fast Motion Estimation)

  • 강현수;박성모
    • 한국통신학회논문지
    • /
    • 제28권7C호
    • /
    • pp.726-732
    • /
    • 2003
  • 본 논문은 계산량을 줄이는 움직임 추정 (motion estimation: ME) 방법을 제안한다. 이 방법은 움직임 추정이 필요 없다고 판단되는 매크로블록(macro-block: MB)들에 대한 움직임 추정 과정을 생략함으로써 고속의 움직임 추정을 가능하게 한다. 그래서, 제안된 방법은 움직임 생략 기법 (ME skipping technique: MEST)이라고 부른다. 일반적으로 움직임 추정은 정수 화소 단위 움직임 추정 (IME)과 반화소 단위 움직임 추정 (HME)로 구성된다. MEST는 IME 과정 바로 직전에 수행되고, 이미 부호화된 주위의 MB들의 움직임 추정 오차에 기초한 기준에 따라 IME 과정을 생략할지를 판단한다. 하나의 MB에 대한 IME 과정이 생략되는 것으로 판단되었을 경우 (이 경우를 ME 생략 모드 (ME skip mode)라 부른다), IME 과정은 생략되고 그 MB에 대한 정수 화소 단위 움직임 벡터를 예측벡터로 대치한다. 예측된 그 벡터는 HME의 입력으로 사용된다. 한편, ME 생략 모드가 아닌 경우(ME non-skip mode)의 MB들에 대한 IME 과정은 생략되지 않고 보통의 IME과정을 수행하게 된다. 따라서 MEST는 ME 생략 모드로 판단되는 MB들이 많을수록 계산량을 감소시키는데 효과적이다. 뿐만 아니라 MEST가 비디오 부호화기에 적용되었을 경우, 좀 더 정화한 율제어 (rate control)과 채널 오류에 좀 더 강한 비트열 (bitstream)을 제작하는데 도움을 준다. 실험을 통해, MEST가 같은 화질을 유지하면서도 이러한 장점을 가짐을 보인다.

선박-육지간 통신을 위한 실시간 H.264 to MPEG-2 트랜스코딩 (A Real-time H.264 to MPEG-2 Transcoding for Ship to Shore Communication)

  • 손남례;정민아;이성로
    • 대한전자공학회논문지SP
    • /
    • 제48권1호
    • /
    • pp.90-102
    • /
    • 2011
  • 현재 위성방송을 통해 신호를 전송 또는 재전송하는 무선통신서비스를 이용하는 시청자 층은 다양하다. 하지만 방송국은 H.264표준으로 압축된 동영상들을 위성통신을 통하여 전송하기 때문에 H.264표준 디바이스를 갖추지 않는 선박은 실시간으로 데이터를 전송받지 못하는 단점을 가지고 있다. 따라서 본 논문에서는 기존 MPEG-2 표준 디바이스를 사용하고 있는 선박을 위하여 H.264 to MPEG-2 트랜스코딩 방법을 제안한다. 제안한 방법은 H.264 표준의 매크로블록모드의 특성을 분석하여 H.264 to MPEG-2 transcoding의 계산시간 및 화질을 개선한다. 첫째 H.264와 MPEG-2표준의 INTRA 모드 방법이 상이하므로 새로운 방법을 제안한다. 둘째 매크로블록모드가 INTER 모드인 경우에는 H.264표준의 가변블록 안에 존재하는 움직임 벡터의 방향성을 고려하여 새로운 예측움직임벡터 (PMV: predictor motion vector)를 제안한다. 이때 최종움직임벡터는 예측움직임벡터를 그대로 사용하거나, H.264표준의 매크로블록내에 존재하는 가변블록들의 움직임벡터들과 MPEG-2부호기(baseline)의 움직임벡터의 일치율을 비교하여 최종적으로 움직임벡터를 예측할 범위(window size)를 결정한다. 실험결과, 제안한 트랜스코딩방법의 PSNR은 MPEG-2 FSBMA와 거의 일치하고, 트랜스코딩에 필요한 계산시간은 평균적으로 각각 70% 또는 67% 감소하였다.

마이크로 셀룰러 시스템에서 MRC 다이버시티와 Reed-Solomon 부호를 적용한 Trellis Coded QPSK 신호의 오율 해석 (Error Performance Analysis of Trellis Coded QPSK Signal with Reed-Solomon Coding and MRC Diversity Reception in Micro-Cellular System)

  • 노재성;김영철;박기식;조성언;조성준
    • 한국전자파학회논문지
    • /
    • 제9권4호
    • /
    • pp.427-438
    • /
    • 1998
  • 본 논문에서는 동일채널간섭과 라이시안 페이딩 환경에서 Trellis Coded QPSK 시스템의 BER 생능올 분석 하였다. 고려되는 Trellis Coded QPSK 시스템은 시스템의 성능을 향상시키기 위하여 최대비 합성(MRC) 다이버시티 수신법과 Reed-Solomon 부호를 사용하였다. 유도한 오율식을 이용하여 Trellis 부호화된 QPSK 시스템의 성능을 구하여, 신호 전력 대 잡음 전력비 (SNR), 신호 전력 대 간섭파의 전력비 (SIR), 라이시안 페이딩 파라미터 (KR), MRC 다이버시티의 가지수 (M), Reed-Solomon 부호의 천체 블럭 길이 (n), Reed-Solomon 부호의 정정 가능한 심볼의 수 (t), Trellis 부호기의 상태수를 함수로 하여 그래프로 나타내고 분석하였다. 분석결과, 제안하는 시스템의 성능은 마이크로셀 환경에서 동일채널간섭과 페이딩에 의하여 영향을 받음을 알 수 있었다. 또한 희망하는 신호의 전력이나 신호 전력 대 간섭파의 전력비를 증가시켜 Trellis 부호화된 QPSK 시스템의 BER 성능을 개선할 수 있음을 알 수 있었다. 그리고 마이크로 셀룰러 시스템의 BER floor 현상은 동 일채널간섭에 의하여 발생하고, 이 현상은 신호 전력 대 간섭와의 전력배가 낮은 경우에는 높은 BER에서 발생 함을 알 수 있었다. 그리고 통일채널간섭과 라이시안 페이딩의 영향올 억압하기 위해서는 M=2인 MRC 다이버 시티 수신된 Trellis Coded QPSK 시스댐보다는 t=2, n=15인 Reed-Solomon 부호롤 척용한 Trellis Coded QPSK 시스템이 효율적임을 알 수 있었다.

  • PDF

영상회의 시스템을 위한 RTP/RTCP 구현 및 오디오 데이터 전송을 위용한 QoS 분석 (Implementation of RTP/RTCP for Teleconferencing System and Analysis of Quality-of-Service using Audio Data Transmission)

  • 강민규;황승구;김동규
    • 한국정보처리학회논문지
    • /
    • 제5권12호
    • /
    • pp.3047-3062
    • /
    • 1998
  • 본 논문은 ITU-T에서 제안한 영상회의 시스템에서 오디오/비디오 스트림 데이터를 회의 참여자에 송수신하거나 또는 수신된 멀티미디어 데이터들에 대한 QoS 정보를 송신측에 피드백 하기 위해 제공되는 RTP/RTCP 프로토콜(RFC1889,1890)에 관한 설계 및 구현에 관해 기술한다. RTP는 인코더로부터 전달된 오디오/비디오 데이터를 고정 포맷으로 패킷화하여 모든 회의 참여자에 멀티캐스팅하고, RTCP모듈은 RTP와 함께 연동되면서 수신 패킷을 모니터하여 지연, 지연변이 및 패킷 손실 등의 QoS 값들을 검출하고, 이를 비-정기적으로 송신측에 피드백하도록 구현하였다. 이들 프로토콜은 Windows NT에서 멀티쓰래드 방식으로 구현되었으며, 하위 프로토콜로 socket I/F를 통해서 U에/IP-Multicast를 이용하였다. 또한, 인터넷 환경에서 영상회의 시스템을 수행했을 때 나타나는 여러 QoS 값들을 검출하여 분석하였다. 시험은 오디오 데이터 전송을 이용하였으며 통신 부하가 심한 시간 구간에서 지연과 지연 변이는 음성 인식에 대체로 허용 범위에 충족되나 다량의 패킷 손실에 따른 품질 저하를 분석할 수 있었으며, 대부분의 손실된 패킷들은 비-연속적인 특성을 갖는 것으로 나타났다.

  • PDF

H.264/AVC에서 효율적인 정화소.부화소 움직임 추정 (Efficient Integer pel and Fractional pel Motion Estimation on H.264/AVC)

  • 윤효순;김희숙;정미경;김미영;조영주;김기홍;이귀상
    • 정보처리학회논문지B
    • /
    • 제16B권2호
    • /
    • pp.123-130
    • /
    • 2009
  • 움직임 추정은 동영상 압축에서 영상 화질과 인코더 속도에 대하여 중요한 역할을 하지만, 많은 수행 시간을 요구한다. H.264/AVC에서 움직임 추정에 소요되는 수행 시간을 줄이면서 화질을 유지하기 위하여 본 논문에서는 정화소와 부화소 움직임 추정 기법을 제안하였다. 본 논문에서는 정화소 움직임 추정을 위하여 계층적인 탐색 기법을 사용하였고, 정확한 움직임 추정을 위하여 블록 크기에 따라 부화소 움직임 추정 패턴을 적응적으로 결정하였다. 제안한 정화소 움직임 추정 탐색 기법은 대칭적 십자가-엑스 탐색 패턴, 다중 사각형 탐색 패턴, 다이아몬드 탐색 패턴들로 이루어져 있다. 이 탐색 패턴들은 블록 움직임이 수직으로 크거나 블록 움직임이 크면서 규칙적인 영상에서 국부적 최소화 문제를 해결하고 움직임 추정에 소요되는 시간을 줄이기 위하여 탐색 영역 내에 탐색 점들을 규칙적, 대칭적으로 배치하였다. 제안한 부화소 움직임 추정 탐색 기법은 부화소 움직임 추정을 위하여 기존의 전역 부화소 탐색 패턴, 중앙 편향적 부화소 탐색 패턴과 제안한 부화소 움직임 탐색패턴들을 사용한다. 그리고 블록의 크기에 따라 3가지의 부화소 탐색 패턴들 중 한 패턴이 부화소 움직임 추정을 위해 적응적으로 결정된다. 블록의 크기에 따라 적응적으로 부화소 탐색 패턴이 결정되므로 보다 정확하게 부화소 움직임 추정을 수행할 수 있다. 제안한 기법을 전역 탐색 기법과 비교하였을 때 약 5.2배의 속도 향상을 가져왔으며, 영상 화질에 있어서 약 0.01 (dB)정도 성능 저하를 보였다. 반면에, 비대칭 다중육각형 탐색 기법과 비교하였을 때 움직임 추정 속도와 화질에 있어서 각각 약 1.2배와 약 0.02 (dB)정도 향상을 보였다.

조명보상 기반 분산 다시점 비디오 코딩 (Distributed Multi-view Video Coding Based on Illumination Compensation)

  • 박시내;심동규;전병우
    • 대한전자공학회논문지SP
    • /
    • 제45권6호
    • /
    • pp.17-26
    • /
    • 2008
  • 본 논문에서는 분산 비디오 코딩기법을 이용한 조명 보상 기반의 다시점 비디오 코딩 방법을 제안한다. 다시점 비디오 코딩을 위한 분산 비디오 코딩은 주변 정보를 생성하는 방법에 따라 크게 움직임 예측 및 보간 방법과 시점 간 예측 및 보간 방법으로 나눌 수 있다. 시점 간 예측 및 보간 방법은 다시점 비디오의 특성을 이용하는 방법으로, 시점 간 상관성에 따른 보조 정보의 생성을 통하여 분산 코딩의 효율을 향상 시킬 수 있다. 그러나, 실제 다시점 영상의 특성상 시점 간 예측에서 각 시점의 카메라 파라미터 및 조명 조건 변화에 따라 부정확한 시점 간 예측 및 보간이 이루어질 수 있다. 본 논문에서는 다시점 비디오에 분산비디오 코딩기법을 적용함에 있어서, 조명 조건을 보상하는 방법을 제안한다. 이를 위하여 인코더에서 AC 변환계수의 패리티 비트에 추가하여 DC 정보를 전송하고, 디코더에서 보조 정보 생성 시 추가 전송된 DC 성분을 이용하여 조명 조건이 보상된, 보다 정확한 보조 정보를 생성하는 방법을 제안한다. 제안된 방법을 통하여 조명보상을 적용하지 않은 경우와 비교했을 때, 같은 비트율에서 $0.1{\sim}0.2dB$의 화질 향상을 얻을 수 있었다.

라벨이 없는 데이터를 사용한 종단간 음성인식기의 준교사 방식 도메인 적응 (Semi-supervised domain adaptation using unlabeled data for end-to-end speech recognition)

  • 정현재;구자현;김회린
    • 말소리와 음성과학
    • /
    • 제12권2호
    • /
    • pp.29-37
    • /
    • 2020
  • 최근 신경망 기반 심층학습 알고리즘의 적용으로 고전적인 Gaussian mixture model based hidden Markov model (GMM-HMM) 음성인식기에 비해 성능이 비약적으로 향상되었다. 또한 심층학습 기법의 장점을 더욱 잘 활용하는 방법으로 언어모델링 및 디코딩 과정을 통합처리 하는 종단간 음성인식 시스템에 대한 연구가 매우 활발히 진행되고 있다. 일반적으로 종단간 음성인식 시스템은 어텐션을 사용한 여러 층의 인코더-디코더 구조로 이루어져 있다. 때문에 종단간 음성인식 시스템이 충분히 좋은 성능을 내기 위해서는 많은 양의 음성과 문자열이 함께 있는 데이터가 필요하다. 음성-문자열 짝 데이터를 구하기 위해서는 사람의 노동력과 시간이 많이 필요하여 종단간 음성인식기를 구축하는 데 있어서 높은 장벽이 되고 있다. 그렇기에 비교적 적은 양의 음성-문자열 짝 데이터를 이용하여 종단간 음성인식기의 성능을 향상하는 선행연구들이 있으나, 음성 단일 데이터나 문자열 단일 데이터 한쪽만을 활용하여 진행된 연구가 대부분이다. 본 연구에서는 음성 또는 문자열 단일 데이터를 함께 이용하여 종단간 음성인식기가 다른 도메인의 말뭉치에서도 좋은 성능을 낼 수 있도록 하는 준교사 학습 방식을 제안했으며, 성격이 다른 도메인에 적응하여 제안된 방식이 효과적으로 동작하는지 확인하였다. 그 결과로 제안된 방식이 타깃 도메인에서 좋은 성능을 보임과 동시에 소스 도메인에서도 크게 열화되지 않는 성능을 보임을 알 수 있었다.

센서융합을 이용한 AGV의 라인 트레킹 방법 (Line Tracking Method of AGV using Sensor Fusion)

  • 정경훈;김정민;박정제;김성신;배선일
    • 한국지능시스템학회논문지
    • /
    • 제20권1호
    • /
    • pp.54-59
    • /
    • 2010
  • 본 논문은 AGV(autonomous guided vehicle)의 센서융합을 통한 위치측정(localization)과 라인 트레킹(line tracking) 방법인 AGV의 유도 시스템(guidance system)에 관한 연구이다. 기존에 AGV는 유도 되어진 선만을 주행 가능한 시스템이었고, 그러한 유도 시스템에 대표적인 방법으로는 자기-자이로 유도(magnet-gyro guidance) 방식과 유선 유도(wire guidance) 방식이 있었다. 하지만 이들은 설치 및 유지보수에 대한 비용이 높고, 작업 환경의 변화에 따른 시스템의 변경이 어렵다는 단점이 있다. 이러한 문제점을 해결하기 위해, 본 논문에서는 레이저 내비게이션과 자이로, 엔코더를 함께 이용하여 외란에 강인하고 작업 환경 및 작업의 내용에 따른 주행 경로 변경이 유연한 위치측정 시스템을 구현하였다. 또한 유도선이 없는 레이저 내비게이션의 라인 트레킹을 위해서 프로그램 상에 가상의 유도선을 설정하고, 경유 노드를 생성하여 AGV와 노드 사이의 각도 차를 바탕으로 주행 제어기(driving controller)를 설계하였다. 실험은 직접 제작한 AGV를 이용하였으며, 동일한 작업공간에서 반복적으로 라인 트래킹 실험을 하였다. 실험 결과, 설정된 주행선의 경로와 실제 AGV 사이의 최대 오차가 49.93mm 이내였으며, 제안한 시스템이 AGV의 라인 트레킹에 효율적임을 확인할 수 있었다.

H.264/AVC Main Profile을 위한 CABAC-기반의 블라인드 워터마킹 알고리즘 (A Blind Watermarking Algorithm using CABAC for H.264/AVC Main Profile)

  • 서영호;최현준;이창열;김동욱
    • 한국통신학회논문지
    • /
    • 제32권2C호
    • /
    • pp.181-188
    • /
    • 2007
  • 본 논문에서는 동영상 압축 기술인 MPEG-4 Part 10 H.264/AVC의 main profile에서 사용되는 엔트로피 코더인 CABAC(Context-based Adaptive Binary Arithmetic Coder)을 이용하여 워터마크를 삽입하고 추출하는 방법을 제안한다. 제안한 알고리즘은 워터마크 삽입을 위한 블록과 계수는 CABAC의 주변 블록 및 주변 계수와의 관계에서 추출된 컨텍스트(context)를 기반으로 선정한다. 이렇게 선별된 계수는 그 절대값과 삽입할 워터마크에 따라 원 계수를 그대로 유지하거나 LSB(Least Significant Bit) 만을 치환하는 방법으로 워터마크를 삽입한다. 따라서 공격자가 워터마크 삽입위치를 판별하기 어렵고, DC계수에 인접 계수들에 워터마크를 삽입함으로써 그 강인성(Robustness)을 만족할 수 있다. 여러 종류 및 강도의 공격을 가한 후 워터마크를 추출했을 때 최대 에러율이 5% 정도로 높은 강인성을 보였다. 또한 제안한 알고리즘은 CABAC 엔트로피 코딩 과정에서 컨텍스트 추출과정 및 이진화과정 수행 중에 워터마크를 삽입하므로, 하드웨어 구현을 고려했을 시에 워터마크 삽입을 위한 위치선정 및 계수선정에 필요한 별도의 연산 과정이 매우 적은 것이 특징이다. 따라서 이 방법은 비디오를 획득한 후 곧바로 압축하여야 하는 응용분야에서 매우 유용하게 사용될 것이라 기대된다.