• 제목/요약/키워드: Parallel coding

검색결과 161건 처리시간 0.027초

UHD 영상의 실시간 처리를 위한 고성능 HEVC In-loop Filter 부호화기 하드웨어 설계 (Hardware Design of High Performance In-loop Filter in HEVC Encoder for Ultra HD Video Processing in Real Time)

  • 임준성;;류광기
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 추계학술대회
    • /
    • pp.401-404
    • /
    • 2015
  • 본 논문에서는 UHD급 영상의 실시간 처리를 위한 고성능 HEVC(High Efficiency Video Coding) In-loop Filter 부호화기의 효율적인 하드웨어 구조를 제안한다. HEVC는 양자화 에러로 발생하는 화질 열화 문제를 해결하기 위해 Deblocking Filter와 SAO(Sample Adaptive Offset)로 구성된 In-loop Filter를 사용한다. 본 논문에서 제안하는 In-loop Filter 부호화기 하드웨어 구조에서 Deblocking Filter와 SAO는 수행시간 단축을 위해 $32{\times}32CTU$를 기준으로 2단 하이브리드 파이브라인 구조를 갖는다. Deblocking Filter는 10단계 파이프라인 구조로 수행되며, 메모리 접근 최소화 및 참조 메모리 구조의 단순화를 위해 효율적인 필터링 순서를 제안한다. 또한 SAO는 화소들의 분류와 SAO 파라미터 적용을 2단계 파이프라인 구조로 구현하고, 화소들의 처리를 간소화 및 수행 사이클 감소를 위해 두 개의 병렬 Three-layered Buffer를 사용한다. 본 논문에서 제안하는 In-loop Filter 부호화기 하드웨어 구조는 Verilog HDL로 설계하였으며, TSMC 0.13um CMOS 표준 셀 라이브러리를 사용하여 합성한 결과 약 205K개의 게이트로 구현되었다. 또한 110MHz의 동작주파수에서 4K UHD급 해상도인 $3840{\times}2160@30fps$의 실시간 처리가 가능하다.

  • PDF

Radix-4 트렐리스 병렬구조 및 역방향 상태천이의 제어에 의한 역추적 비터비 디코더 (Radix-4 Trellis Parallel Architecture and Trace Back Viterbi Decoder with Backward State Transition Control)

  • 정차근
    • 대한전자공학회논문지SP
    • /
    • 제40권5호
    • /
    • pp.397-409
    • /
    • 2003
  • 본 논문에서는 2-step 트렐리스를 하나로 통합한 Radix-4 트렐리스 병렬구조 및 역방향 상태천이의 연속적인 제어에 의한 역추적 비터비 디코더를 구현하고, 이를 초고속 무선 랜에 응용한 결과를 제시한다. Radix-4 트렐리스 병렬구조의 비터비 디코더는 throughput을 개선함과 동시에 구조가 간단하고 지연시간 및 회로의 overhead가 적은 이점이 있다. 이 특성을 기반으로, 본 논문에서는 Radix-4 트렐리스 병렬구조의 구현을 위한 가지 메트릭의 계산과 ACS의 구성, 역방향 상태천이의 연속적인 제어에 의한 역추적 복호 등으로 구성된 새로운 비터비 디코더를 제안한다. 본 제안방법의 적용으로 펑처링의 결과로 인한 가변 부호율의 복호를 통합된 하나의 디코더로 대응할 수 있으며, 부호율의 변화에 따라 별도의 부가회로나 주변제어 회로를 요구하지 않는 특성을 갖는다. 또한, 본 논문에서 제안한 역방향 상태천이의 제어에 의한 역추적 복호는 메모리 제어를 위한 별도의 회로를 추가함이 없이 ACS 사이클 타임에 정확이 동기되어 순서적인 복호를 수행할 수 있게 한다. 제안방법의 유용성을 검증하기 위해, 초고속 무선 랜 규격인 IEEE 802.11a PHY 계층의 채널부호 및 복호에 적용하고, HDL 언어로 구현한 회로의 시뮬레이션 결과를 제시한다.

메모리 호출과 연산횟수 감소기법을 이용한 저전력 움직임추정 VLSI 구현 (VLSI Implementation of Low-Power Motion Estimation Using Reduced Memory Accesses and Computations)

  • 문지경;김남섭;김진상;조원경
    • 한국통신학회논문지
    • /
    • 제32권5A호
    • /
    • pp.503-509
    • /
    • 2007
  • 저전력 움직임추정은 휴대용 정보단말의 실시간 비디오 코딩에 필수적이다. 본 논문에서는 전역탐색 블록정합 방식을 적용한 저전력 움직임추정 알고리즘과 이를 1차원 배열의 VLSI로 구현한 하드웨어 구조를 제안한다. 전역 탐색 블럭정합 방법의 전력소비의 주원인은 많은 연산량과 탐색영역의 프레임 데이터를 호출하는 횟수가 많다는 점이다. 본 논문에서는 두 개의 인접한 참조블럭의 움직임추정 연산을 동시에 병렬로 수행하여 탐색영역의 메모리 호출횟수를 감소시켰으며, 움직임추정시 결과에 영향을 미치지 않는 불필요한 연산을 제거하였다. 제안된 움직임추정 알고리즘을 1차원 PE (processing element) 배열구조의 VLSI로 구현하여 실험한 결과, 제안된 움직임추정기는 기존의 저전력 움직임추정기에 비해 9.3%의 소비전력 감소와 2배 정도의 속도향상이 있음을 확인하였다.

고해상도 비디오 인코더 IP 설계에 대한 연구 (A Study on the Full-HD HEVC Encoder IP Design)

  • 이석호;조승현;김현미;이제현
    • 전자공학회논문지
    • /
    • 제52권12호
    • /
    • pp.167-173
    • /
    • 2015
  • 본 논문에서는 고해상도(Full-HD)급의 비디오를 처리할 수 있는 고효율 비디오 코딩(HEVC) 표준을 따르는 인코더 IP 설계에 대하여 기술한다. 설계된 IP는 HEVC 메인 프로파일 4.1급에 해당되며, 프레임 레이트는 60 fps 로 실시간 인코딩 가능하다. 하드웨어 및 소프트웨어 IP 설계 전에 C 언어로 전체 참조 모델을 개발하였으며 고속처리를 위한 병렬처리구조와 저 전력을 위한 스킵모드를 제안하였다. 또한 IP 관련 펌웨어 및 드라이버 프로그램을 작성하였다. IP 검증을 위한 플랫폼을 개발하였고 설계된 통합 IP를 FPGA 보드로 구현하여 다양한 영상에 대하여 여러 인코딩 조건에서 기능 및 성능을 검증하였다. HM-13.0대비 동일 PSNR에서 약 35% 정도의 비트율 감소와 저전력 모드에서 약 25% 정도의 전력 소모 감소 효과가 있었다.

Benzoazole계 화합물이 glutathione-S-transferases의 유도발현에 미치는 영향 (Expression of Rat Hepatic Glutathione-S-Transferases by Benzoazoles)

  • 서경원;김연정;김태완;김효정;조민경;김상건
    • Environmental Analysis Health and Toxicology
    • /
    • 제13권3_4호
    • /
    • pp.55-61
    • /
    • 1998
  • Glutathione-S-transferases (GSTs) detoxify electrophilic xenobiotics and reactive metabolites. Recently benzene-fused heterocycles have been shown to increase the total amount of hepatic GSTs in rats. Primarily this study aimed to determine the induction of GSTs by benzoazoles (BAs) including benzoxazole (BX), 2-methylbenzoxazole (M-BX), 2,5-dimethyl benzoxazole (D-BX), benzothiazole (BT), aminobenzothiazole (A-BT) and 2-mercaptobenzothiazole (M-BT) in rats. Hepatic cytosol and poly(A)$^+$ mRNA were prepared from rats after oral administration of BX, BT, M-BX, D-BX, A-BT and M-BT for 5 consecutive days at doses of 1 mmol/kg. Western immunoblot and northern blot analysis were conducted with rabbit anti-GST Ya, Yb$_1$, Yb$_2$, Yc antibodies and cDNA probes containing = 500 bps in the specific coding regions of Ya, Yb$_1$, Yb$_2$, Yc$_1$, and Yc$_2$, respectively. All BAs increased the amount of enzymes and mRNA levels of GSTs. BT was the most effective inducer of GSTs among the compounds examined in this study. Although A-BT and M-BT, the derivatives of BT, induced GSTs, these chemicals had lesser effect on induction of GSTs than BT. The derivatives of BX also induced less GSTs than the parent compound and the addition of methyl group to the benzene ring of BX reduced the induction of GSTs. BAs had better inductive effects on the class $\alpha$(Ya, Yc) than class $\mu$ GSTs (Yb$_1$, Yb$_2$). BAs enhanced mRNA levels of GSTs in parallel with the protein levels. These results indicate that 1) most of BAs induced various isozymes of GSTs, 2) the induction of GSTs appears to be correlated with the chemical structure of the derivatives, and 3) the expression of GST by BAs is presumably under the transcriptional regulation.

  • PDF

HEVC 실시간 소프트웨어 인코더를 위한 GOP 병렬 부호화를 지원하는 R-lambda 모델 기반의 율 제어 방법 (An R-lambda Model based Rate Control Scheme to Support Parallel GOP Coding for Real-Time HEVC Software Encoders)

  • 김대은;장용준;김문철;임웅;김휘용;석진욱
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 추계학술대회
    • /
    • pp.107-109
    • /
    • 2016
  • 본 논문에서는 4K UHD 입력 영상을 실시간으로 부호화하기 위해 적용되는 GOP 단위 또는 IDR 주기 단위의 병렬 부호화 구조를 지원하도록 R-${\lambda}$ 모델 기반의 율 제어 방법을 개선하는 비트 분배(bit allocation) 방법을 제안한다. GOP 단위 또는 IDR 주기 단위의 병렬 부호화기 내에서 율 제어기를 작동시키는 경우, 계층적 B 구조에서 같은 계층에 있는 프레임 간에는 상호간에 얼마만큼의 비트를 소모 하였는지에 대한 정보를 공유 할 수 없기 때문에 기존의 비트 분배 방식으로는 비트 예산(bit budget) 관리가 불가능하다. 이를 해결하기 위해 본 논문에서는, 기존의 R-${\lambda}$ 모델 기반 율 제어 방법을 개선하여 부호화 순서에 의한 시간 순서 방향의 비트 예산 갱신 기반 비트 분배하던 방식으로부터, GOP 마다 비트를 할당한 후 계층적 B 구조에서의 계층이 깊어지는 방향으로 비트 예산을 갱신하여 비트를 분배하는 방식으로 율 배분 방식을 개선하였다. 실험 결과를 통해 R-${\lambda}$ 모델 기반 율 제어의 기존 비트 분배 방식보다 제안 방법에 의한 목표 비트 율 달성 오차가 감소함을 확인하였다.

  • PDF

새로운 비대칭 구조를 갖는 터보부호의 Flattening Effect의 성능향상에 관한 연구 (Performance Improvement of the battening Effect of the new Asymmetric Turbo Codes)

  • 정대호;정성태;김환용
    • 한국통신학회논문지
    • /
    • 제27권6A호
    • /
    • pp.533-539
    • /
    • 2002
  • 터보부호는 반복복호 수와 인터리버 크기가 증가할수록 AWGN 채널환경에서 BER 성능이 향상된다는 것은 잘 알려진 사실이다. 그러나 반복복호 수와 인터리버 크기가 증가하면 상대적으로 복호 과정에서 복호지연과 계산량이 증가하게 된다. 또한 임의의 SM에서는 더 이상 BER 성능의 향상이 없는 flattening effect 현상이 발생하기 때문에 오류정정 능력의 한계에 도달하는 큰 단점을 가진다. 따라서 본 논문에서는 터보부호의 flattening effect 현상을 개선시키기 위해서 두 구성부호기의 구속장 뿐만아니라 생성다항식 자체도 서로 다르게 구성한 새로운 비대칭 구조를 갖는 터보부호를 제안한다. 제안된 비대칭 터보부호는 각각의 구성부호기의 생성다항식을 원시다항식과 소수다항식을 혼합한 형태로 구성하였고 구속장도 서로 다르게 구성하여 다양한 구조와 다양한 유효자유거리(effective free distance)를 갖도록 구성하였다. 제안된 비대칭 터보부호는 부호율이 1/3일 때 log-MAP 복호방법을 이용하여 상대적으로 작은 프레임(128. 256)과 큰 프레임(512, 1024)으로 인터리버 크기를 조절하면서 그 성능을 분석하였다. 모의실험 결과, 기존의 터보부호에 비해서 $10^{-4}$의 BER 영역에서 작은 프레임의 경우에 1.7dB~2.5dB이상의 우수한 성능을 나타냈으며 큰 프레임의 경우에 2.0dB~2.5dB 이상의 우수한 성능을 나타냄을 확인할 수 있었고 flattening effect 현상의 개선효과가 있음을 확인할 수 있었다.

광통신 시스템을 위한 40Gb/s Forward Error Correction 구조 설계 (40Gb/s Foward Error Correction Architecture for Optical Communication System)

  • 이승범;이한호
    • 대한전자공학회논문지SD
    • /
    • 제45권2호
    • /
    • pp.101-111
    • /
    • 2008
  • 본 논문은 40Gb/s급 광통신 시스템에서 사용되는 고속 리드-솔로몬(RS) 복호기의 하드웨어 면적을 줄인 새로운 구조를 소개하고 RS 복호기 기반의 고속 FEC구조를 제안한다. 특히 높은 데이터처리율과 적은 하드웨어 복잡도를 가지고 있는 차수 연산 블록이 제거된 pDCME 알고리즘 구조를 소개한다. 제안된 16채널 RS FEC구조는 8개의 신드롬 계산 블록이 1개의 KES 블록을 공유하는 8 채널 RS FEC구조 2개로 구성되어 있다. 따라서 4개의 신드롬 계산 블록에 1개의 KES블록을 공유하는 기존의 16채널 3-병렬 FEC 구조와 비교하여 하드웨어 복잡도를 약 30%정도 줄일 수 있다. 제안된 FEC 구조는 1.8V의 공급전압과 $0.18-{\mu}m$ CMOS 기술을 사용하여 구현하였고 총 250K개의 게이트수와 5.1Gbit/s의 데이터 처리율을 가지고 400MHz의 클럭 주파수에서 동작함을 보여준다. 제안된 면적 효율적인 FEC 구조는 초고속 광통신뿐만 아니라 무선통신을 위한 차세대 FEC 구조 등에 바로 적용될 수 있을 것이다.

전파천문 관측데이터 분석을 위해 소프트웨어를 이용한 디지털필터 설계에 관한 연구 (A Study on the Digital Filter Design using Software for Analysis of Observation Data in Radio Astronomy)

  • 염재환;오세진;노덕규;오충식;정동규;신재식;김효령;황주연
    • 융합신호처리학회논문지
    • /
    • 제16권4호
    • /
    • pp.175-181
    • /
    • 2015
  • 본 논문은 전파천문 관측데이터 분석을 위해 소프트웨어를 이용한 디지털필터 설계방법에 대해 제안한다. 전파천문 관측시스템은 컴퓨팅 시스템의 발전과 함께 하드웨어에서 소프트웨어를 이용한 분석방법으로 넘어가는 단계이다. 기존 하드웨어로는 특정규격에 맞도록 설계 제작되었기 때문에 규격을 변경하는 것이 어렵고 제작에 많은 비용이 소요되지만, 소프트웨어는 규격 변경이 유연하고 공개 소프트웨어를 이용할 경우 저렴하게 설계할 수 있는 장점이 있다. 그러나 소프트웨어로 전파천문과 같이 많은 자료를 분석하기 위해서는 컴퓨터 시스템의 성능이 우수해야 하는 점도 있다. 본 연구에서는 한국우주전파관측망에서 운영하고 있는 관측시스템 중에서 하드웨어로 구성된 디지털필터와 같은 성능을 갖는 소프트웨어 디지털 필터 설계에 대해 제안한다. 제안 방법은 표준 C언어를 이용하여 디지털 필터를 설계하였으며, 설계한 디지털필터에 대해 GNU Octave로 시뮬레이션을 수행하여 유효성을 검토하였다. 또한 설계한 디지털필터의 고속연산을 위해 병렬연산이 가능한 SSE 라이브러리를 도입하였다. KVN 관측모드 중에 광대역 관측데이터를 대상으로 제안한 방법의 디지털 필터를 통하여 협대역 관측모드로 데이터 필터링을 수행하였다. 그 결과, 대역 내의 필터링이 설계대로 수행되었고 리플이 발생하지 않아, 제안방법이 유효함을 확인하였다.

H.264/AVC용 가변 블록 크기를 지원하는 움직임 추정 부호기의 연구 (A Study on Motion Estimation Encoder Supporting Variable Block Size for H.264/AVC)

  • 김원삼;손승일
    • 한국정보통신학회논문지
    • /
    • 제12권10호
    • /
    • pp.1845-1852
    • /
    • 2008
  • 인터 예측의 핵심 요소는 ME와 MC이다. ME는 SAD(Sum of Absolute Difference)와 같은 정합기준을 사용하는 것뿐만 아니라 비트스트림의 최종 비트수에 따라서 최적의 움직임 벡터를 찾는다. 인터 예측부호화는 고화질의 실시간 비디오 응용에 있어서 언제나 주된 병목을 초래한다. 따라서 실시간 비디오 응용에서는 인터 예측을 수행하는 고속의 전용 하드웨어를 필요로 한다. 본 논문에서는 H.264/AVC의 움직임 추정기를 연구하였다. 설계된 움직임 추정기는 2-D 시스토릭 배열 기반으로 기본 처리기 요소를 병렬로 연결하여 SAD 값을 빠르게 계산한다. 참조데이터를 상위영역과 하위영역으로 나누어 각각의 연결선을 두고 입력 시퀀스를 조절하여 파이프라인 중지 없이 연속적인 연산을 수행한다. 데이터 재사용 기법을 통하여 메모리 엑세스를 줄였고 특별한 지연 없이 최소의 SAD를 갖는 파티션을 찾아내어 움직임 벡터를 생성하게 하였다. 설계된 움직임 추정기는 가변 블록 크기를 지원하며 하나의 매크로블록의 연산을 하는데 328 사이클이 소요된다. 논문 [6]이 로컬메모리를 사용하는 것과 달리, 본 논문은 로컬메모리를 사용하지 않는다.