• 제목/요약/키워드: pre-decoding

검색결과 29건 처리시간 0.025초

SIMT구조 GP-GPU의 명령어 처리 성능 향상을 위한 Dispatch Unit과 Operand Selection Unit설계 (Design of a Dispatch Unit & Operand Selection Unit for Improving the SIMT Based GP-GPU Instruction Performance)

  • 곽재창
    • 전기전자학회논문지
    • /
    • 제19권3호
    • /
    • pp.455-459
    • /
    • 2015
  • 본 논문은 그래픽 처리 뿐 만 아니라 범용 연산의 가속화를 지원하기 위한 SIMT 구조 GP-GPU의 Dispatch Unit과 Operand Selection Unit을 제안한다. Warp Scheduler로부터 발행된 명령어에서 사용되는 Operand의 모든 정보를 Decoding 하면 불필요한 Operand Load가 발생하여 레지스터 부하가 발생 한다. 이러한 문제점을 해결하기 위해 Pre-decoding방법을 사용하여 Operand의 정보만을 먼저 Decoding 하여 Operand Load를 줄이고, 레지스터의 부하를 줄일 수 있는 방법을 제안한다. 제안하는 Dispatch Unit에서 나온 Operand 정보들을 레지스터 뱅크 충돌을 방지하는 방법을 적용한 Operand Selection Unit에 전달해 전체적인 처리 성능을 향상 시켰다. Modelsim 10.0b를 이용하여 Warp Scheduler로부터 발행된 10,000개의 임의의 명령어를 처리하여 소요되는 총 Clock Cycle을 측정하였다. 본 논문에서 제안한 Pre-Decoding 기능을 탑재한 Dispatch Unit과 Operand Selection Unit을 적용하여 기존의 방법들 보다 각각 약 11%, 24%의 처리 효율이 증가한 것을 확인 할 수 있었다.

단일 비트 이하 오류 정정을 위한 극 부호용 선 처리 복호기법 (Low-Latency Polar Decoding for Error-Free and Single-Error Cases)

  • 최소연;유호영
    • 전기전자학회논문지
    • /
    • 제22권4호
    • /
    • pp.1168-1174
    • /
    • 2018
  • NAND 플래시 메모리를 포함하는 저장 매체의 경우 초기 상태에서 메모리 셀의 상태가 매우 우수하기 때문에, 오류가 없거나 단일 오류가 발생하는 경우가 지배적이다. 무-오류와 단일-오류에 대한 처리는 저장 매체의 시스템에 있어서 전체 시스템 성능에 영향을 미치는 중요한 요소가 된다. 전통적인 polar code 복호기법은 무-오류 또는 단일-오류에 대한 독립적인 검출이 불가능하기 때문에 일반적인 복호화 기법을 따르며 다른 오류 발생 경우와 동일한 수준의 지연 시간을 가진다. 본 논문에서는 저장 매체에서 빈번하게 발생하는 무-오류 또는 단일-오류에 대한 검출 및 정정을 일반적인 복호화 과정에 앞서 처리해줌으로써, 전체 복호화 과정에 필요한 평균적인 지연시간을 감소시키는 기법을 제안한다. 실험 결과에 따르면 무-오류 또는 단일-오류에 대한 제안하는 선 처리 (pre-processing) 기법을 적용할 경우 (1024, 512) 극 부호에 대하여 일반적인 복호화기법 대비 평균 지연시간을 약 64% 줄일 수 있다.

Reliability-Based Iterative Proportionality-logic Decoding of LDPC Codes with Adaptive Decision

  • Sun, Youming;Chen, Haiqiang;Li, Xiangcheng;Luo, Lingshan;Qin, Tuanfa
    • Journal of Communications and Networks
    • /
    • 제17권3호
    • /
    • pp.213-220
    • /
    • 2015
  • In this paper, we present a reliability-based iterative proportionality-logic decoding algorithm for two classes of structured low-density parity-check (LDPC) codes. The main contributions of this paper include: 1) Syndrome messages instead of extrinsic messages are processed and exchanged between variable nodes and check nodes, which can reduce the decoding complexity; 2) a more flexible decision mechanism is developed in which the decision threshold can be self-adjusted during the iterative process. Such decision mechanism is particularly effective for decoding the majority-logic decodable codes; 3) only part of the variable nodes satisfying the pre-designed criterion are involved for the presented algorithm, which is in the proportionality-logic sense and can further reduce the computational complexity. Simulation results show that, when combined with factor correction techniques and appropriate proportionality parameter, the presented algorithm performs well and can achieve fast decoding convergence rate while maintaining relative low decoding complexity, especially for small quantized levels (3-4 bits). The presented algorithm provides a candidate for those application scenarios where the memory load and the energy consumption are extremely constrained.

OCHM 시스템에서 전확산에 의한 충돌 분산 기법 (Collision Dispersion Based on Orthogonal Pre-Spreading in Orthogonal Code Hopping Multiplexing)

  • 권재균;정방철;윤경수;성단근
    • 한국통신학회논문지
    • /
    • 제34권9A호
    • /
    • pp.679-684
    • /
    • 2009
  • OCHM(orthogonal code hoppging multiplexing) 방식은 시스템의 직교 부호 채널 수보다 훨씬 많은 숫자의 저 활성도 채널을 수용하기 위해 고안되었다. 본 논문에서는 OCHM 시스템에서 발생하는 심볼 충돌에 의한 열화를 줄이기 위해 직교 전확산(pre-spreading)에 기반한 충돌 분산 기법을 제안한다. 제안된 방식은 채널 복호 과정에서 요구 신호대 잡음비를 대폭 개선한다. 또한 본 방식은 OFDM에 기반한 주파수 도약인 OFHM 시스템에도 적용될 수 있다.

느린 페이딩 채널에서 공간-시간 트렐리스 부호화된 OFDM의 준최적 검파 (Suboptimum detection of space-time trellis coded OFDM over slowly fading channel)

  • 김영주;이신;박노윤;이인성
    • 대한전자공학회논문지TC
    • /
    • 제44권12호
    • /
    • pp.28-33
    • /
    • 2007
  • 느린 페이딩 패널에서 공간-시간 트렐리스 부호화된 OFDM 시스템을 제안하고, 시간 영역에서 제안된 principal ratio combining(PRC)와 일반화된 PRE(GPRC)의 수식을 이론적으로 주파수 영역에서 새롭게 분석한다. 시간영역에서와 마찬가지로 GPRC 기법은 ML 및 PRC 기법을 분할하여 성능과 수신기 복잡도 간의 유연한 tradeoff를 활용할 수 있다. M진 PSK 변조 방식을 이용하는 컴퓨터 시뮬레이션을 통해 주파수 플랫 및 주파수 선택적 페이딩에서 성능을 검증한다. 또한 세 가지 수신 기법간의 수신기 복잡도와 시뮬레이션 시간을 비교 검토한다.

동화 내용에 대한 교사와 유아의 토의활동이 유아의 문해발달에 미치는 효과 (Effects on Literacy Development of Teacher-Child Discussion about the Contents of Storybooks)

  • 민옥진;이윤경
    • 아동학회지
    • /
    • 제22권1호
    • /
    • pp.163-175
    • /
    • 2001
  • This study investigated the effect on children's literacy of teacher-child discussion about the contents of storybooks. The subjects were 10 experimental and 10 control 5-year-old kindergarten children in Cheongju. The experimental design was the Split Plot design. The research instruments used for pre- and post-tests were the Vocabulary Decoding Competence Test(Lee, 1998), Writing Competence Test(Lee & Lee, 1990), Story Comprehension Competence Test(Lee, 1998; Morrow, 1990), and the Emergent Reading Ability Judgements for Favorite Storybooks(Sulzby, 1985). Data were analyzed by ANOVA with repeated measures. Results showed that the teacher-child discussions about the contents of storybooks were effective for improving children's competence in decoding vocabulary, writing, and story comprehension but not for improving emergent reading ability.

  • PDF

메모리 최적화를 위한 Viterbi 디코더의 설계 (A design of Viterbi decoder for memory optimization)

  • 신동석;박종진김은원조원경
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 1998년도 하계종합학술대회논문집
    • /
    • pp.285-288
    • /
    • 1998
  • Viterbi docoder is a maximum likelihood decoding method for convolution coding used in satellite and mobile communications. In this paper, a Viterbi decoder with constraint length of K=7, 3-soft decision and traceback depth of $\Gamma$=96 for convolution code is implemented using VHDL. The hardware size of designed decoder is reduced by 4 bit pre-traceback in the survivor memory.

  • PDF

An Efficient List Successive Cancellation Decoder for Polar Codes

  • Piao, Zheyan;Kim, Chan-Mi;Chung, Jin-Gyun
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제16권5호
    • /
    • pp.550-556
    • /
    • 2016
  • Polar codes are one of the most favorable capacity-achieving codes due to their simple structure and low decoding complexity. However, because of the disappointing decoding performance realized using conventional successive cancellation (SC) decoders, polar codes cannot be used directly in practical applications. In contrast to conventional SC decoders, list SC (SCL) decoders with large list sizes (e.g. 32) achieve performances very close to those of maximum-likelihood (ML) decoders. In SCL decoders with large list sizes, however, hardware increase is a severe problem because an SCL decoder with list size L consists of L copies of an SC decoder. In this paper, we present a low-area SCL decoder architecture that applies the proposed merged processing element-sharing (MPES) algorithm. A merged processing element (MPE) is the basic processing unit in SC decoders, and the required number of MPEs is L(N-1) in conventional SCL decoders. Using the proposed algorithm reduces the number of MPEs by about 70% compared with conventional SCL decoders when the list size is larger than 32.

Construction of Structured q-ary LDPC Codes over Small Fields Using Sliding-Window Method

  • Chen, Haiqiang;Liu, Yunyi;Qin, Tuanfa;Yao, Haitao;Tang, Qiuling
    • Journal of Communications and Networks
    • /
    • 제16권5호
    • /
    • pp.479-484
    • /
    • 2014
  • In this paper, we consider the construction of cyclic and quasi-cyclic structured q-ary low-density parity-check (LDPC) codes over a designated small field. The construction is performed with a pre-defined sliding-window, which actually executes the regular mapping from original field to the targeted field under certain parameters. Compared to the original codes, the new constructed codes can provide better flexibility in choice of code rate, code length and size of field. The constructed codes over small fields with code length from tenths to hundreds perform well with q-ary sum-product decoding algorithm (QSPA) over the additive white Gaussian noise channel and are comparable to the improved spherepacking bound. These codes may found applications in wireless sensor networks (WSN), where the delay and energy are extremely constrained.