• 제목/요약/키워드: Code Optimization

검색결과 589건 처리시간 0.032초

Code Generation and Optimization for the Flow-based Network Processor based on LLVM

  • Lee, SangHee;Lee, Hokyoon;Kim, Seon Wook;Heo, Hwanjo;Park, Jongdae
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2012년도 추계학술발표대회
    • /
    • pp.42-45
    • /
    • 2012
  • A network processor (NP) is an application-specific instruction-set processor for fast and efficient packet processing. There are many issues in compiler's code generation and optimization due to NP's hardware constraints and special hardware support. In this paper, we describe in detail how to resolve the issues. Our compiler was developed on LLVM 3.0 and the NP target was our in-house network processor which consists of 32 64-bit RISC processors and supports multi-context with special hardware structures. Our compiler incurs only 9.36% code size overhead over hand-written code while satisfying QoS, and the generated code was tested on a real packet processing hardware, called S20 for code verification and performance evaluation.

ARM Core(R)를 이용한 AMR-WB+ 오디오 부호화기의 실시간 구현 (Real-time Implementation of the AMR-WB+ Audio Coder using ARM Core(R))

  • 원양희;이형일;강상원
    • 대한전자공학회논문지SP
    • /
    • 제46권3호
    • /
    • pp.119-124
    • /
    • 2009
  • 본 논문에서는 AMR Core(R)를 이용해서 AMR-WB+ 오디오 부호화기를 실시간 구현하였다. 구현 시 사용된 최적화 방법은 어셈블리어 단계에서 수행되었고, latency를 제거하고 32비트 레지스터를 사용하였다. 구현된 음성 부호화기는 평균 복잡도가 ARM9E 버전에서 인코더 160.76MHz, 디코더 33.05MHz으로 총 193.81MHz로 측정되었다. 사용된 ROM의 크기는 인코더 65.21Kbyte, 디코더 32.01Kbyte, 공통소스 279.81Kbyte이다. 구현된 AMR-WB+ 소스 코드는 3GPP에서 제공하는 테스트 벡터들을 CodeWarrior와 목표 PDA 상에서 모두 bit-exact하게 통과함을 보임으로써 검증되었다.

Optimization of HE-AAC for Korean S-DMB Using TMS320C55x DSP Core

  • Kim, Hyung-Jung;Jee, Deock-Gu
    • The Journal of the Acoustical Society of Korea
    • /
    • 제25권4E호
    • /
    • pp.137-141
    • /
    • 2006
  • This paper presents HE-AAC decoder optimization on TMS320C55x fixed-point DSP core using a DSP-C like FFR code, which provides fast and flexible porting to a DSP core. Our optimization efforts are focused on methodologies that include general optimization methods of FFR code suitable for general DSP or RISC platform in high-level language and software optimization methods in assembly language level. The implementation result requires 48 MIPS and 135 Kbytes memory space to decode 48 Kbps stereo using real Korean S-DMB data.

불필요한 코드 모션 억제를 위한 배정문 모션 (An Assignment Motion to Suppress the Unnecessary Code Motion)

  • 신현덕;이대식;안희학
    • 인터넷정보학회논문지
    • /
    • 제9권1호
    • /
    • pp.55-67
    • /
    • 2008
  • 본 논문에서는 코드 최적화를 위하여 계산적으로나 수명적으로 제한이 없는 배정문 모션 알고리즘을 제안한다. 이 알고리즘은 지나친 레지스터의 사용을 막기 위하여 불필요한 코드 모션을 억제한다. 본 논문은 최종 최적화단계가 추가된 배정문 모션 알고리즘을 제안한다. 또한 기존 알고리즘의 술어의 의미가 명확하지 않은 것을 개선하였고 노드 단위 분석과 명령어 단위 분석을 혼용했기 때문에 발생하는 모호함도 개선하였다. 따라서 제안한 알고리즘은 불필요하게 중복된 수식이나 배정문의 수행을 피하게 함으로써, 프로그램의 불필요한 재계산이나 재실행을 하지 않게 하여 프로그램의 능률 및 실행시간을 향상시킨다.

  • PDF

불필요한 코드모션 억제를 위한 배정문 모션 알고리즘 (An Assignment Motion Algorithm to Suppress the Unnecessary Code Motion)

  • 신현덕;안희학
    • 정보처리학회논문지A
    • /
    • 제8A권1호
    • /
    • pp.27-35
    • /
    • 2001
  • 본 논문에서는 코드 최적화를 위하여 계산적으로나 수명적으로 제한이 없는 배정문 모션 알고리즘을 제안한다. 이 알고리즘은 지나친 레지스터의 사용을 막기 위하여 불필요한 코드 모션을 억제한다. 본 논문은 최종 최적화단계가 추가된 재정문 모션 알고리즘을 제안한다. 또한 기존 알고리즘의 술어의 의미가 명확하지 않은 것을 개선하였고 노드 단위 분석과 명령어 단위 분석을 혼용했기 때문에 발생하는 모호함도 개선하였다. 따라서 제안한 알고리즘은 불필요하게 중복된 수식이나 배정문의 수행을 피하게 함으로써, 프로그램의 불필요한 재계산이나 재실행을 하지 않게 하여 프로그램의 능률 및 실행시간을 향사시킨다.

  • PDF

APPLICATION OF A GENETIC ALGORITHM FOR THE OPTIMIZATION OF ENRICHMENT ZONING AND GADOLINIA FUEL (UO2/Gd2O3) ROD DESIGNS IN OPR1000s

  • Kwon, Tae-Je;Kim, Jong-Kyung
    • Nuclear Engineering and Technology
    • /
    • 제44권3호
    • /
    • pp.273-282
    • /
    • 2012
  • A new effective methodology for optimizing the enrichment of low-enriched zones as well as gadolinia fuel ($UO_2/Gd_2O_3$) rod designs in PLUS7 fuel assemblies was developed to minimize the maximum peak power in the core and to maximize the cycle lifetime. An automated link code was developed to integrate the genetic algorithm (GA) and the core design code package of ALPHA/PHOENIX-P/ANC and to generate and evaluate the candidates to be optimized efficiently through the integrated code package. This study introduces an optimization technique for the optimization of gadolinia fuel rod designs in order to effectively reduce the peak powers for a few hot assemblies simultaneously during the cycle. Coupled with the gadolinia optimization, the optimum enrichments were determined using the same automated code package. Applying this technique to the reference core of Ulchin Unit 4 Cycle 11, the gadolinia fuel rods in each hot assembly were optimized to different numbers and positions from their original designs, and the maximum peak power was decreased by 2.5%, while the independent optimization technique showed a decrease of 1.6% for the same fuel assembly. The lower enrichments at the fuel rods adjacent to the corner gap (CG), guide tube (GT), and instrumentation tube (IT) were optimized from the current 4.1, 4.1, 4.1 w/o to 4.65, 4.2, 4.2 w/o. The increase in the cycle lifetime achieved through this methodology was 5 effective full-power days (EFPD) on an ideal equilibrium cycle basis while keeping the peak power as low as 2.3% compared with the original design.

원전구조물의 고강도철근 설계 최적화 방안 (Design Optimization of Nuclear Power Plant Structures with High-Strength Reinforcements)

  • 이병수
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2017년도 추계 학술논문 발표대회
    • /
    • pp.137-138
    • /
    • 2017
  • Generally, a lot of reinforcements are used in nuclear power plant concrete structures in order to improve the structural safety, but it may cause several potential problems due to the overcrowded reinforcement, such as the degradation of concrete quality, the construction delay and the increase of construction cost. In order to resolve these problems, structural test researches and code change studies on using high-strength reinforcement (Gr.80) in unclear power plant structures are under way, and there is good progress in code change of ASM BPVC.III.2 and ACI 349. This purpose of this study is to review the code change status ASM BPVC.III.2, ACI 349 under way to use the high-strength reinforcement in nuclear power plant structures. Also I will introduce the design optimization of NPP structures with high-strength reinforcements in order to maximize the effect and minimize the problem when using the high-strength reinforcements in NPP structures.

  • PDF

다목적 Error Correcting Code의 새로운 설계방법 (A New Approach to Multi-objective Error Correcting Code Design Method)

  • 이희성;김은태
    • 한국지능시스템학회논문지
    • /
    • 제18권5호
    • /
    • pp.611-616
    • /
    • 2008
  • Error correcting codes는 일반적으로 soft error를 막기 위해서 사용된다. single error의 수정과 double error의 검출(SEC-DED) 코드들은 이런 목적으로 사용된다. 본 논문에서는 이러한 회로의 크기, 지연시간, 전력 소비를 선택적으로 최소로 하는 SEC-DED의 설계방법을 제안한다. 이러한 SEC-DED의 설계는 비선형 최적화 문제로 포함되는데 우리는 다목적 유전자 알고리즘을 이용하여 이 문제를 해결한다. 제안하는 방법은 여러 가지 SEC-DED code들을 제공하여 사용자의 환경에 따라 알맞은 회로를 선택할 수 있도록 한다. 제안하는 방법을 효율적인 ECC코드로 알려져 있는 odd-column weight Hsiao code에 적용하여 그 효율성을 입증하였다.

CFX 와 HEEDS 를 이용한 사류펌프 임펠러-디퓨저 최적화방법 (Mixed-Flow Pump Impeller-Diffuser Optimization Method by Using CFX and HEEDS)

  • 이용갑;박인형;신재혁;김성;이경용;최영석
    • 대한기계학회논문집B
    • /
    • 제39권10호
    • /
    • pp.831-842
    • /
    • 2015
  • 본 논문에서는 사류펌프의 성능을 향상시키는 최적화 방법을 개발하였다. 본 연구에서 개발한 최적화 방법은 유동해석코드인 CFX 와 최적화 소프트웨어인 HEEDS 를 연계하는 프로세스로 이루어진다. CFX 는 유체기계해석 분야에서는 잘 알려진 소프트웨어로 해석결과의 신뢰성은 이미 검증되었으나, 새롭게 소개되고 있는 HEEDS 는 주로 구조해석 분야에서 최적화를 수행한 사례가 보고되어 있다. 이에 본 논문을 통해 유체기계에 적용하여 최적화 결과를 검토하였다. HEEDS 에는 SHERPA 라는 최적화 기법이 탑재되어 있으며, 다수의 설계변수를 설정할 수 있어 변수간의 교호작용 등을 효율적으로 검토할 수 있다. 본 논문에서는 DOE 방법으로 최적화가 이루어진 사류펌프 임펠러에 대해 개발된 방법을 적용하여 최적화 결과의 타당성과 안정성을 검토하였으며, 같은 방법을 디퓨저에 적용하여 최적화 형상을 검토하였다. 본 논문에서 개발된 최적화 방법을 이용하여 사류펌프 최적화를 수행한 결과, DOE 방법을 이용한 설계보다 개선된 결과를 적절한 시간 내에 얻을 수 있음을 확인하였다.

최신 마이크로프로세서에서 2차 캐쉬 적중률 증가를 고려한 LU-SGS 코드의 가속 (Acceleration of LU-SGS Code on Latest Microprocessors Considering the Increase of Level 2 Cache Hit-Rate)

  • 최정열;오세종
    • 한국항공우주학회지
    • /
    • 제30권7호
    • /
    • pp.68-80
    • /
    • 2002
  • 최신 마이크로프로세서에서 성능 최적화된 수치 코드를 작성하는 접근법을 제시하였다. 국소화로 지칭한 이 코드 최적화 방법은 모든 최신 마이크로프로세서에서 채용되는 2차 캐시의 사용을 최대화하고 시스템의 주기억장치에 대한 접근을 최소화하는 개념이다. 본 연구에서는 유체역학 문제의 해결을 위한 LU-SGS 해법을 3 단계에 걸쳐 국소화 하였으며, 요즈음 널리 이용되고 있는 여러 가지 마이크로프로세서들에 대해 시험을 수행하였다. 국소 최적화 개념의 시험 결과는, 컴퓨터 시스템에 따라서는, 같은 컴퓨터에서 완전히 동일한 해를 기본 알고리즘에 비해 7.35배까지 빨리 얻을 수 있는 주목할 만한 성능을 보여 주었다.