• Title/Summary/Keyword: DSP optimization

Search Result 83, Processing Time 0.028 seconds

우적제거 알고리즘의 DSP 최적화 (DSP Optimization of Rain Removal Algorithm)

  • 최동윤;서승지;송병철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2015년도 하계학술대회
    • /
    • pp.489-490
    • /
    • 2015
  • 객체의 인식을 위한 컴퓨터 비전 알고리즘은 안개와 비와 같은 기상이 좋지 않은 상황에서는 인식 성능이 떨어지고 있다. 이로 인하여 최근 악천후 환경에서 촬영된 영상으로부터 날씨 현상을 제거하는 기법들이 연구되고 있다. 빗줄기는 시공간적 무작위성으로 인하여 검출 및 제거가 어려운 현상이다. 또한 기존의 빗줄기 검출 및 제거 기법들은 대부분 고정된 카메라로부터 촬영된 영상을 대상으로 처리함으로써 자동차와 같은 움직임이 있는 촬영환경에서는 부적합하다. 최근에는 카메라나 객체의 움직임에 대응할 수 있는 빗줄기 검출 및 제거 알고리즘이 개발되고 있으나, 방대한 연산량이 필요하기 때문에 실시간이 불가능하다. 본 논문에서는 최근 연구되고 있는 카메라 움직임이 있는 환경에서 빗줄기 검출 및 제거 알고리즘을 DSP 환경에서 구현하고 내부 메모리 최적화와 EMDA 이용, 소프트웨어 파이프라인 등을 통해 최적화를 수행하여 실시간성을 보인다.

  • PDF

Fast Implementation of a 128bit AES Block Cipher Algorithm OCB Mode Using a High Performance DSP

  • Kim, Hyo-Won;Kim, Su-Hyun;Kang, Sun;Chang, Tae-Joo
    • Journal of Ubiquitous Convergence Technology
    • /
    • 제2권1호
    • /
    • pp.12-17
    • /
    • 2008
  • In this paper, the 128bit AES block cipher algorithm OCB (Offset Code Book) mode for privacy and authenticity of high speed packet data was efficiently designed in C language level and was optimized to support the required capacity of contents server using high performance DSP. It is known that OCB mode is about two times faster than CBC-MAC mode. As an experimental result, the encryption / decryption speed of the implemented block cipher was 308Mbps, 311 Mbps respectively at 1GHz clock speed, which is 50% faster than a general design with 3.5% more memory usage.

  • PDF

임베디드 DSP 기반 H.264/SVC 복호기 구현 (Implementation of H.264/SVC Decoder Based on Embedded DSP)

  • 김윤일;백두산;김재곤;김진수
    • 방송공학회논문지
    • /
    • 제16권6호
    • /
    • pp.1018-1025
    • /
    • 2011
  • H.264/AVC의 스케일러블확장 표준인 SVC(Scalable Video Coding)는 하나의 비트스트림으로 다양한 공간, 시간, 화질 계층의 비디오를 제공할 수 있는 컨버전스용 코덱이다. 최근, 감시 비디오, 모바일 방송 등에 활용하기 위한 실시간 SVC 코덱 개발이 진행되고 있다. 본 논문은 임베디드 DSP 기반의 H.264/SVC 복호기의 설계 및 구현을 기술한다. 본 연구에서는 PC 환경에서 실시간 최적화된 OSD(Open SVC Decoder)의 구조와 복잡도를 분석하고, 이를 이용하여 TI사의 Davinci EVM(Evaluation Module) 보드에 실시간 SVC 복호기를 구현하였다. 구현된 H.264/SVC 복호기는 QCIF, CIF급 해상도는 50Hz 이상, SD는 15Hz까지 실시간으로 복호화할 수 있음을 확인하였다.

고성능 DSP에서 동영상 인코더의 최적화 구현을 위한 캐쉬 및 내부 메모리 성능 분석 (Performance Analysis of Cache and Internal Memory of a High Performance DSP for an Optimal Implementation of Motion Picture Encoder)

  • 임세훈;정선태
    • 한국콘텐츠학회논문지
    • /
    • 제8권5호
    • /
    • pp.72-81
    • /
    • 2008
  • 고성능 DSP는 보통 캐쉬와 내부 메모리를 지원한다. 이러한 고성능 DSP에 멀티미디어 스트림 응용을 최적화하여 구현하고자 하는 경우에는, DSP 가 지원하는 캐쉬와 내부 메모리를 효율적으로 잘 활용하여야 한다. 본 논문에서는 2단계 레벨 캐쉬 구조 및 내부 메모리 구성을 지원하는 고성능 DSP인 TMS320C6000 시리즈에 대해 동영상 인코더와 같은 멀티미디어 스트림 처리 응용을 최적으로 구현하기 위해서 필요한 캐쉬 성능 분석, 내부 메모리 구성 및 배치에 따른 성능 분석과 개선 방안에 대해 연구하였다. 분석 및 실험 결과, L2 메모리의 경우, 이중 집합연관 캐쉬로 구성하고, 남은 메모리는 내부 메모리로 구성하는 것이 수행 시간 성능 개선에 효과적임을 확인하였다. 또한, L1P 캐쉬의 경우는 자주 호출되고 시간이 많이 소요되는 루틴들을 연속적으로 내부 메모리에 배치하는 것이 L1P 캐쉬의 히트 율을 개선하며, L1D 캐쉬의 경우는 사용하는 데이터의 크기를 조절하므로 써 쉽게 히트 율을 개선할 수 있다는 것을 밝혔다. 본 논문의 연구 결과는 고성능 DSP 에 멀티미디어 스트림 처리 응용을 최적화로 구현하는데 도움을 줄 것으로 기대한다.

TMS320C64x 기반 MPEG-1 LayerII Decoder의 DSP 구현 (Implementation of the MPEG-1 Layer II Decoder Using the TMS320C64x DSP Processor)

  • 조충상;이영한;오유리;김홍국
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2006년도 하계종합학술대회
    • /
    • pp.257-258
    • /
    • 2006
  • In this paper, we address several issues in the real time implementation of MPEG-1 Layer II decoder on a fixed-point digital signal processor (DSP), especially TMS320C6416. There is a trade-off between processing speed and the size of program/data memory for the optimal implementation. In a view of the speed optimization, we first convert the floating point operations into fixed point ones with little degradation in audio quality, and then the look-up tables used for the inverse quantization of the audio codec are forced to be located into the internal memory of the DSP. And then, window functions and filter coefficients in the decoder are precalculated and stored as constant, which makes the decoder faster even larger memory size is required. It is shown from the real-time experiments that the fixed-point implementation enables us to make the decoder with a sampling rate of 48 kHz operate with 3 times faster than real-time on TMS320C6416 at a clock rate of 600 MHz.

  • PDF

모바일 TFT-LCD를 위한 새로운 화질 최적화 시스템 (A New Image Quality Optimization System for Mobile TFT-LCD)

  • 류지열;노석호
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.734-737
    • /
    • 2008
  • 본 논문은 새로운 형태의 TFT-LCD 자동 화질 최적화 시스템을 제안한다. 또한 참조 감마 곡선과의 6-점 프로그램 정합 기술을 이용한 새로운 알고리즘 및 자동 전압 설정 알고리즘을 제안한다. 이러한 시스템은 평균 감마 오차, 감마 조정 시간 및 플리커 등을 줄이기 위해 모바일 LCD 구동 IC 내의 감마 조정 레지스터들과 전압 설정 레지스터들을 자동적으로 제어한다. 개발된 알고리즘과 프로그램은 범용 LCD 모듈에 적용 가능하다. 제안된 최적 화질 향상 시스템은 측정 대상이 되는 모듈 (MUT, LCD 모듈), 제어 프로그램, 휘도 측정용 멀티미디어 디스플레이 측정기 및 인터페이스용 제어 보드로 구성되어 있다. 제어 보드는 DSP와 FPGA로 구성되어 있고, RGB 및 CPU와 같은 다양한 인터페이스들을 지원한다. 개발된 자동 화질 최적화시스템은 기존의 시스템에 비해 현저히 짧은 감마 조정시간, 적은 플리커 및 적은 평균 감마 오차를 보였다. 본 논문에서 제안하는 시스템은 최적 감마 곡선 및 자동 전압 설정을 이용하기 때문에 개발 공정 시간을 단축시키고, 고화질의 TFT-LCD를 제공하는데 아주 유용하다.

  • PDF

Dynamic swarm particle for fast motion vehicle tracking

  • Jati, Grafika;Gunawan, Alexander Agung Santoso;Jatmiko, Wisnu
    • ETRI Journal
    • /
    • 제42권1호
    • /
    • pp.54-66
    • /
    • 2020
  • Nowadays, the broad availability of cameras and embedded systems makes the application of computer vision very promising as a supporting technology for intelligent transportation systems, particularly in the field of vehicle tracking. Although there are several existing trackers, the limitation of using low-cost cameras, besides the relatively low processing power in embedded systems, makes most of these trackers useless. For the tracker to work under those conditions, the video frame rate must be reduced to decrease the burden on computation. However, doing this will make the vehicle seem to move faster on the observer's side. This phenomenon is called the fast motion challenge. This paper proposes a tracker called dynamic swarm particle (DSP), which solves the challenge. The term particle refers to the particle filter, while the term swarm refers to particle swarm optimization (PSO). The fundamental concept of our method is to exploit the continuity of vehicle dynamic motions by creating dynamic models based on PSO. Based on the experiments, DSP achieves a precision of 0.896 and success rate of 0.755. These results are better than those obtained by several other benchmark trackers.

TMS320C5509 DSP를 이용한 AMR-WB 음성부호화기의 실시간 구현 (Real-time Implementation or AMR-WB Speech Coder Using TMS320C5509 DSP)

  • 최송인;지덕구
    • 한국음향학회지
    • /
    • 제24권1호
    • /
    • pp.52-57
    • /
    • 2005
  • AMR-WB 음성부호화기는 50~7000 Hz의 확장된 대역폭을 갖는 음성신호를 압축/복원하는 광대역 음성부호화기로써 6.60 kbit/s에서 23.85 kbit/s까지 9개의 전송 비트율을 가지고 있다. 본 논문에서는 2개의 MAC (Multimply and-Accumulate) 유닛을 가진 Tl의 16bit 고정소수점 DSP인 TMS320C5509 DSP를 이용한 AMR-WB 음성부호화기의 실시간 구현에 관하여 논한다. 실시간 구현은 intrinsic을 이용한 C수준의 구현 및 어셈블리 코딩에 의한 구현을 수행하여 그 결과를 비교하였다. 어셈블리 코딩에 의하여 실시간 구현된 AMR-WB 음성부호화기는 23.85 kbit/s 모드에서 42.9 Mclock의 계산량을 가지며, 사용된 프로그램 메모리는 15.1 kword이고, 데이터 ROM 메모리는 9.2 kword이고 데이터 RAM 메모리는 13.9 kword이다.

A Rule-based Optimal Placement of Scaling Shifts in Floating-point to Fixed-point Conversion for a Fixed-point Processor

  • Park, Sang-Hyun;Cho, Doo-San;Kim, Tae-Song;Paek, Yun-Heung
    • JSTS:Journal of Semiconductor Technology and Science
    • /
    • 제6권4호
    • /
    • pp.234-239
    • /
    • 2006
  • In the past decade, several tools have been developed to automate the floating-point to fixed-point conversion for DSP systems. In the conversion process, a number of scaling shifts are introduced, and they inevitably alter the original code sequence. Recently, we have observed that a compiler can often be adversely affected by this alteration, and consequently fails to generate efficient machine code for its target processor. In this paper, we present an optimization technique that safely migrates scaling shifts to other places within the code so that the compiler can produce better-quality code. We consider our technique to be safe in that it does not introduce new overflows, yet preserving the original SQNR. The experiments on a commercial fixed-point DSP processor exhibit that our technique is effective enough to achieve tangible improvement on code size and speed for a set of benchmarks.

SRP 기반 FHD HEVC Decoder (SRP Based Programmable FHD HEVC Decoder)

  • 송준호;이상조;이원창;김두현;김재현;이시화
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2014년도 하계학술대회
    • /
    • pp.160-162
    • /
    • 2014
  • A programmable video decoding system with multi-core DSP and co-processors is presented. This system is adopted by Digital TV SoC (System on Chip) and is used for FHD HEVC (High Efficiency Video Coding) decoder. Using the DSP based programmable solution, we can reduce commercialization period by one year because we can parallelize algorithm development, software optimization and hardware design. In addition to the HEVC decoding, the proposed system can be used for other application such as other video decoding standard for multi-format decoder or video quality enhancement.

  • PDF