• Title/Summary/Keyword: 파이프라이닝

Search Result 53, Processing Time 0.023 seconds

PDA-based Text Extraction System using Client/Server Architecture (Client/Server구조를 이용한 PDA기반의 문자 추출 시스템)

  • Park Anjin;Jung Keechul
    • Journal of KIISE:Software and Applications
    • /
    • v.32 no.2
    • /
    • pp.85-98
    • /
    • 2005
  • Recently, a lot of researches about mobile vision using Personal Digital Assistant(PDA) has been attempted. Many CPUs for PDA are integer CPUs, which have no floating-computation component. It results in slow computation of the algorithms peformed by vision system or image processing, which have much floating-computation. In this paper, in order to resolve this weakness, we propose the Client(PDA)/server(PC) architecture which is connected to each other with a wireless LAN, and we construct the system with pipelining processing using two CPUs of the Client(PDA) and the Server(PC) in image sequence. The Client(PDA) extracts tentative text regions using Edge Density(ED). The Server(PC) uses both the Multi-1.aver Perceptron(MLP)-based texture classifier and Connected Component(CC)-based filtering for a definite text extraction based on the Client(PDA)'s tentativel99-y extracted results. The proposed method leads to not only efficient text extraction by using both the MLP and the CC, but also fast running time using Client(PDA)/server(PC) architecture with the pipelining processing.

Performance Enhancement of Parallel Prime Sieving with Hybrid Programming and Pipeline Scheduling (혼합형 병렬처리 및 파이프라이닝을 활용한 소수 연산 알고리즘)

  • Ryu, Seung-yo;Kim, Dongseung
    • KIPS Transactions on Computer and Communication Systems
    • /
    • v.4 no.10
    • /
    • pp.337-342
    • /
    • 2015
  • We develop a new parallelization method for Sieve of Eratosthenes algorithm, which enhances both computation speed and energy efficiency. A pipeline scheduling is included for better load balancing after proper workload partitioning. They run on multicore CPUs with hybrid parallel programming model which uses both message passing and multithreading computation. Experimental results performed on both small scale clusters and a PC with a mobile processor show significant improvement in execution time and energy consumptions.

An Optimization of Computer-Generated Hologram Operation for Hardware Implementation (하드웨어 구현을 위한 컴퓨터 생성 홀로그램 연산의 최적화)

  • Choi, Hyun-Jun;Seo, Young-Ho;Kim, Dong-Wook
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2010.07a
    • /
    • pp.224-226
    • /
    • 2010
  • 컴퓨터 생성 홀로그램(computer-generated hologram, CGH) 기법은 광학 신호들을 근사화한 후 PC에서 수학적인 연산으로 디지털 홀로그램을 생성하는 기술이다. 본 논문에서는 CGH 기법을 하드웨어로 구현할 경우 완벽한 병렬처리와 파이프라이닝이 가능하도록 연산식을 최적화하는 방법을 제안한다. 제안한 방법은 홀로그램의 이전 좌표에서 계산된 값에 일정한 값을 더하여 홀로그램을 생성하는 반복가산 기법의 일반항을 분석하여 하드웨어에 최적화된 수식으로 변형하는 것이다. 최적화된 수식의 경우 현재 좌표의 홀로그램을 계산하기 위해 이전 좌표에서 연산되었던 결과값을 기다렸다 이용하지 않기 때문에 실시간 디지털 홀로그래피를 위한 전용 하드웨어의 설계에 적합할 것이다.

  • PDF

Data Flow Analysis for Deriving Uniform Recurrence Equation from Loop Algorithms (루프 알고리즘으로부터 정규순환방정식 유도를 위한 자료흐름 분석)

  • Gu, Gyo-Min;Ha, Gyeong-Ju;Yu, Gi-Yeong
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.26 no.2
    • /
    • pp.145-154
    • /
    • 1999
  • 본 논문에서는 주어진 문제의 루프 알고리즘으로부터 시스톨릭 어레이 구현이 용이한 정규 순환 방정식으로의 자동적 유도를 위한 대수적인 방법과 조건을 제시하였다. 이를 위하여 계산점 집합과 순차 정렬 벡터를 구하고, 행렬의 커널을 이용하여 자료 흐름 벡터를 찾았으며, 정규 파이프라이닝 가능성 조건을 제시하였다 그리고 각 계산점에 대한 배열 원소의 초기 입력 위치를 구하였다. 본 논문에서 제시된 방법을 사용하면 주어진 루프 알고리즘을 정규 순환방정식으로 자동적으로 유도 할 수 있으며, 주어진 알고리즘이 정규 순환 방정식으로 유도될 수 있는지를 검사할 수 있다.

A Datapath Scheduling Under Resource Constraints (자원제약조건 하에서의 데이터패스 스케듈링)

  • 이근만;임인칠
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.17 no.4
    • /
    • pp.424-432
    • /
    • 1992
  • This paper deals with the scheduling ploblems, which are the most important subtasks in High-level syntheses. IP(integer programming) formulations is used as the scheduling problem approach. This paper describes a new resource-constraints scheduling algorithm. We have concentrated our attentions on the multicycle operations and the structural pipelining, and we fully analyze the characteristics of operators to achieve the maximal performance and the maximal resource sharing. For experiment results, we choose the 5-th order digital wave filter as a benchmark and do the schedule, Finally, we can obtain near-optimal scheduling results.

  • PDF

An Efficient Dissemination Protocol Using Network Coding in Wireless Sensor Network (무선 센서 네트워크 상에서 network coding을 이용한 효율적인 코드 전파 기법)

  • Cha, Jeong-Woo;Kim, Il-Hyu;Kim, Chang-Hoon;Kwon, Young-Jik
    • Proceedings of the Korea Society for Industrial Systems Conference
    • /
    • 2008.10b
    • /
    • pp.623-628
    • /
    • 2008
  • 소프트웨어 업 데이트를 위한 업데이트 코드 전파 기법은 매우 중요한 기술 중 하나이다. 본 논문에서는 네트워크 코딩 기법을 이용한 새로운 업데이트 코드 전파 기법을 제안한다. 제안된 코드전파 기법은 기존의 파이프라이닝 방식에 비해 데이터 송수신 횟수에 있어 약 49%의 성능 향상을 보인다. 따라서 본 논문에서 제안한 코드 업데이트 기법을 사용할 경우 속도, 에너지, 네트워크 혼잡도 측면에서 효율적인 소프트웨어 업데이트를 수행할 수 있다. 뿐만 아니라 본 논문에서 제안한 방식은 네트워크 코딩의 overhearing 문제점인 원본 데이터의 분실이나 데이터의 미 수신시 발생하는 디코딩문제를 미리 정의된 메시지를 이용, 방지함으로써 신뢰성있는 데이터 전송을 가능하게 한다.

  • PDF

A Multi-Stream Buffering System for Efficient Transmission Transfer (효율적 멀티미디어 전송을 위한 다중 스트림 버퍼링 시스템)

  • 김현태;김형진;이경근;나인호
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 1998.05a
    • /
    • pp.233-237
    • /
    • 1998
  • 다중의 연속 미디어 데이타를 출력 마감시간(playout deadline)전에 검색 및 전송하여 자연스럽게 처리하기 위한 가장 효율적인 처리방안은 메모리 버퍼를 이용하는 것이다. 본 논문에서는 다중 스트림의 데이타 전송 요구 및 해제시의 버퍼 상태를 파악하여 버퍼를 동적으로 할당하고 물리작인 버퍼를 윈도우 크기의 논리버퍼로 분할하여 동적으로 관리하는 매핑관리자를 설계하여 버퍼이용률을 높일 수 있는 방안을 제시하였다. 또한, 서로 다른 소비율로 발생된 여분의 버퍼 공간을 활용할 수 있는 지능적인 선반입 기법과 마감시간을 고려한 전송 스케줄링 기법을 통해 실시간에 동기식으로 다중 미디어 스트림을 전송할 수 있는 동적 버퍼 관리 기법을 제안하였다. 마지막으로, 버퍼의 이용율을 높이기 위해 입출력 주기에 따라 버퍼 공간을 여러 스트림들이 파이프라이닝 방식으로 버퍼를 공유하는 기법과 잔여 버퍼공간의 할당 여부를 결정하기 위한 수락제어 기법을 적용하였다.

  • PDF

Delayed Scheduling under Resource Constrains (자원제약하에서의 지연 스케쥴링)

  • Shin, In-Soo;Lee, Keun-Man
    • The Transactions of the Korea Information Processing Society
    • /
    • v.4 no.10
    • /
    • pp.2571-2580
    • /
    • 1997
  • In this paper, we deal with the resource constrain scheduling to execute behavior algorithm under resource limit. Expecially, we proposed a scheduling algorithm, called delayed scheduling, which finds the lower bound control step to assign operation under resource limit. We take in account the actual scheduling problems including multicycle operation and functional pipelining. Integer Linear Programing formulations are used to the scheduling problems in order to get optimal scheduling result. Experiment was done on the DFG model of fifth-order digital wave filter, to show it's effectiveness.

  • PDF

Improving Software Pipelining Performance Using a Register Renaming Technique (소프트웨어 파이프라이닝에서 레지스터 변경을 통한 성능 개선)

  • Cho, Doosan
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2010.11a
    • /
    • pp.1642-1643
    • /
    • 2010
  • 멀티미디어 도메인의 응용 프로그램에는 풍부한 병렬성이 내재하기 때문에 VLIW (Very Long Instruction Word) 형식의 신호처리 프로세서가 많이 사용되고 있다. VLIW 프로세서를 구성하는 복수의 연산처리유닛 (processing unit, PU)의 사용률은 컴파일러의 명령어 스케쥴러의 성능에 의하여 결정된다. 명령어들 사이의 병렬성을 분석하여 동시 수행가능한 명령어들을 각기 다른 PU 에서 수행되도록 프로그램 코드를 최적화한다. 하지만 기존의 명령어 스케쥴러는 복잡한 데이터 디펜던스 그래프 (data dependence graph, DDG)를 구성하여 복수의 PU 를 충분히 사용하도록 하지 못하는 문제점을 내재하고 있다. 이는 명령어 스케쥴러가 각 레지스터 사용시간을 별도로 고려하지 않기 때문에 실제로 내재된 데이터 디펜던스 보다 복잡성이 높은 디펜던스 그래프를 구성하게 되어 스케쥴러가 올바르게 최적화된 코드 스케쥴링 결과를 제공하지 못하기 때문이다. 본 연구에서는 레지스터의 라이프타임을 다른 레지스터를 이용하여 적절히 끊어주는 것으로 데이터 디펜던스 복잡도 완화하여 시스템 성능 향상의 가능성을 보이고 있다.

Monitoring of Parallel Transfer Performance for MPTCP-based Globus Service (MPTCP기반 Globus 서비스 적용을 위한 병렬 전송성능 모니터링)

  • Hong, Wontaek
    • Proceedings of the Korean Institute of Information and Commucation Sciences Conference
    • /
    • 2021.10a
    • /
    • pp.354-356
    • /
    • 2021
  • For science applications that requires rapid transfer and sharing of large volume data, many efforts to improve data transfer performance have been made based on concurrency, parallelism and pipelining in data transfer applications such as Globus/GridFTP. In this paper, as a similar trial, experiments have been conducted for the expected transfer throughput enhancement by the increased number of network interface and parallelism in the Mptcp emulation environment and the result is presented.

  • PDF