• 제목/요약/키워드: Memory Bandwidth

검색결과 240건 처리시간 0.023초

웹 문서 경량화에 의한 모바일용 콘텐츠 변환 시스템 (Contents Conversion System for Mobile Devices using Light-Weight Web Document)

  • 김정희;권훈;곽호영
    • 인터넷정보학회논문지
    • /
    • 제6권6호
    • /
    • pp.13-22
    • /
    • 2005
  • 본 논문은 유선용으로 작성된 웹 문서를 모바일용 단말기에서 서비스가 가능하도록 유선 콘텐츠를 모바일 콘텐츠로 변환하는데 목적을 두고 있다. 유선 콘텐츠는 일반적으로 Pop-Up광고창, 불필요한 이미지, 유용하지 못한 링크들로 꾸며져 있어서 유선 환경에 비해 낮은 대역폭, 메모리, 스크린 크기를 갖고 있는 모바일 단말기상에 프리젠테이션이 어려울 뿐만 아니라 모바일 사용자들에게 직접 콘텐츠에 접근하는 것을 혼란스럽게 하고 있다. 그러므로 유선 웹 문서로부터 유용하고 적절한 콘텐츠를 추출하고 이를 모바일 단말기의 특성에 맞춤식으로 제공하는 요구가 대두되고 있다. 따라서 본 논문은 WAP 2,0과 여기에 채용된 콘텐츠 생성 언어인 XHTML Basic을 기반으로 한 콘텐츠 변환 시스템을 제안하였다. 제안된 시스템의 콘텐츠 변환 방식은 유선 웹 문서를 경량화한 후, 기존의 변환 방식인 필터 방식 변환 규칙을 적용하였다. 그리고 적용된 변환 규칙은 수정과 삭제가 쉽게 처리될 수 있도록 XHTML Basic의 모듈단위 기반을 사용하였으며, 또한 변환의 확장성 및 문서의 유효성을 유지하기 위하여 변환 규칙은 XSLT 기술의 XSL 문서 내에 정의하였다. 또한 WAP 1,X의 Legacy한 서비스와의 연동을 위해 CC/PP 프로파일 및 단말기 헤더 정보를 분석하는 모듈을 갖도록 시스템을 구성하였다.

  • PDF

한일상관기의 잔차 지연 보정 알고리즘의 개선 (Improvement of Residual Delay Compensation Algorithm of KJJVC)

  • 오세진;염재환;노덕규;오충식;정진승;정동규
    • 융합신호처리학회논문지
    • /
    • 제14권2호
    • /
    • pp.136-146
    • /
    • 2013
  • 본 논문에서는 FX 형식의 한일상관기(Korea-Japan Joint VLBI Correlator, KJJVC)의 잔차 지연 보정 알고리즘을 제안하였다. KJJVC의 초기 잔차 지연보정 알고리즘에는 연산의 고속화를 위해 정수 연산과 위상보정 계수를 위한 cos/sin table을 도입하였다. 그리고 잔차 지연 알고리즘의 초기설계에서 데이터의 타이밍과 잔차 지연 위상의 불일치와 비트쉬프트와 잔차 지연 위상의 불일치 문제를 해결하였다. VCS의 잔차 지연 알고리즘의 최종 설계에서는 잔차 지연보정된 값을 FFT segment에 적용할 때 잔차 지연 보정 회전 메모리가 초기화 되지 않는 것을 수정하였다. 제안한 잔치 지연 보정 알고리즘을 이용하여, 교차 전력 스펙트럼의 대역폭 모양이 모든 대역폭에 대해서 손실이 없이 평탄한 것을 확인하였다. 제안한 잔차 지연보정 알고리즘의 유효성을 확인하기 위해 시뮬레이터와 KJJVC를 이용하여 실제 관측데이터를 대상으로 상관처리 시험을 수행하였다. 실험결과를 통하여 제안한 잔차 지연 보정 알고리즘이 KJJVC에 잘 적용되고 있으며, 신호대 잡음비가 약 8% 향상되는 것을 확인하였다.

내장형 시스템을 위한 에너지-성능 측면에서 효율적인 2-레벨 데이터 캐쉬 구조의 설계 (Energy-Performance Efficient 2-Level Data Cache Architecture for Embedded System)

  • 이종민;김순태
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제37권5호
    • /
    • pp.292-303
    • /
    • 2010
  • 온칩(on-chip) 캐쉬는 외부 메모리로의 접근을 감소시키며 빈번하게 접근되기 때문에 내장형 시스템의 성능과 에너지 소비 측면에서 중요한 역할을 한다. 본 논문에서는 내장형 시스템에 맞추어 설계된 2-레벨 데이터 캐쉬 메모리 구조를 제안하고자 한다. 레벨1(L1) 캐쉬의 구성으로 작은 크기, 직접시장(direct-mapped) 그리고 바로쓰기(write-through)를 채용한다. 대조적으로 레벨2(L2) 캐쉬는 보통의 캐쉬 크기와 집합연관(set-associativity) 그리고 나중쓰기(write-back) 정책을 채용한다. 결과적으로 L1 캐쉬는 빠른 접근 시간을 가지며 (한 사이클 이내) L2 캐쉬는 전체 캐쉬의 미스율(global miss rate)을 낮추는데 효과적이다. 작은 크기의 L1 데이터 캐쉬로 인한 증가된 캐쉬 미스율(miss rate)을 줄이기 위해 ECP(Early Cache hit Predictor)기법을 제안하였다. 제안된 ECP기법은 L1 캐쉬 히트 예측을 통해서 요청된 데이터가 L1 캐쉬에 있는지 예측할 수 있으며 추가적으로, ALU를 필요로 하지 않고 빠르게 유효주소(effective address)계산을 할 수 있다. 또한, 두 캐쉬 계층간 바로쓰기(write-through) 정책에서 오는 빈번한 L2 캐쉬 접근으로 인한 에너지 소비를 줄이기 위해 지정웨이 쓰기(one-way write) 기법을 제안하였다. 제안된 지정웨이 쓰기 기법을 이용하면 바로쓰기 정책으로 인한 L1 캐쉬에서 L2 캐쉬로의 쓰기 접근시 태그(tag) 비교 과정을 거치지 않고 하나의 지정된 웨이를 바로 접근할 수 있다. 사이클 단위 정확도의 시뮬레이터와 내장형 벤치마크를 이용한 실험 결과 본 논문에서 제안한 2-레벨 데이터 캐쉬 메모리 구조는 평균적으로 3.6%의 성능향상과 50%의 데이터 캐쉬 에너지 소비를 감소 시켰다.

H.264 표준의 가변 움직임 블록을 위한 고속 움직임 탐색 기법 (Fast Motion Estimation for Variable Motion Block Size in H.264 Standard)

  • 최웅일;전병우
    • 대한전자공학회논문지SP
    • /
    • 제41권6호
    • /
    • pp.209-220
    • /
    • 2004
  • 기존 비디오 표준과 비교해 볼 때, H.264 비디오 표준이 갖는 중요한 두 가지 특징으로는 높은 부호화 효율과 네트워크 친화성을 들 수 있다. 그러나 이러한 중요한 특성에도 불구하고 H.264 표준은 구현시 요구되는 메모리 대역폭과 연산량의 복잡도가 높기 때문에 실시간 응용에 적용하는데 어려움이 있다. H.264 부호화 기술 가운데 특히 복수 참조 영상을 이용한 다양한 블록 단위 움직임 탐색은 높은 부호화 효율을 갖도록 하는 핵심 요소지만 최적의 움직임 벡터를 찾기 위해 다양한 블록 단위 조합의 모든 경우에 대하여 SAD (Sum of Absolute Difference)를 구해야 하므로 상당한 계산량을 요구한다. 그러므로 본 논문에서는 움직임 탐색의 연산량을 줄이기 위해 정수화소 움직임 탐색 및 부화소 움직임 탐색을 위한 고속 알고리즘을 제안한다. 정수화소 단위 움직임 탐색의 경우, 기존의 고속 움직임 탐색 기법은 H.264의 다양한 블록 단위 움직임 탐색 구조에 그대로 적용할 경우 효과적이지 못하기 때문에 본 논문에서는 종래 다이아몬드 탐색 기반 방법을 계층적 블록 구조에 맞게 개선한 적응적 움직임 탐색 기법을 제안하도록 한다. 또한 부화소 단위 움직임 탐색을 위해서는 움직임 벡터의 통계적 특성을 이용하여 예측벡터를 중심으로 한 다이아몬드 탐색 기반 고속 알고리즘을 제안한다.

병렬 응용프로그램 실행 시 GPU 구조에 따른 성능 분석 (Performance Evaluation of the GPU Architecture Executing Parallel Applications)

  • 최홍준;김철홍
    • 한국콘텐츠학회논문지
    • /
    • 제12권5호
    • /
    • pp.10-21
    • /
    • 2012
  • 통합형셰이더 코어 구조 개발 이후 GPU는 그래픽스 전용 연산장치에서 범용 연산장치로 발달하고 있다. 특히, 병렬 응용 프로그램들은 병렬화된 하드웨어 구조를 효과적으로 활용할 수 있기 때문에, GPU를 활용하여 병렬 응용프로그램들을 실행시키는 기법이 주목을 받고 있다. 하지만, 현재의 GPU 구조는 비그래픽스 응용프로그램을 실행하는데 있어서 병렬성을 충분히 확보하지 못하다는 한계를 가지고 있기 때문에, 이를 해결하기 위해 GPU 구조는 빠르게 변화하고 있다. 본 논문에서는 GPU 구조의 개발 방향을 살펴보기 위해, 비그래픽스 병렬 응용프로그램들을 수행하는 경우에 코어 개수 및 동작 주파수 등의 하드웨어구조에 따른 GPU의 성능을 상세히 분석하고자 한다. 실험 결과, 코어 개수가 30에서 192로 늘어나고 동작주파수가 325MHz에서 450MHz로 증가함에 따라 GPU 성능은 28.9%에서 125.8%, 4.4%에서 16.2% 각각 향상되는 반면 성능 향상 효율성은 감소하는 것을 볼 수 있다. 성능 향상 효율성 감소의 주된 원인은 향상된 연산 능력에 맞추어 증가된 데이터 요구를 메모리가 적절하게 처리하지 못하기 때문이다. 결과적으로 GPU의 성능 향상 효율성을 더욱 높이기 위해서는 연산 능력 향상과 더불어 시스템 자원들 또한 GPU 구조에 맞게 변경되어야 함을 구체적인 실험을 통해 알 수 있다.

사물인터넷 헬스케어 서비스를 위한 oneM2M기반 ISO/IEEE 11073 DIM 전송 구조 설계 및 구현 (Design and Implementation of ISO/IEEE 11073 DIM Transmission Structure Based on oneM2M for IoT Healthcare Service)

  • 김현수;천승만;정윤석;박종태
    • 전자공학회논문지
    • /
    • 제53권4호
    • /
    • pp.3-11
    • /
    • 2016
  • 사물 인터넷 (Internet of Things : IoT) 환경에서 IoT 디바이스들은 전원이나 메모리 등의 물리적 구성요소들에 의해 제한되며 대역폭, 무선 채널, 처리율, 페이로드 등의 네트워크 성능 또한 제한적임에도 불구하고 타 IoT 디바이스들과 리소스를 공유한다. 특히 IoT 헬스케어 서비스에 있어서 원격 디바이스 정보 관리 뿐만 아니라 원격 환자 정보관리가 매우 중요하며, 더욱이, 사물인터넷 헬스케어 디바이스와 헬스케어 플랫폼간 상호연동성 지원이 매우 중요하다. 이를 위해서는 헬스케어 디바이스와 헬스케어 플랫폼간 데이터 정보 표현, 데이터 전송 표현, 메시지 규격 등이 사물인터넷 환경에 적합한 국제표준 준수가 매우 필요하다. 하지만, 기존의 국제의료정보 전송표준인 ISO/IEEE 11073 PHD (Personal Healthcare Device) 표준에서는 사물인터넷 환경 (네트워크 프로토콜)을 고려하지 않아 사물인터넷 헬스케어 서비스에 적용하기 어렵다. 이를 위해 본 논문에서는 사물인터넷 표준인 oneM2M과 의료정보 전송표준인 ISO/IEEE 11073 DIM(Domain Information Model)을 적용한 사물인터넷 헬스케어 시스템을 설계 및 구현하였다. 구현을 위해 oneM2M 기반인 OM2M 플랫폼을 활용하였고, 헬스케어 디바이스와 OM2M 플랫폼간 효율적인 전송 구문에 대한 평가를 위해 HTTP와 CoAP간, XML과 JSON간 단일 처리과정의 패킷 사이즈와 전송 패킷 수 등을 성능 분석하였다.

삼중대각행렬 시스템 풀이의 빠른 GPU 구현 (Fast GPU Implementation for the Solution of Tridiagonal Matrix Systems)

  • 김영희;이성기
    • 한국정보과학회논문지:시스템및이론
    • /
    • 제32권11_12호
    • /
    • pp.692-704
    • /
    • 2005
  • 컴퓨터 하드웨어의 급속한 발전으로 그래픽 프로세서 유닛(Graphics Processor Units : GPUs)은 굉장한 메모리 대역폭과 산술 능역을 보유하게 되어 범용 계산에 많이 활용되고 있으며, 특히 계산 집약적인 물리 기반 시뮬레이션(physics based simulation)의 GPU 구현이 활발하게 연구되고 있다. 물리 기반 시뮬레이션의 기본이 되는 미분방정식 풀이 과정에서 삼중대각행렬(tridiagonal matrix) 시스템은 유한차분(finite-difference) 근사에 의해서 자주 나타나는 선형시스템으로 물리 기반 시뮬레이션 관점에서 삼중대각행렬 시스템의 빠른 풀이는 중요한 연구 분야이다. 본 논문에서는 GPU에서 삼중대각행렬 시스템 풀이를 빠르게 구현할 수 있는 방법을 제안한다. 벡터 프로세서(vector processor) 계산에서 삼중대각행렬 시스템 풀이 방법으로 널리 사용되는 cyclic reduction 또는 odd-even reduction 알고리즘을 GPU에서 구현하였다. 본 논문에서 제안한 방법을 삼중대각행렬 시스템 풀이 방법으로 잘 알려져 있는 Thomas 방법과 GPU를 이용한 선형시스템 풀이에서 좋은 성과를 보이고 있는 conjugate gradient 방법과 비교할 때 상당한 성능 향상을 얻을 수 있었다. 또한, 열전도(heat conduction) 방정식, 이류 확산(advection-diffusion) 방정식, 얕은 물(shallow water) 방정식에 의한 물리 기반 시뮬레이션의 GPU 구현에 본 논문에서 제안한 방법을 사용하여 1024x1024 격자의 계산 영역에서 초당 35프레임 이상의 놀라운 성능을 보여주었다.

멀티코어 시스템에서 흐름 수준 병렬처리에 기반한 리눅스 TCP/IP 스택의 성능 개선 (A Performance Improvement of Linux TCP/IP Stack based on Flow-Level Parallelism in a Multi-Core System)

  • 권희웅;정형진;곽후근;김영종;정규식
    • 정보처리학회논문지A
    • /
    • 제16A권2호
    • /
    • pp.113-124
    • /
    • 2009
  • 최근 멀티코어가 장착된 시스템이 증가하면서 이를 통한 애플리케이션 성능향상에 대한 노력이 계속 되어왔다. 하나의 시스템에 다수의 처리장치가 존재함으로 인해 프로세싱 파워는 기존보다 증가했지만 기존의 소프트웨어나 하드웨어들은 싱글코어 시스템에 적합하게 설계된 경우가 많아 멀티코어의 이점을 충분히 활용하지 못하고 있는 경우가 많다. 기존의 많은 소프트웨어들은 멀티코어 상에서 공유 자원에 대한 병목현상과 비효율적인 캐시 메모리 사용으로 인하여 충분한 성능향상을 기대하기 어려우며 이러한 문제점들로 인하여 기존 소프트웨어는 코어의 개수에 비례한 성능을 얻지 못하며, 최악의 경우 오히려 감소될 수 있다. 본 논문에서는 TCP/IP를 사용하는 기존의 네트워크 애플리케이션과 운영체제에 흐름 수준 병렬처리 기법을 적용하여 성능을 증가 시킬 수 있는 방법을 제안한다. 제안된 방식은 개별 코어단위로 네트워크 애플리케이션, 운영체제의 TCP/IP 스택, 디바이스 드라이버, 네트워크 인터페이스가 서로 간섭 없이 작동할 수 있는 환경을 구성하며, L2 스위치를 통해 각 코어 단위로 트래픽을 분산하는 방법을 적용하였다. 이를 통해 각 코어 간에 애플리케이션의 데이터 및 자료구조, 소켓, 디바이스 드라이버, 네트워크 인터페이스의 공유를 최소화하여, 각 코어간의 자원을 차지하기 위한 경쟁을 최소화하고 캐시 히트율을 증가시킨다. 이를 통하여 8개의 멀티코어를 사용하였을 경우 네트워크 접속속도와 대역폭이 코어의 개수에 따라 선형적으로 증가함을 실험을 통해 입증하였다.

부분 응답 채널을 위한 채널 등화기들의 성능 분석에 관한 연구 (Performance Analysis of the Channel Equalizers for Partial Response Channels)

  • 이상경;이재천
    • 한국통신학회논문지
    • /
    • 제27권8A호
    • /
    • pp.739-752
    • /
    • 2002
  • 부분 응답 신호 기법은 데이터 전송 및 저장 채널에서 신호간 간섭을 효율적으로 제어함으로써 주파수 대역폭 감축의 목적을 달성할 수 있어 많이 채택하고 있는 기법이다. 본 논문에서는 부분 응답 채널 시스템에서의 채널 등화의 문제를 연구하였다. 부분 응답 모델의 대상으로 자기 기록 채널을 고려하였는데 적응 등화기 설계를 위한 기준 신호의 서로 다른 선택이 등화기 성능에 미치는 영향을 연구하였다. 먼저 각각의 등화기에 대해서 기존의 등화기 설계에서 사용하고 있는 등화기 출력 단에서의 평균제곱오차를 이론적으로 분석하였다. 한편 등화기 출력 단에서의 평균제곱오차는 등화기 자체 분석에 있어서는 유용하지만 서로 다른 등화기법의 비료에는 미흡하기 때문에 이를 보완하기 위한 성능 평가 요소로서 최종 데이터 검출 직전에서의 데이터 평균제곱오차를 이론적으로 유도하였다. 이 결과를 통해 부분 응답 시스템에서 서로 다른 신호 배치를 갖는 적응 등화 기법들의 성능 비교가 가능하다. 또한 이러한 성능 평가 기준에 적합한 등화기 설계 방법도 고려하였다. 마지막으로 컴퓨터 시뮬레이션 결과를 통해 이론적으로 분석된 연구 결과의 타당성을 입증하였다.

UNI 4.0 기반 ATM 망에서의 IP 멀티캐스트 지원 방안을 위한 서비스 구조 (A Service Architecture to support IP Multicast Service over UNI 4.0 based ATM Networks)

  • 이미정;정선;김예경
    • 한국정보과학회논문지:정보통신
    • /
    • 제27권3호
    • /
    • pp.348-359
    • /
    • 2000
  • 인터넷에서의 대부분의 중요한 실시간 멀티미디어 응용들은 멀티캐스트 서비스를 요구하므로 이들 응용을 ATM 기반의 인터넷에서 지원하기 위해서는 IP 멀티캐스트의 효율적인 처리가 필수적이다. IETF에서는 UNI 3.0/3.1 기반 ATM 망에서 연결형 일대다. ATM VC로 비연결형 IP 멀티캐스트를 지원하기 위해 MARS(Multicast Address Resolution Server)모델을 제안하였다. UNI 3.0/3.1 시그널링으로는 동적으로 멀티캐스트 그룹에 참여하려는 수신원을 VC 연결의 주체인 송신원에게 알릴 수 없기 때문에, MARS는 동적으로 멀티캐스트 그룹에 참여하려는 수신원을 멤버들의 요청을 받아 이를 송신원에게 알려주는 오버레이 서비스를 제공한다. 그런데 ATM Forum이 UNI 3.0/3.1 시그널링을 수정, 보완하여 표준화한 UNI 4.0 시그널링에서는 일대다 ATM VC에 참여하기 위해 수신원이 직접 송신원으로 신호할 수 있는 LIJ(Leaf Initiated Join)기능이 제안되었다. 본 논문에서는 UNI 4.0 기반의 ATM 망에서 LIJ 기능을 이용하여 IP 멀티캐스트 서비스를 제공하는 UNI4MARS 모델을 제안한다. MARS 서버와는 대조적으로, 제안하는 UNI4MARS 서버는 수신원이 LIJ 요청을 할 때 필요로 하는 송신원 정보를 알려주기 위하여 멀티캐스트 그룹에 대한 송신원의 등록/탈퇴 정보를 유지한다. 시뮬레이션을 통하여 비교해 본 결과, 제안하는 UNI4MARS모델은 동적인 IP 멀티캐스트를 지원하는 기능적인 면에서는 기존의 MARS 모델과 동일하지만 송신원에 비하여 수신원의 수가 많은 비대칭적 다중점 대 다중점 응용의 경우 구현에 필요한 프로세싱 오버헤드 및 메모리와 대역폭 요구량 측면에서 MARS 모델보다 유리함을 알 수 있었다.

  • PDF