• 제목/요약/키워드: 4-D 프레임

검색결과 344건 처리시간 0.024초

모바일 로봇을 위한 엣지 컴퓨팅에서의 실시간 2D/3D 객체인식 (Real time 2D/3D Object Detection on Edge Computing for Mobile Robot)

  • 김재영 ;문형필
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1161-1162
    • /
    • 2023
  • 모바일 로봇의 자율주행을 위하여 인터넷이 제약된 환경에서도 가능한 Edge computing 에서의 Object Detection 이 필수적이다. 본 논문에서는 이를 위해 Orin 보드에서 YOLOv7 과 Complex_YOLOv4 를 구현하였다. 직접 취득한 데이터를 통해 YOLOv7 을 구현한 결과 0.56 의 mAP 로 프레임당 133ms 가 소요되었다. Kitti Dataset 을 통해 Complex_YOLOv4 를 구현한 결과 0.88 의 mAP 로 프레임당 236ms 가 소요되었다. Comple_YOLOv4 가 YOLOv7 보다 더 많은 데이터를 예측하기에 시간은 더 소요되지만 높은 정확성을 가지는 것을 확인할 수 있었다.

화소 영역 Wyner-Ziv코덱에서 적응적 예측을 통한 보조정보 생성 방식과 성능 비교 (A Side Information Generation Using Adaptive Estimation and Its Performance Comparison in PDWZ CODEC)

  • 김진수;김재곤;서광덕
    • 한국정보통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.383-393
    • /
    • 2010
  • 분산 비디오 부호화 기법(DVC, Distributed Video Coding)은 복잡한 통계 특성을 복호기측에서 처리하고, 간단한 연산만 수행하는 부호기를 구현할 수 있다. 이러한 응용 분야에서는, 복호기에서 Wyner-Ziv 프레임에 대한 예측치 즉, 보조정보(SI, Side Information)의 우수한 예측치를 구하는 것은 Wyner-Ziv 부호화에서 전체 성능을 결정하는데 매우 중요한 역할을 한다. 기존의 움직임 보상 프레임 보간에 기초를 둔 방식들은 키 프레임의 블록 기반 또는 물체 기반으로 움직임을 각각 예측하지만, Wyner-Ziv 프레임에 대한 초기 정보를 고려하지 않는다. 본 논문에서는 평균 영상에 기초한 블록 적응적인 움직임 예측을 통한 보조정보 생성 방식을 제안한다. 모의실험을 통하여 제안 기법은 최대 0.4dB 정도의 개선을 보이며, Wyner-Ziv 코덱에 대한 모의실험에서도 우수한 주관적 및 객관적 화질을 제공함을 보인다.

구리기판의 표면처리 및 접착증진제 함량에 따른 에폭시 컴포지트의 접착특성 (Adhesive Properties of Epoxy Composite According to the Surface Treatment of Cu Substrate and Adhesion Promoter Content)

  • 김은진;김정수;장영욱;김동현
    • 접착 및 계면
    • /
    • 제23권4호
    • /
    • pp.108-115
    • /
    • 2022
  • 본 연구에서는 표면처리된 Cu 리드프레임과 에폭시 컴포지트의 접착강도를 향상시키기 위하여 신규 고분자 접착증진제인 poly(itaconic acid-co-acrylamide) (IAcAAM)를 합성하였다. 이타콘산과 아크릴아마이드를 포함하는 IAcAAM은 라디칼 수성 중합을 통해 제조되었다. IAcAAM의 구조 및 물성은 FT-IR, 1H-NMR, GPC 및 DSC로 분석하였다. Cu 리드프레임의 표면은 고온, 알칼리, UV 오존으로 처리하였다. 표면처리 후 Cu 리드프레임의 접촉각이 감소함에 따라 Cu 리드프레임/에폭시 컴포지트의 접착강도는 증가하였다. 에폭시 혼합물에 IAcAAM을 첨가함에 따라 Cu 리드프레임/에폭시 컴포지트의 접착강도가 증가하였다. 또한, 에폭시 혼합물에 실리카 함량이 증가할수록 Cu 리드 프레임과 에폭시 컴포지트의 접착강도는 약간 감소하는 경향을 나타내었다.

인접한 동영상 프레임의 차영상을 이용한 디스플레이 주변 조명효과의 제어 (An Ambient Light Control System using The Image Difference between Video Frames)

  • 신수철;한순흥
    • 한국시뮬레이션학회논문지
    • /
    • 제19권3호
    • /
    • pp.7-16
    • /
    • 2010
  • 본 논문은 비디오 및 게임 영상에서 인접한 프레임의 차영상을 이용하여 디스플레이 주변의 조명 장치를 제어하는 방법을 제안한다. 제안된 방법은 현재 프레임의 대표 색상을 추출하는 단계, 이전 프레임과의 차영상으로부터 변화량을 측정하고 변화 색상을 추출하는 단계, 새로운 대표 색상을 생성하는 단계의 세 단계로 구성된다. 변화량을 측정하기 위해 이미지를 사람 지각 시스템에 가까운 YUV 색공간으로 변환하고 차영상을 구한 후, 각 화소별 색차의 합을 변화량으로 사용하였다. 새로운 대표색상은 변화량에 비례하여 변화색상을 반영한다. 제안한 방법의 성능을 평가하기 위해 동일한 동영상에 대하여 시간에 따른 조명 효과의 변화 양상을 비교하였다. 실험 결과 기존 방법보다 더 역동적인 조명효과를 보이는 것을 확인하였다.

2중 코드북 구조를 통한 CELP 음성부호화기의 성능 향상에 관한 연구 (A Study on the performance improvement of the CELP coder by the structure of dual codebook)

  • 김종우;김응곤;한승조
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (3)
    • /
    • pp.271-273
    • /
    • 1999
  • 본 논문에서는 CELP 부호화기의 계산량을 줄이면서도 고음질의 음성을 합성할 수 있는 코드북 구조를 제안한다. 제안한 코드북 구조는 불규칙 코드북과 희박 중첩형 코드북 두 개의 코드북의 합으로 여기 신호를 표현한다. codebook I에서 잔류신호와 오차가 적은 여기신호열을 구한 후, 이 여기신호열에 codebook II의 여기신호열을 합하여 최적의 여기신호열을 구한다. 또한 이로 인한 전송비트수의 증가를 막기위해 홀수 프레임에서는 두 개 코드북의 index를, 짝수 프레임에서는 codebook I의 여기신호열은 그대로 사용하고 codebook II에서만 검색하여 전송하는 방법을 사용하였다. 이러한 2중 코드북 구조는 두 개의 여신호열의 합으로 표현되고 각각의 서로 다른 코드북 이득을 사용하기 때문에 정확한 이득을 표현할 수 있어 기존의 개선 알고리듬보다 더 나은 음질을 제공할 수 있다. 검색시간이 빠르고, 본 코드북 구조를 갖는 4.8kbps CELP형 부호화기를 설계하여 컴퓨터 모의 실험한 결과, 같은 전송률을 갖는 DoD CELP 부호화기보다 segSNR가 0.53dB 더 높게 나타났다.

  • PDF

강인한 비디오 워터마킹을 적용한 실시간 DVR 시스템의 설계 구현 (System Design and Realization for Real Time DVR System with Robust Video Watermarking)

  • 류광렬;김자환
    • 한국정보통신학회논문지
    • /
    • 제10권6호
    • /
    • pp.1019-1024
    • /
    • 2006
  • 본 논문은 콘텐츠 보안을 위해 강인한 비디오 워터 마킹 알고리즘과 실시간 처리속도를 적용한 DVR시스템 설계 구현에 관한 연구이다. 강인한 비디오 워터마킹은 프레임내 공간영역삽입과 프레임간 삽입방법을 동시에 적용하고 영상 및 알고리즘을 실시간으로 처리하기 위해 64비트 4개의 전용DSP 프로세서 사용과 어셈블리 및 소프트 파이프라인 코드를 적용한다. 실험 결과 D1 영상에서 프레임 당 처리 시간이 움직임 60% 영상의 경우 약2.5ms 소요되었다.

3차원 다중 기선을 사용만 비데오 영상 모자이크 기술 (Video Image Mosaicing Technique Using 3 Dimensional Multi Base Lines)

  • 전재춘;서용철
    • 대한원격탐사학회지
    • /
    • 제20권2호
    • /
    • pp.125-137
    • /
    • 2004
  • 하나의 기선에 작은 여러 영상을 투영하여 하나의 영상 모자이크를 생성하는 2차원 영상 모자이크 기법은 비데오 카메라가 도심지역을 이동하여 얻은 영상을 하나의 모자이크 영상을 생성할 수 없다. 본 논문에서는, 3차원 다중 기준선을 이용함으로서 3차원 공간에서 영상 모자이크를 생성시킬 수 있는 새로운 기법을 제안하였다. 제안된 방법은 각 영상 프레임마다 독립적인 기선을 가지도록 하여 3차원 공간에서 영상 모자이크를 생성 제안하는 것으로서, 독립적인 기선은 각 영상 프레임에서 추출된 광류의 지상 기준점들을 1차 방정식으로 표현한 것이다. 제안한 방법은 계층적 방법을 이용한 광류(Optical Flow)계산, 카메라 외부표정(Exterior Orientation)계산, 다중 기선(Multi-baselines)계산과 모자이크 된 영상들간의 경계를 감지 못하는 화소(Optimal Seamline Detection)의한 영상 모자이크 재생성 과정을 통해 구현되며, 실제 영상 프레임을 이용한 실험을 통해 효과적으로 3차원 공간에서 영상 모자이크 제작이 가능함을 입증하였다.

효율적인 채널 정보 메모리 관리를 위한 PCM 엔코더 설계 (Design of Advanced PCM Encoder Architecture for Efficient Channel Information Memory Management)

  • 노윤희;김건희;김동영;김복기;이남식
    • 한국항행학회논문지
    • /
    • 제24권4호
    • /
    • pp.305-313
    • /
    • 2020
  • 원격측정 시스템은 비행체의 상태 정보 데이터를 획득하여 지상 수신소로 전송하는 시스템이다. PCM 엔코더는 획득한 상태 정보 데이터를 이용하여 프레임을 생성하기 위해 채널 정보를 저장할 메모리가 필요하다. 대형 비행체의 경우 각 부위의 센서 및 시스템이 증가함에 따라 많은 데이터를 계측해야 하므로 더 큰 용량의 메모리를 필요로 한다. 그러나 한정된 메모리에서 모든 채널 정보를 저장하기에는 어려움이 있다. 따라서 본 논문에서는 FPGA 내부 ROM의 한정된 메모리에서 중복되는 채널 정보는 메모리에 한번만 할당하고, 마이너 프레임마다 다른 정보를 가지는 서브콤의 채널 정보는 서브콤 배수만큼 메모리에 할당하는 PCM 엔코더 구조를 제시하고 구현하였다. 이는 중복으로 할당되는 채널 정보를 최소화하여 효율적으로 메모리를 관리할 수 있다. 또한 다양한 계측 주기의 채널을 구성한 시뮬레이션을 통해 제시한 PCM 엔코더의 동작을 검증하였다.

모션 데이터의 계층적 가시화에 의한 3차원 아바타의 표정 제어 (Facial Expression Control of 3D Avatar by Hierarchical Visualization of Motion Data)

  • 김성호;정문렬
    • 정보처리학회논문지A
    • /
    • 제11A권4호
    • /
    • pp.277-284
    • /
    • 2004
  • 본 논문은 사용자로 하여금 계층적 가시화 기법에 의한 표정들의 공간으로부터 일련의 표정을 선택하게 함으로써 3차원 아바타의 표정 제어기법을 기술한다. 본 시스템에서는 2,40P0여개의 표정 프레임을 이용하여 2차원 표정공간을 구성하였으며, 3차원 아바타의 표정 제어는 사용자가 표정공간을 항해하면서 수행한다. 그러나 표정의 수가 너무 많아 사용자가 항해를 하는데 어려움이 많기 때문에 계층적 가시화 기법이 필요하다. 표정공간을 계층적으로 분할하기 위해, 퍼지 클러스터링을 이용한다. 초기 단계에서는 2,400여개의 표정들을 이용하여 약 11개의 클러스터센터를 가지도록 클러스터링한다. 클러스터 센터들은 2차원 평면에 표시되며 후보 키 프레임으로 사용된다 사용자는 후보 키 프레임들 중에서 특정 키 프레임들을 선택하여 초기 항해경로를 생성한다. 사용자가 줌 인(이산적인 단계를 가지고 있음)을 하면 상세한 단계를 보기를 원한다는 의미이므로 줌 인된 단계에 적합한 표정 클러스터들을 생성한다. 단계가 증가될 때 마다 클러스터의 수를 두 배로 하고, 클러스터의 수만큼 표정들을 클러스터링한다. 사용자는 현재 단계에서 그전 단계의 항해경로를 따라 새로운 키 프레임(클러스터 센터)들을 선택하여 항해경로를 갱신한다. 줌 인을 최대로 한 마지막 단계에서 항해경로를 갱신하면 표정 제어 설정이 끝난다. 사용자는 언제든지 줌 아웃을 통해 그 전단계로 돌아가서 항해경로를 수정할 수 있다. 본 논문은 본 시스템이 어떤 효과가 있는지를 알기 위해 사용자들로 하여금 본 시스템을 사용하여 3차원 아바타의 표정 제어를 수행하게 하였으며, 그 결과를 평가한다.

잡음 모델 선택을 이용한 Wyner-Ziv 비디오 압축 (Wyner-Ziv Video Compression using Noise Model Selection)

  • 박천호;심혁재;전병우
    • 대한전자공학회논문지SP
    • /
    • 제46권4호
    • /
    • pp.58-66
    • /
    • 2009
  • 최근 경량화 비디오 부호화를 위함 분산 비디오 부호화 기술 (DVC: Distributed Video Coding)에 대한 연구가 활발히 이루어지고 있으며, Wyner-Ziv 부호화 기술은 이의 대표적인 기술로써 각광받고 있다. Wyner-Ziv (WZ) 부호화기는, 영상을, 기존의 인트라 부호화기를 이용하는 키 (Key) 프레임과 WZ 부호화를 하는 WZ 프레임으로 나누어 독립적으로 부호화 한다. WZ 복호화기로 전송된 키 프레임은 복원된 뒤 키 프레임 사이의 WZ 프레임을 추정하는데 사용되며 추정된 WZ 프레임을 보조정보 (Side Information)라고 한다. 보조정보는 WZ 프레임에 대한 정보가 없는 상태에서 추정되므로 필연적으로 WZ 프레임과 다르며 WZ 복호화기에서는 보조정보와 WZ 프레임과의 차이를 가상의 채널 잡음으로 간주한다. WZ 복호화 과정은 가상의 채널잡음을 WZ 복호화기 내에 존재하는 채널코드를 이용하여 제거함으로써 이루어지므로 채널 정보를 정확히 아는 것은 채널코드의 에러정정능력에 큰 영향을 미친다. WZ 복호화기에서는 추정된 WZ 영상만이 존재하므로 정확한 잡음의 양을 알 수 없으며, 일반적으로 선형 움직임에 근거한 키 프레임 간의 차를 하나의 예측 수단으로 사용한다. 또한 이와 같이 예측이 갖는 불확실성으로 채널코드의 효율이 저하되는 것을 막기 위하여 주변의 잡음과 비교를 통한 잘못된 잡음을 정정하는 방법도 제안되었다. 하지만 이런 방법들이 모든 프레임이나 비트 플레인에 존재하는 잡음을 제대로 측정한다고 할 수는 없다. 따라서 본 논문에서는 여러 개의 후보 잡음 모델을 생성한 후, 복호화 과정에서 가장 효율적인 모델을 선택하는 방법을 제안한다. 제안 방법에 대한 실험결과는 최대 0.8 dB의 PSNR이득을 보여준다.