• 제목/요약/키워드: video compression.

검색결과 778건 처리시간 0.03초

3차원 데이터의 손실압축과 손실보정기법 연구 (Loss Compression and Loss Correction Technique of 3D Point Cloud Data)

  • 신광성;신성윤
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 춘계학술대회
    • /
    • pp.351-352
    • /
    • 2021
  • 최근 코로나19로 인한 사회 환경의 급변화로 인하여 비대면/비접촉 기반 정보 교환 기술의 필요성이 급속도로 대두되고 있다. 이러한 변화들로 인해 몰입감, 임장감을 이용한 대안시스템의 개발이 절실히 요구되고 있다. 본 연구에서는 화상회의 시스템을 구현하기 위해 대용량 3차원 데이터를 지연 없이 실시간으로 전송하기 위한 기술을 구현하였다. 이를 위해 비지도학습 계열의 최신 딥러닝 알고리즘인 GAN의 응용알고리즘을 활용하였다.

  • PDF

MMT를 이용한 PCC 데이터 송수신 기술 개발 (Development of PCC data transmission and reception using MMT)

  • 박성환;김규헌
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.576-578
    • /
    • 2020
  • 최근 사용자에게 더욱 몰입감 있는 콘텐츠를 제공하기 위한 기술에 대한 관심이 증가하고 있으며 기존의 2D 콘텐츠와는 다른 새로운 방식인 3D 콘텐츠에 대한 연구가 활발히 진행되고 있으며 그 중 가장 대표적인 것이 Point Cloud 영상이라고 할 수 있다. Point Cloud의 경우 수많은 3차원 좌표를 가진 점들로 구성되어 있으며 각 점들마다 Attribute 값을 이용하여 색상 등의 표현이 가능한 구조로 이루어져 있다. 이러한 특성 때문에 Point Cloud 데이터는 방대한 용량을 가지고 있으며 기존의 2D 방식과 데이터 구조가 상이하기 때문에 새로운 압축 표준이 요구되었다. 이에 미디어 표준화 단체인 MPEG(Moving Picture Experts Group)에서는 MPEG-I(Immersive) 차세대 프로젝트 그룹을 이용하여 이러한 움직임에 대응하고 있다. MPEG-I의 part 5(Video-based Point Cloud Compression, V-PCC)에서는 객체를 대상으로 하여 기존의 비디오 코덱을 활용한 Point Cloud 압축 표준화를 진행중이다. V-PCC 데이터의 경우 기존의 2D 영상 데이터와 같이 전송을 통해 소비될 가능성이 아주 높기 때문에 이에 대한 고려가 필요하다. 현재 MPEG에서 표준화를 완료한 MMT(MPEG Media Transport)라는 전송 표준이 존재하기 때문에 이 기술을 활용 가능할 것으로 보인다. 따라서 본 논문에서는 Point Cloud 데이터를 압축한 V-PCC 데이터를 전송 표준 방식인 MMT를 이용하여 전송하는 방안에 대하여 제안한다.

  • PDF

VCM 을 위한 다중 스케일 특징 압축 방법 (multi-scale feature compression for VCM)

  • 한희지;최민석;정순흥;곽상운;추현곤;정원식;서정일;최해철
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.140-142
    • /
    • 2022
  • 최근 신경망 기반 기술들의 발달에 따라, 신경망 기술들은 충분히 높은 임무 수행 성능을 달성하고 있으며 사물인터넷, 스마트시티, 자율주행 등 다양한 환경을 고려한 응용 역시 활발히 연구되고 있다. 하지만 이러한 신경망의 임무 다양성과 복잡성은 더욱 많은 비디오 데이터가 요구되며 대역폭이 제한된 환경을 고려한 응용에서 이러한 비디오 데이터를 효과적으로 전송할 방법이 필요하다. 이에 따라 국제 표준화 단체인 MPEG 에서는 신경망 기계 소비에 적합한 비디오 부호화 표준 개발을 위해 Video Coding for Machines (VCM) 표준화를 진행하고 있다. 본 논문에서는 신경망의 특징 부호화 효율을 개선하기 위하여 VCM 을 위한 다중 스케일 특징 압축 방법을 제안한다. COCO2017 데이터셋의 검증 영상을 기반으로 제안방법을 평가한 결과, 압축된 특징의 크기는 원본 이미지의 0.03 배이며 6.8% 미만의 임무 정확도 손실을 보였다.

  • PDF

V-PCC 부호화기를 위한 고속 결합 법선 추정 방법 (Fast Joint Normal Estimation Method for V-PCC Encoder)

  • 김용환;김유라
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.246-249
    • /
    • 2022
  • 최근 들어 세계적으로 크게 관심을 받는 메타버스 및 몰입형(가상현실, 확장현실, 및 라이트필드) 콘텐츠 서비스의 응용 범위를 확대하기 위해서는 3D 객체의 실시간 전송을 위한 압축 기술이 필요하다. ISO/IEC 23090 MPEG-I Part 5 로 2021 년 표준화 완료된 V-PCC (Video-based Point Cloud Compression)는 이러한 산업계의 관심 및 필요에 의해서 국제 표준화된 동적 3D 포인트 클라우드 객체 부호화 기술이다. V-PCC 기술의 압축 성능은 기존 산업계 기술에 비해 매우 우수하나, 부호화기의 연산 복잡도가 매우 높다는 단점을 가지고 있다. 본 논문에서는 V-PCC 부호화기에서 가장 높은 연산 복잡도를 갖는 법선 추정 알고리즘의 결합 고속화 기법을 제안한다. 법선 추정은 2 개의 알고리즘으로 구성되어 있다. 첫번째는 "방향을 무시하는 법선 추정 알고리즘(normal estimation)"이고, 두번째는 첫번째 알고리즘에서 추정된 법선들을 대상으로 하는 "법선 방향 추정 알고리즘(normal orientation)"이다. 본 논문에서 제안하는 고속화 기법은 2 개 알고리즘을 결합하여 첫번째 법선 추정 알고리즘에서 획득한 부가 정보를 두번째 법선 방향 추정 알고리즘에서 활용함으로써 연산량을 대폭 줄이고, 또한 법선 방향 추정 알고리즘 내의 우선순위 큐 자료구조를 변경하여 추가적인 고속화를 달성한다. 7 개 테스트 영상에 대한 실험 결과, 압축 효율 저하 없이 법선 방향 추정 알고리즘의 속도를 평균 89.2% 향상시킬 수 있다.

  • PDF

다이렉트쇼 환경 기반에서 고압축과 저작권 보호를 위한 비디오 트랜스 코딩과 워터마킹 구현 (Implementation of Video Watermarking and Transcoding for High Compression and Copyright protection based on Directshow Environment)

  • 정용재;정태일;김종남;문광석
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.1500-1503
    • /
    • 2008
  • H.264와 같은 고압축 비디오처리 기법의 등장으로 기존의 MPEG2와 같은 비디오 압축에서 H.264로의 비디오 트랜스코딩이 증가되고 있지만, 고압축 비디오 콘텐츠의 온라인과 오프라인에서 불법배포는 현재 문제가 되고 있다. 본 논문에서는 다이렉트쇼 환경 기반에서 고압축과 저작권 보호를 위한 비디오 트랜스 코딩과 워터마킹을 구현한다. 제안한 방법은 다이렉트쇼의 필터를 이용하여 MPG,WMV를 H.264로 비디오 트랜스코딩을 하고 이와 함께 비디오의 공간영역 특성을 이용하여 저작권 보호를 위한 강인한 워터마킹을 구현한다. 실험 결과 MPG,WMV를 H.264로 트랜스코딩에서 H.264의 QP(Quantization parameter)를 15로 하고 화면간 반복을 10프레임으로 하였을 경우 저작권 보호를 위하여 삽입된 워터마크는 평균 99% 검출됨을 확인하였고, 또한 트랜스코딩중 워터마크삽입에 따른 시간지연은 전체 트랜스코딩시간의 5.7%가 됨을 확인할 수 있었다. 제안한 방법은 저작권 삽입 기능가지는 트랜스코딩 소프트웨어를 필요로 하는 Digital TV방송, IPTV, DVD 사업에 사용 될 수 있을 것이다.

DNN 기반 수어 번역 모델을 통한 성능 분석 (Performance Analysis Using a DNN-Based Sign Language Translation Model)

  • 정민재;노승환;홍준기
    • 한국빅데이터학회지
    • /
    • 제9권1호
    • /
    • pp.187-196
    • /
    • 2024
  • 본 연구에서는 수어의 좌표를 압축하여 학습 시간을 획기적으로 단축시킬 수 있는 DNN (Deep Neural Network) 기반 수어 번역 모델을 제안하고 수어 좌표 압축 유무에 따른 정확도와 모델 학습 시간을 비교 분석하였다. 제안한 모델을 사용하여 수어를 번역한 결과, 수어 영상을 압축하기 전과 후의 정확도는 약 5.9% 감소한 반면, 학습 시간은 56.57% 감소하여 수어 번역 정확도 손실 대비 학습 시간에서 많은 이득을 얻는 것을 확인하였다.

통계적 확률 기반의 효율적인 고속 화면 내 모드 예측 방법 (Efficient High-Speed Intra Mode Prediction based on Statistical Probability)

  • 임웅;남정학;정광수;심동규
    • 대한전자공학회논문지SP
    • /
    • 제47권3호
    • /
    • pp.44-53
    • /
    • 2010
  • H.264/AVC는 공간적 중복성을 제거하기 위하여 9개의 화면 내 예측모드를 사용하도록 설계되었다. 또한, 모드 정보의 전송을 위하여 이웃한 블록의 모드간의 높은 상관도를 사용한다. 모드를 표현할 때, 더 높은 확률을 가진 모드에 더 적은 비트가 할당되며, 이웃한 두 개 블록의 예측모드 간에 최소값을 취하여 예측함으로써 압축된다. 본 논문에서는, 몇 개의 테스트 비디오 시퀀스를 사용하여 왼쪽과 위쪽의 이웃한 두 블록의 모드에 따라서 발생하는 현재 블록의 예측모드에 대한 통계적 확률을 구하였다. 다음으로 왼쪽과 위쪽의 이웃한 두 블록의 예측모드의 모든 조합에 대하여 현재 블록에서 결정될 확률이 가장 높은 5개 모드를 후보 예측모드로 하여 테이블로 구성한다. 이 확률 테이블을 사용하여, 선택된 5개의 후보 모드들만 율-왜곡 최적화를 수행함으로써 부호화 과정을 고속화하고, 각각의 경우에서 가장 높은 발생 확률을 갖는 모드를 most probable mode로 사용하여 모드 정보를 줄임으로써 부호화 성능을 높이는 방법을 제안한다. 제안한 알고리즘의 부호화 성능은 5개 후보 모드의 발생확률의 합이 90%, 85%, 80%이상인 경우에 대하여 JM14.2 대비 각각 1.17%, 1.50%, 1.19% 향상되었으며 부호화 속도는 18.46%, 27.97%, 36.03% 향상되었다.

유방촬영 시 유방보형물 환자에 대한 새로운 압박대 적용의 유용성 평가 (Evaluation of Usefulness of Image by Using New Compression Paddle for Mammoplasty Patient During Mammography)

  • 홍동희
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제38권3호
    • /
    • pp.229-235
    • /
    • 2015
  • 유방확대수술이 미용을 위한 성형뿐만 아니라 유방암 절제술 후 재건의 목적으로 받는 등의 증가 추세이다. 유방확대수술을 받은 여성은 유방에 삽입한 보형물이 유방실질을 가려 유방질환을 진단하기 어려운 경우가 점점 증가하고 있고, 압박대로인한 보형물 파열 우려로 환자의 두려움은 증가하고 있다. 그러므로 유방보형물 삽입 여성에게 적용 가능한 압박대를 개발하여 그 유용성을 알아보고자 하며, 기존의 압박대와 새롭게 개발한 압박대를 유방보형물 삽입 환자모형의 phantom에 적용시켜 영상을 얻은 후 유방의 Inner, Outer 부분과 유두후방길이(Posterior Nipple Line; PNL), 전체적인 포함면적을 비교하여 그 유용성을 비교해보고자 한다. 개발한 압박대로 압박 시 전체 면적은 CC view에서 $9,813.797mm^2$로 10.09% 증가하였고, CC-ID view에서 $7,621.531mm^2$로 3.88% 증가하였으며, PNL은 CC view에서 90.916mm로 3.41% 증가, CC-ID view에서 75.357mm로 1.64% 증가하였다. 또한 흉벽 측 유방조직은 CC view에서 177.725mm로 3.53% 증가하였고, CC-ID view에서 152.510mm로 6.57% 증가되는 것으로 나타났으며, 기존의 압박대에 비해 개발한 압박대의 CC-ID 영상에서는 보형물이 완전히 제거된 것을 확인할 수 있었다.

효율적인 스테레오 영상 압축을 위한 밝기차 보상 (Intensity Compensation for Efficient Stereo Image Compression)

  • 전영탁;전병우
    • 대한전자공학회논문지SP
    • /
    • 제42권2호
    • /
    • pp.101-112
    • /
    • 2005
  • 사람이 두 눈을 통하여 3차원 공간을 지각하는 것과 같이 두 대의 카메라로부터 얻어진 스테레오 영상을 이용하여 3차원 정보를 얻을 수 있다. 스테레오 영상은 많은 데이터량을 가지기 때문에 최근 수년간 디지털 비디오 압축 기술의 발전과 함께 스테레오 영상을 효율적으로 압축하기 위한 기술이 개발되고 있다. 스테레오 영상을 압축하고 3차원 정보를 추출하는데 이용되는 양안차 추정은 일반적으로 두 스테레오 영상의 화소 간의 밝기 차이를 이용한다. 하지만 두 카메라의 초점거리, 방향, 상대적 위치, 조리개에 의해 입사되는 빛의 양 등의 미세한 차이에도 스테레오 영상 간의 밝기차가 발생한다. 밝기차가 있는 스테레오 영상은 부정확한 양안차 벡터와 이에 따른 낮은 압축 효율과 같은 문제점을 발생시킬 수 있다. 따라서 이런 스테레오 영상 간의 밝기차를 사전에 보상한 후 압축함으로써 압축의 효율을 높이고, 또한 재생 시 두 눈을 통하여 들어오는 서로 다른 시각 정보로 인한 눈과 두뇌의 피로를 덜어 줄 수 있다. 본 논문에서는 간단하면서도 효율적인 전처리 방법으로 전역 밝기 보상과 국부지역 밝기 보상 및 계층적 밝기 보상을 제안한다 실험결과는 제안된 보상 방법이 효율적으로 스테레오 영상을 압축하는 것을 보여준다.

DCT 직류 값을 이용한 움직임 추정기 설계에 관한 연구 (A Study on Motion Estimator Design Using DCT DC Value)

  • 이권철;박종진;조원경
    • 대한전자공학회논문지SP
    • /
    • 제38권3호
    • /
    • pp.258-268
    • /
    • 2001
  • 정보량이 많은 고화질의 동영상을 실시간으로 전송하기 위하여 압축 알고리즘을 필수적으로 사용하고 있으며, 시간적 중복성을 제거하는 동영상의 압축방법은 움직임 추정 알고리즘을 사용한다. 본 연구에서 설계하고자 하는 움직임 추정기는 블록정합 알고리즘이며, MPEG 부호기에서 사용되는 DCT 연산 결과인 DC 값을 이용하여 화면의 밝기를 판단한다. 움직임 추정기는 휘도 신호 8비트 모두를 사용하지 않고, 화면 밝기에 따른 비트 플레인(bit plane)에서 3비트만 선택하는 비교선택기를 이용한다. 본 연구에서 제안한 비교 선택기는 I-Picture만을 계산한다. I-Picture에 의해 계산된 선택 비트는 I, P와 B Picture의 움직임 추정 연산에 사용함으로서 움직임 추정기의 크기를 줄일 수 있는 구조를 제안하였다. 제안된 움직임 추정기의 고찰을 위하여 실험에 사용된 표준 동영상의 해상도는 352×288이며, DCT 연산의 처리 블록은 8×8이며, 탐색 영역은 23×23이다. 제안된 알고리즘은 C언어로 모델링하였으며, 기존 완전탐색방법과 PSNR을 비교한 결과 사람의 시각으로 거의 구별할 수 없는 작은 차이(0~0.83dB)가 나타남을 알 수 있었다. 본 연구에서 제안한 움직임 추정기의 하드웨어 크기는 기존 구조Ⅰ보다 38.3%, 기존 구조Ⅱ보다 30.7% 줄일 수 있었고, 메모리 크기는 기존 구조Ⅰ,Ⅱ보다 31.3% 줄일 수 있었다.

  • PDF