통합 검색 | Korea Science

VVC 를 위한 CNN 기반의 변환계수 적응적 화질개선 기법 (CNN-Based Transformed Coefficient-Adaptive Enhancement for VVC)

김지훈;임성균;박도현;김재곤
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 하계학술대회
- /
- pp.311-312
- /
- 2021
최근 VVC(Versatile Video Coding) 표준 완료 이후 JVET(Joint Video Experts Team)은 NNVC(Neural Network-based Video Coding) AhG(Ad-hoc Group)을 구성하고 인공지능을 이용한 비디오 압축 기술들을 탐색하고 있다. 본 논문에서는 VVC 복원 영상의 DCT 계수를 기반으로 복원 영상을 분류하고, 분류된 각 클래스에 따라 적응적으로 CNN(Convolutional Neural Network) 기반의 화질 개선을 수행하는 VVC 후처리 기법을 제안한다. 실험결과, 제안기법은 AI(All Intra) 부호화 모드에서 1.23% BD-rate 이득을 보였다.
PDF

완전연결계층 기반의 다중 모델을 이용한 화면내 예측 (Intra Prediction Using Multiple Models Based on Fully Connected Layer)

김민재;문기화;박도현;권형진;김재곤
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 하계학술대회
- /
- pp.355-356
- /
- 2021
딥러닝 기술과 하드웨어의 발전으로 다양한 분야에서 인공신경망과 관련한 연구가 활발히 진행되고 있다. 비디오 코덱 부분에서도 딥러닝 기술을 적용하는 부호화 기술이 많이 연구되고 있다. 본 논문은 최근 완료된 VVC 에 채택된 신경망 기반의 기술인 MIP(Matrix Weighted Intra Prediction)를 확장하여 보다 깊은 계층의 모델로 학습된 새로운 화면내 예측 모델을 제안한다. 기존 VVC 의 MIP 의 성능과 비교하기 위하여 기존 MIP 모델과 제안하는 다중완전연결계층(Fully Connected Layer) 화면내 예측 모델을 HEVC(High Efficiency Video Coding)에 적용하여 그 성능을 비교하였다. 실험결과 제안기법은 VVC MIP 대비 0.08 BD-rate 성능 향상을 보였다.
PDF

ECM 의 효율적인 GPM 확장 모드 시그널링 기법 (Efficient Signaling of Extended GPM Modes in ECM)

문기화;이지원;박도현;김재곤
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 하계학술대회
- /
- pp.1236-1238
- /
- 2022
JVET 은 최신 비디오 부호화 표준인 VVC(Versatile Video Coding) 표준화를 완료한 후, VVC 보다 더 높은 압축 성능을 가지는 새로운 표준기술 탐색을 진행하고 있으며, 이를 위하여 참조 소프트웨어 ECM(Enhanced Compression Model)을 개발하고 있다. 현재 ECM4.0 에는 다양한 후보 구성 및 예측 성능 개선 기법을 추가하여 기존 VVC 의 GPM(Geometric Partitioning Mode)을 확장한 GPM-MMVD(GPM with merge MV differences), GPM-TM(GPM with template matching) 등을 채택하고 있다. 본 논문에서는 ECM 에 채택된 확장된 GPM 기술들의 각 기술 별 선택 빈도를 분석하고 이를 바탕으로 보다 효율적인 GPM 확장 모드 시그널링 방식을 제안한다. 또한 후보 탐색 알고리즘을 간소화한 복잡도 감소 기법을 제시한다. 실험결과 제안하는 시그널링 기법은 ECM4.0 대비 Y와 Cb, Cr 에서 각각 0.02%, 0.16%, 0.09% BD-rate 부호화 성능 향상을 보였고 GPM 인덱스 탐색 간소화 기법은 ECM4.0 대비 Y 와 Cr 에서 각각 0.02%, 0.18% BD-rate 부호화 성능 향상을 보였다.
PDF

VCM 을 위한 FPN 다중 스케일 특징 압축 (Compression of Multiscale Features of FPN for VCM)

김동하;윤용욱;이주영;정세윤;김재곤;정대권
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 하계학술대회
- /
- pp.143-145
- /
- 2022
MPEG-VCM(Video Coding for Machine)은 입력된 비디오 특징(feature)를 압축하는 Track1 과 입력 영상을 직접 압축하는 Track2 로 나뉘어 표준화가 진행중이다. 본 논문은 VCM Track 1 에 해당하는 Detectron2 FPN(Feature Pyramid Network)에서 추출한 다중 스케일 특징맵을 VVC 로 압축하는 MSFC(Multi-Scale Feature Compression)을 구조를 제안한다. 본 논문의 MSFC 에서는 다중 스케일 특징을 결합하여 부호화/복호화하는 기존의 구조에서 특징맵의 해상도를 줄여 압축하는 개선된 MSFC 를 제시한다. 제안 방법은 VCM 의 Track2 의 영상 앵커(image anchor) 보다 우수한 BPP-mAP 성능을 보이고 최대 -84.98%의 BD-rate 성능향상을 보인다.
PDF

딥러닝 분석 모델 기반 스트레스 완화를 위한 서비스 제공 시스템 설계 (Design of Service Delivery System for Stress Relief using Deep Learning Analysis Model)

김현정;유서연;임효경;김강규;윤나리;하옥균
- 한국컴퓨터정보학회:학술대회논문집
- /
- 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
- /
- pp.535-536
- /
- 2021
현대의 스트레스 케어는 대부분 비디오 시청, 상담, 취미 활동 등을 통해 진행된다. 시각, 청각을 스트레스 케어에 활용한 사례는 이미 일상에서 쉽게 접할 수 있음으로 다른 새로운 감각을 요구하고 있다. 본 논문에서는 스트레스 케어를 목적으로, 생체정보를 대상으로 딥러닝 기술 기반의 '사용자 스트레스 및 효과적인 스트레스 해소 요소 판단 알고리즘 모델'을 사용하는 서비스 제공 시스템을 설계한다. 생체정보는 손목시계형 웨어러블을 통해 수집된 심박수, 혈압, 체온, 산소포화도, ECG 등 생체데이터를 사용한다. 제시하는 방법은 실시간으로 수집된 생체정보를 알고리즘, 모델을 통해 스트레스 수치를 예측하여 사용자에게 적절한 음악과 조명을 이용한 시청각적 요소와 아로마 요법을 이용한 후각적 요소를 제공한다.
PDF

수치지도 생성 및 갱신을 위한 Video Photogrammetry 적용 (Application of Video Photogrammetry for Generating and Updating Digital Maps)

유환희;성재열
- 대한공간정보학회지
- /
- 제6권2호
- /
- pp.11-20
- /
- 1998
수치지도를 생성하거나 갱신하기 위해 항공사진측량을 이용하지만 각종 지상시설물에 대한 위치와 속성자료를 항공사진측량만으로 작성하기 어려우므로 현장조사를 통해 지상시설물에 대한 정보를 얻고 있다. 따라서 본 연구에서는 현장조사의 정확도와 신뢰성을 향상시키기 위해 고해상 디지털카메라에 의해 입체영상을 얻고 DLT기법을 적용하여 3차원위치결정을 할 수 있는 비디오사진측량기법을 개발하였다. 또한 개발된 비디오 사진측량기법은 생성된 3차원위치자료에 속성자료를 연결시키는 기능을 이용하여 수치지도의 위치와 속성자료를 생성 및 갱신 할 수 있도록 개발하였다.
PDF

VVC 의 다중 변환 선택을 고려한 신경망 기반 화면내 예측 (Neural Network-Based Intra Prediction Considering Multiple Transform Selection in Versatile Video Coding )

박도현;문기화;임성창;김재곤
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 추계학술대회
- /
- pp.8-9
- /
- 2022
최근 VVC(Versatile Video Coding) 표준 완료 이후 JVET(Joint Video Experts Team)에서는 NNVC(Neural Network-based Video Coding) EE(Exploration Experiment)를 통하여 화면내 예측을 포함한 신경망 기반의 부호화 기술들을 탐색하고 검증하고 있다. 본 논문에서는 VVC 에 채택되어 있는 다중 변환 선택(MTS: Multiple Transform Selection)에 따라서 적절한 예측 블록을 선택할 수 있는 TDIP(Transform-Dependent Intra Prediction) 모델을 제안한다. 실험결과 제안기법은 VVC 의 AI(All Intra) 부호화 환경에서 VTM(VVC Test Model) 대비 Y, U, V 에 각각 0.87%, 0.87%, 0.99%의 BD-rate 절감의 비디오 부호화 성능 향상을 보였다.
PDF

T-DMB/AT-DMB 비디오 서비스를 위한 스케일러블 부호화기 모델에 따른 복잡도 및 성능 분석 (Complexity and Performance Analysis of SVC(Scalable Video Coding) Encoder Models for T-DMB/AT-DMB Video Service)

김진수;김규석;김필중;이시웅;김재곤;최해철
- 한국정보통신학회논문지
- /
- 제11권11호
- /
- pp.2015-2020
- /
- 2007
본 논문에서는 고품질-DMB(Advanced Terrestrial-DMB) 비디오 서비스를 제공하기 위해 SVC(Scalable Video Coding) 부호화기 법을 다룬다. SVC 기저계층으로 T-DMB 서비스와 호환이 되도록 하면서, 향상계층은 공간 확장성을 통하여 AT-DMB 비디오 서비스를 제공할 수 있다. 그러나 SVC 부호화 기법은 매우 복잡하므로, 이를 구현하기 위해서는 SVC 부호화기의 복잡도에 따른 성능 분석이 필요하다. 본 논문에서는 SVC 부호화 파라미터에 따른 성능 변화를 조사하고, 이를 기반으로 3가지 부호화기 모델에 따른 복잡도 및 성능 특성을 모의실험을 통하여 비교 분석한다.
https://doi.org/10.6109/jkiice.2007.11.11.2015 인용 PDF KSCI

대체 병합 후보를 이용한 병합 후보 리스트 구성 기법 (A Method of Merge Candidate List Construction using an Alternative Merge Candidate)

박도현;윤용욱;도지훈;김재곤
- 방송공학회논문지
- /
- 제24권1호
- /
- pp.41-47
- /
- 2019
HEVC(High Efficiency Video Coding) 보다 뛰어난 압축 성능을 갖는 차세대 비디오 압축 표준으로 진행중인 VVC(Versatile Video Coding)에서는 보다 향상된 움직임 병합(Merge) 모드를 위한 기법들이 다루어지고 있다. 기존의 병합 모드에서는 다수의 주변 블록에서 움직임 정보가 존재하지 않으면 현재 블록의 움직임 정보로 사용할 병합 후보 리스트에 제로(zero) 움직임 벡터가 후보에 삽입될 수 있으며 이는 부호화 효율을 저하시킬 수 있다. 본 논문에서는 병합 후보 리스트에 제로 움직임 후보가 삽입되는 경우를 줄이기 위해 대체 움직임 정보를 생성하여 병합 후보 리스트에 삽입하는 효율적인 병합 모드 후보 리스트 구성 기법을 제시한다. 실험결과 제안 기법은 VTM1.0 대비 3% 복호화 복잡도 증가와 함께 0.2%의 부호화 성능 향상을 보였다.
https://doi.org/10.5909/JBE.2019.24.1.41 인용 PDF KSCI KPUBS HTML

비디오 영상으로부터 배경 합성의 모자이크 방법 연구 (A Study on Global Background Scene Mosaicking Method from Video)

이재철;최유락;전형섭
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2006년도 추계학술발표대회
- /
- pp.109-112
- /
- 2006
이미지 모자이크 기법은 한 번에 촬영 할 수 없는 큰 배경이나 사물을 부분적으로 촬영 한 후 이들을 조합하여 전체 배경이나 사물을 합성하는 기술이다. 이 기술은 주로 지형을 촬영한 항공사진을 조합하여 전체 영상을 얻는 용도로 사용되어왔다. 본 연구에서는 일반적인 스틸사진의 조합이 아닌 동영상으로 촬영된 영상물로부터 전체 배경을 합성하는 방법에 대한 것이다. 이를 위하여 먼저 비디오 프레임간의 공통적인 특징 점들을 추출하고 일치되는 점들을 찾아내었다. 이로부터 두 프레임간의 상대적인 좌표를 구한 후 이를 저장하였다. 마지막으로 합성 단계에서는 저장된 상대 좌표로부터 부분 이미지를 연결하여 전체 이미지를 구하는 방법을 제안하였다. 제안된 방법은 근접 촬영이 필수인 협소공간의 고대 구조물의 육안 검사를 소형로봇 등의 원격 이동체에 실린 카메라로 수행하기 위한 용도에 응용될 수 있다.
PDF

검색결과 64건 처리시간 0.033초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)