통합 검색 | Korea Science

체적형 객체 촬영을 위한 RGB-D 카메라 기반의 포인트 클라우드 정합 알고리즘 (Point Cloud Registration Algorithm Based on RGB-D Camera for Shooting Volumetric Objects)

김경진;박병서;김동욱;서영호
- 방송공학회논문지
- /
- 제24권5호
- /
- pp.765-774
- /
- 2019
본 논문에서는 다중 RGB-D 카메라의 포인트 클라우드 정합 알고리즘을 제안한다. 일반적으로 컴퓨터 비전 분야에서는 카메라의 위치를 정밀하게 추정하는 문제에 많은 관심을 두고 있다. 기존의 3D 모델 생성 방식들은 많은 카메라 대수나 고가의 3D Camera를 필요로 한다. 또한 2차원 이미지를 통해 카메라 외부 파라미터를 얻는 기존의 방식은 큰 오차를 가지고 있다. 본 논문에서는 저가의 RGB-D 카메라 8대를 사용하여 전방위 3차원 모델을 생성하기 위해 깊이 이미지와 함수 최적화 방식을 이용하여 유효한 범위 내의 오차를 갖는 좌표 변환 파라미터를 구하는 방식을 제안한다.
https://doi.org/10.5909/JBE.2019.24.5.765 인용 PDF KSCI KPUBS

3차원 복원 및 시점 합성을 위한 반복적인 매칭 비용 업데이트 기반의 다시점 스테레오 매칭 알고리즘 (Iterative Matching Cost Update based Multi-view Stereo Matching Algorithm for 3D Reconstruction and View Synthesis)

이민재;박순용;엄기문;정원식;윤정일;이진환
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2020년도 하계학술대회
- /
- pp.144-145
- /
- 2020
본 논문에서는 정밀한 3차원 복원 및 시점 합성을 위해 매칭 비용을 반복적으로 업데이트하는 Generalized Soft 3D Reconstruction (GenSoft3D) 알고리즘을 제안한다. 먼저 다시점 영상들과 카메라 자세정보가 주어지면 GenSoft3D는 볼륨 기반의 다시점 스테레오 매칭 알고리즘으로 시점별 초기 매칭 비용 볼륨 및 시차 맵을 계산한다. 그 후 정제 과정에서 각 시점은 모든 시차 맵을 이용하여 표면 확률 및 가시 확률을 계산한다. 표면 확률은 초기 매칭 비용 업데이트에 사용하며, 가시 확률은 폐색 영역의 정확한 시차를 계산하기 위해 사용된다. 해당 정제 과정을 일정 횟수 반복할 경우 시점별 고정밀의 시차 맵 획득이 가능하다. 또한 시차 맵의 정확도가 향상됨에 따라 정확한 시점 합성이 가능하다.
PDF

MMT 기반 3차원 포인트 클라우드 콘텐츠의 영역 선별적 전송 방안 (Region Selective Transmission Method of MMT based 3D Point Cloud Content)

김두환;김준식;김규헌
- 방송공학회논문지
- /
- 제25권1호
- /
- pp.25-35
- /
- 2020
최근 하드웨어 성능뿐 아니라 영상 처리 기술의 발달로 인해 다양한 분야에서 사용자에게 자유로운 시야각과 입체감을 제공하는 3차원 포인트를 다루는 기술에 관한 연구를 지속하고 있다. 3차원 포인트를 표현하는 형식 중 포인트 클라우드 기술은 포인트를 정밀하게 획득/표현할 수 있다는 장점으로 인해 다양한 분야에서 주목받고 있다. 하지만 하나의 3차원 포인트 클라우드 콘텐츠를 표현하기 위해 수십, 수백만 개의 포인트가 필요하므로 기존의 2차원 콘텐츠보다 많은 양의 저장 공간을 요구한다는 단점이 존재한다. 이러한 이유로, 국제 표준화 기구인 MPEG (Moving Picture Experts Group)에서는 3차원 포인트 클라우드 콘텐츠를 효율적으로 압축 및 저장하고, 사용자에게 전송하는 방안에 대해 계속 연구를 진행 중이다. 본 논문에서는 MPEG-I (Immersive) 그룹에서 제안한 V-PCC(Video based Point Cloud Compression) 부호화기를 통해 생성된 V-PCC 비트스트림을 MMT (MPEG Media Transport) 표준에서 정의한 MPU (Media Processing Unit)로 구성하는 방안을 제안한다. 또한, MMT 표준에서 정의한 시그널링 메시지를 확장하여 3차원 포인트 클라우드 콘텐츠의 영역 선별적 전송 방안을 위한 파라미터와 사용자의 요구에 따라 선택적으로 품질 파라미터를 결정할 수 있도록 V-PCC에서 상정하는 품질 파라미터를 추가 정의한다. 마지막으로, 본 논문에서는 제안한 기술을 기반으로 검증 플랫폼의 설계/구현을 통해 결과를 확인한다.
https://doi.org/10.5909/JBE.2020.25.1.25 인용 PDF KSCI KPUBS

음성특징의 다양한 조합과 문장 정보를 이용한 감정인식 (Emotion Recognition using Various Combinations of Audio Features and Textual Information)

서승현;이보원
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2019년도 추계학술대회
- /
- pp.137-139
- /
- 2019
본 논문은 다양한 음성 특징과 텍스트를 이용한 멀티 모드 순환신경망 네트워크를 사용하여 음성을 통한 범주형(categorical) 분류 방법과 Arousal-Valence(AV) 도메인에서의 분류방법을 통해 감정인식 결과를 제시한다. 본 연구에서는 음성 특징으로는 MFCC, Energy, Velocity, Acceleration, Prosody 및 Mel Spectrogram 등의 다양한 특징들의 조합을 이용하였고 이에 해당하는 텍스트 정보를 순환신경망 기반 네트워크를 통해 융합하여 범주형 분류 방법과 과 AV 도메인에서의 분류 방법을 이용해 감정을 이산적으로 분류하였다. 실험 결과, 음성 특징의 조합으로 MFCC Energy, Velocity, Acceleration 각 13 차원과 35 차원의 Prosody 의 조합을 사용하였을 때 범주형 분류 방법에서는 75%로 다른 특징 조합들 보다 높은 결과를 보였고 AV 도메인 에서도 같은 음성 특징의 조합이 Arousal 55.3%, Valence 53.1%로 각각 가장 높은 결과를 보였다.
PDF

거리 함수 학습을 활용하여 장르 분류를 위한 특징 셋의 간소화 방법 연구 (Feature reduction based on distance metric learning for musical genre classification)

장달원;신사임;이종설;장세진;임태범
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2014년도 하계학술대회
- /
- pp.3-4
- /
- 2014
음악 장르 분류 분야에서는 다양한 특징을 모아서 특징 벡터를 만들고 이를 support vector machine (SVM)와 같은 분류기에 입력하는 시스템이 주로 사용되고 있다. 이 논문에서는 거리 함수 학습를 음악 장르 분류를 위한 특징 벡터의 간소화에 적용하였다. 여러 거리 함수 학습 방법 중 하나의 방법을 선택하고, 기존의 논문들에서 사용되었던 특징 셋을 활용하여 기존 특징 셋에 대해서 성능을 떨어뜨리지 않으면서 특징 셋의 길이를 줄일 수 있는지 살펴본다. 우리의 실험에서는 168차원의 특징 셋을 10차원까지 줄였는데, 이 경우 분류 정확도가 2% 이내로 저하되었다.
PDF

감정 차원에 관한 연구 (A Study of Emotion Dimension)

한의환;서보국;차형태
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2013년도 하계학술대회
- /
- pp.163-164
- /
- 2013
최근 들어 감성공학에 관한 관심도가 증가하고 있다. 감성공학과 관련된 연구는 사람의 감정 상태를 표현하는 방법에 관한 연구가 활발히 진행되고 있다. 감정 상태를 표현하는 방법으론 1980년대 Russel이 제안한 Circumplex 모델[1]이 가장 대표적으로 사용되고 있으며, 최근에도 여러 논문[3-6]에서 이 모델을 이용하여 감정 상태를 나타낸다. 하지만 이 모델의 경우에는 사람의 감정상태를 감정차원 평면위에 하나의 점(평균, 분산)으로 표현하기 때문에, 실제 생체신호와의 연관성, 언어 및 문화 차이에 의한 다양성에 관한 연구를 진행하기에 어려움이 있다. 따라서 본 논문에서는 척도 대비 분산의 크기 값을 판단하여 하나의 점이 아닌 다수개의 점으로 나타내는 방법을 제시한다.
PDF

카메라 모델에 의한 변환 영역에서 보간 (Interpolation in the transformation domain by camera model)

이학무;강문기
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 1998년도 학술대회
- /
- pp.127-130
- /
- 1998
3차원의 영상을 2차원 화면에 투영시키기 위해서는 영상에 대한 카메라의 촬영 각도와 촬영 거리를 일치시켜주어야 한다. 이를 위해서 다른 각도와 거리에서 촬영한 영상을 같은 각도와 거리에서 촬영한 영상으로 만들어 주는 변환을 만들었다. 그러나 이러한 변환을 하였을 때 디지털 영상은 경계부분이나 직선 등이 끊어지는 현상이 발생하게 된다. 본 논문에서는 변환된 영역에서의 정수 점에 원래 영상의 점을 바로 대응시키지 않고 주변 점의 다항식으로 나타낼 수 있다. 이 다항식의 계수를 정하는 방법으로 변환된 영역에서의 정수 점에 대응하는 원래 영상의 점을 구하여 2차 선형 보간법(Bilinear interpolation)을 사용하였다. 변환된 영역에서의 정수 점에 대응하는 원래 영상에서의 좌표를 얻기 위해 주변 4개의 점 내에서는 부분적으로 선형적임을 가정하였다. 위의 방법으로 주변 점들의 에너지를 각 정수 점들로 분산시킴으로써 경계 점이나 직선들이 잘 보존된 상태로 변환할 수 있었다.
PDF

2차원 블록 단위 기반의 고성능 컴퓨터 생성 홀로그램 생성기의 구조 (A High-Performance Architecture for 2 Dimensional Block-Based Computer Generated Hologram)

이윤혁;서영호;김동욱
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2012년도 하계학술대회
- /
- pp.109-110
- /
- 2012
본 논문에서는 홀로그램을 실시간으로 생성하기 위하여 수정된 디지털 홀로그램(computer-generated hologram, CGH) 수식을 재정의 하여 3단계로 나누고 2차원 블록 단위 기반의 컴퓨터 생성 홀로그램 생성기의 하드웨어 구조를 제안하였다. 유효광원의 대한 z축 항에 대하여 연산하는 공통항 연산기와 x,y축을 연산하는 죄표값 연산기 마지막으로 각 화소의 대하여 연산하는 화소값 연산기로 이루어진 하드웨어를 제안하고 구현 하였다. 구현한 하드웨어는 $32{\times}32$ 중간 블록의 구조를 가질 때 기존 연구에 비하여 86%이상의 DSP블록을 줄일 수 있다.
PDF

인체 골격 정보를 이용한 Multiclass SVM 기반의 자세 인식 분류 기법

강민주;강제원
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2015년도 추계학술대회
- /
- pp.74-76
- /
- 2015
본 논문에서는 효율적인 자세인식을 위해 인체 골격 정보를 활용한 멀티클래스 SVM(Multiclass Support Vector Machine)학습 기반의 자세 인식 분류 기법을 제안한다. RGB 카메라로 취득한 영상을 활용하거나 깊이 카메라로부터 취득한 골격 정보를 그대로 사용하는 기존 연구와 달리 제안 기법에서는 깊이 정보로부터 추출한 인체의 3 차원 골격 정보를 이용하여 고차원의 특징을 추출하고 그로부터 자세 인식 분류를 수행한다. 제안 기법의 특징 벡터는 깊이 정보에서 취득한 골격 정보의 관절간 각도의 조합으로 구성하여 인체의 골격 편차에 강인할 뿐 아니라 특징의 차원을 효과적으로 감소시킬 수 있다. 또한 분류기로는 멀티클래스 SVM 방식 중 one-vs-one 분류 방식을 이용하여 학습 및 판별을 수행함으로써 제안 기술의 성능을 평가한다. 실험을 통해 제안 기법은 다수의 자세에서 비교하는 다른 학습 기법보다 비교적 높은 자세인식률을 보인다.
PDF

모바일 단말에서 실시간으로 동작하는 초고해상화 기술 개발 (Real-time Single Image Super Resolution in Mobile Devices)

김성제;정진우
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2022년도 추계학술대회
- /
- pp.42-43
- /
- 2022
본 논문은 모바일 단말에서 실시간으로 동작하는 딥러닝 기반 경량 초고해상화 기술에 관한 내용이다. 대용량 3차원 메쉬 모델의 비실시간 압축은 실시간 스트리밍 응용 시나리오에서 제약점으로 작용하고 있고, 본 논문에서는 두 입력 텐서의 차원을 일치시켜야 하는 element-wise 덧셈 대신 concatenation을 활용해 연산량을 개선하고, float-to-int8 양자화 과정에서 발생하는 오차를 줄이기 위해 weight clipping 및 regularization 기법을 활용해 초고해상화 화질 성능을 개선하였다. 제안하는 알고리즘은 기존 모바일 초고해상화 기술을 화질 측면에서 0.12dB, 처리 속도 측면에서 13.6ms 개선하였고, Mobile AI & AIM 2022 실시간 이미지 초고해상화 대회에서 1등을 수상하였다.
PDF

검색결과 582건 처리시간 0.031초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)