• 제목/요약/키워드: Depth Map Generation

검색결과 107건 처리시간 0.023초

단안 영상의 입체 자유시점 Tour-Into-Picture (Stereoscopic Free-viewpoint Tour-Into-Picture Generation from a Single Image)

  • 김제동;이광훈;김만배
    • 방송공학회논문지
    • /
    • 제15권2호
    • /
    • pp.163-172
    • /
    • 2010
  • 자유시점 비디오는 원하는 시점을 자유로이 선택하여 보는 능동형 비디오이다. 이 기술은 박물관 투어, 엔터테인먼트 등의 다양한 분야에서 활용된다. 본 논문에서는 자유시점 비디오의 새로운 분야로 가상 카메라와 깊이맵을 이용하여 한 장의 영상 내부를 항해하는 입체 자유시점 Tour-Into-Picture (TIP)을 제안한다. 오래전부터 TIP가 연구되어 왔는데, 이 분야는 한 장의 단안 사진 내부를 항해하면서 애니메이션으로 볼 수 있게 하는 기술이다. 제안 방법은 전경 마스크, 배경영상, 및 깊이맵을 반자동 방법으로 구한다. 다음에는 영상 내부를 항해하면서 입체 원근투영 영상들을 획득한다. 배경영상과 전경객체의 3D 데이터를 기반으로 가상 카메라의 3차원 공간이동, 요/피치/롤링 등의 회전, 룩어라운드, 줌 등의 다양한 카메라 기능을 활용하여 입체 자유시점 비디오를 구현한다. 원근투영은 직교투형보다 우수한 입체감을 전달하며, 기존 방법과 비교하여 텍스쳐의 3D 데이터를 직접 원근투영하여 처리속도를 향상시켰다. 소프트웨어는 MFC Visual C++ 및 OpenGL 기반으로 구축되었으며, 실험영상으로 신윤복의 단오풍정을 사용하여 고전화의 입체 자유시점 비디오를 시청이 가능하다.

캐릭터 객체의 변환을 이용하는 입체 동영상 콘텐츠 제작 (Producing Stereoscopic Video Contents Using Transformation of Character Objects)

  • 이관욱;원지연;최창열;김만배
    • 방송공학회논문지
    • /
    • 제16권1호
    • /
    • pp.33-43
    • /
    • 2011
  • 3D 디스플레이의 급격한 공급으로 다양한 3D 입체 콘텐츠의 제작이 요구되고 있다. 3D 콘텐츠의 제작 방법으로는 일반적으로 스테레오 카메라로 입체물을 제작할 수 있지만, 기존 2D 콘텐츠에서 입체영상물을 제작하는 기법도 중요한 기술이다. 이러한 2D 콘텐츠의 변환작업을 통한 3D 영상물 제작은 3D 변환 분야에서 활발히 진행되고 있다. 그러나 단순히 한 장의 영상을 3D로 변환하는 것은 콘텐츠의 실감을 전달하지 못한다. 본 논문에서는 기존의 2D 영상에 존재하는 객체에 생명력을 불어넣어, 그림속이 객체가 살아나 움직이는 새로운 애니메이션 콘텐츠 제작 방법을 제안한다. 또한 3D 디스플레이에서 시청이 가능하도록 입체영상으로 제작된다. 입력영상이 주어지면 배경영상, 전경객체 마스크, 배경 깊이맵, 객체 깊이맵을 생성한다. 각 전경객체의 이동, 회전, 및 줌을 통해 생동감있는 객체를 구현하며, 변환된 객체의 깊이맵 및 배경영상을 이용하여 실감있는 입체영상을 제작한다. 실험영상은 신윤복의 단오풍정 및 픽사의 애니메이션 UP의 클립영상을 이용하여 3D 입체영상으로 구현하였다.

정확한 깊이지도 생성을 위한 가이드 필터기반 비용 최적화 방법 (Guide Filter based Cost Optimization Method for Accurate Depth Map Generation)

  • 문지훈;호요성
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2016년도 하계학술대회
    • /
    • pp.1-4
    • /
    • 2016
  • 효율적으로 깊이지도를 획득하기 위해 다양한 방법의 지역 기반스테레오 매칭 방법이 사용된다. 일반적인 지역기반 스테레오 매칭에 사용되는 비용값 계산 방법을 통해 깊이지도를 생성하게 되면 객체의 경계 영역이 무너지거나, 유사한 텍스쳐 정보가 연속적으로 나타나는 영역에서 부정확한 깊이값을 얻는 문제가 발생한다. 본 논문에서는 깊이지도의 정확성을 높이기 위해 2가지 단계를 거쳐 최종 깊이지도를 생성한다. 처음으로, 일반적으로 사용하는 지역기반 스테레오 매칭 비용 함수와 입력 영상의 기울기를 고려한 초기 비용값을 가이드 필터를 이용하여 최적의 비용값을 찾아 초기 변위지도를 생성한다. 스테레오매칭을 수행할 경우, 시점의 차이로 인해 보이지 않는 영역에서 정확한 변위값을 찾지 못하는 문제가 발생한다. 이러한 문제를 해결하기 위해 좌영상과 우영상을 기반으로 획득한 변위지도를 사용하여 교차검사를 함으로써 폐색영역을 찾아낸다. 폐색 영역을 이웃한 화소의 값을 사용하여 채울 경우 실선과 같은 오류가 결과 영상에 나타나게 된다. 이러한 오류 영역을 제거하기 위해 마지막으로 가중치를 적용한 중간값 필터를 적용한다. 실험 결과 제안한 방법을 사용하여 획득한 깊이지도가 기존의 방법보다 정확한 깊이값을 얻는 것을 확인할 수 있었다.

  • PDF

가상 카메라와 깊이 맵을 활용하는 자유시점 입체 TIP 생성 (Free-viewpoint Stereoscopic TIP Generation Using Virtual Camera and Depth Map)

  • 이광훈;조철용;최창열;김만배
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송공학회 2009년도 추계학술대회
    • /
    • pp.219-222
    • /
    • 2009
  • 자유시점 비디오는 단순히 수동적으로 비디오를 보는 것이 아니라 원하는 시점을 자유로이 선택하여 보는 능동형 비디오이다. 일반적으로 다양한 위치 및 다양한 각도에 위치하는 다수의 카메라로부터 촬영된 영상을 이용하여 제작하는데, 이 기술은 박물관 투어, 엔터테인먼트 등의 다양한 분야에서 활용된다. 본 논문에서는 자유시점 비디오의 새로운 분야로 한 장의 영상을 가상 카메라와 깊이맵을 이용하여 영상 내부를 네비게이션하는 자유시점 입체 Tour-Into-Picture (TIP)을 제안한다. 오래전부터 TIP가 연구되어 왔는데, 이 분야는 한 장의 사진 내부를 탐험하면서 애니메이션으로 볼 수 있게 하는 기술이다. 제안 방법은 전처리과정으로 전경 마스크, 배경영상, 및 깊이맵을 자동 및 수동 방법으로 구한다. 다음에는 영상 내부를 항해하면서 투영 영상들을 획득한다. 배경영상과 전객객체의 3D 모델링 데이터를 기반으로 가상 카메라의 3차원 공간 이동, yaw, pitch, rolling의 회전, look-around effect, 줌인 등의 다양한 카메라 기능을 활용하여 자유시점 비디오를 구현한다. 또한 깊이정보의 특성 및 구조에 따라 놀라운 시청효과를 전달하는 카메라 기능의 설정 방법을 소개한다. 소프트웨어는 OpenGL 및 MFC Visual C++ 기반으로 구축되었으며, 실험영상으로 조선시대의 작품인 신윤복의 단오풍정을 사용하였고, 입체 애니메이션으로 제작되어 보다 실감있는 콘텐츠를 제공한다.

  • PDF

치아 보철물 디자인을 위한 이미지 대 이미지 변환 GAN 모델 (An Image-to-Image Translation GAN Model for Dental Prothesis Design)

  • 김태민;김재곤
    • 한국IT서비스학회지
    • /
    • 제22권5호
    • /
    • pp.87-98
    • /
    • 2023
  • Traditionally, tooth restoration has been carried out by replicating teeth using plaster-based materials. However, recent technological advances have simplified the production process through the introduction of computer-aided design(CAD) systems. Nevertheless, dental restoration varies among individuals, and the skill level of dental technicians significantly influences the accuracy of the manufacturing process. To address this challenge, this paper proposes an approach to designing personalized tooth restorations using Generative Adversarial Network(GAN), a widely adopted technique in computer vision. The primary objective of this model is to create customized dental prosthesis for each patient by utilizing 3D data of the specific teeth to be treated and their corresponding opposite tooth. To achieve this, the 3D dental data is converted into a depth map format and used as input data for the GAN model. The proposed model leverages the network architecture of Pixel2Style2Pixel, which has demonstrated superior performance compared to existing models for image conversion and dental prosthesis generation. Furthermore, this approach holds promising potential for future advancements in dental and implant production.

FFT와 초점정보를 이용한 상대적 깊이지도의 생성 (Generation of the Relative Depth Map using FFT and Focal Information)

  • 이진용;조진수;이일병
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2007년도 추계학술발표대회
    • /
    • pp.104-107
    • /
    • 2007
  • 인간은 초점정보를 이용하여 단안만으로도 공간의 깊이를 지각할 수 있다. 이것은 한 번에 하나의 대상물에만 초점을 맞출 수 있고 그 외의 부분은 흐림 현상을 유도함으로써 이루어진다. 이는 초점이 맞는 대상물체로부터 멀어지면 멀어질수록 흐림 현상이 강해지는 원리를 이용한 것으로 주파수 성분의 변화량에 대한 연산과 깊은 관련이 있다. 본 논문에서는 이와 같은 인간의 시각 시스템의 요소 중 하나인 초점정보를 모방하여 초점거리가 다른 각각의 이미지들에 각각의 가중치를 부여하였다. 그리고 각 이미지들을 일정 블록으로 각각 분할하여 초점이 가장 잘 맞는 블록을 찾아내어 하나의 이미지로 통합하였다. 이때 각 영역은 자신이 속했던 이미지의 가중치를 따르게 한다. 각 이미지에서 가장 포커스 수치가 높은 영역을 찾기 위한 방법으로 주파수 영역 기반 처리와 공간 영역 기반 처리를 결합 하였다. 주파수 기반으로는 FFT(Fast Fourier Transform)에서 고주파 부분의 영역을 뽑아내어 포커스수치를 계산하였으며, 공간 영역 처리 기반으로는 이웃픽셀과의 차이가 임계값이하인 것을 제외한 영역을 뽑아내어 저주파 영역의 연산을 제거하는 방법과 단순히 Laplacian measure만을 사용하여 저주파까지도 포함한 방법의 두 가지를 적용하였다. 최종적으로 3개의 포커스 측정값을 결합시켜 포커스 수치를 계산한 후 각 블록의 가중치에 맞게 하나의 이미지로 통합하여 상대적 깊이지도를 생성하였다.

물체의 위치 인식을 위한 유전 알고리즘과 스테레오 정합에 관한 연구 (A Study on Genetic Algorithm and Stereo Matching for Object Depth Recognition)

  • 홍석근;조석제
    • 한국항해항만학회지
    • /
    • 제32권5호
    • /
    • pp.355-361
    • /
    • 2008
  • 스테레오 정합은 스테레오 시각 분야에서 가장 활발히 연구되는 분야이다. 본 논문에서는 물체의 위치 인식을 위한 유전 알고리즘을 이용한 스테레오 정합을 제안한다. 정합 환경을 최적화 문제로 간주하고 진화 전략을 이용하여 최적해를 탐색한다. 따라서, 유전 연산자는 스테레오 정합에 맞게 설계하였고 개체는 변위집단을 대표한다. 영상의 수평화소라인을 염색체로 간주하였다. 비용함수는 스테레오 정합에서 사용하는 일반적인 제약조건들의 조합이다. 비용함수가 명암도, 유사도, 변위 평활성으로 구성되었기 때문에 정합을 시도할 때 매 세대마다 이 모든 요소들을 한번에 다룬다. 염색체를 정의하기 위해 LoG연산자로 경계선을 추출하였으며 실험을 통하여 제안한 방법을 검증하였다.

가상시점 영상 생성을 위한 경계 잡음 제거와 홀 채움 기법 (Boundary Noise Removal and Hole Filling Algorithm for Virtual Viewpoint Image Generation)

  • 고민수;유지상
    • 한국통신학회논문지
    • /
    • 제37권8A호
    • /
    • pp.679-688
    • /
    • 2012
  • 본 논문에서는 3D 워핑(warping) 기법을 이용하여 가상시점 영상생성 시 화질 개선을 위하여 경계 잡음(boundary noise)을 제거하고 홀(hole) 채움을 하는 새로운 기법을 제안한다. 경계 잡음은 가상시점 영상 합성 시기준 시점 영상과 깊이 영상 내 객체의 경계 불일치로 발생되며 홀은 기준시점 영상에서 보상할 수 없는 가려짐 영역(occlusion)으로 정의된다. 제안하는 기법에서는 경계 잡음 제거를 위해 먼저 배경 화소들의 평균과 절대 값 비교를 통해 경계 잡음에 해당되는 화소를 검출하고 검출된 화소를 홀 영역으로 확장한다. 경계 잡음 영역이 포함된 확장된 홀 영역은 나선형 가중 평균(spiral weighted average) 기법과 기울기 탐색(gradient searching) 기법을 혼용하여 채우게 된다. 나선형 가중 평균 기법은 깊이 정보를 사용함으로 객체 정보를 최소로 사용하지만 결과 영상이 번지는 단점이 있다. 기울기 탐색 기법은 영상의 기울기를 이용하여 세밀한 부분을 보존할 수 있는 장점이 있다. 따라서 각각의 결과를 ${\alpha}$ 가중치로 조합하여 생성된 가상 시점은 두 기법의 장점을 동시에 적용하기 때문에 좋은 화질을 얻을 수 있다. 실험을 통해 제안하는 기법의 성능이 기존의 다른 기법보다 우수하다는 것을 확인하였다.

다시점 RGB-D 카메라를 이용한 실시간 3차원 체적 모델의 생성 (Real-time 3D Volumetric Model Generation using Multiview RGB-D Camera)

  • 김경진;박병서;김동욱;권순철;서영호
    • 방송공학회논문지
    • /
    • 제25권3호
    • /
    • pp.439-448
    • /
    • 2020
  • 본 논문에서는 다시점 RGB-D 카메라의 포인트 클라우드 정합을 위한 수정된 최적화 알고리즘을 제안한다. 일반적으로 컴퓨터 비전 분야에서는 카메라의 위치를 정밀하게 추정하는 것은 매우 중요하다. 기존의 연구에서 제안된 3D 모델 생성 방식들은 많은 카메라 대수나 고가의 3차원 Camera를 필요로 한다. 또한 2차원 이미지를 통해 카메라 외부 파라미터를 얻는 방식들은 큰 오차를 가지고 있다. 본 논문에서는 저가의 RGB-D 카메라를 8개 사용하여 전방위 자유시점을 제공할 수 있는 3차원 포인트 클라우드 및 매쉬 모델을 생성하기 위한 정합 기법을 제안하고자 한다. RGB영상과 함께 깊이지도 기반의 함수 최적화 방식을 이용하고, 초기 파라미터를 구하지 않으면서 고품질의 3차원 모델을 생성할 수 있는 좌표 변환 파라미터를 구하는 방식을 제안한다.

영상 데이터의 입체화 및 합성 기반 실감 콘텐츠 생성 기법 (Realistic-Contents Generation Techniques with Stereoscopic and Composite Image Data)

  • 김만배;홍동희;조영란;김학수
    • 방송공학회논문지
    • /
    • 제9권4호
    • /
    • pp.402-410
    • /
    • 2004
  • 최근 HDTV 및 3차원 TV의 연구 개발에서 실감 방송에 대한 관심이 증가되고 있다. 실감 방송은 콘텐츠 생성, 제작, 압축, 전송 및 디스플레이까지 복합적이고 종합적인 시스템으로 구성된다. 이러한 분야에서는 방송을 통해 사용자에게 전송되는 실감 콘텐츠의 종류를 우선적으로 고려해야 한다. 콘텐츠에 따라 제작 단계에서 새로운 제작 기능을 필요로 하고, 콘텐츠 압축 기술의 연구의 필요성이 요구되며, 또한 전송 시스템의 설계 및 디스플레이 단말기들의 연구 개발이 필요하다. 본 논문에서는 향후 실감 방송에서 제공할 수 있는 실감 콘텐츠들을 소개하고 이에 따른 제작 방법을 제안한다. 제안하는 실감콘텐츠는 입체 다중뷰 영상, 객체기반 입체 영상, 깊이지도기반 합성 및 입체 영상과 그래픽 영상 합성으로 구성되며, 각 콘텐츠마다 제작 소프트웨어를 개발하였다. 또한, 실험 결과는 제작된 콘텐츠들이 사용자에게 입체감, 몰임감 및 현실감이 제공된다는 것을 보여준다.