• Title/Summary/Keyword: 3차원 포인트 클라우드

Search Result 123, Processing Time 0.025 seconds

Class-Agnostic 3D Mask Proposal and 2D-3D Visual Feature Ensemble for Efficient Open-Vocabulary 3D Instance Segmentation (효율적인 개방형 어휘 3차원 개체 분할을 위한 클래스-독립적인 3차원 마스크 제안과 2차원-3차원 시각적 특징 앙상블)

  • Sungho Song;Kyungmin Park;Incheol Kim
    • The Transactions of the Korea Information Processing Society
    • /
    • v.13 no.7
    • /
    • pp.335-347
    • /
    • 2024
  • Open-vocabulary 3D point cloud instance segmentation (OV-3DIS) is a challenging visual task to segment a 3D scene point cloud into object instances of both base and novel classes. In this paper, we propose a novel model Open3DME for OV-3DIS to address important design issues and overcome limitations of the existing approaches. First, in order to improve the quality of class-agnostic 3D masks, our model makes use of T3DIS, an advanced Transformer-based 3D point cloud instance segmentation model, as mask proposal module. Second, in order to obtain semantically text-aligned visual features of each point cloud segment, our model extracts both 2D and 3D features from the point cloud and the corresponding multi-view RGB images by using pretrained CLIP and OpenSeg encoders respectively. Last, to effectively make use of both 2D and 3D visual features of each point cloud segment during label assignment, our model adopts a unique feature ensemble method. To validate our model, we conducted both quantitative and qualitative experiments on ScanNet-V2 benchmark dataset, demonstrating significant performance gains.

Effective Multi-Modal Feature Fusion for 3D Semantic Segmentation with Multi-View Images (멀티-뷰 영상들을 활용하는 3차원 의미적 분할을 위한 효과적인 멀티-모달 특징 융합)

  • Hye-Lim Bae;Incheol Kim
    • KIPS Transactions on Software and Data Engineering
    • /
    • v.12 no.12
    • /
    • pp.505-518
    • /
    • 2023
  • 3D point cloud semantic segmentation is a computer vision task that involves dividing the point cloud into different objects and regions by predicting the class label of each point. Existing 3D semantic segmentation models have some limitations in performing sufficient fusion of multi-modal features while ensuring both characteristics of 2D visual features extracted from RGB images and 3D geometric features extracted from point cloud. Therefore, in this paper, we propose MMCA-Net, a novel 3D semantic segmentation model using 2D-3D multi-modal features. The proposed model effectively fuses two heterogeneous 2D visual features and 3D geometric features by using an intermediate fusion strategy and a multi-modal cross attention-based fusion operation. Also, the proposed model extracts context-rich 3D geometric features from input point cloud consisting of irregularly distributed points by adopting PTv2 as 3D geometric encoder. In this paper, we conducted both quantitative and qualitative experiments with the benchmark dataset, ScanNetv2 in order to analyze the performance of the proposed model. In terms of the metric mIoU, the proposed model showed a 9.2% performance improvement over the PTv2 model using only 3D geometric features, and a 12.12% performance improvement over the MVPNet model using 2D-3D multi-modal features. As a result, we proved the effectiveness and usefulness of the proposed model.

A Study on Cross-section Extraction Method based on 3D Point Cloud Data (3차원 포인트클라우드 기반 단면 정보 추출 기술 개발)

  • Kim, Hoe-Min;Chun, Sungkuk;Kim, Un-Yong;Yun, Jeongrok
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.277-278
    • /
    • 2022
  • 본 연구는 3차원 포인트클라우드로부터 단면 정보를 자동으로 추출할 수 있는 알고리즘에 관한 것이다. 3차원 스캐너로부터 획득한 포인트클라우드 데이터는 다양한 제조 공정의 결과물인 산업 제품의 접합 상태를 파악하는데 자주 사용된다. 하지만 많은 노이즈를 포함하는 포인트클라우드 데이터로부터 제조 상태에 대한 수치적인 결과를 반복적으로 획득하기에는 많은 비용이 수반된다. 따라서 본 연구는 산업 제품의 접합부에 대한 포인트클라우드로부터 단면 정보를 자동으로 추출할 수 있는 알고리즘을 소개하고자 한다.

Automatic Generation of Clustered Solid Building Models Based on Point Cloud (포인트 클라우드 데이터 기반 군집형 솔리드 건물 모델 자동 생성 기법)

  • Kim, Han-gyeol;Hwang, YunHyuk;Rhee, Sooahm
    • Korean Journal of Remote Sensing
    • /
    • v.36 no.6_1
    • /
    • pp.1349-1365
    • /
    • 2020
  • In recent years, in the fields of smart cities and digital twins, research on model generation is increasing due to the advantage of acquiring actual 3D coordinates by using point clouds. In addition, there is an increasing demand for a solid model that can easily modify the shape and texture of the building. In this paper, we propose a method to create a clustered solid building model based on point cloud data. The proposed method consists of five steps. Accordingly, in this paper, we propose a method to create a clustered solid building model based on point cloud data. The proposed method consists of five steps. In the first step, the ground points were removed through the planarity analysis of the point cloud. In the second step, building area was extracted from the ground removed point cloud. In the third step, detailed structural area of the buildings was extracted. In the fourth step, the shape of 3D building models with 3D coordinate information added to the extracted area was created. In the last step, a 3D building solid model was created by giving texture to the building model shape. In order to verify the proposed method, we experimented using point clouds extracted from unmanned aerial vehicle images using commercial software. As a result, 3D building shapes with a position error of about 1m compared to the point cloud was created for all buildings with a certain height or higher. In addition, it was confirmed that 3D models on which texturing was performed having a resolution of less than twice the resolution of the original image was generated.

Dynamically Acquired Point Cloud Compression Method based on Video based Point Cloud Compression (V - PCC 기반 동적 획득 포인트 클라우드 압축 방안)

  • Kim, Junsik;Im, Jiheon;Kim, Kyuheon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2019.06a
    • /
    • pp.185-188
    • /
    • 2019
  • 3D 영상 데이터 중 하나인, 포인트 클라우드는 3 차원 데이터를 정밀하게 획득 할 수 있다는 장점으로 인해 군사, 교육, 의료, 건축 등의 다양한 분야에서 사용되고 있다. 특히, 자율 주행 분야에서 사용되는 동적 획득 포인트 클라우드는 광범위한 영역을 표현하므로 방대한 양의 데이터를 갖고 있어, 효율적인 압축이 필수적이다. 비디오 코덱을 활용하여 3 차원 데이터 압축을 진행하는 V - PCC 의 경우, 신뢰성과 범용성이 높다는 장점이 있으나, 2D 비디오 영상을 활용하기 때문에 대용량 및 광범위한 데이터의 압축이 불가능하다는 한계를 지니고 있다. 따라서, 본 논문에서는 V- PCC 의 한계를 극복하고, 광범위한 영역의 정보를 표현하는 동적 획득 포인트를 압축하기 위해 포인트 클라우드를 분할 및 양자화하는 방안을 제시하였다.

  • PDF

3D Motion Estimation and Compensation method for Point cloud video codec by 3D DCT (3D DCT 를 이용한 포인트 클라우드의 움직임 예측/보상 기법)

  • Lee, Minseok;Kim, Boyeun;Yoon, Sangeun;Hwang, Yonghae;Kim, Junsik;Kim, Khuheon
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.279-282
    • /
    • 2021
  • 포인트 클라우드는 3 차원 물체를 표현하기 위한 점들의 집합으로, 동적인 3 차원 데이터를 정밀하게 획득할 수 있기에 이의 효율적인 압축의 필요성이 대두되고 있다. 기존 3D DCT(3D Discrete Cosine Transform)를 이용한 동적 객체의 포인트 클라우드 압축 방식은 Inter 프레임 압축을 고려하지 않아 압축시의 데이터 압축률에 한계가 있다. 따라서 본 논문은 이러한 문제점을 개선하기 위해 3D DCT 를 이용한 움직임 예측을 통하여 포인트 클라우드 영상의 I 프레임 및 P 프레임을 압축하는 방식을 제안한다.

  • PDF

A Comparison of 3D R-tree and Octree to Index Large Point Clouds from a 3D Terrestrial Laser Scanner (대용량 3차원 지상 레이저 스캐닝 포인트 클라우드의 탐색을 위한 3D R-tree와 옥트리의 비교)

  • Han, Soo-Hee;Lee, Seong-Joo;Kim, Sang-Pil;Kim, Chang-Jae;Heo, Joon;Lee, Hee-Bum
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.29 no.1
    • /
    • pp.39-46
    • /
    • 2011
  • The present study introduces a comparison between 3D R-tree and octree which are noticeable candidates to index large point clouds gathered from a 3D terrestrial laser scanner. A query method, which is to find neighboring points within given distances, was devised for the comparison, and time lapses for the query along with memory usages were checked. From tests conducted on point clouds scanned from a building and a stone pagoda, it was shown that octree has the advantage of fast generation and query while 3D R-tree is more memory-efficient. Both index and leaf capacity were revealed to be ruling factors to get the best performance of 3D R-tree, while the number of level was of oetree.

Rendering Quality Improvement Method based on Inverse Warping and Depth (역 변환과 뎁스 기반의 포인트 클라우드 렌더링 품질 향상 방법)

  • Lee, Heejea;Yun, Junyoung;Park, Jong-Il
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.85-88
    • /
    • 2021
  • 포인트 클라우드 콘텐츠는 실제 환경 및 물체를 3 차원 위치정보를 갖는 점들과 그에 대응하는 색상 등을 획득하여 기록한 실감 콘텐츠이다. 위치와 색상 정보로만 이뤄진 3 차원 점으로 이뤄진 포인트 클라우드 콘텐츠는 확대하여 렌더링 할 경우 점과 점 사이의 간격이 벌어지면서 발생하는 구멍에 의해 콘텐츠 품질이 저하될 수 있다. 이러한 문제를 해결하기 위해 본 논문에서는 포인트 클라우드 확대 시 점들 간 간격이 벌어져 생기는 구멍에 대해 깊이정보를 활용한 역변환 기반 보간 방법을 통해 포인트 클라우드 콘텐츠 품질을 개선하는 방법을 제안한다. 벌어진 간격들 사이에서 빈 공간을 찾을 때 그 사이로 뒷면의 점들이 그려지게 되어 보간 방법을 적용하는데 방해요소로 작용한다. 이를 해결하기 위해 구멍이 발생하지 않은 시점에서 렌더링 된 영상을 사용하여 포인트 클라우드의 뒷면에 해당되는 점들을 제거한다. 다음으로 깊이 맵(depth map)을 추출한 후 추출된 깊이 값을 사용하여 뎁스 에지(depth edge)를 구하고 에지를 사용하여 깊이 불연속 부분에 대해 처리한다. 마지막으로 뎁스 값을 활용하여 이전에 찾은 구멍들의 역변환을 하여 원본의 데이터에서 픽셀을 추출한다. 제안하는 방법으로 콘텐츠를 렌더링 한 결과, 기존의 크기를 늘려 빈 영역을 채우는 방법에 비해 렌더링 품질이 평균 PSNR 측면에서 2.9 dB 향상된 결과를 보였다.

  • PDF

V-PCC based Color Attributes Compression for Plenoptic Point Clouds (V-PCC 기반 플렌옵틱 포인트 클라우드의 색상 속성 정보 부호화 방법)

  • Hahyun Lee;Jungwon Kang
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2022.11a
    • /
    • pp.109-111
    • /
    • 2022
  • 일반적인 포인트 클라우드(Point Clouds)는 3 차원 공간상의 포인트가 한 개의 색상 정보만을 포함하고 있는 반면에 플렌옵틱 포인트 클라우드(Plenoptic Point Clouds)는 사실감을 향상시키기 위해 한 개의 포인트가 여러 시점에서 촬영된 색상 정보들을 모두 포함하고 있는 새로운 방식의 볼륨 메트릭 데이터 표현 방식이다. 하지만, 일반적인 포인트 클라우드에 비해 더 많은 색상 정보를 필요로 하기 때문에 효율적인 압축이 필수적이다. 따라서, 본 논문에서는 비디오 기반 포인트 클라우드 압축 표준 기술인 V-PCC 를 기반으로 플렌옵틱 포인트 클라우드의 색상 속성간 중복성 제거를 통해 효율적으로 색상 정보를 압축할 수 있는 방법을 제안한다. 실험 결과 제안 방법은 다중 플렌옵틱 색상 속성 정보를 독립적으로 부호화 경우에 비해 상당한 성능 향상이 있음을 보여준다.

  • PDF

Circular Splats Based Visualization for Point Cloud Contents (포인트 클라우드 콘텐츠의 원형 Splat 기반 시각화 기법)

  • Yun, Junyoung;Kim, Jongwook;Park, Jong-Il
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2020.07a
    • /
    • pp.276-278
    • /
    • 2020
  • 포인트 클라우드 콘텐츠는 실제 사물을 수천만 개의 점으로 표현하는 미디어 콘텐츠이다. 각 점들은 색상 값과 3 차원 공간상의 위치로 구성 되어있다. 이러한 컨텐츠를 영상 미디어로 활용하기 위해서는 실시간으로 네트워크를 통해 전달되는 포인트 클라우드 콘텐츠를 고품질의 영상으로 시각화 할 필요성이 있다. 본 연구에서는 포인트 클라우드 콘텐츠를 구성하는 점들이 임의의 순서로 입력될 때, 각 점이 투영된 형상을 원형으로 나타내어 블렌딩하는 원형 splat 기반의 실시간 시각화 기법을 제안한다.

  • PDF