Class-Agnostic 3D Mask Proposal and 2D-3D Visual Feature Ensemble for Efficient Open-Vocabulary 3D Instance Segmentation (효율적인 개방형 어휘 3차원 개체 분할을 위한 클래스-독립적인 3차원 마스크 제안과 2차원-3차원 시각적 특징 앙상블)

  • Sungho Song;Kyungmin Park;Incheol Kim
    • The Transactions of the Korea Information Processing Society
    • v.13 no.7
    • pp.335-347
    • 2024
  • Open-vocabulary 3D point cloud instance segmentation (OV-3DIS) is a challenging visual task to segment a 3D scene point cloud into object instances of both base and novel classes. In this paper, we propose a novel model Open3DME for OV-3DIS to address important design issues and overcome limitations of the existing approaches. First, in order to improve the quality of class-agnostic 3D masks, our model makes use of T3DIS, an advanced Transformer-based 3D point cloud instance segmentation model, as mask proposal module. Second, in order to obtain semantically text-aligned visual features of each point cloud segment, our model extracts both 2D and 3D features from the point cloud and the corresponding multi-view RGB images by using pretrained CLIP and OpenSeg encoders respectively. Last, to effectively make use of both 2D and 3D visual features of each point cloud segment during label assignment, our model adopts a unique feature ensemble method. To validate our model, we conducted both quantitative and qualitative experiments on ScanNet-V2 benchmark dataset, demonstrating significant performance gains.

Multi-Modal Cross Attention for 3D Point Cloud Semantic Segmentation (3차원 포인트 클라우드의 의미적 분할을 위한 멀티-모달 교차 주의집중)

  • HyeLim Bae;Incheol Kim
    • Annual Conference of KIPS
    • 2023.05a
    • pp.660-662
    • 2023
  • 3차원 포인트 클라우드의 의미적 분할은 환경을 구성하는 물체 단위로 포인트 클라우드를 분할하는 작업으로서, 환경의 3차원적 구성을 이해하고 환경과 상호작용에 필수적인 시각 지능을 요구한다. 본 논문에서는 포인트 클라우드에서 추출하는 3차원 기하학적 특징과 함께 멀티-뷰 영상에서 추출하는 2차원 시각적 특징들도 활용하는 새로운 3차원 포인트 클라우드 의미적 분할 모델 MFNet을 제안한다. 제안 모델은 서로 이질적인 2차원 시각적 특징과 3차원 기하학적 특징의 효과적인 융합을 위해, 새로운 중기 융합 전략과 멀티-모달 교차 주의집중을 이용한다. 본 논문에서는 ScanNetV2 벤치마크 데이터 집합을 이용한 다양한 실험들을 통해, 제안 모델 MFNet의 우수성을 입증한다.


  • Kim, Jeong-Yeon
    • Cartoon and Animation Studies
    • s.5
    • pp.456-459
    • 2001
  • 제작자의 작품세계에서 표현하고자 하는 시각적 언어를 감상자의 느낌과 제작자의 시점을 통해 시각적 커뮤니케이션이 이루어지도록 하고자 한다. 인간의 시각화의 차례를 역순(feed back)으로 표현하여 시각화된 2차원의 이미지 이전의 3차원에서 관찰할 수 있는 시점에서의 다양한 관찰의 시점을 제시하고자 한다. 시각적 요소들을 관찰자의 시점에서 시각적 이미지로 형성되기 이전의 관찰자의 시점에서 볼 수 있는 시점 중 4가지 시점에서의 관찰을 제시하여 시점의 표현을 관찰하고자 가능한 한 효율적인 동작으로 연구하여 제작하고자 한다.

Quantitative Analysis of Landscape in Tokyusan National Park (덕유산 국립공원 경관에 대한 계량적 분석)

  • 김세천
    • Korean Journal of Environment and Ecology
    • v.7 no.2
    • pp.231-240
    • 1994
  • The purpose of this study is to suggest the objective basic data for applying to development and conservation management of the national park through the quantitative analysis of the visual quality included in the and physical environment of the Tokyusan National Park. For this, spatial images and structures, of natural elements have been analyzed by factor analysis algorithm, and degree of visual quality has been measured mainly through questionnaries. Result of this study can be summarized as follows. Factors covering the spatial image of the Tokyusan National Park landscape have been found to be the overall synthetic evaluation, appeal, spatial, natural quality and dignity factors such as the overall synthetic evaluation, spatial and appeal yield high factor scores. The main factors determining the degree of visual quality are the clearness valley, peculiarity of configuration, natural of trail, harmony of suitable artificial planting and temple.

The Assessment of Visual Preference and Landscape Image in Odaesan National Park (오대산 국립공원 경관의 이미지 및 시각선호성 평가)

  • 김세천
    • Korean Journal of Environment and Ecology
    • v.9 no.2
    • pp.232-249
    • 1996
  • The purpose of this is to suggest objective basic data for the use development and conservation management of the national park through the quantitative analysis of the visual quality included in the physical environment of the Odaesan National Park, for this, spatial images structure of physical elements have been analyzed by factor analysis algorithm and degree of visual quality have been measured mainly by questionnaries. Result of this thesis can be summarized as follows. Factors covering the spatial image of the Odaesan National Park landscape have been found to be the pverall synthetic evaluation, physical, spatial, natural quality and, appeal factors such as the overall the synthetic evaluation, spatial and appeal yield high factor scores. As for the factors determining the degree of visual quality of clear of valley, peculiarity of configuration, natural of trail, harmony of suitable artificaial planting and temple.

3D Virtual Engraving with Haptic Feedback (햅틱 모델을 이용한 3 차원 가상 판화 시스템)

  • Park, Se-Kil;Park, Ji-Hwan;Lee, Dong-Wook;Park, Jin-Ah
    • 한국HCI학회:학술대회논문집
    • 2006.02a
    • pp.219-224
    • 2006
  • 3 차원 입력 장치는 키보드나 마우스 같은 일반적인 입력 장치로는 받아 들이기 어려운 3 차원 입력을 사용자로부터 간편하고 직관적인 방법으로 받아들일 수 있다는 측면에서 활발히 연구 및 사용되고 있다. 또한 햅틱 장치는 가상 물체의 조작에 따른 시각적인 피드백 외에 가상 물체의 느낌을 피드백 힘을 통해 사용자에게 전달해 줌으로써 컴퓨터와 사용자간의 상호 작용에 큰 도움을 준다. 본 논문은 햅틱 피드백이 적용된 실시간 가변형 모델과 효과적인 3 차원 입력에 대한 기반 연구를 하고자 한다. 그리고 이에 대한 한 가지 사례로써 햅틱 장치를 이용한 가상 판화 시스템을 제작 한다. 가상 판화 시스템은 시각 처리 부분과 촉각 처리 부분, 그리고 사용자의 3 차원 입력을 돕는 인터페이스 부분으로 구성되어 있다. 시각 처리 부분은 3 차원 공간 상에서 사용자의 조각에 따른 판화 표면의 변형을 처리하며 촉각 처리 부분은 실제 판화를 제작할 때 느끼는 촉각을 햅틱 인터페이스를 이용하여 사용자에게 전달한다. 이를 위해 먼저 시각 처리 부분에서는 NURBS 기반의 자유 형상 변형 (FFD)기법을 이용하였는데 가상 조각도에 의한 물체 표면의 지역적인 변형을 구현하기 위해 조각도가 닿는 부분에 대해 기조 격자점 (control point)을 증가시켜 원하는 부분에 대한 지역적인 변화를 용이하도록 하였고 다음으로 촉각 처리 부분에서는 S-chain 모델을 이용하였는데 S-chain 모델을 객체 전체에 적용하지 않고 접촉이 일어날 경우 그 접촉점을 기준으로 S-chain 모델을 지역적으로 적용하는 방법을 고안하여 실제 구현에 이용하였다. 인터페이스 적인 측면에서 사용자의 3 차원 입력장치를 통한 인터렉션은 사용자로 하여금 보다 자유로운 입력을 허용하지만 이에 따른 깊이 지각 문제를 발생시킨다. 이러한 문제를 최소화 시키고 사용자의 깊이 지각을 강화시키기 위해 사용자에게 제공되는 시각적 자극을 변형시키고 다양한 정보를 제공하도록 하였다. 가상 판화 시스템은 가상 환경에서 사용자의 조작에 따른 다양한 결과물을 제작 및 출력해 볼 수 있도록 해준다. 또한 가상 환경에서 이러한 기반을 제공함으로써 가상 환경의 장점인 복사, 이동 및 영구 보존 특성을 동시에 얻을 수 있다. 본 논문은 이러한 작업을 위한 기반 기술로써 햅틱 및 가변형 모델, 3 차원 입력 장치에 대한 시각적 인터페이스에 대해 다루고 이 기반 기술을 바탕으로한 가상 판화 시스템의 구현에 대하여 논하고자 한다.

Collapsibility Criteria using Raindrop Plots

  • 홍종선;김범준
    • Proceedings of the Korean Statistical Society Conference
    • 2004.11a
    • pp.175-178
    • 2004
  • 범주형 자료분석에서 차원축소(collapsibility)는 오즈비로 설명되었다. 실제의 $2\times2\timesK$ 분할표 자료를 이 이론에 적용시켰을 때 오즈비의 값으로 차원축소가 가능한지의 여부를 판단하기는 어렵다. 오즈비를 시각적으로 표현하는 방법 중에서 Doi, Nakamura와 Yamamoto(2001)가 제안한 Contour plot을 통해서 분할표 자료를 설명하는 것은 가능하지만 차원축소의 가능성을 결정하기에는 한계가 있다. 본 연구에서는 오즈비의 신뢰구간을 시각적으로 표현할 수 있는 방법으로 Barrowman과 Myers(2003)가 제안한 Raindrop plot을 이용하여 $P_{\lambda,;,T}^M-policy$ 분할표 자료를 설명할 수 있으며 동시에 차원축소의 가능성을 판단할 수 있는 방법을 제안하고자 한다.

3D Visualization of Link Information Using Depth Data (깊이 정보를 이용한 링크 정보의 3차원 시각화)

  • Park, Myeong-Chul
    • Proceedings of the Korean Society of Computer Information Conference
    • 2012.01a
    • pp.81-82
    • 2012
  • 본 논문에서는 수준별 깊이 정보를 이용하여 노드의 링크 정보를 시각화 도구를 구현하였다. 제한된 공간에서 다수의 노드 정보를 효과적으로 시각화하는 많은 연구가 있지만 기본 방법들은 2차원적인 도구가 대부분이고 각 노드의 링크를 표현하기 위하여 일정한 영역을 동일하게 할당하여 시각화한다. 이는 시각화 대상이 적을 경우에는 문제가 발생하지 않지만 대량의 데이터를 시각화하는 경우에는 연결 식별성이 저하되는 경향이 있다, 본 논문에서는 각 노드를 시각화할 때 수준별 깊이 정보를 이용하여 하위 노드의 수에 따른 가중치 기반으로 3차원 공간상에 시각화하여 보다 공간적 효율성과 식별성이 높은 시각화 방법을 제안 한다. 본 논문의 결과물은 연결성 정보를 시각화하는 영역에 활용될 수 있을 것이다.

The Impact of the Panorama on Contemporary Sculpture and Installation - The Panorama in the Development of the Perspective-

  • Halbherr, Bernd;Yoo, Jong Yoon
    • Cartoon and Animation Studies
    • s.41
    • pp.407-427
    • 2015
  • This thesis is research about the development and application of the panorama image in contemporary artwork, focusing on sculpture and installation. The samples of artworks are a selection of representatives from numerous examples of works that cannot be introduced without exceeding a reasonable scope of the thesis. A brief outline of the historical concepts of the perspective will describe the development of the panorama in itself. Some technical explanations and the practical use of the panorama with its link to 3-dimensional applications should bridge the explanation gap between the 2nd and 3rd dimensional usage of the panorama in contemporary artwork. Furthermore, some philosophical statements are proposed in the discussion. One of the main interests and initial motivation of this study was my personal believe that there is always a relationship between social philosophical values and the way a society sees or encounters visual structures. In other words the contemporary understanding of space and perspective is mirroring the actual zeitgeist and creates an exemplary visual aesthetics.

Quantitative Analysis of Landscape in Sobaeksan National Park (소백산 국립공원 경관의 계량적 분석)

  • 김세천
    • Korean Journal of Environment and Ecology
    • v.6 no.2
    • pp.201-217
    • 1993
  • The purpose of this is to suggest objective basic data for the use development and conservation management of the national park through the quantitative analysis of the visul quality included in the physical environment of the Sobaeksan National Park, for this. spatial images structure of physical elements have been analyzed by factor analysis algorithm and degree of visual quality have been measured mainly by questionnaries. Result of this thesis can be summarized as follows. Factors covering the spatial image of the Sobaeksan National Park landscape have been found to be the overall synthetic evaluation appeal, spatial, natural quality and dignity factors such as the overall the synthetic evaluation. spatial and appeal yield high factor scores. As for the factors determining the degree of visual quality of clear of valley, peculiarity of configuration natural of trail, harmony of suitable artificial planting and temple.

