• 제목/요약/키워드: 시각적 깊이

검색결과 192건 처리시간 0.027초

단안 카메라 깊이 추정기를 이용한 미지 물체의 자세 추정 (Unseen Object Pose Estimation using a Monocular Depth Estimator)

  • 송성호;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.637-640
    • /
    • 2022
  • 3차원 물체의 탐지와 자세 추정은 실내외 환경에서 장면 이해, 로봇의 물체 조작 작업, 자율 주행, 증강 현실 등과 같은 다양한 응용 분야들에서 공통적으로 요구되는 매우 중요한 시각 인식 기술이다. 깊이 지도를 요구하는 기존 연구들과는 달리, 본 논문에서는 RGB 컬러 영상만을 이용해 미지의 물체들, 즉 3차원 CAD 모델을 가지고 있지 않은 새로운 물체들을 탐지해내고, 이들의 자세를 추정해낼 수 있는 새로운 신경망 모델을 제안한다. 제안 모델에서는 최근 빠른 속도로 발전하고 있는 깊이 추정 기술을 이용함으로써, 깊이 측정 센서 없이도 물체 자세 추정에 필요한 깊이 지도를 컬러 영상에서 구해낼 수 있다. 본 논문에서는 벤치마크 데이터 집합을 이용한 실험을 통해, 제안 모델의 유용성을 평가한다.

하드 파라미터 쉐어링 기반의 보행자 및 운송 수단 거리 추정 (Pedestrian and Vehicle Distance Estimation Based on Hard Parameter Sharing)

  • 서지원;차의영
    • 한국정보통신학회논문지
    • /
    • 제26권3호
    • /
    • pp.389-395
    • /
    • 2022
  • 심층 학습 기술의 발전으로 인해 분류, 객체 검출, 분할과 같은 시각 정보를 이용한 심층 학습이 다양한 분야에서 활용되고 있다. 그 중 자율 주행은 시각 데이터를 잘 활용하는 대표적인 분야 중 하나이다. 본 논문에서는 도로 위의 사람과 운송수단 객체에 대한 개별적인 깊이 값을 예측하는 망을 제안한다. 제안하는 모델은 YOLOv3와 Monodepth를 기반으로 하며, 하드 파라미터 쉐어링을 이용한 인코더와 디코더를 통해 객체 검출과 깊이 추정을 동시에 수행한다. 또한 주의 집중 기법을 사용하여 객체 검출 및 깊이 추정의 정확도를 높이고자 하였다. 깊이 추정은 단안 이미지를 통해 이루어지며, 자가 학습 방법을 통해 학습을 수행하였다.

Effects of Mirror-based Visual Effects on Chest Compression Quality in Cardiopulmonary Resuscitation

  • Yun, Seong-Woo
    • 한국컴퓨터정보학회논문지
    • /
    • 제24권11호
    • /
    • pp.179-185
    • /
    • 2019
  • 이 연구는 심폐소생술 중 거울을 활용한 시각적 효과를 이용했을 때 가슴압박의 질을 비교함으로써, 좀 더 나은 물리적 요소를 제공하여 효과적인 심폐소생술을 할 수 있도록 하는데 기초자료를 제공하고자 시행 되었다. 무작위 교차방법(Randomized Crossover Design)에 의한 실험 연구로 BLS Health Care-Provider 자격을 이수한 28명을 대상으로 가슴압박 시행 시 깊이, 속도, 압박 대이완의 비율, 팔의 각도, 용이성 등을 측정하였다. 수집된 자료는 SPSS Ver. 23.0 for Win 통계프로그램을 이용하여 분석하였다. 본 연구의 결과를 종합해 보면 심폐소생술에서 가슴압박 시행 시 거울을 활용한 가슴압박 방법을 이용한다면 효율적인 가슴압박을 할 수 있었고, 가슴압박의 평균 깊이, 압박 대 이완 비율, 팔의 각도, 구조자의 자세가 나아져 가슴압박의 질적 지표가 향상되었음을 알 수 있었다. 하지만 거울을 활용한 가슴압박 방법에 대해 다양한 환경요소 및 직군에 대하여 추가적인 연구를 통해 임상적 활용의 가능성을 확인하는 것이 필요 할 것이다.

등위면 볼륨렌더링을 위한 이미지 공간 폐색 쉐이딩 모델 (Image Space Occlusion Shading Model for Iso-surface Volume Rendering)

  • 김석연;유상봉;장윤
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제20권4호
    • /
    • pp.1-7
    • /
    • 2014
  • 볼륨렌더링은 주로 의학 및 과학 분야에서 사용되는 기법이었으나, 하드웨어의 발달과 더불어 다양한 응용프로그램에서의 적용이 가능해짐에 따라 볼륨렌더링에 대한 관심이 증가하고 있다. 볼륨렌더링의 시각화에 있어서 쉐이딩은 물체의 깊이 정보를 효율적으로 전달하여 시각적 인지에 큰 도움이 된다. 전역조명을 사용하면 시각적 인지를 향상시킬 수 있지만, 많은 GPU 메모리의 사용과 긴 연산시간으로 인해 프로그램과의 상호작용에 영향을 미친다. 본 논문에서는 렌더링 속도의 저하를 최소화하며 볼륨렌더링에 사실적인 쉐이딩을 적용하기 위하여 이미지 공간 폐색 쉐이딩 모델을 제안하고자 한다.

디지털 홀로그램 방송을 위한 영상 콘텐츠의 암호화 (Image Contents Encryption Technique for Digital Hologram Broadcasting Service)

  • 하준;최현준
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.818-819
    • /
    • 2013
  • 본 논문에서는 디지털 홀로그래픽 방송 서비스를 위한 콘텐츠 암호화 기술을 제안한다. 디지털 홀로그래픽 비디오 서비스는 현존하는 2차원 또는 3차원 비디오를 서비스하는 시스템의 프레임, 즉 데이터의 획득, 처리, 전송, 수신, 복원의 과정을 그대로 따른다고 가정한다. 본 논문에서는 이와 같은 시스템을 위해 RGB 영상과 깊이정보의 암호화를 수행한다. 실험결과 전체 데이터 중에서 0.048%의 데이터만을 암호화하여 원본 RGB 영상과 깊이정보의 시각적인 정보를 은닉할 수 있었다.

  • PDF

노출빈도와 인지도 관계에 따른 정보의 유형과 표현기법 (Information Types and Display Methods according to the Relation between Frequency of Exposure and Degree of Cognition)

  • 한지애;류시천
    • 디지털융복합연구
    • /
    • 제10권10호
    • /
    • pp.497-504
    • /
    • 2012
  • 본 연구는 사용자의 인지적 측면에서 정보의 효율성을 높이기 위한 고찰로써, 정보의 노출빈도와 인지도의 관계에 따른 정보의 유형과 속성에 따른 표현 기법을 제안하였다. 인지공학과 인지심리학 분야의 문헌연구를 통해 노출빈도와 인지도의 상관관계를 규명하였고, 이를 바탕으로 다음과 같은 연구결과를 얻었다. 첫째, 사용자의 인지적 요구를 파악 할 수 있도록 하는 '프레임웍'으로써의 정보유형과 유형별 시각화 속성을 제안하였다. 세부적으로 정보 노출 빈도와 정보의 인지도에 따른 STM, STA, LTM, LTA 4가지 정보 유형과 각 유형에 관한 인지적 특성, 14가지 고품질 정보의 시각화 속성을 유형별로 재분류한 '시각화 속성 매트릭스'를 제안하였다. 둘째, 정보 콘텐츠 제작에 있어서 필요한 정보 깊이에 따른 표상방식에 대한 가이드라인을 제안하였다. 1차적 정보로서 STM, STA 정보의 표현기법으로 "독특속성", "선행 조직자(Advance Organizer)", "단계적 정보공개(Progress Closure)", "행위유발단서(Affordance)"를 제안하였으며, 다차원 정보로서 LTM 정보 표현기법으로 "모듈방식(Modularity)", "일관성(Consistency)", "모방(Mimicry)", "기억술(Mnemonic Device)"를 제안하였다. 본 연구를 통한 주요 발견점으로 정보의 유형과 깊이에 따라 정보의 시각화 속성의 중요도에 차이가 나타나며, 이에 따라 정보 표현기법이 달라 질 수 있음을 발견하였다.

단안 영상 시퀸스에서 움직임 추정 기반의 3차원 깊이 정보 추출 알고리즘 (3D Depth Information Extraction Algorithm Based on Motion Estimation in Monocular Video Sequence)

  • 박준호;전대성;윤영우
    • 정보처리학회논문지B
    • /
    • 제8B권5호
    • /
    • pp.549-556
    • /
    • 2001
  • 2차원 영상으로 부터 3차원 영상으로 복원하는 일은 일반적으로 카메라의 초점에서 영상 프레임의 각 픽셀까지의 깊이 정보가 필요하고, 3차원 모델의 복원에 관한 일반적인 수작업은 많은 식나과 비용이 소모된다. 본 논문에서는 카메라의 움직임이 포함되어 있는 단안 영상 시퀸스로부터 3차원 영상 제작에 필요한 상대적인 깊이 정보를 실시간으로 추출하는 알고리즘을 제안하고, 하드웨어를 구현하기 위한여 알고리즘을 단순화하였다. 이 알고리즘은 카메라 이동에 의한 영상의 모든 점들의 움직임은 깊이 정보의 종속적이라는 사실에 기반을 두고 있다. 불록매칭 알고리즘에 기반을 둔 전역 움직임 탐색에 의한 움직임 벡터를 추출한 후, 카메라 회전과 확대/축소에 관한 카메라 움직임 보상을 실행하고 깉이 정보 추출 과정이 전개된다. 깊이 정보 추출 과정은 단안 영상에서 객체의 이동처리를 분석하여 움직임 벡터를 구하고 프레임내의 모든 픽셀에 대한 평균 깊이를 계산한 후, 평균 깊이에 대한 각 블록의 상대적 깊이를 산출하였다. 모의 실험 결과 전경과 배경에 속하는 영역의 깊이는 인간 시각 체계가 인식하는 상대적인 깊이와 일치한다는 것을 보였다.

  • PDF

GOCAD를 이용한 저류층 속성정보의 3차원 시각화 연구 (3-D Visualization of Reservoir Characteristics through GOCAD)

  • 곽상환;이두성
    • 지구물리와물리탐사
    • /
    • 제4권3호
    • /
    • pp.80-83
    • /
    • 2001
  • 미국 텍사스 북부 분스빌 친연가스전에서 취득한 3차원 탄성파자료로부터 4개의 탄성파 반사면과, 탄성파 event 들의 coherence를 도출하여 38개의 검층 자료와 3차원으로 통합 시각화하였다. 시간면은 반사면을 따라 시간을 취득해서 얻었으며 반사면 상에서의 속도는 탄성파 자료와 해석된 38개 검층 자료로부터 산출하였다. 38개 지점의 속도로부터 속도면을 내삽하고 속도면을 이용하여 시간면에서 깊이면으로 변환하였다. Coherence는 탄성파 자료로부터 semblence 방법을 통하여 도출하였으며 입방체로 만든 후 역시 속도면을 이용하여 깊이면으로 변환하였다. 3차원 통합시각화를 통하여 관찰할 때, coherence의 공간적 분포 양상이 잘 파악되었으며, 시간단면등 종래의 3차원 탄성파 분석법과 비교할 때 3차원 시각화 도면에서 선형의 층서적 양상이 더욱 정확함을 알 수 있었다.

  • PDF

생성적 대립쌍 신경망을 이용한 깊이지도 기반 연무제거 (Single Image Dehazing Based on Depth Map Estimation via Generative Adversarial Networks)

  • 왕야오;정우진;문영식
    • 인터넷정보학회논문지
    • /
    • 제19권5호
    • /
    • pp.43-54
    • /
    • 2018
  • 연무가 있는 상황에서 촬영된 영상은 낮은 대비로 인해 시인성이 낮아지는 문제가 있다. 이렇게 연무로 인해 흐릿한 영상에서 연무의 효과를 제거하는 과정을 연무제거라고 한다. 연무제거에서 가장 중요한 문제 중 하나는 전달지도 (transmission map) 또는 깊이지도 (depth map)를 정확하게 추정하는 것이다. 본 논문에서는 정확한 깊이지도 추정을 위해 생성적 대립쌍 신경망 (Generative Adversarial Network: GAN)을 이용한 정확한 깊이 영상 추정 방법을 제안한다. 제안된 GAN 모델은 흐릿한 입력영상과 이에 상응하는 깊이지도 간의 비선형 매핑을 학습한다. 그리고 연무제거단계에서는 훈련된 모델을 사용하여 입력영상의 깊이지도를 추정하고 이것을 전달지도를 계산하는데 사용한다. 이어서 guided filter를 사용하여 전달지도를 다듬는다. 마지막으로 대기 산란 모델을 기반으로 연무가 제거된 영상을 복원한다. 제안된 GAN 모델은 합성실내영상으로 훈련되었다. 하지만 실제 연무영상에 대해서도 적용할 수 있다. 이를 실험을 통해 증명하였다. 또한 실험에서 제안된 방법이 이전에 연구된 방법에 비해 시각적 및 정량적 측면에서 우수한 결과를 나타냈다.

모듈형 서비스 매니퓰레이터의 제어를 위한 ROS 환경 설계 방법 (ROS Configuration Method for Effective Control of Modular Service Manipulator)

  • 구모세;김상훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.533-535
    • /
    • 2021
  • 본 연구에서는 서비스 역할을 수행하는 6축 모듈형 매니퓰레이터 개발을 목표로 하며, 최종 기술 사양에 따른 설계를 진행하는 과정에서 기구의 섬세한 동작을 효율적으로 제어하기 위해 로봇 제어 소프트웨어의 오픈소스 환경인 ROS를 사용한다. 매니퓰레이터의 동작 설계를 ROS 기반에서 제어하기 위해 중요한 기본 환경을 구축하였으며, 특히 로봇 모델링을 위한 시각화를 위해 URDF파일에 해당 매니퓰레이터의 필수 파라미터값들을 지정하여 적용하였고, 전체 동작 시나리오에 맞춰 매니퓰레이터가 특정 자세를 취할 경우의 역기구학적인 해석과 그에 따른 경로를 생성하도록 매니퓰레이터의 라이브러리인 MoveIt을 활용하여 시각적으로 표현하고 시뮬레이션을 수행하였다. 또한, 설계한 ROS 환경 설계 방법을 바탕으로 MCU와의 통신을 통해 모터의 실시간 각도 값을 제어하고, 3D 깊이 카메라의 거리정보와 이미지 정보의 융합을 통해 로봇의 서비스 내용의 개선을 기대할 수 있다.