통합 검색 | Korea Science

복수 등장인물을 대상으로 한 제스처 인식 (Gesture Recognition in Multiple People Environment)

홍석주;;김송국;김장운;이칠우
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2007년도 학술대회 1부
- /
- pp.891-896
- /
- 2007
지금까지 진행된 제스처 인식 연구는 한 사람을 대상으로 정적인 환경을 가정하여 이루어져 왔다. 본 논문에서는 복수의 등장인물이 존재하는 환경에서 대화 상대를 선택하여 제스처를 인식하는 방법에 대해 기술한다. 먼저 복수의 인물이 존재하는 환경에서 배경영역을 제외한 행위자의 영역을 추출한다. 그 후 각각의 행위자를 트래킹하면서 카메라와 가장 가까이 있는 행위자를 대화 상대자로 선택한다. 대화상대자가 선택되면 스테레오 카메라에서 입력된 영상에서 추출된 실루엣 이미지를 이용하여 얼굴과 두 손을 특징 영역으로 하여 매 프레임마다 Kalman filter를 사용하여 각 영역을 트래킹한다. 트래킹되는 특징 영역의 2차원 좌표 값을 모델 제스처의 2차원 좌표 값과 비교하여 가장 높은 유사값을 갖는 모델 제스처를 입력 제스처로 인식하게 된다. 본 논문에서 사용한 방법은 복수의 등장인물이 있는 경우 효과적으로 행위 대상자를 선택하여 제스처를 인식할 수 있다. 또한 제스처 인식에 있어서 단순한 큐 매칭을 사용함으로써 계산이 복잡하지 않은 장점이 있다. 실험을 통해 본 논문에서 제시한 방법을 적용함으로써 복수의 인물이 등장하는 환경에서 제스처 인식이 가능함을 입증한다.
PDF

손실된 영역의 복원을 이용한 깊이 영상 개선 기법 (Depth Image Improvement using Estimation of Lost Region)

조지호;박정욱;장인엽;이관행
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2007년도 학술대회 1부
- /
- pp.481-486
- /
- 2007
본 논문에서는 깊이 영상을 개선하는 방법으로 깊이 영상 획득 시 손실된 영역을 복원하는 기법을 제안한다. 대상 객체의 동적인 3차원 정보는 적외선 깊이 센서가 장착된 깊이 비디오 카메라를 통하여 실시간으로 획득한다. 이때, 깊이 비디오뿐만 아니라 각 프레임마다 컬러영상이 동시에 획득된다. 그러나 대상 객체의 일부 또는 전체가 반짝이는 검은 재질로 되어있을 경우, 획득된 깊이 영상에 손실이 발생한다. 특히 방송용 콘텐츠로서 연기자의 3차원 정보를 획득할 때 머리카락 영역이 손실되는 심각한 문제가 발생한다. 이를 해결하기 위해 먼저 컬러 영상을 이용하여 손실된 영역의 위치 정보를 알아낸다. 손실된 영역 내 경계부분의 깊이 정보를 복원한 후 2차 베지어 커브로 보간하여 내부의 깊이 정보를 복원한다. 개선된 깊이 영상을 기반으로 일련의 모델링 과정을 수행하면 보다 자연스러운 3차원 모델을 생성할 수 있다. 생성된 3차원 모델은 실감방송용 콘텐츠로 사용될 수 있으며, 시청자에게 시각상호작용과 촉각상호작용 등 다차원 감각의 상호작용을 제공할 수 있다.
PDF

증강현실 기반의 인터랙티브 스토리보드 제작 시스템 (Augmented Reality based Interactive Storyboard System)

박준
- 한국컴퓨터그래픽스학회논문지
- /
- 제13권2호
- /
- pp.17-22
- /
- 2007
영화나 애니메이션의 초기 제작 단계에서 스토리보드는 줄거리를 시각적으로 설명하기 위해 사용된다. 스토리 보드는 스토리의 텍스트 뿐 아니라 사람과 사물의 배치, 카메라 위치 등의 설정을 위해 그림이나 사진을 사용되기도 한다. 본 논문에서는 스토리보드 제작을 용이하게 그리고 직관적이 되도록 하기 위하여 증강현실 기반의 스토리보드 시스템을 제안한다. 본 시스템을 사용하면 경험이 없는 사용자라도 미리 만들어진 3차원 모델을 사용하여 사용자 자신의 실제 환경에서 모델들을 배치하고 애니메이션을 실행시킬 뿐 아니라 카메라의 위치와 방향까지도 제어할 수 있다.
PDF

사진이미지에 가중치를 부여한 가상모텔 텍스춰매핑 (Virtual Model Texture Mapping Using Weighted Image Interpolation)

박창근;이명원;조선영;김진한
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2002년도 가을 학술발표논문집 Vol.29 No.2 (2)
- /
- pp.445-447
- /
- 2002
본 논문에서는 일반 사용자가 사실감 있는 가상공긴 표현을 위해 사진 이미지를 이용하여 직법 텍스춰 매핑을 할 수 있는 방법에 대해 기술한다. 텍스춰매핑은 세 장의 이미지를 이용하는데 각 카메라에서 바라본 건물 표면의 특정 픽셀들과 카메라사이에서 생성되는 각도를 이용한다. 이 각도로 매핑되는 픽셀값에 가중치를 부설하여 건물 외곽에 발생되는 경사와 같은 왜곡현상을 최소화시켜서 매핑된 건물이 실제 건물처럼 사실감이 있도록 매핑할 수 있는 것이다. 이 방법을 이용하여 가상공간을 자동 생성해주는 웹 컨텐츠 구축 시스템의 매핑 인터페이스를 구현하였다. 자동생성된 가상 건물모델에 사용자가 직접 찍은사진영상을 입력하면 랜더링시 텍스춰를 재구성하여 건물모델에 사실감을 증가시키는 역할을 하도륵 하였다.
PDF

광학식 동작 포착에서 동적 모델을 이용한 신뢰성있는 3-D 좌표 추정 및 추적 (Robust 3-D Points Estimation and Tracking with Dynamic Model for Optical Motion Capture)

이동훈;추창우;김성진;정순기
- 한국정보과학회논문지:시스템및이론
- /
- 제27권10호
- /
- pp.825-834
- /
- 2000
광학식 동작 포착(optical motion capture)시스템에서 신뢰할만한 3차원 좌표의 획득과 마커의 궤적 추적은 매우 중요한 문제이다. 3차원 좌표를 획득하기 이해서는 다중의 카메라로부터 2차원의 데이터 간의 대응관계를 구해야 한다. 본 논문에서는 각 카메라에서의 3차원 마커들 간의 대응관계를 k-partite graph로 모델링하고, 릴렉세이션 알고리즘을 사용하여 고스트가 제거된 신뢰성있는 클릭을 추출한다. 이를 통해 정확하고 안정적인 3차원의 좌표를 생성할 수 있다. 또한 추출된 3차원 마커의 궤적의 추적을 위해 칼만 필터를 사용한 마커의 예측과 데이터 연계 문제의 해결을 위한 전략을 제안하고. 사라진 마커의 궤적을 유지시키기 위해 다이나믹 모델을 사용한 추적 알고리즘을 제시한다.
PDF

손 모양 특징점 정보를 이용한 핸드마우스 인터페이스 구현 (Efficient Hand Mouse Interface using Feature Points with Hand Gestures)

김지현;김민하;차의영
- 한국정보통신학회:학술대회논문집
- /
- 한국해양정보통신학회 2011년도 추계학술대회
- /
- pp.223-226
- /
- 2011
본 논문은 웹 카메라로부터 입력받은 영상을 이용하여 손 영역을 추출하여 마우스를 대체할 수 있는 핸드마우스를 구현한다. 먼저 웹 카메라를 이용하여 입력받은 영상에서 손 영역을 추출한다. 손영역을 추출하기 위해서 HSV 컬러 모델에서 조도 변화에 강인한 Hue값과 피부색 특징이 잘 나타나는 YcbCr 컬러 공간을 이용하여 손 후보 영역을 획득한다. 손 후보 영역에서 레이블링(labeling) 알고리즘을 적용하여 정확한 손 영역을 추출한다. 추출한 손 영역에서 무게 중심점을 구한 후, 무게 중심점으로부터 거리를 이용하여 손 영역을 분리한다. 분리된 손 영역에서 무게 중심점으로부터 거리 정보를 이용하여 손 영역의 최종 특징 점을 추출한다. 본 논문에서 제안한 방법은 추출한 손 모양의 손끝 정보를 이용하여 마우스 이벤트를 수행함으로써 사용자가 사용하기 편리한 핸드마우스를 구현하였다.
PDF

깊이 카메라 영상에서의 3D 특징점 기반 얼굴영역 추출 (3D Feature Point Based Face Segmentation in Depth Camera Images)

홍주연;박지영;김명희
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
- /
- pp.454-455
- /
- 2012
깊이 카메라에서 입력 받은 사용자의 얼굴 데이터에 morphable 모델을 fitting하여 실제 얼굴과 가까운 3D 얼굴 모델을 생성하기 위해서는 먼저 깊이 영상으로부터의 정확한 얼굴 영역 추출이 필요하다. 이를 위해 얼굴의 특징점을 기반으로 얼굴 영역 추출을 시도한다. 먼저 원본 깊이 영상을 보정하고, 컬러 영상으로부터 얼굴과 눈, 코의 영역을 탐색한 후 이를 깊이 영상에 대응시켜 눈, 코, 턱의 3차원 위치를 계산한다. 이렇게 결정된 얼굴의 주요 특징점들을 시작으로 영역을 확장함으로써 영상의 배경으로부터 얼굴 영역을 분리한다.

카메라-라이다 정합 모델에 대한 스케일링 공격 (Scaling attack for Camera-Lidar calibration model)

임이지;최대선
- 한국정보처리학회:학술대회논문집
- /
- 한국정보처리학회 2023년도 춘계학술발표대회
- /
- pp.298-300
- /
- 2023
자율주행 및 robot navigation 시스템에서 물체 인식 성능향상을 위해 대부분 MSF(Multi-Sensor Fusion) 기반 설계를 한다. 따라서 각 센서로부터 들어온 정보를 정합하는 것은 정확한 MSF 알고리즘을 위한 필요조건이다. 다양한 선행 연구에서 2D 데이터에 대한 공격을 진행했다. 자율주행에서는 3D 데이터를 다루어야 하므로 선행 연구에서 하지 않았던 3D 데이터 공격을 진행했다. 본 연구에서는 스케일링 공격 기반 카메라-라이다 센서 간 정합 모델의 정확도를 저하시키는 공격 방법을 제안한다. 제안 방법은 입력 라이다의 포인트 클라우드에 스케일링 공격을 적용하여 다운스케일링 단계에서 공격하고자 한다. 실험 결과, 입력 데이터에 공격하였을 때 공격 전보다 평균제곱 이동오류는 56% 이상, 평균 사원수 각도 오류는 98% 이상 증가했음을 보였다. 다운스케일링 크기 별, 알고리즘별 공격을 적용했을 때, 10×20 크기로 다운스케일링 하고 lanczos4 알고리즘을 적용했을 때 가장 효과적으로 공격할 수 있음을 확인했다.
https://doi.org/10.3745/PKIPS.y2023m05a.298 인용 PDF

위치 정보 인코딩 기반 ISP 신경망 성능 개선 (Enhancing A Neural-Network-based ISP Model through Positional Encoding)

김대연;김우혁;조성현
- 한국컴퓨터그래픽스학회논문지
- /
- 제30권3호
- /
- pp.81-86
- /
- 2024
영상 신호 프로세서(Image Signal Processor, ISP)는 카메라 센서로부터 획득된 RAW 영상을 사람의 눈에 보기 좋은 sRGB 영상으로 변환한다. RAW 영상은 sRGB 영상에 비해 영상 처리에 도움이 되는 정보를 가지고 있지만 상대적으로 큰 용량으로 인해 주로 sRGB 영상만 저장되고 사용된다. 또한, 실제 카메라의 ISP 과정이 공개되어 있지 않아 그 역과정을 모사하는 것은 매우 어렵다. 이에 sRGB와 RAW 영상의 상호 변환을 위한 카메라 ISP 모델링 연구가 활발히 진행되고 있으며, 최근 기존의 단순한 ISP 신경망 구조를 고도화하고 실제 카메라 ISP의 동작과 유사하게 카메라 파라미터(노출 시간, 감도, 조리개 크기, 초점 거리)를 직접 반영하는 ParamISP[1] 모델이 제안되었다. 하지만 ParamISP[1]를 포함한 기존의 연구는 카메라 ISP를 모델링함에 있어 렌즈로 인해 발생하는 렌즈 쉐이딩(Lens Shading), 광학 수차(Optical Aberration), 렌즈 왜곡(Lens Distortion) 등을 고려하지 않아 복원 성능에 한계가 있다. 본 연구는 ISP 신경망이 렌즈로 인해 발생하는 열화를 보다 잘 다룰 수 있도록 위치 정보 인코딩(Positional Encoding)을 도입한다. 제안하는 위치 정보 인코딩 기법은 영상을 분할하여 패치(Patch) 단위로 학습하는 카메라 ISP 신경망에 적합하며 기존 모델에 비해 영상의 공간적 맥락을 반영할 수 있어 더욱 정교한 영상 복원을 가능하게 한다.
https://doi.org/10.15701/kcgs.2024.30.3.81 인용 PDF

MPEG 압축 영역에서의 움직이는 객체 추적 및 해석 (A Study on The Tracking and Analysis of Moving Object in MPEG Compressed domain)

문수정;이준환;박동선
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2001년도 정기총회 및 학술대회
- /
- pp.103-106
- /
- 2001
본 논문에서는 MPEG2비디오 스트림에서 직접 얻을 수 있는 정보들을 활용하여 카메라의 움직임을 추정하여 이를 기반으로 하여 움직이는 객체를 추정하고자 한다. 이를 위해, 먼저 MPEG2의 움직임 벡터는 압축의 효율성 때문에 움직임의 예측이 순서적이지 못한데, 예측 프레임들의 속성을 이용하여 이를 광 플로우(Optical Flow)를 갖는 움직임 벡터(Motion Vector)로 변환하였다. 그리고 이러한 벡터들을 이용하여 카메라의 기본적인 움직임인 팬(Fan), 틸트(Tilt). 줌(Zoom) 등을 정의하였다. 이를 위하여 팬, 틸트-줌 카메라 모델의 매개변수와 같은 의미의 $\Delta$x, $\Delta$y, $\alpha$값을 정의하고자 움직임 벡터 성분의 Hough변환을 이용하여 $\Delta$x, $\Delta$y, $\alpha$값들을 구하였다. 또한 이러한 카메라 움직임(Camera Operation)은 시간적으로 연속적으로 발생하는 특징을 이용하여 각 프레임마다 구한 카메라의 움직임을 보정하였다. 마지막으로 움직이는 객체의 추정은 우선 사용자가 원하는 객체를 바운딩박스 형태로 정의한 후 카메라 움직임이 보정된 객체의 움직임 벡터를 한 GOF(Group of Pictures) 단위로 면적 기여도에 따라 누적하여 객체를 추적하고 해석하였으며 DCT 질감 정보를 이용하여 객체의 영역을 재설정 하였다. 물론 압축된 MFEG2비디오에서 얻을 수 있는 정보들은 최대 블록 단위이므로 객체의 정의도 블록단위 이상의 객체로 제한하였다. 제안된 방법은 비디오 스트림에서 직접 정보를 얻음으로써 계산속도의 향상은 물론 카메라의 움직임특성과 움직이는 객체의 추적들을 활용하여 기존의 내용기반의 검색 및 분석에도 많이 응용될 수 있다. 이러한 개발 기술들은 압축된 데이터의 검색 및 분석에 유용하게 사용되리라고 기대되며 , 특히 검색 툴이나 비디오 편집 툴 또는 교통량 감시 시스템, 혹은 무인 감시시스템 등에서 압축된 영상의 저장과 빠른 분석을 요구시 필요하리라고 기대된다.
PDF

검색결과 1,046건 처리시간 0.039초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)