Search | Korea Science

Design of Behavioral Classification Model Based on Skeleton Joints (Skeleton Joints 기반 행동 분류 모델 설계)

Cho, Jae-hyeon;Moon, Nam-me
- Proceedings of the Korea Information Processing Society Conference
- /
- 2019.10a
- /
- pp.1101-1104
- /
- 2019
키넥트는 RGBD 카메라로 인체의 뼈대와 관절을 3D 공간에서 스켈레톤 데이터수집을 가능하게 해주었다. 스켈레톤 데이터를 활용한 행동 분류는 RNN, CNN 등 다양한 인공 신경망으로 접근하고 있다. 본 연구는 키넥트를 이용해서 Skeleton Joints를 수집하고, DNN 기반 스켈레톤 모델링 학습으로 행동을 분류한다. Skeleton Joints Processing 과정은 키넥트의 Depth Map 기반의 Skeleton Tracker로 25가지 Skeleton Joints 좌표를 얻고, 학습을 위한 전처리 과정으로 각 좌표를 상대좌표로 변경하고 데이터 수를 제한하며, Joint가 트래킹 되지 않은 부분에 대한 예외 처리를 수행한다. 스켈레톤 모델링 학습 과정에선 3계층의 DNN 신경망을 구축하고, softmax_cross_entropy 함수로 Skeleton Joints를 집는 모션, 내려놓는 모션, 팔짱 낀 모션, 얼굴을 가까이 가져가는 모션 해서 4가지 행동으로 분류한다.
https://doi.org/10.3745/PKIPS.y2019m10a.1101 인용 PDF

Upper-body Pose Analysis using Cylindrical Coordinate System (원통좌표시스템을 이용한 상반신 포즈 분석)

Park, Jae-Wan;Kim, Dae-Young;Lee, Chil-Woo
- Proceedings of the Korea Information Processing Society Conference
- /
- 2012.11a
- /
- pp.359-361
- /
- 2012
본 논문에서는 깊이영상에서 상반신 포즈 분석을 위하여 원통좌표시스템을 제안한다. 깊이영상에서 포즈 후보 영역을 설정하고, 포즈 후보 영역을 이용하여 카메라로부터 신체 중심점까지의 거리와 신체 특징에 따라 원통좌표계를 설정한다. 그리고 밝기값으로 표현되는 깊이 정보를 이용하여 특징벡터를 추출한다. 추출된 원통좌표계의 특징벡터는 원형의 특징공간에 표현되고 포즈 패턴으로 분류된다. 그리고 포즈 패턴들은 특징벡터들의 평균값을 이용하여 학습되고 미리 정의된 포즈 패턴들과 유클리디언 거리로 비교하여 포즈로 분류된다. 본 논문은 상반신 포즈 후보 영역에 동적인 원통 모델을 적용하여 간단한 연산을 통해 머리와 몸통, 팔을 구분할 수 있도록 효과적인 포즈 정보 추출에 목적을 두고 있다.
https://doi.org/10.3745/PKIPS.y2012m11a.359 인용 PDF

Dolly Zoom Rendering for Computer Graphics (그래픽스 기반 달리줌 렌더링)

Kim, Kangtae;Jeong, Yuna;Lee, Sungkil
- Proceedings of the Korea Information Processing Society Conference
- /
- 2012.04a
- /
- pp.464-465
- /
- 2012
장면에는 초점을 두는 중요한 영역이 있다. 초점에 의한 영상 효과는 사실감 뿐 아니라 작가들의 매시지를 효과적으로 전달하는데 현저히 도움이 된다. 본 논문에서는 영화 영상 기법 중 달리줌을 컴퓨터 그래픽스에 적용/렌더링하여 초점 효과를 극적으로 향상시키는 방법에 대하여 제안한다. 달리줌과 더불어, thin-lens 카메라 모델 기반 디포커스 블러를 추가하여, 보다 극적인 효과를 실시간에 얻을 수 있다. 이러한 효과는 역동적인 원근감을 제공하여 물체를 강조하는 다양한 특수효과에 쓰일 수 있다.
https://doi.org/10.3745/PKIPS.y2012m04a.464 인용 PDF

Distortion correction in the overlapping area of 360VR by the sudden appearance of objects (객체 출현에 따른 360VR 중첩영역에서의 왜곡 보정)

Lee, HeeKyung;Lim, Seong Yong;Seo, Jeong-il
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2018.11a
- /
- pp.90-92
- /
- 2018
본 논문에서는 입력 영상을 카메라의 자세 정보에 따라 적절히 와핑한 후 이들을 심(Seam)을 따라 이어붙인 360VR 에서 갑작스런 객체 출현에 의해 중첩 영역에서 발생하는 왜곡 문제를 해결할 방법을 제안한다. 임의의 객체가 나타났을 때, 객체의 윤곽선을 반영하여 심(Seam)을 재설정함으로써 객체가 우그러지거나, 잘려나가는 등의 왜곡 문제를 해결한다. 이를 위해 본 논문에서는 가우시안(Gaussian) 혼합 모델 기반 전경/배경분리에 의한 움직이는 객체 추출, 객체 윤곽선 검출, 윤곽선에 기반한 심(Seam) 조정, 새로운 심(Seam) 기반 스티칭으로 왜곡을 없애는 방법을 제안하였다. 그리고 이를 실제 촬영 영상에 적용하여 왜곡 개선 효과를 보였다.
PDF

Indoor Pedestrian Detection-Counting and Analysis-Prediction Techniques for Multi-Complex Building (다중이용시설 이용자수 감지계수 및 분석예측 기술 개발)

Jang, Bongseog
- Journal of Integrative Natural Science
- /
- v.15 no.2
- /
- pp.73-81
- /
- 2022
본 연구는 다중이용시설 이용자들의 쾌적함과 안전 그리고 시설내부 에너지 사용량의 최적 절감을 위하여 이용자수를 분석예측한 정보에 따른 공기질품질제어시스템 운영을 통해 국민 중심의 안전하고 쾌적한 서비스를 제공할 필요로 수행되었다. 이를 위하여 실내유동인구수를 카운팅하는 로컬시스템을 제작하고 수집된 유동인구 카운팅 정보를 시계열 모델링을 기반으로 분석예측하는 연구를 진행하였다. 개발된 시스템 성능평가 결과 유동인구 카운팅시스템은 95% 이상 정확도를 보여주었고, 예측시스템은 83~95% 정확도를 확보하였다. 본 연구결과 개발된 시스템은 다중이용시설에 즉시 적용가능하며 향후 남녀노소 인식을 진행하고 이를 예측한 정보에 의한 보다 다양한 서비스 개발을 추진할 계획이다.
https://doi.org/10.13160/ricns.2022.15.2.73 인용 PDF KSCI

Korean and English Text Image Super-Resolution for Improving Text Recognition Accuracy (텍스트 인식률 개선을 위한 한글 및 영어 텍스트 이미지 초해상화)

Kwon, Junhyeong;Cho, Nam Ik
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2022.11a
- /
- pp.72-75
- /
- 2022
야외 환경을 카메라로 촬영한 일반 영상에서 텍스트 이미지를 검출하고 인식하는 기술은 로봇 비전, 시각 보조 등의 기반이 되는 기술로 활용될 수 있어 매우 중요한 기술이다. 하지만 저해상도의 텍스트 이미지의 경우 텍스트 이미지에 포함된 노이즈나블러 등이 더 두드러지기 때문에 텍스트 내용을 인식하는 것이 어렵다. 이에 본 논문은 일반 영상에서의 저해상도 한글 및 영어 텍스트에 대한 이미지 초해상화를 통해 텍스트 인식 정확도를 개선하였다. 트랜스포머에 기반한 모델로 한글 및 영어 텍스트에 대한 이미지 초해상화를 수행하였으며, 영어 및 한글 데이터셋에 대해 제안한 초해상화 방법을 적용했을 때 그렇지 않을 때보다 텍스트 인식 성능이 개선되는 것을 확인하였다.
PDF

Face Recognition using Image Super-Resolution (이미지 초해상화를 이용한 얼굴 인식)

Park, Junyoung;Cho, Nam Ik
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- 2022.11a
- /
- pp.85-87
- /
- 2022
최근 CCTV 출입 기록, 휴대폰 보안, 스마트 매장 등에서 얼굴 인식을 통해 개인을 식별하는 기술이 널리 사용되고 있다. 카메라의 각도, 조명, 사람의 움직임 등 얼굴 인식에 많은 외부 환경이 영향을 미치고 있지만 그중에서도 실제 영상에서 얼굴이 차지하는 영역이 작아 저해상도 얼굴 인식에 어려움을 겪고 있다. 이러한 문제점을 해결하고자 본 논문에서는 이미지 해상도가 얼굴 인식에 끼치는 영향을 알아보고 이미지 초해상화를 통해 얼굴 인식 성능을 개선하고자 한다. 쌍선형, 양3차 회선 보간법과 딥러닝 기반의 이미지 초해상화 모델인 RCAN을 이용하여 업스케일링한 데이터셋에 대해 학습한 ArcFace를 통해 얼굴 검증 평가를 진행하였다. 고해상도 이미지는 얼굴 인식 성능을 향상시키며, RCAN을 사용한 이미지 초해상화가 보간법을 사용한 방법보다 더 좋은 성능을 보였다.
PDF

Abnormal Sound Detection and Identification in Surveillance System (감시 시스템에서의 비정상 소리 탐지 및 식별)

Joo, Young-min;Lee, Eui-jong;Kim, Jeong-sik;Oh, Seung-geun;Park, Dai-hee
- Proceedings of the Korea Information Processing Society Conference
- /
- 2010.11a
- /
- pp.592-595
- /
- 2010
본 논문에서는 감시카메라 환경에서 취득한 오디오 데이터를 입력으로 하여, 비정상 상황을 인식하는 시스템을 제안한다. 제안된 시스템은 단일클래스 SVM의 대표적인 모델인 SVDD와 최근 얼굴 인식 분야에서 성공적인 업적을 보여주고 있는 신호 처리 분야의 SRC를 계층적으로 결합한 구조로써, 첫 번째 계층에서는 SVDD로 비정상 소리를 신속하게 탐지하여 관리자에게 알람 경고하고, 두 번째 계층의 SRC는 탐지된 비정상 소리를 유형별로 세분화 식별하여 관리자에게 비상 상황을 보고함으로써 관리자의 위기 상황 대처를 돕는다. 제안된 시스템은 실시간 처리가 가능하며, 점증적 갱신의 학습 능력으로 인하여 비정상 오디오 데이터베이스의 변화에도 능동적으로 적응할 수 있다. 실험을 통하여 제안된 시스템의 성능을 검증한다.
https://doi.org/10.3745/PKIPS.y2010m11a.592 인용 PDF

Depth Image-based Ground Detection and Altitude Measurement Method (깊이영상을 이용한 지면 검출 및 고도 측정 방법)

Cheon, Muho;Jeon, Byeungwoo
- Proceedings of the Korean Society of Broadcast Engineers Conference
- /
- fall
- /
- pp.180-182
- /
- 2021
본 논문에서는 드론의 비행 장소와 온도 및 습도에 영향을 받지 않는 적외선 기반 깊이 카메라로부터 얻어진 깊이영상을 분석하여 지면 영역을 찾고 AGL(Above Ground Level) 단위의 고도를 측정하는 방법을 제안한다. Decimation filter 와 Median filter 를 적용하여 잡음 및 빈 데이터들을 제거한 깊이영상으로부터 RANSAC (RANdom Sample Consensus) 기반 평면 모델 추정 방법을 이용하여 지면 영역과 이에 대한 평면의 방정식을 유추하고 현재 위치와의 거리를 계산한다. 성능 평가를 위해 Lidar 센서와 비교한 결과, 제안 방법이 지면에 위치한 장애물에 영향을 더 적게 받으며, 자세 정보와 독립적으로 고도를 측정할 수 있었다.
PDF

3D Map Construction from Spherical Video using Fisheye ORB-SLAM Algorithm (어안 ORB-SLAM 알고리즘을 사용한 구면 비디오로부터의 3D 맵 생성)

Kim, Ki-Sik;Park, Jong-Seung
- Proceedings of the Korea Information Processing Society Conference
- /
- 2020.11a
- /
- pp.1080-1083
- /
- 2020
본 논문에서는 구면 파노라마를 기반으로 하는 SLAM 시스템을 제안한다. Vision SLAM은 촬영하는 시야각이 넓을수록 적은 프레임으로도 주변을 빠르게 파악할 수 있고, 많은 양의 주변 데이터를 이용해 더욱 안정적인 추정이 가능하다. 구면 파노라마 비디오는 가장 화각이 넓은 영상으로, 모든 방향을 활용할 수 있기 때문에 Fisheye 영상보다 더욱 빠르게 3D 맵을 확장해나갈 수 있다. 기존의 시스템 중 Fisheye 영상을 기반으로 하는 시스템은 전면 광각만을 수용할 수 있기 때문에 구면 파노라마를 입력으로 하는 경우보다 적용 범위가 줄어들게 된다. 본 논문에서는 기존에 Fisheye 비디오를 기반으로 하는 SLAM 시스템을 구면 파노라마의 영역으로 확장하는 방법을 제안한다. 제안 방법은 카메라의 투영 모델이 요구하는 파라미터를 정확히 계산하고, Dual Fisheye Model을 통해 모든 시야각을 손실 없이 활용한다.
https://doi.org/10.3745/PKIPS.y2020m11a.1080 인용 PDF

Search Result 1,047, Processing Time 0.029 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)