통합 검색 | Korea Science

딥 러닝 기반의 눈 랜드마크 위치 검출이 통합된 시선 방향 벡터 추정 네트워크 (Deep Learning-based Gaze Direction Vector Estimation Network Integrated with Eye Landmark Localization)

주희영;고민수;송혁
- 방송공학회논문지
- /
- 제26권6호
- /
- pp.748-757
- /
- 2021
본 논문은 눈 랜드마크 위치 검출과 시선 방향 벡터 추정이 하나의 딥러닝 네트워크로 통합된 시선 추정 네트워크를 제안한다. 제안하는 네트워크는 Stacked Hourglass Network를 백본(Backbone) 구조로 이용하며, 크게 랜드마크 검출기, 특징 맵 추출기, 시선 방향 추정기라는 세 개의 부분(Part)으로 구성되어 있다. 랜드마크 검출기에서는 눈 랜드마크 50개 포인트의 좌표를 추정하며, 특징 맵 추출기에서는 시선 방향 추정을 위한 눈 이미지의 특징 맵을 생성한다. 그리고 시선 방향 추정기에서는 각 출력 결과를 조합하여 최종 시선 방향 벡터를 추정한다. 제안하는 네트워크는 UnityEyes 데이터셋을 통해 생성된 가상의 합성 눈 이미지와 랜드마크 좌표 데이터를 이용하여 학습하였으며, 성능 평가는 실제 사람의 눈 이미지로 구성된 MPIIGaze 데이터셋을 이용하였다. 실험을 통해 시선 추정 오차는 3.9°의 성능을 보였으며, 네트워크의 추정 속도는 42 FPS(Frame per second)로 측정되었다.
https://doi.org/10.5909/JBE.2021.26.6.748 인용 PDF KSCI KPUBS

PCA 기반 변환을 통한 다해상도 피처 맵 압축 방법 (A Feature Map Compression Method for Multi-resolution Feature Map with PCA-based Transformation)

박승진;이민훈;최한솔;김민섭;오승준;김연희;도지훈;정세윤;심동규
- 방송공학회논문지
- /
- 제27권1호
- /
- pp.56-68
- /
- 2022
본 논문에서는 VCM을 위한 다해상도 피처 맵에 대한 압축 방법을 제안한다. 제안하는 압축 방법은 PCA 기반의 변환을 통해 다해상도 피처 맵의 채널 및 해상도 계층 간 중복성을 제거하며 변환에 사용된 기저 벡터와 평균 벡터 그리고 변환을 통해 얻어진 변환 계수를 각각의 특성에 따라 VVC 기반 부호화기와 DeepCABAC을 통하여 압축한다. 제안하는 방법의 성능을 측정하기 위하여 OpenImageV6와 COCO 2017 validation set에 대하여 객체 검출 성능을 평가하며, MPEG-VCM 앵커 및 본 논문에서 제안하는 피처 맵 압축 앵커 대비 bpp와 mAP를 BD-rate 관점에서 비교한다. 실험 결과, 제안하는 방법은 OpenImageV6에서 피처 맵 압축 앵커 대비 25.71%의 BD-rate 성능 향상을 보이며, 특히 COCO 2017 validation set의 크기가 큰 객체들에 대해서 MPEG-VCM 앵커 대비 최대 43.72%의 BD-rate 성능이 향상됨을 보인다.
https://doi.org/10.5909/JBE.2022.27.1.56 인용 PDF KSCI KPUBS

모바일 기기를 위한 스캔라인 엣지 플래그 방식의 2D 벡터 그래픽 레스터라이저 설계 (A Design of 2D Vector Graphics Rasterizer with a Modified Scan-line Edge flag Algorithms for Mobile Device)

박정훈;이광엽;정태의
- 한국정보통신학회:학술대회논문집
- /
- 한국해양정보통신학회 2008년도 춘계종합학술대회 A
- /
- pp.298-301
- /
- 2008
벡터 그래픽스는 수학적 정보를 이용하여 이미지를 표현하기 때문에 이미지 손상 없이 쉽게 확대 축소가 가능하며, 비트맵 방식으로 표현되는 이미지보다 더 작은 파일 크기를 가진다. 본 논문에서 제안하는 벡터 그래픽 래스터라이저는 개선된 스캔라인 엣지 플래그 방식을 사용하여 설계되었으며 클리핑과 슈퍼샘플링 과정을 같이 수행한다. OpenVG 2D 벡터 이미지를 사용하여 검증되었다. 본 논문에서 제안하는 가속기는 Tiger image의 랜더링에 초당 5 프레임의 성능을 가진다.
PDF

경계 중요도 맵 및 영역 병합에 기반한 칼라 영상 분할 (Color Image Segmentation Based on Edge Salience Map and Region Merging)

김성영
- 한국컴퓨터정보학회논문지
- /
- 제12권3호
- /
- pp.105-113
- /
- 2007
본 논문에서는 경계 중요도 맵과 영역 병합에 의한 영상 분할 방법을 제안한다. 경계 중요도 맵은 텍스쳐 경계 강도와 칼라 경계 강도의 조합에 의해 생성한다. 텍스쳐 경계 강도는 가버 필터 뱅크를 사용하여 다중 스케일과 방향에 따른 필터링 결과를 병합하여 생성하며 칼라 경계 강도는 HSI 칼라 모델의 H 성분에 대해 계산한다. 경계 중요 맵 영상에 대해서는 Watershed 변환을 통해 사전 영상 분할을 수행한다. Watershed 변환에 의한 영상 분할은 영역들이 과잉 분할되는 현상이 나타나므로 이를 개선하여 최종 영상 분할 결과를 생성한다. 이를 위해 우선 모폴로지 연산을 사용하여 경계 중요도 맵 영상에 대한 컨트라스트 향상과 마커 영역을 생성한다. 모폴로지 연산으로 과잉 분할 영역은 줄어들지만 여전히 상당수 존재하게 되므로 이를 극복하기 위해 영역 병합 과정을 수행한다. 영역 병합 단계에서는 영역 내부의 평균 칼라 및 가버 텍스쳐 벡터를 함께 사용함으로써 효과적으로 과잉 분할된 영역을 병합할 수 있도록 하였다. 제안한 방법은 다양한 자연 영상에 대해 실험하였으며 기존 방법과 결과를 비교하여 성능의 우수성을 확인하였다.
PDF

로스 텍스처 필터 기반 영상의 자동 깊이 생성 기법 (Automatic Depth Generation Using Laws' Texture Filter)

조철용;김제동;장성은;최창열;김만배
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송공학회 2009년도 추계학술대회
- /
- pp.87-90
- /
- 2009
영상의 깊이 정보를 추출하는 것은 매우 어려운 연구이다. 다양한 유형의 영상 구조의 분석이 필요하지만 많은 경우에 주관적인 판단의 도움이 필요하다. 본 논문에서는 로스 텍스처 필터를 기반으로 정지 영상의 깊이를 자동으로 생성하는 방법을 제안한다. 로스 텍스처 필터는 단안 비전에서 3D 깊이를 얻기 위한 방법으로 활용되었는데, 실제 2D 영상에서 깊이를 예측하기 위해 텍스처 편차, 텍스처 기울기, 색상 등을 활용한다. 로스 필터는 $1{\times}5$ 벡터로부터 콘볼루션을 이용하여, 20여개의 $5{\times}5$ 콘볼루션 필터가 구해지는데, 영상에 필터를 적용하여 로스 에너지를 계산한다. 구해진 에너지를 깊이 맵으로 변환하고, 깊이 맵에서 특징 점을 구하고, 특징 점들로부터 델러노이 삼각화를 이용하여 삼각형 깊이 메쉬를 얻는다. 구해진 깊이 맵의 성능을 측정하기 위해 카메라 시점을 변경하면서 영상의 3D 구조를 분석하였으며, 입체영상을 생성하여 3D 입체 시청 결과를 분석하였다. 실험에서는 로스 텍스처 필터를 이용하는 깊이 생성 방법이 좋은 효과를 얻는 것을 확인하였다.
PDF

다해상도 편향맵을 이용한 GPU기반의 지형 렌더링 (A GPU-based Terrain Rendering using Multi-resolution Bias Map)

이은석;김태권;이진희;신병석
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
- /
- pp.314-316
- /
- 2012
대용량 지형 데이터를 실시간에 렌더링 하기 위해 여러 가지 연속상세단계 기법들이 연구되었다. 하지만 이러한 방법을 적용해도 지형 데이터가 하드웨어에서 처리할 수 있는 크기보다 클 경우 과도한 간략화로 인한 기하오차가 발생하거나 프레임률이 저하된다. 또한 기존 연속상세단계 기법을 수행하기 위해 만들어진 자료구조들 또한 지형 데이터의 크기에 비례하여 커지므로 메모리와 전처리 시간이 많이 소요된다. 본 논문에서는 적은 개수의 정점으로 효과적인 지형 렌더링이 가능한 편향맵을 다해상도로 확장하여 별도의 자료구조가 따로 필요 없는 간단한 연속상세단계 기법을 제안한다. 이 방법은 적은 메모리 용량으로 높은 정확도의 지형을 실시간에 렌더링 할 수 있다. 연속상세단계 선택은 보다 빠른 처리를 위해 GPU에서 패치 단위의 테셀레이션을 통해서 단일 패스로 수행된다. 상세단계가 선택으로 세분화 된 지형의 각 정점들은 화면 공간상의 오차를 참조하여 각각의 상세단계를 선택한 후 해당되는 편향맵에 저장된 이동벡터만큼 이동하여 최종 지형 메쉬를 생성한다. 제안한 방법은 전처리 단계를 포함한 모든 처리가 GPU에서 수행되므로 속도가 빠르고 적은 정점으로 보다 정확한 지형을 렌더링 할 수 있다.

WMS 시스템을 이용한 해양예측모델 데이터의 가시화 기법 (A Visualization Method for the Ocean Forecast Data using WMS System)

권태정;이재령;박재표
- 한국인터넷방송통신학회논문지
- /
- 제18권6호
- /
- pp.11-19
- /
- 2018
최근 GIS(Geographic Information System)을 중심으로 다양한 정보를 지도위에 제공하고 있으며, 대표적으로 국외의 경우 구글맵, 오픈스트리트맵, 빙맵 등이 있고, 국내의 경우 네이버지도, 다음지도, 브이월드맵 등이 GIS 기술의 한 부분인 WMS(Web Map Service)를 이용하여 서비스를 제공하고 있다. 본 논문에서는 현재 서비스되고 있는 벡터장 데이터 정보를 이용하여, 조류의 흐름도 와 스트림라인의 표출 방안 알고리즘 연구 및 사용자 편의성을 고려한 해양예측모델 데이터의 가시화 방안에 대해 연구를 수행하였다. 기존의 조류 흐름도 표출 및 스트림라인 표출 알고리즘과 제안하는 방식의 성능을 비교를 하여, 기존의 기술 보다 2배 이상 빠른 표출이 되는 것을 확인하였다.
https://doi.org/10.7236/JIIBC.2018.18.6.11 인용 PDF KSCI HTML

시점을 달리한 여러 장의 투영 영상을 이용한 반투명 재질의 실시간 렌더링 (Representation of Translucent Objects using Multiple Projection Images for Real-time Rendering)

이재영;김강연;유재덕;이관행
- 한국HCI학회:학술대회논문집
- /
- 한국HCI학회 2006년도 학술대회 1부
- /
- pp.878-883
- /
- 2006
반투명 물체(Translucent Object)는 불투명한 물체와는 달리 물체 내부에서 산란이 일어난다. 반투명 물체의 한 표면(Surface)을 렌더링하기 위해서는 그 표면의 정규 벡터뿐만 아니라 그 표면의 주변 기하 정보가 필요하다. 그러나 그래픽 하드웨어 구조는 반투명 물체의 실시간 렌더링의 구현에 많은 제약을 준다. 3D 기하 정보 대신에 라디언스 맵(Radiance map)과 깊이 맵(Depth map)과 같은 투영 영상(Projected Image)을 기반으로 하는 영상 공간 접근 방법(Image Space Approach)을 사용함으로써 GPU 상에서 반투명 재질을 실시간으로 표현할 수 있다. 본 논문에서는 영상 공간 접근 방법(Image Space Approach)의 연장선에서 시점을 달리한 여러 장의 투영 영상을 이용함으로써 기존의 한 장의 투영 영상만을 이용한 방법이 가지고 있는 가시성 한계점을 해결한다. 또한 복수 투영 영상의 이용에 따른 계산량 증가에 의해서 손실된 프레임 속도(Frame Rate)에 대해 분석한다.
PDF

딥러닝 기반의 표 경계선 히트맵 회귀를 이용한 표의 구조 인식 (Table Structure Recognition using Borderline Heatmap Regression)

이은지;박재우;구형일;조남익
- 한국방송∙미디어공학회:학술대회논문집
- /
- 한국방송∙미디어공학회 2021년도 추계학술대회
- /
- pp.84-87
- /
- 2021
본 논문에서는 딥러닝을 기반으로 문서영상에서 표 안의 셀 경계선을 히트맵 회귀(heatmap regression)로 추정함으로써 표의 구조를 인식하는 방법을 제안한다. 표는 기본적으로 행과 열로 이루어져 있기 때문에, 제안하는 방법에서는 먼저 1 차원 벡터 형태로 세로/가로 방향의 행/열 경계선 위치를 찾고, 이에 병합된 셀을 처리하기 위해 경계선이 그어져야 할 위치를 2 차원으로 추정한 결과를 적용하여 온전한 표의 경계선을 구한다. 이러한 구조를 통해 제안하는 방법은 표의 행과 열에 대한 정보를 효과적으로 이용함과 동시에, 복잡한 후처리 없이 병합된 셀을 처리할 수 있는 이점을 보인다. 실험은 1 차원의 행/열 경계선 위치를 반영하는 두 가지 방식에 대해 PubTabNet[11]에 대해 진행하여 결과를 보였다.
PDF

경계 방향성을 고려한 스테레오 동영상의 움직임-변이 동시추정 기법 (Edge-Directional Joint Disparity-Motion Estimation of Stereoscopic Sequences)

김용태;서형갑;박창섭;이재호;손광훈
- 방송공학회논문지
- /
- 제9권3호
- /
- pp.196-206
- /
- 2004
본 논문에서는 스테레오 동영상 CODEC (Coder and decoder)을 위한 효율적인 변이와 움직임의 동시추정 기법을 제안한다. 동시 추정 기법은 좌우 움직임 벡터와 이전 시점의 변이 벡터를 이용해서 현재 시점의 변이 벡터를 예측한다. 하지만 동시추정 기법은 추정 오류가 축적되고 가려진 영역으로 인해 벡터들이 잘못 추정될 경우 성능이 매우 떨어질 수가 있다. 이런 문제점을 해결하기 위해서 동시추정 기법과 별도로 공간적인 변이 벡터의 예측을 수행한다. 즉, 동시 추정과 공간적인 변이 벡터의 예측을 통해서 정확한 변이 벡터들을 구해내어 전체 부호화 효율을 높일 수 있다. 마지막으로 본 논문에서는 역방향 사진트리 분할 기법을 제안한다. 역방향 사진트리 분할 기법은 사진트리 분할 정보를 보내지 않고도 상세한 변이맵을 얻어낼 수 있기 때문에 변이 보상의 성능을 높일 수 있었다. 실험 결과를 통해서 제안 알고리듬이 기존 알고리듬과 비교하여 수행시간이 9배가량 감소하고 주관적 화질에서 좋은 결과를 보임을 확인하였고 객관적 화질 평가에서 0.5～1.5dB가량 PSNR이 높아짐을 확인하였다.
PDF KSCI

검색결과 103건 처리시간 0.025초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)