• 제목/요약/키워드: 프레임 검출

검색결과 839건 처리시간 0.025초

팬/틸트 제어기반의 스데레오 카메라의 기하학적 정보를 이용한 새로운 높이 추정기법 (A New Height Estimation Scheme Using Geometric Information of Stereo Camera based on Pan/tilt control)

  • 고정환;김은수
    • 한국통신학회논문지
    • /
    • 제31권2C호
    • /
    • pp.156-165
    • /
    • 2006
  • 본 논문에서는 지능적인 보안 시스템 구현의 새로운 접근 방식으로, 인공지능형 시각 시스템에 기반한 팬/틸트 탑재형 스테레오 카메라의 기하학적 정보를 이용한 사람 키 높이 추정기법을 제안하였다. 제안된 시스템에서는 먼저, 스데레오 카메라에서 입력된 영상으로 부터 YCbCr 컬러 모델과 위상형 상관 기법을 사용하여 표적 얼굴영역의 중심좌표를 검출한 다음, 지능형 시각 시스템에 기반한 팬/틸트 탑재형 스테레오 카메라의 능동적인 제어각도 산출을 통해 표적의 다양한 변화에 관계없이 표적의 3차원 좌표를 실시간적으로 검출하고, 이를 통한 표적 대상의 적응적인 신체 크기 추정을 수행하였다. 각기 다른 신장을 가진 3사람의 다양한 이동경로를 가진 480 프레임의 테스트용 스테레오 영상을 사용한 실험 결과, 표적의 추정된 신체 크기값 역시 계산치 및 측정치 사이의 표준편차가 평균 1.03의 작은 값으로 유지됨은 물론, 제안된 시스템에서 계산된 좌표값과 실제 실험대상으로 참여한 사람의 정확한 실제 위치와의 차이 역시 평균 1.2cm 미만의 오차와 전체적으로 1.18$\%$의 오차를 보임으로써 이를 통한 새로운 실시간 스테레오 표적 감시추적 시스템의 구현 가능성을 제시하였다.

얼굴 및 눈 위치 추적을 통한 IPTV 화면 인터페이스 제어에 관한 연구 (A Study on Controlling IPTV Interface Based on Tracking of Face and Eye Positions)

  • 이원오;이의철;박강령;이희경;박민식;이한규;홍진우
    • 한국통신학회논문지
    • /
    • 제35권6B호
    • /
    • pp.930-939
    • /
    • 2010
  • 최근 HCI 분야에서 사용자의 시선 추적을 통해 보다 편리한 입력 장치를 개발하려는 연구가 활발히 진행되고 있다. 하지만 기존의 시선 추적 방법들은 부가적인 사용자 착용형 장비를 필요로 하거나 원거리에서 작동되지 않는 문제 등으로 인해 IPTV 환경에서 적용하기 어려운 실정이다. 이에 본 연구에서는 사용자 착용없이 고정된 하나의 카메라를 이용하여 얼굴을 취득하고, 취득된 얼굴 영역 내에서 눈의 위치를 검출하여 IPTV의 화면 인터페이스를 제어할 수 있는 새로운 방법을 제안한다. 또한, Adaboost 방법으로 얼굴이나 눈이 성공적으로 검출되지 못했을 경우에도, 계층적 KLT (Kanade-Lucas-Tomasi)특징 추적 방법을 통해 구해진 모션 벡터를 이용하여 화면 인터페이스를 제어할 수 있는 방법을 제안한다. 이처럼, 본 논문의 방법은 기존의 방법과는 달리 실제 IPTV의 시청거리인 2m 정도의 원거리에서도 사용가능하며, 카메라 이외에 별도의 장치를 착용할 필요가 없으므로 편의성이 높고 얼굴 움직임의 제약이 없다는 장점이 있다. 실험결과, 입력되는 얼굴 영상을 초당 15프레임의 속도로 실시간 처리함을 확인할 수 있었으며, 기존 입력 장치의 역할을 충분히 대신할 수 있음을 알 수 있었다.

폴립 가중치 영상 생성을 통한 캡슐내시경 영상의 학습 성능 비교 연구 (A Study on the Comparison of Learning Performance in Capsule Endoscopy by Generating of PSR-Weigted Image)

  • 임창남;박예슬;이정원
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제8권6호
    • /
    • pp.251-256
    • /
    • 2019
  • 캡슐 내시경은 식도부터 항문까지 소화기관 전체를 한 번에 촬영할 수 있는 의료기기로, 한 번의 검사에서 평균 8~12시간의 길이와 5만장 이상의 프레임으로 구성된 영상을 생성한다. 그러나 생성된 영상에 대한 분석은 전문가에 의해 수작업으로 진행되고 있어서, 질병 영상 진단을 돕기 위한 영상 분석 자동화에 대한 수요가 증가하고 있다. 그 중에서도 본 연구에서는 위장관 내에서 발견될 수 있는 융기성 병변인 폴립 영상 자동 검출에 초점을 맞추었다. 본 연구에서는 멀티 스케일 분석을 통해 폴립 의심 영역을 추출하고, 이것을 원본 영상과 합성하여 폴립 학습을 강화시킬 수 있는 가중치 영상을 생성하는 기법을 제안한다. 수집한 452장의 데이터에 대해 머신 러닝 기법중 하나인 SVM과 RF로 실험한 결과, 원본 영상을 이용한 폴립 검출의 F1점수는 89.3%였지만, 생성된 가중치 영상을 통해 학습한 결과 F1점수가 93.1%로 향상된 것을 확인하였다.

임베디드 기기를 위한 딥러닝 점자블록 인식 방법 (Deep Learning Braille Block Recognition Method for Embedded Devices)

  • 김희진;윤재혁;권순각
    • 한국산업정보학회논문지
    • /
    • 제28권4호
    • /
    • pp.1-9
    • /
    • 2023
  • 본 논문은 딥러닝을 통해 실시간으로 임베디드 기기에서 점자 블록을 인식하는 방법을 제안한다. 먼저 고성능 컴퓨터에서 점자 블록 인식을 위한 딥러닝 모델을 학습시키고, 임베디드 기기에 적용하기 위하여 학습 모델을 경량화 도구에 적용한다. 점자 블록의 보행 정보를 인식하기 위해 영상에서 점자블록과의 거리를 이용하여 경로를 판별하는 알고리즘을 사용한다. 임베디드 기기를 통해 촬영한 영상에서 YOLOv8 모델을 통해 점자 블록, 볼라드, 횡단보도를 검출한 후 점자블록 경로 판별 알고리즘을 거쳐 보행정보를 인식한다. 실시간으로 점자 블록을 검출하기 위해 모델 경량화 도구를 YOLOv8에 적용한다. YOLOv8 모델 가중치의 정밀도를 기존 32비트에서 8비트로 낮추고, TensorRT 최적화 엔진을 적용하여 모델의 최적화를 진행한다. 제안된 방법을 통해 경량화 된 모델을 기존 모델과 비교한 결과, 경로 인식 정확도는 99.05%로 기존 모델과 거의 차이가 없지만, 인식 속도는 기존 모델 대비 59% 단축되어 1초에 약 15개의 프레임을 처리할 수 있다.

컬러 성분 에지 기울기 검출 필터링을 이용한 디모자이킹 알고리즘 (Demosaicing Algorithm by Gradient Edge Detection Filtering on Color Component)

  • 전광길;정태영;김동형;김승종;정제창
    • 한국통신학회논문지
    • /
    • 제34권12C호
    • /
    • pp.1138-1146
    • /
    • 2009
  • 단일 영상 센서를 사용하는 디지털 카메라에서 컬러 영상은 3개의 R, G, B 프레임으로 나뉘는데, 복원할 때에는 컬러 보간 과정을 이용하여 풀(full) 해상도 영상을 획득한다. 따라서 베이어 패턴(Bayer’s pattern)과 같은 컬러 필터 어레이(CFA : Color Filter Array)를 통과하는 풀 해상도 컬러영상을 복원하는 과제는 소실된 컬러 요소에 대한 보간 기법과 관련이 있다. 본 논문에서는 모자이크 영상으로부터 정확한 에지 기울기 정보를 추출하기 위한 새로운 필터링 방법을 이용한 디모자이킹 알고리즘을 소개한다. 기존의 알고리즘은 G성분 값을 먼저 보간 후, R과 B성분 값을 보간하는 방식을 취하지만, 본 논문에서 제안하는 알고리즘은 휘도(luminance; L) 정보를 먼저 예측한 후, G와 R, B성분 값을 구한다. 이렇게 얻어진 컬러 성분 값들을 이용해 각각의 에지 방향들이 가지는 가중치를 구하고 가중치들의 합을 이용하여 컬러 보간을 수행한다. 24개의 테스트 영상을 이용하여 기존의 디모자이킹 알고리즘과 제안한 알고리즘을 비교하였으며, 제안한 알고리즘이 화질이 우수함을 입증하였다.

키넥트와 모바일 장치 알림 기반 온라인 모니터링 시스템 (Online Monitoring System based notifications on Mobile devices with Kinect V2)

  • 니욘사바에릭;장종욱
    • 한국정보통신학회논문지
    • /
    • 제20권6호
    • /
    • pp.1183-1188
    • /
    • 2016
  • 키넥트 센서 버전 2는 컴퓨터 비전과 엑스 박스와 같은 엔유아이 인터페이스로 마이크로소프트에서 출시한 카메라의 일종이다. 이는 높은 프레임 속도로 컬러 영상과 깊이 영상, 오디오 입력 및 스켈레톤 데이터를 취득 할 수 있다. 이러한 다양한 타입의 데이터 정보를 제공해 주기 때문에 이것은 다른 범위의 연구자들을 위한 리소스가 된다. 본 논문에서는 깊이 이미지를 사용하여 우리는 키넥트 범위내에서 특정 영역을 감시하는 시스템을 제시한다. 타켓 영역은 깊이의 최소, 최대 값의 크기에 따라서 그 공간을 모니터링 할 수 있다. 컴퓨터 비전 라이브러리 (Emgu CV)를 사용해서 만약 어떤 오브젝트가 타겟 영역에서 검출된다면 그것을 추적하고 키넥트 카메라는 RGB 이미지를 데이터베이스 서버에 전송한다. 따라서 안드로이드 플랫폼 기반 모바일 애플리케이션을 통해 키넥트 타켓 지역에서 수상한 움직임이 감지되었음을 사용자에게 통지하고 그 장면의 RGB 영상을 표시하기 위해 개발되었다. 사용자는 모니터링 영역 또는 제한 구역과 관련된 다른 경우에서 가치 있는 물건의 대해 최선의 방법으로 반응하고 실시간 통지를 얻는다.

차량의 위치 파악을 위한 도로안내표지판 인식과 거리정보 습득 방법 (An Recognition and Acquisition method of Distance Information in Direction Signs for Vehicle Location)

  • 김현태;정진성;장영민;조상복
    • 전자공학회논문지
    • /
    • 제54권1호
    • /
    • pp.70-79
    • /
    • 2017
  • 본 논문에서는 도로안내표지판 내의 거리정보를 빠르고 정확하게 획득하는 방법을 제안한다. 제안된 방법은 표지판의 인식, 거리를 획득하기 용이한 전 처리 과정, 거리정보를 습득하는 것으로 구성된다. 표지판의 인식은 여러 가지 잡음을 해결하기 위해 감마 보정을 포함한 색상검출을 사용하였으며, 거리정보를 용이하게 획득하기 위해서 직선 인자를 이용한 기울기 보정과 고속 푸리에변환을 이용한 해상도 보정을 적용하였다. 거리정보를 습득하는 과정은 모폴로지 연산을 통해 영역을 부각하고 레이블링, 템플릿 매칭을 사용하였다. 이러한 과정을 통해 도로안내표지판의 거리정보를 습득하여 분기점까지 남은 거리를 출력하는 시스템을 제안하였다. 결과적으로 연산속도 개선에 중점을 두어 실시간으로 처리할 수 있는 시스템에 사용 가능하며, 그 결과 프레임 당 평균 0.46초의 속도를 가지며, 정확도에서도 유사도 0.65의 수치를 갖는다.

다중 사용자 Massive MIMO 시스템의 파일럿 오버헤드를 고려한 최적 기지국 안테나 수 및 사용자 수 분석 (Optimal Numbers of Base Station Antennas and Users in Multiuser Massive MIMO Systems with Pilot Overhead)

  • 정민채;최수용
    • 한국통신학회논문지
    • /
    • 제41권11호
    • /
    • pp.1630-1638
    • /
    • 2016
  • 본 논문에서는 다중 사용자(multiuser)가 다수의 기지국 안테나(MIMO, Multiple-Input and Multiple-Output)를 동시에 사용하는 다중 사용자 massive MIMO 시스템 환경을 고려한다. 다중 사용자를 동시에 지원하기 위해 기지국에서는 ZFBF(Zero-Forcing Beamforming) 기법을 고려하고 수신 신호 검출을 위해 파일럿 신호를 고려한 하향 링크 프레임 구조를 적용하여 평균 셀 용량을 도출한다. 평균 셀 용량은 기지국 안테나 수 및 사용자 수에 대해 오목 함수 (concave function)임을 수식적으로 증명하고, 오목 함수 특징을 통해 최적의 기지국 안테나 수 및 사용자 수를 도출한다. 실험 결과를 통해 수식적으로 도출한 최적 값을 검증하고, 최적값 기반의 평균 셀 용량은 송신 SNR(Signal to Noise Ratio)에 비례하여 증가함을 확인할 수 있다.

OFCDM시스템에서 PCSSCG를 이용한 셀 탐색에 관한 연구 (A Study on a Cell search Using PCSSCG in Broadband OFCDM Systems)

  • 김대용;최권휴;박용완
    • 대한전자공학회논문지TC
    • /
    • 제43권6호
    • /
    • pp.1-8
    • /
    • 2006
  • 비동기 OFCDM 시스템 환경에서 초기 동기을 위한 셀 탐색 방법이 다음과 같이 3단계 방법으로 수행된다. 셀 탐색 1단계에서 보호구간의 상관을 이용한 심볼동기 즉, FFT 윈도우 타이밍 추정과 탐색 2 단계는 주파수영역에서 CSSC(Cell Specific Scrambling Code) 위상 천이성질을 이용한 CPICH(Common Pilot Channel)의 상관을 획득함으로써 프레임 타이밍 및 CSSC 그룹을 검출하고 마지막으로 탐색 3 단계에서 그룹 안에 속한 CSSC 위상 즉, 최적의 CSSC를 얻게 된다. 본 논문에서는 탐색 2단계에서 기존의 CPICH만을 이용한 셀 탐색방법을 변형한 PCSSCG(partial cell specific scrambling code group)를 이용하여 성능을 거의 같은 수준으로 유지하면서 이동국의 복잡도를 줄이는 셀 탐색 방법을 제안한다. 제안된 방법은 모의실험을 통하여 기존의 방법과 비교 검증하였다.

멀티 레이저 라인 조사를 이용한 비등속 이동물체의 3차원 형상 복원 (3D surface Reconstruction of Moving Object Using Multi-Laser Stripes Irradiation)

  • 이영열;예수영;남기곤
    • 대한전자공학회논문지SP
    • /
    • 제44권2호
    • /
    • pp.144-152
    • /
    • 2007
  • 본 논문에서는 멀티 레이저 라인 조사 방법을 이용한 능동적 비젼(Active Vision)의 방법으로 비등속 이동물체의 표면을 효율적으로 모델링 하는 방법을 제안한다. 레이저 라인을 물체에 조사하고 레이저가 조사된 방향과 각도를 달리한 방향에서 이를 관찰하면 레이저 라인이 표면의 굴곡에 따라 휘어지는 현상을 관찰할 수 있다. 이를 삼각기법(triangulation method)을 이용하여 분석하면 물체의 표면 3차원 정보 획득이 가능하다. 기존에 대표적 구조화 조명기법인 단일 라인(single stripe) 기법과 단일 프레임(single frame) 기법의 장단점과 제안하는 멀티 라인 기법의 장점을 설명하고 정밀도를 높이기 위한 레이저 라인의 효율적 배치에 대하여 설명한다. 강인한 레이저 라인의 추출을 위하여, 레이저 라인 피크 검출기법과 색 분석을 통해 얻은 레이저 반응도를 함께 이용하는 방법을 소개하였고, 효과적인 레이저 라인의 라벨링 기법을 새로 제안하였다. 개별 3차원 복원 표면을 전체영상으로 표현하기 위하여 동기화 정보 획득에 영상 간 특징점 매칭을 활용한 영상 정합 기법을 접목하였다. 3차원 표면 모델링 기술을 최종적으로 컨테이너 표면 데미지 검사에 활용하여 제안 3D 모델링 기술의 우수성을 확인하였다.