• 제목/요약/키워드: Real-Time Computer Vision

검색결과 361건 처리시간 0.025초

Lightweight CNN based Meter Digit Recognition

  • Sharma, Akshay Kumar;Kim, Kyung Ki
    • 센서학회지
    • /
    • 제30권1호
    • /
    • pp.15-19
    • /
    • 2021
  • Image processing is one of the major techniques that are used for computer vision. Nowadays, researchers are using machine learning and deep learning for the aforementioned task. In recent years, digit recognition tasks, i.e., automatic meter recognition approach using electric or water meters, have been studied several times. However, two major issues arise when we talk about previous studies: first, the use of the deep learning technique, which includes a large number of parameters that increase the computational cost and consume more power; and second, recent studies are limited to the detection of digits and not storing or providing detected digits to a database or mobile applications. This paper proposes a system that can detect the digital number of meter readings using a lightweight deep neural network (DNN) for low power consumption and send those digits to an Android mobile application in real-time to store them and make life easy. The proposed lightweight DNN is computationally inexpensive and exhibits accuracy similar to those of conventional DNNs.

로컬 버퍼 최적화를 통한 병렬 처리 캐니 경계선 검출기의 FPGA 설계 (FPGA Design of a Parallel Canny Edge Detector with Optimized Local Buffers)

  • 민인기;심수현;황승원;김선희
    • 반도체디스플레이기술학회지
    • /
    • 제22권4호
    • /
    • pp.59-65
    • /
    • 2023
  • Edge detection in image processing and computer vision is one of the most fundamental operations. Canny edge detection algorithm has excellent performance and is currently widely used. However, it is difficult to process the algorithm in real-time because the algorithm is complex. In this study, the equations required in the algorithm were simplified to facilitate hardware implementation, and the calculation speed was increased by using a parallel structure. In particular, the size and management of local buffers were selected in consideration of parallel processing and filter size so that data could be processed without bottlenecks. It was designed in verilog and implemented in FPGA to verify operation and performance.

  • PDF

스테레오 영상에서의 적응적 영역 가중치 매칭의 효율적 근사화 방법 (An Efficient Approximation method of Adaptive Support-Weight Matching in Stereo Images)

  • 김호영;이성원
    • 방송공학회논문지
    • /
    • 제16권6호
    • /
    • pp.902-915
    • /
    • 2011
  • 영역기반 스테레오 매칭 분야에서 최근 인간의 시각체계(Human Visual System)에 기반하여 영역내의 밝기값과 거리값에 따라 적응적으로 가중치를 부여하는 적응적 영역 가중치(Adaptive Support-Weight, ASW) 방법이 좋은 매칭 결과를 보이고 있다. 그러나 이 방법은 좋은 매칭 결과에 비해서 많은 연산비용을 필요로 하게 되고, 매칭의 실시간 시스템화에 큰 장애요소로 작용한다. 이에 Bilateral filter 수식으로 근사화 후 Integral Histogram 기법을 적용하여 영역 윈도우의 크기에 상관없이 상수 시간 O(1) 내에 매칭을 수행하는 연구가 진행되었다. 하지만 이 방법은 근사화 과정에서의 원 ASW 수식을 왜곡하기 때문에 매칭 정확도의 손실을 가져오게 된다. 본 논문에서는 적응적 영역 가중치 알고리즘의 매칭 정확도를 유지하면서 적응적 영역 가중치 알고리즘의 계산 비용을 줄이는 알고리즘을 제안한다. 이를 위해 영역내의 픽셀을 그룹화하여 근사화된 매칭을 수행하는 Sub-Block 방법과 영상의 에지 정보에 따라 적응적으로 시차 탐색 범위를 조정하는 방법을 제안한다. 결과적으로 제안된 기법은 기존 방식보다 좋은 매칭 정확도를 유지하면서도 효율적으로 계산 수행 시간을 줄이게 된다.

제스쳐 클리핑 영역 비율과 크기 변화를 이용한 손-동작 인터페이스 구현 (Implement of Hand Gesture Interface using Ratio and Size Variation of Gesture Clipping Region)

  • 최창열;이우범
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권1호
    • /
    • pp.121-127
    • /
    • 2013
  • 본 논문에서는 UI 시스템에서 포인팅 장비를 대신할 수 있는 컴퓨터 비전 기반의 제스쳐 형상의 영역 비율과 크기 변화 특징을 이용한 손-동작 인터페이스를 제안한다. 제안한 방법은 효과적인 손 영역 검출을 위해서 HSI 컬러 모델을 기반으로 손 영역의 피부 색상(Hue)과 채도(Saturation) 값을 혼합하여 적용함으로서 제스쳐 인식에 있어서 손 영역 이외의 피부색 영역을 제거할 수 있으며, 빛에 의한 잡음 영향을 줄이는데 효과적이다. 또한 제시되는 제스쳐의 정적인 포즈 인식이 아닌 실시간으로 변화하는 제스쳐 클리핑 영역에서의 손 영역 화소 비율과 크기 변화를 검출함으로써 계산량을 줄일 수 있으며, 보다 빠른 응답 속도를 보장한다. 제안한 컴퓨터 비전 기반의 포인팅 인터페이스는 우리가 이전 연구에서 구현한 자가 시력 측정 시스템에서 독립적인 포인팅 인터페이스로 적용한 결과, 평균적으로 86%의 제스쳐 인식률과 87%의 좌표이동 인식률을 보여 포인팅 인터페이스로의 활용도를 보였다.

휴먼 컴퓨터 인터페이스를 위한 실시간 시선 식별 (Real Time Gaze Discrimination for Human Computer Interaction)

  • 박호식;배철수
    • 한국통신학회논문지
    • /
    • 제30권3C호
    • /
    • pp.125-132
    • /
    • 2005
  • 본 논문에서는 실시간 시선 식별을 위한 능동적 적외선 조명을 기반으로 한 컴퓨터 비전 시스템을 제안하고자 한다. 현존하는 대다수의 시선 식별 방법은 고정된 얼굴에서만 원활하게 동작하고 개개인에 대한 교정 절차를 필요로 한다. 그러므로 본 논문에서는 교정 작업 없이 얼굴 움직임이 있는 경우에도 견실하고 정확하게 동작하는 시선 식별 시스템을 제안하고 있다. 제안된 시스템은 추출된 변수로부터 시선을 스크린 좌표로 매핑하기 위해 GRNN을 이용하였다. 동공을 추적하여 GRNN을 사용함으로서, 시선 매핑에 분석적 기능이나 얼굴 움직임에 대한 계산이 필요 없을 뿐 아니라 다른 개개인에 대하여 학습과정에서 매핑 기능을 일반화 할 수 있었다. 시선 예측 정확도를 개선하고자 계층적 식별을 제안함으로써 오분류를 줄일 수 있었고, 공간 시선 해상도는 스크린에서 1m 정도 떨어진 거리에서 수평으로 10cm, 수직으로 약 13cm, 즉 수평으로 8도 수직으로 5도 이었다. 실험 결과, 재식별 하였을 경우 1차 시선 식별시 84%보다 약 9% 정도 정확성이 향상되어 93%를 나타냄으로써 제안된 시스템의 유효성을 증명하였다.

컴퓨터 인터페이스를 위한 실시간 시선 식별 (Real Time Gaze Discrimination for Computer Interface)

  • 황선기;김문환
    • 한국정보전자통신기술학회논문지
    • /
    • 제3권1호
    • /
    • pp.38-46
    • /
    • 2010
  • 본 논문에서는 실시간 시선 식별을 위한 능동적 적외선 조명을 기반으로 한 컴퓨터 비전 시스템을 제안 하고자 한다. 현존하는 대다수의 시선 식별 방법은 고정된 얼굴에서만 원활하게 동작하고 개개인에 대한 교정 절차를 필요로 한다. 그러므로 본 논문에서는 교정 작업 없이 얼굴 움직임이 있는 경우에도 견실하고 정확하게 동작하는 시선 식별 시스템을 제안하고 있다. 제안된 시스템은 추출된 변수로부터 시선을 스크린 좌표로 매핑하기 위해 GRNN을 이용하였다. 동공을 추적하여 GRNN을 사용함으로서, 시선 매핑에 분석적 기능이나 얼굴 움직임에 대한 계산이 필요 없을 뿐 아니라 다른 개개인에 대하여 학습과정에서 매핑 기능을 일반화 할 수 있었다. 시선 예측 정확도를 개선하고자 계층적 식별을 제안함으로써 오분류를 줄일 수 있었고, 공간 시선 해상도는 스크린에서 1m 정도 떨어진 거리에서 수평으로 10cm, 수직으로 약 13cm, 즉 수평으로 8도 수직으로 5도 이었다. 실험 결과, 재식별 하였을 경우 1차 시선 식별시 84%보다 약 9% 정도 정확성이 향상되어 93%를 나타냄으로써 제안된 시스템의 유효성을 증명하였다.

  • PDF

고밀도 3D 형상 계측 시스템에서의 고속 시차 추정을 위한 NCC 알고리즘 기반 하드웨어 구조 (A hardware architecture based on the NCC algorithm for fast disparity estimation in 3D shape measurement systems)

  • 배경렬;권순;이용환;이종훈;문병인
    • 센서학회지
    • /
    • 제19권2호
    • /
    • pp.99-111
    • /
    • 2010
  • This paper proposes an efficient hardware architecture to estimate disparities between 2D images for generating 3D depth images in a stereo vision system. Stereo matching methods are classified into global and local methods. The local matching method uses the cost functions based on pixel windows such as SAD(sum of absolute difference), SSD(sum of squared difference) and NCC(normalized cross correlation). The NCC-based cost function is less susceptible to differences in noise and lighting condition between left and right images than the subtraction-based functions such as SAD and SSD, and for this reason, the NCC is preferred to the other functions. However, software-based implementations are not adequate for the NCC-based real-time stereo matching, due to its numerous complex operations. Therefore, we propose a fast pipelined hardware architecture suitable for real-time operations of the NCC function. By adopting a block-based box-filtering scheme to perform NCC operations in parallel, the proposed architecture improves processing speed compared with the previous researches. In this architecture, it takes almost the same number of cycles to process all the pixels, irrespective of the window size. Also, the simulation results show that its disparity estimation has low error rate.

타원체 모델과 깊이값 포인트 매칭 기법을 활용한 사람 움직임 추적 기술 (Human Motion Tracking based on 3D Depth Point Matching with Superellipsoid Body Model)

  • 김남규
    • 디지털콘텐츠학회 논문지
    • /
    • 제13권2호
    • /
    • pp.255-262
    • /
    • 2012
  • 사람 움직임 추적 알고리즘은 인간과 컴퓨터 상호작용, 화상회의, 감시 시스템, 게임 및 엔터테인먼트 분야에서 반드시 필요한 기술로 인식되고 있다. 과거 다양한 사람 움직임 추적 알고리즘들이 응용 프로그램의 특성에 따라 구현되고, 실시간성을 고려한 보다 효율적인 영상 처리, 컴퓨터 비전, 인터페이스 기술들을 적용하여 구현되고 있다. 본 논문에서는 타원체 형태의 신체 모델과 깊이값 정보를 갖는 3차원 점들과의 매칭을 통해 실시간으로 적용 가능한 움직임 추적 기술을 소개한다. 움직임 추적을 위한 기반 모델은 사람의 모습과 유사한 형태의 타원체 조합의 18개의 관절을 갖는 형태로 구성되어 지며, 영상으로부터 들어온 사람의 모습을 분석하여 일련의 신체 부위를 나누고, 그 정보를 바탕으로 역기구학 기반의 초기 자세를 추출한다. 초기 자세는 3차원 점 매칭 기법을 활용하여 보다 정확한 자세로 수정된다.

지역적 불변특징 기반의 3차원 환경인식 및 모델링 (Recognition and Modeling of 3D Environment based on Local Invariant Features)

  • 장대식
    • 한국컴퓨터정보학회논문지
    • /
    • 제11권3호
    • /
    • pp.31-39
    • /
    • 2006
  • 본 논문에서는 지능로봇. 지능형자동차. 지능형빌딩 등에 다양하게 활용될 수 있는 3차원 환경과 여기에 포함된 물체의 실시간 인식을 위한 새로운 접근 방법을 제안한다. 본 논문에서는 먼저 사람이 환경을 인식하고 상호작용하는 데 사용하는 3가지 기본 원칙을 설정하고, 이 기본 원칙들을 이용하여 실시간 3차원 환경 및 물체 인식을 위한 통합된 방법을 제시한다. 이들 3가지 기본 원칙은 다음과 같다. 첫째, 전역 적인 평면 특징들을 인식함으로써 작업환경의 기하학적 구조에 대한 개략적 특성화를 고속으로 진행한다. 둘째, 작업환경 속에서 기존에 알려진 물체를 먼저 빠르게 인식하고 이를 데이터베이스 내에 저장되어 있는 물체의 모델로 교체한다. 셋째, 다중 해상도 Octree 표현 방법을 이용하여 기타 영역을 주어진 작업의 필요에 따라 적응적으로 실시간 모델링 한다. 본 논문에서는 3차원 SIFT로 언급되는 3차원 좌표를 가지는 SIFT특징들을 3차원 좌표정보와 함께 확장하여 사용함으로서 전역적 평면 특징의 빠른 추출, 고속의 물체 인식, 빠른 장면 정합 등의 기능에 활용하고 이와 동시에 스테레오 카메라로부터 입력되는 3차원 좌표의 잡음과 불완전성을 극복한다.

  • PDF

YOLOv8 알고리즘 기반의 주행 가능한 도로 영역 인식과 실시간 추적 기법에 관한 연구 (Research on Drivable Road Area Recognition and Real-Time Tracking Techniques Based on YOLOv8 Algorithm)

  • 서정희
    • 한국전자통신학회논문지
    • /
    • 제19권3호
    • /
    • pp.563-570
    • /
    • 2024
  • 본 논문은 운전자의 운행 보조 역할로 주행 가능한 차선 영역을 인식하고 추적하는 방법을 제안한다. 주요 주제는 차량 내부의 앞 유리 중앙에 설치된 카메라를 통해 실시간으로 획득한 영상을 기반으로 컴퓨터 비전과 딥 러닝 기술을 활용하여 주행 가능한 도로 영역을 예측하는 심층 기반 네트워크를 설계한다. 본 연구는 YOLOv8 알고리즘을 이용하여 카메라에서 직접 획득한 데이터로 훈련한 새로운 모델을 개발하는 것을 목표한다. 실제 도로에서 자신의 차량의 정확한 위치를 실제 영상과 일치하게 시각화하여 주행 가능한 차선 영역을 표시 및 추적함으로써 운전자 운행의 보조하는 역할을 기대한다. 실험 결과, 대부분 주행 가능한 도로 영역의 추적이 가능했으나 밤에 비가 심하게 오는 경우와 같은 악천후에서 차선이 정확하게 인식되지 않는 경우가 발생하여 이를 해결하기 위한 모델의 성능 개선이 필요하다.