• 제목/요약/키워드: Real Time Object Detection

검색결과 512건 처리시간 0.029초

Design of Image Extraction Hardware for Hand Gesture Vision Recognition

  • Lee, Chang-Yong;Kwon, So-Young;Kim, Young-Hyung;Lee, Yong-Hwan
    • 한국정보기술학회 영문논문지
    • /
    • 제10권1호
    • /
    • pp.71-83
    • /
    • 2020
  • In this paper, we propose a system that can detect the shape of a hand at high speed using an FPGA. The hand-shape detection system is designed using Verilog HDL, a hardware language that can process in parallel instead of sequentially running C++ because real-time processing is important. There are several methods for hand gesture recognition, but the image processing method is used. Since the human eye is sensitive to brightness, the YCbCr color model was selected among various color expression methods to obtain a result that is less affected by lighting. For the CbCr elements, only the components corresponding to the skin color are filtered out from the input image by utilizing the restriction conditions. In order to increase the speed of object recognition, a median filter that removes noise present in the input image is used, and this filter is designed to allow comparison of values and extraction of intermediate values at the same time to reduce the amount of computation. For parallel processing, it is designed to locate the centerline of the hand during scanning and sorting the stored data. The line with the highest count is selected as the center line of the hand, and the size of the hand is determined based on the count, and the hand and arm parts are separated. The designed hardware circuit satisfied the target operating frequency and the number of gates.

실험적 교정상수를 사용한 가변문턱값에 기초한 영상 쌍에서의 강인한 이상 물체 검출 (Robust Outlier-Object Detection in Image Pairs Based on Variable Threshold Using Empirical Correction Constant)

  • 김동식
    • 대한전자공학회논문지SP
    • /
    • 제46권1호
    • /
    • pp.14-22
    • /
    • 2009
  • 동일한 위치에서 같은 장면을 담고 있지만 서로 다른 시간에 획득된 두 영상의 차를 구하여 이상점의 집합을 검출할 수 있다. 이때 영상들의 서로 다른 밝기 특성에 의한 영향을 줄이기 위하여 다항식 회귀모델에 근거하여 반복적으로 회귀분석을 적용하여 밝기 보정을 하고, 서로 다른 분산의 영향을 줄여서 강인한 검출을 수행하기 위하여 영상 차를 잡음의 분산을 사용하여 정규화 한 잔차(residual)를 사용한다. 따라서 잡음분산의 정확한 추정은 강인한 이상 물체 검출에 매우 중요하다. 본 논문에서는 정확한 추정을 위하여, 실험적으로 구하는 교정상수의 도입을 제안하였으며, 여러 합성 영상에 적용하여 그 성능이 우수함을 확인하였으며, 실제 영상에 적용하여 임의의 문턱 값 선정에도 강인하게 동작하는 이상 물체 검출 알고리듬을 제안하였다.

딥러닝을 위한 모폴로지를 이용한 수중 영상의 세그먼테이션 (Segmentation of underwater images using morphology for deep learning)

  • 이지은;이철원;박석준;신재범;정현기
    • 한국음향학회지
    • /
    • 제42권4호
    • /
    • pp.370-376
    • /
    • 2023
  • 수중영상은 수중 잡음과 낮은 해상도로 표적의 형상과 구분이 명확하지 않다. 그리고 딥러닝의 입력으로 수중영상은 전처리가 필요하며 Segmentation이 선행되어야 한다. 전처리를 하여도 표적은 명확하지 않으며 딥러닝에 의한 탐지, 식별의 성능도 높지 않을 수 있다. 따라서 표적을 구분하며 명확하게 하는 작업이 필요하다. 본 연구에서는 수중영상에서 표적 그림자의 중요성을 확인하고 그림자에 의한 물체 탐지 및 표적 영역 획득, 그리고 수중배경이 없는 표적과 그림자만의 형상이 담긴 데이터를 생성하며 더 나아가 픽셀값이 일정하지 않은 표적과 그림자 영상을 표적은 흰색, 그림자는 흑색, 그리고 배경은 회색의 3-모드의 영상으로 변환하는 과정을 제시한다. 이를 통해 딥러닝의 입력으로 명확히 전처리된 판별이 용이한 영상을 제공할 수 있다. 또한 처리는 Open Source Computer Vision(OpenCV)라이브러리의 영상처리 코드를 사용했으면 처리 속도도 역시 실시간 처리에 적합한 결과를 얻었다.

Joint Reasoning of Real-time Visual Risk Zone Identification and Numeric Checking for Construction Safety Management

  • Ali, Ahmed Khairadeen;Khan, Numan;Lee, Do Yeop;Park, Chansik
    • 국제학술발표논문집
    • /
    • The 8th International Conference on Construction Engineering and Project Management
    • /
    • pp.313-322
    • /
    • 2020
  • The recognition of the risk hazards is a vital step to effectively prevent accidents on a construction site. The advanced development in computer vision systems and the availability of the large visual database related to construction site made it possible to take quick action in the event of human error and disaster situations that may occur during management supervision. Therefore, it is necessary to analyze the risk factors that need to be managed at the construction site and review appropriate and effective technical methods for each risk factor. This research focuses on analyzing Occupational Safety and Health Agency (OSHA) related to risk zone identification rules that can be adopted by the image recognition technology and classify their risk factors depending on the effective technical method. Therefore, this research developed a pattern-oriented classification of OSHA rules that can employ a large scale of safety hazard recognition. This research uses joint reasoning of risk zone Identification and numeric input by utilizing a stereo camera integrated with an image detection algorithm such as (YOLOv3) and Pyramid Stereo Matching Network (PSMNet). The research result identifies risk zones and raises alarm if a target object enters this zone. It also determines numerical information of a target, which recognizes the length, spacing, and angle of the target. Applying image detection joint logic algorithms might leverage the speed and accuracy of hazard detection due to merging more than one factor to prevent accidents in the job site.

  • PDF

깊이 영상의 평면 검출 기반 3차원 정합 기법을 이용한 상지 부종의 부피 측정 기술 (Volume measurement of limb edema using three dimensional registration method of depth images based on plane detection)

  • 이원희;김광기;정승현
    • 한국멀티미디어학회논문지
    • /
    • 제17권7호
    • /
    • pp.818-828
    • /
    • 2014
  • After emerging of Microsoft Kinect, the interest in three-dimensional (3D) depth image was significantly increased. Depth image data of an object can be converted to 3D coordinates by simple arithmetic calculation and then can be reconstructed as a 3D model on computer. However, because the surface coordinates can be acquired only from the front area facing Kinect, total solid which has a closed surface cannot be reconstructed. In this paper, 3D registration method for multiple Kinects was suggested, in which surface information from each Kinect was simultaneously collected and registered in real time to build 3D total solid. To unify relative coordinate system used by each Kinect, 3D perspective transform was adopted. Also, to detect control points which are necessary to generate transformation matrix, 3D randomized Hough transform was used. Once transform matrices were generated, real time 3D reconstruction of various objects was possible. To verify the usefulness of suggested method, human arms were 3D reconstructed and the volumes of them were measured by using four Kinects. This volume measuring system was developed to monitor the level of lymphedema of patients after cancer treatment and the measurement difference with medical CT was lower than 5%, expected CT reconstruction error.

컴퓨터 비젼 응용을 위한 태스크 레벨 파이프라인 멀티컴퓨터 RV860-PIPE의 구현 (Implementation of a Task Level Pipelined Multicomputer RV860-PIPE for Computer Vision Applications)

  • 이충환;김준성;박규호
    • 전자공학회논문지B
    • /
    • 제33B권1호
    • /
    • pp.38-48
    • /
    • 1996
  • 본 논문에서는 컴퓨터 비젼응용을 위한 태스크레벨 파이프라인 멀티컴퓨터인 "RV860-PIPE(Realtime Vision i860 system using PIPEline)"를 구현하고 성능평가 하였다. RV860-PIPE는 MIMD형태의 아키텍쳐를 가지며, 시각처리에 적합한 ring 형태의 상호연결망(interconnection network)을 갖는 매시지 패싱타입의 컴퓨터로 구현되었다. RV860-PIPE의 단위 노드 컴퓨터는 일반적인 시각알고리즘의 수행을 위하여 법용성과 강력한 처리능력을 갖도록 64-bit 프로세서를 사용하여 설계하였다. 또한 단위 노드간 양방향 통신 및 영상 입출력기와의 통신 부담을 덜기 위한 전용화된 고속 통신 채널을 설계하였다. 구현된 시스템은 edge 검출, 실시간 이동물체 추적, 실시간 얼굴인식과 같은 시각 처리 응용프로그램들을 성능평가함으로써 컴퓨터 비젼응용에 실용적으로 적용가능함을 보였다.

  • PDF

5G를 탑재한 AI 디바이스 통신 시스템의 설계 및 실험 (The Design and Experiment of AI Device Communication System Equipped with 5G)

  • 한성일;이대식;한지환;문현진;임창민;이상구
    • 디지털산업정보학회논문지
    • /
    • 제19권2호
    • /
    • pp.69-78
    • /
    • 2023
  • In this paper, IO+5G dedicated hardware is developed and an AI device communication system equipped with a 5G is designed and tested. The AI device communication system equipped with a 5G receives the collected real-time images and the information collected from the IoT sensor in real time is to analyze the information and generates the risk detection events in the AI processing board. The event generated in the AI processing board creates a 5G channel in the dedicated hardware equipped with IO+5G. The created 5G channel delivers event video to the control video server. The 5G based dongle network enables faster data collection and more precise data measurement compared to wireless LAN and 5G routers. As a result of the experiment in this paper, the average test result of the 5G dongle network is about 51% faster than the Wi-Fi average test result in downlink and about 40% faster in uplink. In addition, when comparing the test result with terms of the 5G rounter to be set to 80% upload and 20% download, the average test result is that the 5G dongle network is about 11.27% faster when downloading and about 17.93% faster when uploading. when comparing the test result with terms of the the router to be set to 60% upload and 40% download, the 5G dongle network is about 11.19% faster when downlinking and about 13.61% faster when uplinking. Therefore, in this paper it describes that the developed 5G dongle network can improve the results by collecting data and analyzing it faster than wireless LAN and 5G routers.

인공지능 기반 컨테이너 적재 안전관리 시스템 연구 (Research on Artificial Intelligence Based Shipping Container Loading Safety Management System)

  • 김상우;오세영;서용욱;연정흠;조희정;윤주상
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제12권9호
    • /
    • pp.273-282
    • /
    • 2023
  • 최근 스마트항만을 구축하기 위해 ICT 기술이 적용된 물류 자동화, 항만 운영 자동화 등 다양한 기술이 개발 중이다. 하지만 항만 안전과 안전사고를 예방하기 위한 기술 개발은 부족한 상황이다. 이에 본 논문에서는 항만 내 컨테이너 적재 공간에서 발생할 수 있는 안전사고를 예방하기 위한 인공지능 기반 컨테이너 적재 안전관리 시스템을 제안한다. 이 시스템은 인공지능 기반 컨테이너 안전사고 위험도 분류 및 저장 기능과 실시간 안전사고 모니터링 기능으로 구성되어 있다. 이 시스템은 실시간으로 현장의 사고 위험도를 모니터링하며 이를 통해 컨테이너 붕괴사고를 예방할 수 있다. 제안된 시스템은 프로토타입으로 개발되어 직접 항만에 적용하여 시스템을 평가하였다.

환자움직임 감지를 위한 효율적인 하드웨어 및 소프트웨어 혼성 모드 영상처리시스템설계에 관한 연구 (A study on the design of an efficient hardware and software mixed-mode image processing system for detecting patient movement)

  • 정승민;정의성;김명환
    • 인터넷정보학회논문지
    • /
    • 제25권1호
    • /
    • pp.29-37
    • /
    • 2024
  • 본 논문에서는 환자와 같은 특정 객체의 움직임을 감지하고 추적하기 위한 효율적인 영상처리 시스템을 제안한다. 이진화된 차 영상에서 객체의 윤곽선추출을 위하여 기존 알고리즘대비 대비 정밀한 감지가 가능하고 혼성모드설계에 용이한 세선화 알고리즘을 적용하여 영역을 추출한다. 연산량이 많은 이진화와 세선화 단계를 RTL(Register Transfer Level) 기반으로 설계하여 논리회로 합성을 거쳐 최적화된 하드웨어 블록으로 대체된다. 설계된 이진화 및 세선화 블록은 표준 180n CMOS 라이브러리를 이용하여 논리회로로 합성한 후 시뮬레이션을 통하여 동작을 검증하였다. 소프트웨어기반의 성능비교를 위해 32bit FPGA 임베디드시스템 환경에서 640 × 360 해상도의 샘플 영상을 적용하여 이진 및 세선화 연산에 대한 성능분석도 실시하였다. 검증결과 혼성모드 설계가 이전의 소프트웨어로만 이루어지는 처리속도에서 이진 및 세선화 단계에서 93.8% 향상될 수 있음을 확인하였다. 제안된 객체인식을 위한 혼성모드 시스템은 인공지능 네트워크가 적용되지 않는 엣지 컴퓨팅 환경에서도 환자의 움직임을 효율적으로 감시할 수 있을 것으로 기대된다.

Photo Diode Sensor를 이용한 컬러정보 분석 (Analysis of Color Information by Photo Diode Sensor)

  • 김지선;정구인;임성환;이영재;이필재;이정환;김경섭;전재훈
    • 전기학회논문지
    • /
    • 제60권5호
    • /
    • pp.1049-1054
    • /
    • 2011
  • Color is discerned due to the reflectance of object and its hue is determined by the Ratio of RGB spectrum. The aim of this study is to evaluate the Color information using by the optical system in terms of convenience and simplicity. Firstly, the differential Ratio of RGB is evaluated by photodiode Sensor which achieves a high efficiency with quick tranducer output. To extract the information of RGB Ratio, light emitting diode is built in Color sensing system with photodiode. Our proposed method is very economical, simple, and convenient. Our results can be applied to confirm the accurate information of Color in the research environments and commercial purposes. Thus RGB information can be determined subjectively and thus, the inherent characteristic of Color will be revealed precisely and its related features can be resolved in a real time mode.