• 제목/요약/키워드: Real Time Object Detection

검색결과 520건 처리시간 0.024초

딥러닝을 이용한 시각장애인용 횡단보도 탐지 모델 연구 (Crosswalk Detection Model for Visually impaired Using Deep Learning)

  • 김준수;이혁
    • 한국정보전자통신기술학회논문지
    • /
    • 제17권1호
    • /
    • pp.67-75
    • /
    • 2024
  • 복잡한 도시 환경에서 횡단보도는 보행자의 안전한 이동을 위해 중요한 역할을 한다. 하지만 시각 장애인에게는 횡단보도가 큰 위험 요소가 될 수 있다. 안전한 보행을 위한 점자 블록이나 음향 신호등과 같은 보조 시설들이 존재하지만, 부실한 관리로 인하여 때로는 오히려 안전을 저해하는 요소로 작용할 수 있다. 본 논문에서는 시각 장애인의 보행 보조를 위한 애플리케이션에 활용할 수 있는 딥러닝 기반 실시간 횡단보도 탐지 모델에 정확도 향상을 위한 방법을 제안한다. 횡단보도 이미지의 흰색 줄이 도로 표면과 대조를 이루는 특성을 활용하여 이미지를 이진화하고, 이를 통해 횡단보도를 더 잘 인식할 수 있게 하고 횡단보도 전체와 중간 부분을 각각 학습한 두 가지 모델을 활용하여 횡단보도의 위치를 더 정확하게 파악할 수 있도록 하였다. 또한 횡단보도를 인식하는 경계 상자를 전체와 부분의 두 단계로 생성하여 정확도를 높이고자 하였다. 이러한 방법을 통해 횡단보도 횡단 영상에서 RGB 이미지 학습에서 탐지 모델이 탐지하지 못한 프레임들을 추가로 탐지할 수 있었다.

Markerless camera pose estimation framework utilizing construction material with standardized specification

  • Harim Kim;Heejae Ahn;Sebeen Yoon;Taehoon Kim;Thomas H.-K. Kang;Young K. Ju;Minju Kim;Hunhee Cho
    • Computers and Concrete
    • /
    • 제33권5호
    • /
    • pp.535-544
    • /
    • 2024
  • In the rapidly advancing landscape of computer vision (CV) technology, there is a burgeoning interest in its integration with the construction industry. Camera calibration is the process of deriving intrinsic and extrinsic parameters that affect when the coordinates of the 3D real world are projected onto the 2D plane, where the intrinsic parameters are internal factors of the camera, and extrinsic parameters are external factors such as the position and rotation of the camera. Camera pose estimation or extrinsic calibration, which estimates extrinsic parameters, is essential information for CV application at construction since it can be used for indoor navigation of construction robots and field monitoring by restoring depth information. Traditionally, camera pose estimation methods for cameras relied on target objects such as markers or patterns. However, these methods, which are marker- or pattern-based, are often time-consuming due to the requirement of installing a target object for estimation. As a solution to this challenge, this study introduces a novel framework that facilitates camera pose estimation using standardized materials found commonly in construction sites, such as concrete forms. The proposed framework obtains 3D real-world coordinates by referring to construction materials with certain specifications, extracts the 2D coordinates of the corresponding image plane through keypoint detection, and derives the camera's coordinate through the perspective-n-point (PnP) method which derives the extrinsic parameters by matching 3D and 2D coordinate pairs. This framework presents a substantial advancement as it streamlines the extrinsic calibration process, thereby potentially enhancing the efficiency of CV technology application and data collection at construction sites. This approach holds promise for expediting and optimizing various construction-related tasks by automating and simplifying the calibration procedure.

실내 사람 위치 추적 기반 LSTM 모델을 이용한 고객 혼잡 예측 연구 (An Approach Using LSTM Model to Forecasting Customer Congestion Based on Indoor Human Tracking)

  • 채희주;곽경헌;이다연;김은경
    • 한국시뮬레이션학회논문지
    • /
    • 제32권3호
    • /
    • pp.43-53
    • /
    • 2023
  • 본 연구는 실내 상업적 공간, 특히 카페에서 보안 카메라를 이용해 방문자 수와 위치를 실시간으로 파악하고, 이를 통해 사용 가능한 좌석 정보와 혼잡도 예측을 제공하는 시스템의 개발을 목표로 한다. 우리는 실시간 객체 탐지 및 추적 알고리즘인 YOLO를 활용하여 방문자 수와 위치를 실시간으로 파악하며, 이 정보를 카페 실내 지도에 업데이트하여 카페 방문자가 사용 가능한 좌석을 확인할 수 있도록 한다. 또한, 우리는 vanishing gradient문제를 해결한 장단기 메모리(Long Short Term Memory, LSTM)와 시간적인 관계를 가지는 데이터를 처리하는데 유용한 시퀀스-투-시퀀스(Sequence-to-Sequence, Seq2Seq)기법을 활용해 다양한 시간 간격에 따른 방문자 수와 움직임 패턴을 학습하고, 이를 바탕으로 카페의 혼잡도를 실시간으로 예측하는 시스템을 개발하였다. 이 시스템은 카페의 관리자와 이용자 모두에게 예상 혼잡도를 제공함으로써, 카페의 운영 효율성을 향상시키고, 고객 만족도를 높일 수 있다. 본 연구에서는 보안 카메라를 활용한 실내 위치 추적 기술의 효용성을 입증하며, 상업적 공간에서의 활용 가능성과 더불어 미래 연구 방향을 제시한다.

YOLO 기반 외곽 사각형을 이용한 근접 돼지 분리 (Separation of Touching Pigs using YOLO-based Bounding Box)

  • 서지현;주미소;최윤창;이준희;정용화;박대희
    • 한국멀티미디어학회논문지
    • /
    • 제21권2호
    • /
    • pp.77-86
    • /
    • 2018
  • Although separation of touching pigs in real-time is an important issue for a 24-h pig monitoring system, it is challenging to separate accurately the touching pigs in a crowded pig room. In this study, we propose a separation method for touching pigs using the information generated from Convolutional Neural Network(CNN). Especially, we apply one of the CNN-based object detection methods(i.e., You Look Only Once, YOLO) to solve the touching objects separation problem in an active manner. First, we evaluate and select the bounding boxes generated from YOLO, and then separate touching pigs by analyzing the relations between the selected bounding boxes. Our experimental results show that the proposed method is more effective than widely-used methods for separating touching pigs, in terms of both accuracy and execution time.

시각장애인 안전을 위한 영상 기반 저비용 보행 공간 인지 알고리즘 (Vision-based Low-cost Walking Spatial Recognition Algorithm for the Safety of Blind People)

  • 강성현;이세훈;안준호
    • 인터넷정보학회논문지
    • /
    • 제24권6호
    • /
    • pp.81-89
    • /
    • 2023
  • 현대사회에서 시각장애인들은 도보, 승강기, 횡단보도 등 일반적인 환경에서 보행을 하는데 어려움이 있다. 시각장애인의 불편 해소를 위한 연구로 영상이나 음성을 이용한 연구가 있으며, 이런 연구는 고비용의 웨어러블 장치, 고성능 CCTV, 음성 센서 등을 사용하여 실생활에 적용하는 데는 한계가 있다. 본 논문에서 시각장애인이 보행 중에 안전한 이동을 위해서 스마트폰에 포함된 저비용의 영상 센서를 활용하여 주변 도보 공간을 인지하는 인공지능 융합 알고리즘을 제안한다. 제안된 알고리즘은 이동 중인 사람 탐지를 위해서 모션 캡처 알고리즘과 장애물 탐지를 위한 객체 탐지 알고리즘을 융합하여 개발하였다. 모션 캡처 알고리즘으로 mediapipe을 사용하여 이동 중에 있는 주변 보행자들을 모델링 및 탐지하였다. 객체 탐지 알고리즘을 사용했으며 도보 중에 발생하는 다양한 장애물을 모델링 하였다. 실험을 통하여 인공지능 융합 알고리즘을 검증했으며, 정확도 0.92, 정밀도 0.91, 재현율 0.99. F1 score 0.95로 결과를 얻어서 알고리즘의 성능을 확인하였다. 본 연구로 보행 중에 발생하는 볼라드, 공유 킥보드, 자동차 등의 주변 장애물 및 이동 중인 보행자 회피하여 시각장애인들의 통행에 도움을 줄 수 있다.

무선통신에 기반한 지능형 이동 감시 시스템 개발 (Intelligent Mobile Surveillance System Based on Wireless Communication)

  • 장재혁;심갑식
    • 한국콘텐츠학회논문지
    • /
    • 제15권2호
    • /
    • pp.11-20
    • /
    • 2015
  • 본 논문에서는 무인 자동 추적 감시를 위한 이진 CDMA 기반 지능형 이동 감시 시스템을 개발한다. 이는 기본적으로 CDMA와 TDMA의 장점을 복합적으로 적용한 이진 CDMA 무선 통신 기술을 이용하여 지능형 감시 시스템을 구현한다. 본 시스템은 네트워크상에서 실시간으로 현지 상황을 모니터링 할 수 있으며, 동시에 보안 감시 체계를 구현하여 다양한 상황별로 처리하도록 하였다. 개발된 시스템은 카메라를 이용한 객체의 360도 추적, PTZ(Pan/Tilt/Zoom) 카메라의 줌 기능에 의한 영상 확대, 영상 내 이동 객체의 식별 및 식별된 영상의 원거리 전송이 가능하다. 마지막으로, 대상 객체에 대한 감시 범위, 객체 확대 기능, 객체 탐지 수, 원격 전송된 영상 모니터링, 영상 출력 신호에 따른 초당 프레임 수 등과 같은 상황 설정한 모의실험을 통해 본 구현 시스템을 보여 줄 것이다.

센서 융합을 통한 물체 거리 측정 및 인식 시스템 (Object detection and distance measurement system with sensor fusion)

  • 이태민;김정환;임준홍
    • 전기전자학회논문지
    • /
    • 제24권1호
    • /
    • pp.232-237
    • /
    • 2020
  • 본 논문에서는 자율주행 자동차에 물체를 인식하고 거리를 측정하는데 효율적인 센서 융합을 제안한다. 자율주행 자동차에 사용되는 대표적인 센서는 레이더, 라이다, 카메라이다. 이 중 라이다 센서는 차량 주변의 맵을 만드는 역할을 한다. 하지만 날씨 조건에 성능이 하락하고 센서의 가격이 매우 비싸다는 단점 있다. 본 논문에서는 이러한 단점을 보완하고자 비교적 저렴하고 눈, 비, 안개에 지장 없는 레이더 센서로 거리를 측정하며 차량 주변을 관찰한다. 물체 인식률이 뛰어난 카메라 센서를 융합하여 물체 인식 및 거리를 측정한다. 융합된 영상은 IP서버를 통해 실시간으로 스마트폰에 전송되어 현재 차량의 상황을 내부, 외부에서 판단하는 자율주행 보조 시스템에 사용될 수 있다.

UAS 및 지상 LiDAR 융합기반 건축물의 3D 재현 (3D Reconstruction of Structure Fusion-Based on UAS and Terrestrial LiDAR)

  • 한승희;강준오;오성종;이용창
    • 도시과학
    • /
    • 제7권2호
    • /
    • pp.53-60
    • /
    • 2018
  • Digital Twin is a technology that creates a photocopy of real-world objects on a computer and analyzes the past and present operational status by fusing the structure, context, and operation of various physical systems with property information, and predicts the future society's countermeasures. In particular, 3D rendering technology (UAS, LiDAR, GNSS, etc.) is a core technology in digital twin. so, the research and application are actively performed in the industry in recent years. However, UAS (Unmanned Aerial System) and LiDAR (Light Detection And Ranging) have to be solved by compensating blind spot which is not reconstructed according to the object shape. In addition, the terrestrial LiDAR can acquire the point cloud of the object more precisely and quickly at a short distance, but a blind spot is generated at the upper part of the object, thereby imposing restrictions on the forward digital twin modeling. The UAS is capable of modeling a specific range of objects with high accuracy by using high resolution images at low altitudes, and has the advantage of generating a high density point group based on SfM (Structure-from-Motion) image analysis technology. However, It is relatively far from the target LiDAR than the terrestrial LiDAR, and it takes time to analyze the image. In particular, it is necessary to reduce the accuracy of the side part and compensate the blind spot. By re-optimizing it after fusion with UAS and Terrestrial LiDAR, the residual error of each modeling method was compensated and the mutual correction result was obtained. The accuracy of fusion-based 3D model is less than 1cm and it is expected to be useful for digital twin construction.

복합형 카메라 시스템을 이용한 자율주행 차량 플랫폼 (Autonomous Driving Platform using Hybrid Camera System)

  • 이은경
    • 한국전자통신학회논문지
    • /
    • 제18권6호
    • /
    • pp.1307-1312
    • /
    • 2023
  • 본 논문에서는 자율주행 인지 기술의 핵심 요소인 객체 인식과 거리 측정을 위해 서로 다른 초점거리를 가진 다시점 카메라와 라이다(LiDAR) 센서를 결합한 복합형 카메라 시스템을 제안한다. 제안한 복합형 카메라 시스템을 이용해 장면 안의 객체를 추출하고, 추출한 객체의 정확한 위치와 거리 정보를 생성한다. 빠른 계산 속도와 높은 정확도, 실시간 처리가 가능하다는 장점 때문에 자율주행 분야에서 많이 사용하고 있는 YOLO7 알고리즘을 이용해 장면 안의 객체를 추출한다. 그리고 객체의 위치와 거리 정보를 생성하기 위해 다시점 카메라를 이용해 깊이맵을 생성한다. 마지막으로 거리 정확도를 향상시키기 위해 라이다 센서에서 획득한 3차원 거리 정보와 생성한 깊이맵을 하나로 결합한다. 본 논문에서는 제안한 복합형 카메라 시스템을 기반으로 주행중인 주변 환경을 더욱 정확하게 인식함과 동시에 3차원 공간상의 정확한 위치와 거리 정보까지 생성할 수 있는 자율주행 차량 플랫폼을 제안하였으며, 이를 통해 자율주행 차량의 안전성과 효율성을 향상시킬 수 있을 것으로 기대한다.

인공지능형 스마트공장 데이터셋 구축 방법에 관한 연구 (A Study on Establishment Method of Smart Factory Dataset for Artificial Intelligence)

  • 박윤수;이상덕;최정훈
    • 한국인터넷방송통신학회논문지
    • /
    • 제21권5호
    • /
    • pp.203-208
    • /
    • 2021
  • 제조현장에서 작업자는 작업 지시서에 따라 제조 공정에 소재를 투입하고 투입 기록을 남기는 방식으로 운영해왔으나, 누락하는 경우가 많아 제품 LOT 추적이 안되는 경우가 발생하고 있었으며, 최근 스마트공장 구축으로 RFID-Tag를 활용하여 소재 투입 정보를 자동입력 하는 시스템으로 진행되고 있다. 특히, 생산라인에 투입되는 RACK에 부착된 TAG 정보를 수신하여 RACK(TAG) ID와 RACK 투입시간 데이터 분석을 통한 투입정보를 자동으로 생성토록 하여 초기 자동인식률이 97%로 양호하였으나 멀티소재 사용 RACK, TAG분실, 신규 제품 투입 이슈 등이 발생하면서 자동인식률이 계속 낮아지는 상황이다. 인공지능형 스마트공장 데이터셋 구축 방법은 자동인식률 향상과 실시간 모니터링이 가능해지므로 생산 공정의 전반에 있어 속도와 수율(정상제품 비율)을 높이는데 기여할 것으로 기대한다.