• Title/Summary/Keyword: yolo

Search Result 398, Processing Time 0.025 seconds

Intelligent Activity Recognition based on Improved Convolutional Neural Network

  • Park, Jin-Ho;Lee, Eung-Joo
    • Journal of Korea Multimedia Society
    • /
    • v.25 no.6
    • /
    • pp.807-818
    • /
    • 2022
  • In order to further improve the accuracy and time efficiency of behavior recognition in intelligent monitoring scenarios, a human behavior recognition algorithm based on YOLO combined with LSTM and CNN is proposed. Using the real-time nature of YOLO target detection, firstly, the specific behavior in the surveillance video is detected in real time, and the depth feature extraction is performed after obtaining the target size, location and other information; Then, remove noise data from irrelevant areas in the image; Finally, combined with LSTM modeling and processing time series, the final behavior discrimination is made for the behavior action sequence in the surveillance video. Experiments in the MSR and KTH datasets show that the average recognition rate of each behavior reaches 98.42% and 96.6%, and the average recognition speed reaches 210ms and 220ms. The method in this paper has a good effect on the intelligence behavior recognition.

Design of Automation (RPA) for uploading workout videos to YouTube highlights through deep learning facial expression recognition (딥러닝 표정 인식을 통한 운동 영상 유튜브 하이라이트 업로드 자동화(RPA) 설계)

  • Shin, Dong-Wook;Moon, NamMee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.655-657
    • /
    • 2022
  • 본 논문은 유튜브에 업로드 된 운동 영상을 시청하는 사람의 얼굴 영역을 YoloV3을 이용하여 얼굴 영상에서 눈 및 입술영역을 검출하는 방법을 연구하여, YoloV3은 딥 러닝을 이용한 물체 검출 방법으로 기존의 특징 기반 방법에 비해 성능이 우수한 것으로 알려져 있다. 본 논문에서는 영상을 다차원적으로 분리하고 클래스 확률(Class Probability)을 적용하여 하나의 회귀 문제로 접근한다. 영상의 1 frame을 입력 이미지로 CNN을 통해 텐서(Tensor)의 그리드로 나누고, 각 구간에 따라 객체인 경계 박스와 클래스 확률을 생성해 해당 구역의 눈과 입을 검출한다. 검출된 이미지 감성 분석을 통해, 운동 영상 중 하이라이트 부분을 자동으로 선별하는 시스템을 설계하였다.

Deep Learning-Based Pressure Ulcer Image Object Detection Study (딥러닝 기반 욕창 이미지 객체 탐지 연구)

  • Seo, Jin-Beom;Lee, Jae-Seong;Yu, Ha-Na;Cho, Young-Bok
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2022.07a
    • /
    • pp.311-312
    • /
    • 2022
  • 본 논문에서는 딥러닝 기반 욕창 감지를 위한 욕창 객체 탐지를 연구한다. 객체 탐지 딥러닝 기법으로 RCNN, Fast R-CNN, Faster R-CNN, YOLO 등 다양한 기법이 존재하며, 각 모델의 특징 또한 다르다. 욕창은 단계별로 피부, 조직에 손상의 정도가 다르다. 낮은 단계의 경우 일반적인 피부색과 유사하게 나타나며, 높은 단계의 경우 근육, 뼈, 지지 조직 등의 괴사로 인해 삼출물 또는 괴사조직이 나타난다. 논문에서는 One-Stage Detection 기법인 YOLO를 기반으로 욕창 이미지 내부에서 욕창 탐지를 진행한다. 현재 보유하고 있는 이미지 데이터 수가 많지 않아 데이터 증강기법을 통해 데이터를 증강하여 학습에 활용하였다.

  • PDF

Mask and Maskless Wearers Detection based on Deep Learning (딥러닝 기반 마스크 착용자 및 미착용자 검출)

  • Kim, Taehyeon;Woo, Seunghee;Kim, Jeongmi;Choi, Haechul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.325-327
    • /
    • 2021
  • 코로나19 전염병 예방을 위한 공공장소에서의 마스크 착용이 의무화되고 있다. 그러나 사람들이 다양한 이유로 마스크를 제대로 착용하지 않아 감염에 노출되는 위험이 발생하고 있다. 이러한 방역 문제를 해결하고 본 논문은 영상을 인식하여 마스크를 쓴 얼굴과 쓰지 않은 얼굴을 검출하는 방식을 제안한다. 제안 방법은 마스크 착용자와 비착용자 얼굴 영상을 딥러닝 기반의 YOLO 네트워크로 학습하여, 마스크 착용 유무를 판별한다. 동일 YOLO 네트워크에 대해 여러가지 조건으로 학습을 수행하고, 학습에 사용되지 않은 검증 데이터를 이용해 정확도가 가장 높은 네트워크의 가중치를 선택하였다. 실험결과, 마스크 착용자는 67.2%, 미착용자는 39.8%의 판별 정확도를 보였다. 미착용자에 대해 낮은 정확도를 보인 이유는 학습 데이터의 부족으로 판단되며, 이를 보완하기 위하여 더 많은 학습데이터를 제작하여 성능을 개선시키고자 한다.

  • PDF

YOLO based Drone detection on Embeded Board (임베디드 보드에서의 YOLO 기반 드론 탐지)

  • Yu, ByeungHo;Park, HanBin;Kim, MinSung;Choi, Haechul
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.335-337
    • /
    • 2021
  • 최근 드론의 용도는 취미, 공연, 농업, 안전, 군사, 연구, 물자수송 등 다양한 분야와 목적으로 활용되고 있다. 더불어 드론의 불법적 활용으로 인한 안전 및 법적 문제 또한 빈번히 발생하고 있어, 이런 문제들을 예방하기 위한 드론의 탐지 기술이 활발히 연구되고 있다. 본 논문은 카메라로 촬영된 영상에서 조류와 같은 다른 객체와 구별하여 드론을 탐지하는 기술과 상공에서 바라본 객체들을 탐지하는 기술을 구현한다. 제안 방법은 딥러닝 기반의 YOLOv4를 사용하였다. UAV_123 데이터세트로 학습한 실험 결과, mAP는 85%, Recall은 85%, Precision은 81%의 정확도를 보였다. 제안 방법은 인명 구조, 배송, 건축 뿐만 아니라 안티 드론 시장에서도 효과적으로 활용될 수 있을 것으로 기대된다.

  • PDF

Detection of Helmet on Electric Scooter (전동 킥보드 헬멧 착용 탐지)

  • Lee, Seon-yeop;Fu, Shirong;Park, Jong-il
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.201-204
    • /
    • 2021
  • 최근 전동 킥보드 사용량이 크게 늘었으나, 다른 이동수단 대비 낮은 안정성과 사용자들의 헬멧 착용에 대한 인식 부족으로 인해 사고의 위험성이 큰 상황이다. 이에 대하여 정부는 헬멧 착용을 강제하는 법률을 제정하였으나, 경찰력의 한계에 따른 단속 미비로 여전히 헬멧 착용율은 낮다. 본 연구는 YOLO v3 알고리즘을 통해 학습시킨 딥러닝 모델을 활용하여 도로 상황을 촬영한 동영상 내에서 헬멧 착용자와 미착용자를 구분하고 미착용자 탐지 시 알람을 제공하는 시스템을 제시한다. 기존 YOLO 알고리즘 및 신경망을 적용하되, 전동 킥보드 데이터를 새로 수집하고 클래스를 구분하여 학습시켰다. 소수의 탐지 및 분류 오류를 보정하기 위해, 히스토그램 간 유사도를 측정해 최종적으로 객체를 추적 및 확정하고, 객체에 대한 헬멧 착용 여부를 통계적으로 확인한다.

  • PDF

Transformer and Spatial Pyramid Pooling based YOLO network for Object Detection (객체 검출을 위한 트랜스포머와 공간 피라미드 풀링 기반의 YOLO 네트워크)

  • Kwon, Oh-Jun;Jeong, Je-Chang
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • fall
    • /
    • pp.113-116
    • /
    • 2021
  • 일반적으로 딥러닝 기반의 객체 검출(Object Detection)기법은 합성곱 신경망(Convolutional Neural Network, CNN)을 통해 입력된 영상의 특징(Feature)을 추출하여 이를 통해 객체 검출을 수행한다. 최근 자연어 처리 분야에서 획기적인 성능을 보인 트랜스포머(Transformer)가 영상 분류, 객체 검출과 같은 컴퓨터 비전 작업을 수행하는데 있어 경쟁력이 있음이 드러나고 있다. 본 논문에서는 YOLOv4-CSP의 CSP 블록을 개선한 one-stage 방식의 객체 검출 네트워크를 제안한다. 개선된 CSP 블록은 트랜스포머(Transformer)의 멀티 헤드 어텐션(Multi-Head Attention)과 CSP 형태의 공간 피라미드 풀링(Spatial Pyramid Pooling, SPP) 연산을 기반으로 네트워크의 Backbone과 Neck에서의 feature 학습을 돕는다. 본 실험은 MSCOCO test-dev2017 데이터 셋으로 평가하였으며 제안하는 네트워크는 YOLOv4-CSP의 경량화 모델인 YOLOv4s-mish에 대하여 평균 정밀도(Average Precision, AP)기준 2.7% 향상된 검출 정확도를 보인다.

  • PDF

A Study on the Automatic Door Speed Control Design by the Identification of Auxiliary Pedestrian Using Artificial Intelligence (AI) (인공지능(AI)를 활용한 보조보행기구 식별에 따른 자동문 속도 조절 설계에 대한 연구)

  • Kim, yu-min;Choi, kyu-min;Shin, jun-pyo;Seong, Seung-min;Lee, byung-kwon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2021.01a
    • /
    • pp.237-239
    • /
    • 2021
  • 본 논문에서는 YOLO 시스템을 사용하여 보조 보행 기구를 인식 한 후 자동문 속도 조절에 대한 방법을 제안한다. Visual studio, OpenCV, CUDA를 활용하여 보조 보행 기구를 인식이 가능하게 신경망 훈련 및 학습 한 데이터를 기반으로 Raspberry Pi, 카메라 모듈을 활용하여 실시간 모니터링을 통해 보조 보행 기구를 인식하여 자동문의 속도를 조절을 구현했다. 이로써 거동이 불편한 장애인은 원활하게 건물 출입이 가능하다.

  • PDF

A Study on Tower Recognition Method for AI Learning (AI 학습을 위한 탑 인식 방법에 대한 연구)

  • Kang, Eunsu;Ko, Byeongguk;Lee, JoSun;Choi, Hajin;Kim, Jun O;Lee, Byongkwon
    • Proceedings of the Korean Society of Computer Information Conference
    • /
    • 2020.07a
    • /
    • pp.339-342
    • /
    • 2020
  • 본 논문에서는 AI 학습을 위한 데이터 수집을 위해 윈도우 환경에서 YOLO 시스템을 사용한 객체 인식에 대한 방법을 제안한다. 이 방법은 아나콘다, 리눅스 등의 가상환경을 요구하지 않기 때문에 실사용 이전 사전 환경설정 작업 시간을 최소화한다. 또한 이 방법은 Visual Studio, OpenCV, CUDA 등 익숙한 플랫폼 및 라이브러리를 요구하기 때문에 다른 사람들에게 편안한 작업환경 제공한다. 또한 기존의 COCO 데이터 셋을 사용한 YOLOv3가 아닌 추가 학습 방법을 제안함으로써 보다 보편적인 객체 인식이 가능하다. 따라서 빠른 시간 내에 자신이 원하는 객체를 인식할 수 있는 시스템을 구축하는 방법을 제안한다.

  • PDF

A Technique for detecting a person hidden behind an object in a fire situation (Guided Attention Mechanism을 활용한 화재사고 시 물체에 가려진 사람 탐지 기법)

  • Yeon-Jun Yoo;;Yong-Tae Shin
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.740-742
    • /
    • 2023
  • 객체 인식 연구에 있어서 딥러닝 기반의 사람 인식에 있어서 많은 연구들이 공개되고 있다. 특히 화재사고에 있어서 연기로 인해 가시성이 떨어져 인명구조에 어려움이 발생한다. 이에 열화상 카메라와 딥러닝을 통해 사람을 인식하는 기술이 연구되고 있다. 기존 연구에서는 열화상 카메라와 YOLO 딥러닝을 통해 사람을 인식하는데 95%의 성능을 보였지만, YOLO는 그리드 셀에서 하나의 분류만하기 때문에 물체에 가려진 사람을 판별하는데 정확도가 낮았다. 본 논문에서는 이와 같은 한계를 극복하기 위해 기존 Faster R-CNN 알고리즘을 사용한다. 신체부위 Guided Attention mechanism을 사용하여 가중치를 준 Feature Map을 RPN에 적용시켜 학습모델을 구현한다면 더 높은 정확도를 얻을 수 있다. 향후 본 논문에서 제안하는 기법은 많은 실험과 다양한 데이터 셋을 통해 실질적인 검증을 할 예정이다.