• 제목/요약/키워드: DETR

검색결과 6건 처리시간 0.019초

DETR 기반 객체탐지를 사용한 댄스 자세교정 방법 (Dance Posture Correction Method using DETR-based Object Detection)

  • 우상철;지수미;성연식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 추계학술발표대회
    • /
    • pp.41-42
    • /
    • 2020
  • 전 세계적으로 코로나 바이러스가 확산되면서 언택트 시대가 되었다. 언택트 시대에서는 대부분의 대면활동이 비대면으로 전환되고 있다. 전 세계적으로 열광중인 케이팝 댄스의 대중화를 위해 우리는 비대면으로 댄스 학습이 가능한 DETR 기반 객체탐지를 사용한 댄스 자세교정 연구를 제안한다. 본 논문에서 제안한 댄스 자세교정은 객체탐지에 DETR을 적용한 방식이다. DETR은 기존 객체탐지 모델에서 앵커박스, 바운딩박스 중복처리를 제거하는 NMS같은 휴리스틱한 방법을 사용하지 않고 트랜스포머를 통해 자동으로 학습하도록 만든 모델이다. DETR로 객체탐지를 한 후 강사와 사용자의 동작유사성을 샴 뉴럴 네트워크를 통해 계산한다.

비관리 해변의 해안 쓰레기 모니터링을 위한 RT-DETR 적용 방안 연구 (Study on the Application of RT-DETR to Monitoring of Coastal Debris on Unmanaged Coasts)

  • 도예빈;윤홍주
    • 한국전자통신학회논문지
    • /
    • 제19권2호
    • /
    • pp.453-466
    • /
    • 2024
  • 한정된 정점과 인력 기반의 조사로 실제 국내 표착되는 해안 쓰레기의 총용량 추정이 어려운 우리나라의 해안 쓰레기 모니터링 방식 개선을 위해 비관리 해변에서 UAV(: Unmanned Aerial Vehicle) 이미지와 RT-DETR 모델을 기반으로 해안 쓰레기 탐지하고 현장 조사와의 비교 연구로 해안 쓰레기의 정량적 탐지 및 자연 해안선 기준 우리나라에 표착되는 전체 쓰레기 총용량 추정 가능성을 제시하였다. RT-DETR(: Realtime DEtection TRansformer) 모델 학습 결과 mAP@0.5는 0.894, mAP@0.5:0.95는 0.693의 정확도를 보였다. 모델을 비관리 해변에 적용한 전체 해안 쓰레기 개수에 대한 정확도는 72.9%로 나타났다. 본 연구와 비관리 해변에 대한 모니터링을 정의하는 관리지침 마련 연구가 동반된다면 우리나라에 표착되는 전체 해안 쓰레기의 총 용량 추정이 가능할 것으로 기대된다.

해안쓰레기 탐지 및 모니터링에 대한 딥러닝 기반 객체 탐지 기술의 적용성 평가: YOLOv8과 RT-DETR을 중심으로 (Applicability Evaluation of Deep Learning-Based Object Detection for Coastal Debris Monitoring: A Comparative Study of YOLOv8 and RT-DETR)

  • 박수호;김흥민;김영민;이인지;박미소;오승열;김탁영;장선웅
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1195-1210
    • /
    • 2023
  • 해안쓰레기는 미관 훼손 및 생태와 보건에 미치는 영향으로 인해 큰 문제로 대두되고 있다. 이를 해결하기 위한 노력의 일환으로 본 연구는 해안쓰레기 탐지와 모니터링을 위한 이미지 데이터셋 구축과 실시간 객체 탐지 분야의 대표적인 모델인 YOLOv8과 RT-DETR의 성능을 비교하였다. 특히 다양한 환경 하에서의 강건성을 평가하기 위해 여러 왜곡 조건에서 성능 변화 실험을 수행하였다. YOLOv8은 mean Average Precision (mAP) 0.927~0.945의 정확도와 65~135 Frames Per Second (FPS)의 탐지 속도를 보인 반면, RT-DETR은 mAP 0.917~0.918의 정확도와 40~53 FPS의 탐지 속도를 보였다. 색상 왜곡에 대해서는 RT-DETR이 더 강건한 성능을 보였으나, 그 외의 조건에서는 YOLOv8이 더 높은 강건성을 보였다. 본 연구의 결과는 실제 해안쓰레기 모니터링 시스템의 모델 선택에 있어 중요한 지침을 제공할 것으로 기대된다.

Evaluating Chest Abnormalities Detection: YOLOv7 and Detection Transformer with CycleGAN Data Augmentation

  • Yoshua Kaleb Purwanto;Suk-Ho Lee;Dae-Ki Kang
    • International journal of advanced smart convergence
    • /
    • 제13권2호
    • /
    • pp.195-204
    • /
    • 2024
  • In this paper, we investigate the comparative performance of two leading object detection architectures, YOLOv7 and Detection Transformer (DETR), across varying levels of data augmentation using CycleGAN. Our experiments focus on chest scan images within the context of biomedical informatics, specifically targeting the detection of abnormalities. The study reveals that YOLOv7 consistently outperforms DETR across all levels of augmented data, maintaining better performance even with 75% augmented data. Additionally, YOLOv7 demonstrates significantly faster convergence, requiring approximately 30 epochs compared to DETR's 300 epochs. These findings underscore the superiority of YOLOv7 for object detection tasks, especially in scenarios with limited data and when rapid convergence is essential. Our results provide valuable insights for researchers and practitioners in the field of computer vision, highlighting the effectiveness of YOLOv7 and the importance of data augmentation in improving model performance and efficiency.

수중영상을 이용한 저서성 해양무척추동물의 실시간 객체 탐지: YOLO 모델과 Transformer 모델의 비교평가 (Realtime Detection of Benthic Marine Invertebrates from Underwater Images: A Comparison betweenYOLO and Transformer Models)

  • 박강현;박수호;장선웅;공신우;곽지우;이양원
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.909-919
    • /
    • 2023
  • Benthic marine invertebrates, the invertebrates living on the bottom of the ocean, are an essential component of the marine ecosystem, but excessive reproduction of invertebrate grazers or pirate creatures can cause damage to the coastal fishery ecosystem. In this study, we compared and evaluated You Only Look Once Version 7 (YOLOv7), the most widely used deep learning model for real-time object detection, and detection tansformer (DETR), a transformer-based model, using underwater images for benthic marine invertebratesin the coasts of South Korea. YOLOv7 showed a mean average precision at 0.5 (mAP@0.5) of 0.899, and DETR showed an mAP@0.5 of 0.862, which implies that YOLOv7 is more appropriate for object detection of various sizes. This is because YOLOv7 generates the bounding boxes at multiple scales that can help detect small objects. Both models had a processing speed of more than 30 frames persecond (FPS),so it is expected that real-time object detection from the images provided by divers and underwater drones will be possible. The proposed method can be used to prevent and restore damage to coastal fisheries ecosystems, such as rescuing invertebrate grazers and creating sea forests to prevent ocean desertification.

Prompting 기반 매개변수 효율적인 멀티 모달 영상 하이라이트 검출 연구 (Parameter-Efficient Multi-Modal Highlight Detection via Prompting)

  • 한동훈;남성욱;박은환;곽노준
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.372-376
    • /
    • 2023
  • 본 연구에서는 비디오 하이라이트 검출 및 장면 추출을 위한 경량화된 모델인 Visual Context Learner (VCL)을 제안한다. 기존 연구에서는 매개변수가 고정된 CLIP을 비롯한 여러 피쳐 추출기에 학습 가능한 DETR과 같은 트랜스포머를 이어붙여서 학습을 한다. 하지만 본 연구는 경량화된 구조로 하이라이트 검출 성능을 개선시킬 수 있음을 보인다. 그리고 해당 형태로 장면 추출도 가능함을 보이며 장면 추출의 추가 연구 가능성을 시사한다. VCL은 매개변수가 고정된 CLIP에 학습가능한 프롬프트와 MLP로 하이라이트 검출과 장면 추출을 진행한다. 총 2,141개의 학습가능한 매개변수를 사용하여 하이라이트 검출의 HIT@1(>=Very Good) 성능을 기존 CLIP보다 2.71% 개선된 성능과 최소한의 장면 추출 성능을 보인다.

  • PDF