• 제목/요약/키워드: Image deep learning

검색결과 1,806건 처리시간 0.027초

CNN 기반 공조 덕트 청소 로봇의 교차점 검출 알고리듬 개발 (Development of a CNN-based Cross Point Detection Algorithm for an Air Duct Cleaning Robot)

  • 이사랑;노은솔;홍석무
    • 한국산학기술학회논문지
    • /
    • 제21권8호
    • /
    • pp.1-8
    • /
    • 2020
  • 건물 내부 공기 순환을 위한 공조 덕트는 장기간 사용 시 오염물질이 내부에 쌓여 인력 또는 로봇이 투입되어 청소가 주기적으로 수행된다. 청소는 작업시간과 인건비 문제를 해결하기 위해 최근 원격 조정으로 로봇을 작동시키는 방법이 사용되고 있다. 하지만 완전 자동화가 아니라 인력 의존적이며 청소 시간 단축에도 한계가 있다. 본 연구는 공조 덕트 청소 로봇 자율 주행을 위해 교차점 검출 알고리듬 개발에 대한 것이다. 자율 주행은 청소 로봇에 장착된 카메라 영상에서 교차점 검출 알고리듬을 통해 추출된 점과 중심점 사이의 거리 및 각도를 계산하여 로봇을 제어하도록 구성된다. 교차점 검출을 위한 데이터는 3D CAD 프로그램을 이용한 공조 덕트 내부 이미지를 Python을 이용해 교차점 좌표 및 두 경계선 각도를 추출하여 생성했다. 검출 알고리듬은 딥러닝 중 CNN 모델이 학습에 사용됐으며 학습 모델은 입력이미지에서 교차점 정보를 추출하며 학습 모델 정확도는 면적과 거리를 이용해 판단했다. 알고리듬 검증을 위해 청소 로봇을 제작했으며 로봇은 몸체, Raspberry Pi, 카메라 및 초음파 센서를 포함한 제어부, 모터와 바퀴를 포함한 구동부로 구성된다. 알고리듬을 탑재한 로봇 청소기 주행 영상을 통해 알고리듬을 검증했다. 향후 공조 덕트뿐만 아니라 에스컬레이터 등 다양한 환경에서 적용 가능할 것으로 기대된다.

CNN 기법을 활용한 운전자 시선 사각지대 보조 시스템 설계 및 구현 연구 (A Study on Design and Implementation of Driver's Blind Spot Assist System Using CNN Technique)

  • 임승철;고재승
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권2호
    • /
    • pp.149-155
    • /
    • 2020
  • 한국도로교통공단은 교통사고분석시스템(TAAS)을 활용하여 2015년부터 발생한 교통사고 원인을 분석한 통계를 제공하고 있다. 교통사고 발생 주요 원인으로, 2018년 한해 전체 교통사고 발생원인 중 전방주시 부주의가 대부분의 원인임을 TAAS를 통해 발표했다. 교통사고 원인에 대한 통계자료의 세부항목으로 운전 중 스마트폰 사용, DMB 시청 등의 안전운전 불이행 51.2%와 안전거리 미확보 14%, 보행자 보호의무 위반 3.6% 등으로, 전체적으로 68.8%의 비율을 보여준다. 본 논문에서는 Deep Learning의 알고리듬 중 CNN(Convolutional Neural Network)를 활용하여 첨단 운전자 보조 시스템 ADAS(Advanced Driver Assistance Systems)을 개선한 시스템을 제안하고자 한다. 제안된 시스템은 영상처리에 주로 사용되는 Conv2D 기법을 사용하여 운전자의 얼굴과 눈동자의 조향을 분류하는 모델을 학습하고, 차량 전방에 부착된 카메라로 자동차의 주변 object를 인지 및 검출하여 주행환경을 인지한다. 그 후, 학습된 시선 조향모델과 주행환경 데이터를 사용하여 운전자의 시선과 주행환경에 따라, 위험요소를 3단계로 분류하고 검출하여 운전자의 전방 및 사각지대 보조한다.

TerraSAR-X 영상으로부터 Modified U-NET을 이용한 홍수 매핑 (Flood Mapping Using Modified U-NET from TerraSAR-X Images)

  • 유진우;윤영웅;이어루;백원경;정형섭
    • 대한원격탐사학회지
    • /
    • 제38권6_2호
    • /
    • pp.1709-1722
    • /
    • 2022
  • 지구온난화로 인해 발생한 기온 상승은 엘니뇨, 라니냐 현상을 초래하였고, 해수의 온도를 비정상적으로 변화시켰다. 해수 온도의 비정상적인 변화는 특정 지역에 강우가 집중되는 현상을 발생시켜 이상 홍수를 빈번하게 일으킨다. 홍수로 인한 인명 및 재산 피해를 복구하고 방지하기 위해서는 침수피해 지역을 신속하게 파악하는 것이 중요한데 이는 합성개구레이더(synthetic aperture radar, SAR)를 통해 가능하다. 본 연구에서는 멀티 커널(kernel) 기반의 수정된 U-NET과 TerraSAR-X 영상을 활용하여 다양한 특성 맵 추출을 통해 반전 잡음(speckle noise)의 효과를 저감하고, 홍수 전, 후의 두 장의 영상을 입력자료로 활용해 홍수 발생 지역을 직접적으로 도출해내는 모델을 제작하고자 한다. 이를 위해 두 장의 SAR 영상을 전처리하여 모델의 입력자료를 제작하였고, 이를 수정된 U-NET 구조에 적용하여 홍수 탐지 딥러닝 모델을 학습시켰다. 해당 방법을 통해 평균 F1 score 값이 0.966으로 높은 수준으로 홍수 발생 지역을 탐지할 수 있었다. 이 결과는 수해 지역에 대한 신속한 복구 및 수해 예방책 도출에 기여할 것으로 기대된다.

U-net 딥러닝 기법을 활용한 PVA 섬유 보강 시멘트 복합체의 섬유 분리 (Phase Segmentation of PVA Fiber-Reinforced Cementitious Composites Using U-net Deep Learning Approach)

  • 서지우;한동석
    • 한국전산구조공학회논문집
    • /
    • 제36권5호
    • /
    • pp.323-330
    • /
    • 2023
  • PVA 섬유 보강 시멘트 복합체는 매우 복잡한 미세구조를 가지고 있으며, 재료의 거동을 정확히 평가하기 위해서는 미세구조 특성을 반영하여 실제 실험과 시너지효과를 내며 효율적인 재료 설계를 가능하게 하는 해석 모델의 개발이 중요하다. PVA 섬유 보강 시멘트 복합체의 역학적 성능은 PVA 섬유의 방향성에 큰 영향을 받는다. 그러나 마이크로-CT 이미지로부터 얻은 PVA 섬유의 회색조 값을 인접한 상과 구분하기 어려워, 섬유 분리 과정에 많은 시간이 소요된다. 본 연구에서는 섬유의 3차원 분포를 얻기 위하여 0.65㎛3의 복셀 크기를 가지는 마이크로-CT 이미지 촬영을 수행하였다. 학습에 사용될 학습 데이터를 생성하기 위해 히스토그램, 형상, 그리고 구배 기반 상 분리 방법을 적용하였다. 본 연구에서 제안된 U-net 모델을 활용하여 PVA 섬유 보강 시멘트 복합체의 마이크로- CT 이미지로부터 섬유를 분리하는 학습을 수행하였다. 훈련의 정확도를 높이기 위해 데이터 증강을 적용하였으며, 총 1024개의 이미지를 훈련 데이터로 사용하였다. 모델의 성능은 정확도, 정밀도, 재현율, F1 스코어를 평가하였으며, 학습된 모델의 섬유 분리 성능이 매우 높고 효율적이며, 다른 시편에도 적용될 수 있음을 확인하였다.

카메라-라이다 융합 모델의 오류 유발을 위한 스케일링 공격 방법 (Scaling Attack Method for Misalignment Error of Camera-LiDAR Calibration Model)

  • 임이지;최대선
    • 정보보호학회논문지
    • /
    • 제33권6호
    • /
    • pp.1099-1110
    • /
    • 2023
  • 자율주행 및 robot navigation의 인식 시스템은 성능 향상을 위해 다중 센서를 융합(Multi-Sensor Fusion)을 한 후, 객체 인식 및 추적, 차선 감지 등의 비전 작업을 한다. 현재 카메라와 라이다 센서의 융합을 기반으로 한 딥러닝 모델에 대한 연구가 활발히 이루어지고 있다. 그러나 딥러닝 모델은 입력 데이터의 변조를 통한 적대적 공격에 취약하다. 기존의 다중 센서 기반 자율주행 인식 시스템에 대한 공격은 객체 인식 모델의 신뢰 점수를 낮춰 장애물 오검출을 유도하는 데에 초점이 맞춰져 있다. 그러나 타겟 모델에만 공격이 가능하다는 한계가 있다. 센서 융합단계에 대한 공격의 경우 융합 이후의 비전 작업에 대한 오류를 연쇄적으로 유발할 수 있으며, 이러한 위험성에 대한 고려가 필요하다. 또한 시각적으로 판단하기 어려운 라이다의 포인트 클라우드 데이터에 대한 공격을 진행하여 공격 여부를 판단하기 어렵도록 한다. 본 연구에서는 이미지 스케일링 기반 카메라-라이다 융합 모델(camera-LiDAR calibration model)인 LCCNet 의 정확도를 저하시키는 공격 방법을 제안한다. 제안 방법은 입력 라이다의 포인트에 스케일링 공격을 하고자 한다. 스케일링 알고리즘과 크기별 공격 성능 실험을 진행한 결과 평균 77% 이상의 융합 오류를 유발하였다.

해안쓰레기 탐지 및 모니터링에 대한 딥러닝 기반 객체 탐지 기술의 적용성 평가: YOLOv8과 RT-DETR을 중심으로 (Applicability Evaluation of Deep Learning-Based Object Detection for Coastal Debris Monitoring: A Comparative Study of YOLOv8 and RT-DETR)

  • 박수호;김흥민;김영민;이인지;박미소;오승열;김탁영;장선웅
    • 대한원격탐사학회지
    • /
    • 제39권6_1호
    • /
    • pp.1195-1210
    • /
    • 2023
  • 해안쓰레기는 미관 훼손 및 생태와 보건에 미치는 영향으로 인해 큰 문제로 대두되고 있다. 이를 해결하기 위한 노력의 일환으로 본 연구는 해안쓰레기 탐지와 모니터링을 위한 이미지 데이터셋 구축과 실시간 객체 탐지 분야의 대표적인 모델인 YOLOv8과 RT-DETR의 성능을 비교하였다. 특히 다양한 환경 하에서의 강건성을 평가하기 위해 여러 왜곡 조건에서 성능 변화 실험을 수행하였다. YOLOv8은 mean Average Precision (mAP) 0.927~0.945의 정확도와 65~135 Frames Per Second (FPS)의 탐지 속도를 보인 반면, RT-DETR은 mAP 0.917~0.918의 정확도와 40~53 FPS의 탐지 속도를 보였다. 색상 왜곡에 대해서는 RT-DETR이 더 강건한 성능을 보였으나, 그 외의 조건에서는 YOLOv8이 더 높은 강건성을 보였다. 본 연구의 결과는 실제 해안쓰레기 모니터링 시스템의 모델 선택에 있어 중요한 지침을 제공할 것으로 기대된다.

KOMPSAT-3/3A 영상으로부터 U-Net을 이용한 산업단지와 채석장 분류 (Classification of Industrial Parks and Quarries Using U-Net from KOMPSAT-3/3A Imagery)

  • 박채원;정형섭;이원진;이광재;오관영;장재영;이명진
    • 대한원격탐사학회지
    • /
    • 제39권6_3호
    • /
    • pp.1679-1692
    • /
    • 2023
  • 대한민국은 인구 증가와 산업 발전의 결과로 많은 양의 오염물질을 배출하는 국가이자, 지리적 위치로 인해 월경성 대기오염의 심각한 영향을 받는 국가이다. 국내외에서 발생하는 오염물질이 대한민국의 대기오염에 큰 피해를 야기하는 상황에서, 대기 오염물질 배출원의 위치 정보는 대기 중 오염물질의 이동 및 분포를 파악하고, 국가 차원의 대기오염 관리 및 대응 전략을 수립하는 데 매우 중요하다. 본 연구는 이러한 배경을 바탕으로, 고해상도 광학위성 영상과 딥러닝 기반의 영상 분할 모델을 활용하여 대기오염 현황을 분석하는 데 필수적인 국내외 대기오염물질 배출원의 공간 정보를 효과적으로 획득하는 것을 목표로 수행되었다. 특히, 월경성 대기오염에 크게 기여하는 것으로 평가된 산업단지와 채석장을 주요 연구 대상으로 선정하였으며, 이들 영역에 대한 다목적실용위성 3호 및 3A호의 영상들을 수집하여 전처리한 후, 모델 학습을 위한 입력 및 라벨 데이터로 변환하였다. 해당 데이터를 활용하여 U-Net 모델을 학습시킨 결과, 전체 정확도는 0.8484, mean Intersection over Union (mIoU)은 0.6490을 달성하였다. 모델의 예측 결과 맵은 코스 어노테이션(Course Annotation) 방식으로 제작된 라벨 데이터보다 객체의 경계를 더욱 정확하게 추출하는 것으로 나타나, 데이터 처리 및 모델 학습 방법론의 유효성을 입증하였다.

KOMPSAT 정사모자이크 영상으로부터 U-Net 모델을 활용한 농촌위해시설 분류 (Semantic Segmentation of Hazardous Facilities in Rural Area Using U-Net from KOMPSAT Ortho Mosaic Imagery)

  • 공성현;정형섭;이명진;이광재;오관영;장재영
    • 대한원격탐사학회지
    • /
    • 제39권6_3호
    • /
    • pp.1693-1705
    • /
    • 2023
  • 국토 면적의 약 90%를 차지하는 농촌은 여러가지 공익적 기능을 수행하는 공간으로서 중요성과 가치가 증가하고 있지만 주거지 인근에 축사, 공장, 태양광패널 등 주민생활에 불편을 미치는 시설들이 무분별하게 들어서면서 농촌 환경과 경관이 훼손되고 주민 삶의 질이 낮아지고 있다. 농촌지역의 무질서한 개발을 방지하고 농촌 공간을 계획적으로 관리하기 위해서는 농촌지역 내 위해시설에 대한 탐지 및 모니터링이 필요하다. 주기적으로 취득 가능하고 전체 지역에 대한 정보를 얻을 수 있는 위성영상을 통해 데이터의 취득이 가능하고, 합성곱 신경망 기법을 통한 영상 기반 딥러닝 기술을 활용하여 효과적인 탐지가 가능하다. 따라서 본 연구에서는 의미적 분할(Semantic segmentation)에서 높은 성능을 보이는 U-Net 모델을 이용하여 농촌 지역에서 잠재적으로 위해시설이 될 수 있는 농촌시설을 분류하는 연구를 수행하였다. 본 연구에서는 2020년에 제작된 공간해상도 0.7 m의 KOMPSAT 정사모자이크 광학영상을 한국항공우주연구원으로부터 제공받아 사용하였으며 축사, 공장, 태양광 패널에 대한 AI 학습용 데이터를 직접 제작하여 학습 및 추론을 진행하였다. U-Net을 통해 학습시킨 결과 픽셀 정확도(pixel accuracy)는 0.9739, mean Intersection over Union (mIOU)은 0.7025의 값을 도출하였다. 본 연구 결과는 농촌 지역의 위험 시설물 모니터링에 활용될 수 있으며, 농촌계획 수립에 있어 기초 자료로 활용될 수 있을 것으로 기대된다.

Fully Automatic Coronary Calcium Score Software Empowered by Artificial Intelligence Technology: Validation Study Using Three CT Cohorts

  • June-Goo Lee;HeeSoo Kim;Heejun Kang;Hyun Jung Koo;Joon-Won Kang;Young-Hak Kim;Dong Hyun Yang
    • Korean Journal of Radiology
    • /
    • 제22권11호
    • /
    • pp.1764-1776
    • /
    • 2021
  • Objective: This study aimed to validate a deep learning-based fully automatic calcium scoring (coronary artery calcium [CAC]_auto) system using previously published cardiac computed tomography (CT) cohort data with the manually segmented coronary calcium scoring (CAC_hand) system as the reference standard. Materials and Methods: We developed the CAC_auto system using 100 co-registered, non-enhanced and contrast-enhanced CT scans. For the validation of the CAC_auto system, three previously published CT cohorts (n = 2985) were chosen to represent different clinical scenarios (i.e., 2647 asymptomatic, 220 symptomatic, 118 valve disease) and four CT models. The performance of the CAC_auto system in detecting coronary calcium was determined. The reliability of the system in measuring the Agatston score as compared with CAC_hand was also evaluated per vessel and per patient using intraclass correlation coefficients (ICCs) and Bland-Altman analysis. The agreement between CAC_auto and CAC_hand based on the cardiovascular risk stratification categories (Agatston score: 0, 1-10, 11-100, 101-400, > 400) was evaluated. Results: In 2985 patients, 6218 coronary calcium lesions were identified using CAC_hand. The per-lesion sensitivity and false-positive rate of the CAC_auto system in detecting coronary calcium were 93.3% (5800 of 6218) and 0.11 false-positive lesions per patient, respectively. The CAC_auto system, in measuring the Agatston score, yielded ICCs of 0.99 for all the vessels (left main 0.91, left anterior descending 0.99, left circumflex 0.96, right coronary 0.99). The limits of agreement between CAC_auto and CAC_hand were 1.6 ± 52.2. The linearly weighted kappa value for the Agatston score categorization was 0.94. The main causes of false-positive results were image noise (29.1%, 97/333 lesions), aortic wall calcification (25.5%, 85/333 lesions), and pericardial calcification (24.3%, 81/333 lesions). Conclusion: The atlas-based CAC_auto empowered by deep learning provided accurate calcium score measurement as compared with manual method and risk category classification, which could potentially streamline CAC imaging workflows.

Spine Computed Tomography to Magnetic Resonance Image Synthesis Using Generative Adversarial Networks : A Preliminary Study

  • Lee, Jung Hwan;Han, In Ho;Kim, Dong Hwan;Yu, Seunghan;Lee, In Sook;Song, You Seon;Joo, Seongsu;Jin, Cheng-Bin;Kim, Hakil
    • Journal of Korean Neurosurgical Society
    • /
    • 제63권3호
    • /
    • pp.386-396
    • /
    • 2020
  • Objective : To generate synthetic spine magnetic resonance (MR) images from spine computed tomography (CT) using generative adversarial networks (GANs), as well as to determine the similarities between synthesized and real MR images. Methods : GANs were trained to transform spine CT image slices into spine magnetic resonance T2 weighted (MRT2) axial image slices by combining adversarial loss and voxel-wise loss. Experiments were performed using 280 pairs of lumbar spine CT scans and MRT2 images. The MRT2 images were then synthesized from 15 other spine CT scans. To evaluate whether the synthetic MR images were realistic, two radiologists, two spine surgeons, and two residents blindly classified the real and synthetic MRT2 images. Two experienced radiologists then evaluated the similarities between subdivisions of the real and synthetic MRT2 images. Quantitative analysis of the synthetic MRT2 images was performed using the mean absolute error (MAE) and peak signal-to-noise ratio (PSNR). Results : The mean overall similarity of the synthetic MRT2 images evaluated by radiologists was 80.2%. In the blind classification of the real MRT2 images, the failure rate ranged from 0% to 40%. The MAE value of each image ranged from 13.75 to 34.24 pixels (mean, 21.19 pixels), and the PSNR of each image ranged from 61.96 to 68.16 dB (mean, 64.92 dB). Conclusion : This was the first study to apply GANs to synthesize spine MR images from CT images. Despite the small dataset of 280 pairs, the synthetic MR images were relatively well implemented. Synthesis of medical images using GANs is a new paradigm of artificial intelligence application in medical imaging. We expect that synthesis of MR images from spine CT images using GANs will improve the diagnostic usefulness of CT. To better inform the clinical applications of this technique, further studies are needed involving a large dataset, a variety of pathologies, and other MR sequence of the lumbar spine.