• 제목/요약/키워드: Image deep learning

검색결과 1,806건 처리시간 0.03초

Vision Transformer를 이용한 UAV 영상의 벼 도복 영역 진단 (Diagnosis of the Rice Lodging for the UAV Image using Vision Transformer)

  • 명현정;김서정;최강인;김동훈;이광형;안형근;정성환;김병준
    • 스마트미디어저널
    • /
    • 제12권9호
    • /
    • pp.28-37
    • /
    • 2023
  • 쌀 수확량 감소에 크게 영향을 주는 것은 집중호우나 태풍에 의한 도복 피해이다. 도복 피해 면적 산정 방법은 직접 피해 지역을 방문하는 현장 조사를 기반으로 육안 검사 및 판단하여 객관적인 결과 획득이 어렵고 많은 시간과 비용이 요구된다. 본 논문에서는 무인 항공기로 촬영된 RGB 영상을 Vision Transformer 기반 Segformer을 활용한 벼 도복 영역 추정 및 진단을 제안한다. 제안된 방법은 도복, 정상, 그리고 배경 영역을 추정하고 종자관리요강 내 벼 포장 검사를 통해 도복률을 진단한다. 진단된 결과를 통해 벼 도복 피해 분포를 관찰할 수 있게 하며, 정부 보급종 포장 검사에 활용할 수 있다. 본 연구의 벼 도복 영역 추정 성능은 평균 정확도 98.33%와 mIoU 96.79%의 성능을 나타내었다.

Copper Filter Dryer 품질보증을 위한 결함 검출 및 원인 분석 (Defect Detection and Cause Analysis for Copper Filter Dryer Quality Assurance)

  • 오석민;박진제;다어반권;장병호;김흥재;김창순
    • 한국산업정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.107-116
    • /
    • 2024
  • Copper Filter Dryer(CFD)는 냉동 및 냉방 시스템에서 냉매의 순환 시 불순물을 제거하여 깨끗한 냉매를 유지하는 역할을 하며, CFD의 결함은 냉동 및 냉방 시스템의 누수, 수명 저하 등 제품의 결함으로 이어질 수 있어 품질보증이 필수적이다. 기존에는 품질 검사 단계에서 작업자가 검사하고 결함을 판단하는 방법이 주로 사용되었으나, 이러한 방법은 주관적으로 판단하기 때문에 정확하지 못하다. 본 논문에서는 CFD 축관 및 용접 공정 과정에서 발생하는 결함을 검출하고 기존의 품질 검사를 대체하기 위해 YOLOv7 객체 감지 알고리즘을 사용하여 결함을 검출했고, F1-Score 0.954, 0.895의 검출 성능을 확인하였다. 또한, 결함 이미지의 Timestamp에 해당하는 센서 데이터 분석을 통해 용접 과정 중 발생하는 결함의 원인을 분석하였다. 본 논문은 CFD 공정 중 발생하는 결함을 검출하고 원인을 분석함으로써 제조 품질보증과 개선 방안을 제시한다.

보행자 및 차량 검지를 위한 레이더 영상 융복합 시스템 연구 (A Study on Radar Video Fusion Systems for Pedestrian and Vehicle Detection)

  • 조성윤;윤여환
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.197-205
    • /
    • 2024
  • 자율주행 자동차 개발 및 상용화에 있어서 주행안전도 확보가 가장 중요한 시점에서 이를 위해 전방 및 주행차량 주변에 존재하는 다양한 정적/동적 차량의 인식과 검출 성능을 고도화 및 최적화하기 위한 AI, 빅데이터 기반 알고리즘개발 등이 연구되고 있다. 하지만 레이더와 카메라의 고유한 장점을 활용하여 동일한 차량으로 인식하기 위한 연구 사례들이 많이 있지만, 딥러닝 영상 처리 기술을 이용하지 않거나, 레이더의 성능상의 문제로 짧은 거리만 동일한 표적으로 감지하고 있다. 따라서 레이더 장비와 카메라 장비에서 수집할 수 있는 데이터셋을 구성하고, 데이터셋의 오차를 계산하여 동일한 표적으로 인식하는 융합 기반 차량 인식 방법이 필요하다. 본 논문에서는 레이더와 CCTV(영상) 설치 위치에 따라 동일한 객체로 판단하기에 데이터 오차가 발생하기 때문에 설치한 위치에 따라 위치 정보를 연동할 수 있는 기술 개발을 목표로 한다.

Evaluation and Prediction of Post-Hepatectomy Liver Failure Using Imaging Techniques: Value of Gadoxetic Acid-Enhanced Magnetic Resonance Imaging

  • Keitaro Sofue;Ryuji Shimada;Eisuke Ueshima;Shohei Komatsu;Takeru Yamaguchi;Shinji Yabe;Yoshiko Ueno;Masatoshi Hori;Takamichi Murakami
    • Korean Journal of Radiology
    • /
    • 제25권1호
    • /
    • pp.24-32
    • /
    • 2024
  • Despite improvements in operative techniques and perioperative care, post-hepatectomy liver failure (PHLF) remains the most serious cause of morbidity and mortality after surgery, and several risk factors have been identified to predict PHLF. Although volumetric assessment using imaging contributes to surgical simulation by estimating the function of future liver remnants in predicting PHLF, liver function is assumed to be homogeneous throughout the liver. The combination of volumetric and functional analyses may be more useful for an accurate evaluation of liver function and prediction of PHLF than only volumetric analysis. Gadoxetic acid is a hepatocyte-specific magnetic resonance (MR) contrast agent that is taken up by hepatocytes via the OATP1 transporter after intravenous administration. Gadoxetic acid-enhanced MR imaging (MRI) offers information regarding both global and regional functions, leading to a more precise evaluation even in cases with heterogeneous liver function. Various indices, including signal intensity-based methods and MR relaxometry, have been proposed for the estimation of liver function and prediction of PHLF using gadoxetic acid-enhanced MRI. Recent developments in MR techniques, including high-resolution hepatobiliary phase images using deep learning image reconstruction and whole-liver T1 map acquisition, have enabled a more detailed and accurate estimation of liver function in gadoxetic acid-enhanced MRI.

항공 LiDAR 및 RGB 정사 영상을 이용한 딥러닝 기반의 도시녹지 분류 (Classification of Urban Green Space Using Airborne LiDAR and RGB Ortho Imagery Based on Deep Learning)

  • 손보경;이연수;임정호
    • 한국지리정보학회지
    • /
    • 제24권3호
    • /
    • pp.83-98
    • /
    • 2021
  • 도시녹지는 도시 생태계 건강성 증진을 위한 중요한 요소이며, 건강한 도시 생태계 유지 및 관리를 위해서는 도시녹지의 공간적인 현황 파악이 필요하다. 환경부에서는 2010년 이후부터 총 41개의 분류 항목을 갖는 1m 급 해상도의 세분류 토지피복지도를 제공해오고 있으나, 가로수와 같은 도시 내 고해상도 상세 녹지 정보는 기타 초지로 분류되거나 누락되어 오고 있다. 따라서, 본 연구에서는 수원시 지역을 대상으로 1m 이하 급의 고해상도 원격탐사 자료(항공 LiDAR 및 RGB 정사영상)를 이용하여, 기존 세분류 토지피복지도에서는 나타나지 않는 고해상도의 상세 도시 녹지(수목, 관목 및 초지) 정보를 분류하고자 하였다. 분류 기법으로는 딥러닝 기반의 이미지 분할방법인 U-Net 구조의 모델을 활용하였으며, 분류 항목의 수 및 사용하는 자료의 종류에 따라 총 3가지의 모델(LRGB10, LRGB5, 및 RGB5)을 제안하고 성능을 평가하였다. 검증 지역에 대한 세 모델의 평균 전체 정확도는 각 83.40%(LRGB10), 89.44%(LRGB5), 74.76%(RGB5)이며, 항공 LiDAR와 RGB 정사영상을 함께 사용하여 총 5개의 항목(수목, 관목, 초지, 건물, 및 그 외)을 분류하는 LRGB5 모델의 성능이 가장 높게 나타났다. 수원시의 수목, 관목 및 초지 기준의 전체 녹지 현황은 각 45.61%(LRGB10), 43.47%(LRGB5), 및 44.22%(RGB5)로 나타났으며, 세 모델 모두 기존 세분류 토지피복지도와 비교하여 평균 13.40%의 도시 수목 정보를 더 제공할 수 있는 것으로 나타났다. 더불어 이러한 도시녹지 분류 결과는 향후 중분류 토지피복지도와 같은 기존 GIS 정보와의 융합을 통해 가로수 녹지 비율 현황 등 추가적인 상세 녹지 현황 정보를 제공할 수 있어, 다양한 도시녹지 연구 및 정책의 기초 자료로 활용될 수 있을 것으로 기대된다.

인조 번호판을 이용한 자동차 번호인식 성능 향상 기법 (Improved Method of License Plate Detection and Recognition using Synthetic Number Plate)

  • 장일식;박구만
    • 방송공학회논문지
    • /
    • 제26권4호
    • /
    • pp.453-462
    • /
    • 2021
  • 자동차 번호인식을 위해선 수많은 번호판 데이터가 필요하다. 번호판 데이터는 과거의 번호판부터 최신의 번호판까지 균형 있는 데이터의 확보가 필요하다. 하지만 실제 과거의 번호판부터 최신의 번호판의 데이터를 획득하는데 어려움이 있다. 이러한 문제를 해결하기 위해 인조 번호판을 이용하여 자동차 번호판을 생성하여 딥러닝을 통한 번호판 인식 연구가 진행되고 있다. 하지만 인조 데이터는 실제 데이터와 차이가 존재하며, 이러한 문제를 해결하기 위해 다양한 데이터 증강 기법을 사용한다. 기존 데이터 증강 방식은 단순히 밝기, 회전, 어파인 변환, 블러, 노이즈등의 방법을 사용하였다. 본 논문에서는 데이터 증강 방법으로 인조데이터를 실제 데이터 스타일로 변환하는 스타일 변환 방법을 적용한다. 또한 실제 번호판 데이터는 원거리가 많고 어두운 경우 잡음이 많이 존재한다. 단순히 입력데이터를 가지고 문자를 인식할 경우 오인식의 가능성이 높다. 이러한 경우 문자인식 향상을 위해 본 논문에서는 문자인식을 위하여 화질개선 방법으로 DeblurGANv2 방법을 적용하여 번호판 인식 정확도를 높였다. 번호판 검출 및 번호판 번호인식을 위한 딥러닝의 방식은 YOLO-V5를 사용하였다. 인조 번호판 데이터 성능을 판단하기 위해 자체적으로 확보한 자동차 번호판을 수집하여 테스트 셋을 구성하였다. 스타일 변환을 적용하지 않은 번호판 검출이 0.614mAP를 기록하였다. 스타일 변환을 적용한 결과 번호판 검출 성능이 0.679mAP 기록하여 성능이 향상되었음을 확인하였다. 또한 번호판 문자인식에는 화질 개선을 하지 않은 검출 성공률은 0.872를 기록하였으며, 화질 개선 후 검출 성능이 0.915를 기록하여 성능 향상이 되었음을 확인 하였다.

역 원근변환 기법을 이용한 터널 영상유고시스템의 원거리 감지 성능 향상에 관한 연구 (A study for improvement of far-distance performance of a tunnel accident detection system by using an inverse perspective transformation)

  • 이규범;신휴성
    • 한국터널지하공간학회 논문집
    • /
    • 제24권3호
    • /
    • pp.247-262
    • /
    • 2022
  • 국내 200 m 이상 연장의 터널에서는 CCTV 설치가 의무화되어 있으며, 터널 내 돌발 상황을 자동으로 인지한 다음 터널 관리자에게 알릴 수 있는 터널 영상유고시스템의 운영이 권고된다. 여기서 터널 내 설치된 CCTV는 터널 구조물의 공간적인 한계로 인해 낮은 높이로 설치된다. 이에 따라 이동차량과 매우 인접하므로, 이동차량과 CCTV와의 거리에 따른 원근현상이 매우 심하다. 이로 인해, 기존 터널 영상유고시스템은 터널 CCTV로부터 멀리 떨어질수록 차량의 정차 및 역주행, 보행자 출현 및 화재 발생과 같은 터널 내 유고상황을 인지하기 매우 어려우며, 100 m 이상의 거리에서는 높은 유고상황 인지 성능을 기대하기 어려운 것으로 알려져 있다. 이 문제를 해결하기 위해 관심영역 설정 및 역 원근변환(Inverse perspective transform)을 도입하였으며, 이 과정을 통해 얻은 변환영상은 먼 거리에 있는 객체의 크기가 확대된다. 이에 따라 거리에 따라 객체의 크기가 비교적 일정하게 유지되므로, 거리에 따른 객체 인식 성능과 영상에서 보이는 차량의 이동속도 또한 일관성을 유지할 수 있다. 이를 증명하기 위해 본 논문에서는 터널 CCTV의 원본영상과 변환영상을 바탕으로 동일한 조건을 가지는 데이터셋을 각각 제작 및 구성하였으며, 영상 내 차량의 실제 위치의 변화에 따른 겉보기 속도와 객체 크기를 비교하였다. 그 다음 딥러닝 객체인식 모델의 학습 및 추론을 통해 각 영상 데이터셋에 대한 거리에 따른 객체인식 성능을 비교하였다. 결과적으로 변환영상을 사용한 모델은 200 m 이상의 거리에서도 객체인식 성능과 이동차량의 유고상황 인지 성능을 확보할 수 있음을 보였다.

Curve Number 및 Convolution Neural Network를 이용한 유출모형의 적용성 평가 (Applicability Evaluation for Discharge Model Using Curve Number and Convolution Neural Network)

  • 송철민;이광현
    • Ecology and Resilient Infrastructure
    • /
    • 제7권2호
    • /
    • pp.114-125
    • /
    • 2020
  • 본 연구는 유출모형 연구를 위해 주로 사용되었던 DNN에서 벗어나, 다양한 신경망을 이용하여 유출모형을 개발하고 모형의 적합성을 나타내고자 하였다. 이를 위해 분류문제에만 사용되었던 CNN을 활용하였는데, 본 모형의 입력자료로 일반적으로 CNN에서 사용하는 사진을 이용할 수 없으며, 연구의 특성상 유역조건 및 강우 등의 영향이 반영된 수치적(numerical) 이미지(image)를 사용해야 하는 난해점이 있다. 이를 해결하고자 NRCS의 CN을 사용하여 이미지를 생성했으며, CNN 모형의 입력자료로 충분히 활용 가능함을 나타냈다. 이에 더하여, 유출 추정을 위해서만 사용되어왔던 CN의 새로운 용도를 제시할 수 있었다. 모형의 학습 및 검정 결과, 전반적으로 안정적으로 모형의 학습 및 일반화가 이루어졌으며, 관측값과 산정값간의 관계를 나타내는 R2는 0.79로 비교적 높은 값이 나타났다. 또한, 모형의 평가결과는 Pearson 상관계수, NSE, 및 RMSE 등이 각각 0.84, 0.65 및 24.54 ㎥/s으로 나타나, 전반적으로 양호한 모형의 산정성능을 보인것으로 나타났다.

HRNet-OCR과 Swin-L 모델을 이용한 조식동물 서식지 수중영상의 의미론적 분할 (Semantic Segmentation of the Habitats of Ecklonia Cava and Sargassum in Undersea Images Using HRNet-OCR and Swin-L Models)

  • 김형우;장선웅;박수호;공신우;곽지우;김진수;이양원
    • 대한원격탐사학회지
    • /
    • 제38권5_3호
    • /
    • pp.913-924
    • /
    • 2022
  • 이 연구에서는 국내 연안어장을 대상으로 조식동물 및 서식지에 대한 수중영상 기반의 인공지능 학습자료를 구축하고, state-of-the-art (SOTA) 모델인 High Resolution Network-Object Contextual Representation(HRNet-OCR)과 Shifted Windows-L (Swin-L)을 이용하여, 조식동물 서식지 수중영상의 의미론적 분할을 수행함으로써 화소 또는 화소군 간의 공간적 맥락(상관성)을 반영하는 보다 실제적인 탐지 결과를 제시하였다. 조식동물 서식지인 감태, 모자반의 수중영상 레이블 중 1,390장을 셔플링(shuffling)하여 시험평가를 수행한 결과, 한국수산자원공단의 DeepLabV3+ 사례에 비해 약 29% 향상된 정확도를 도출하였다. 모든 클래스에 대해 Swin-L이 HRNet-OCR보다 판별율이 더 좋게 나타났으며, 특히 데이터가 적은 감태의 경우, Swin-L이 해당 클래스에 대한 특징을 더 풍부하게 반영할 수 있는 것으로 나타났다. 영상분할 결과 대상물과 배경이 정교하게 분리되는 것을 확인되었는데, 이는 Transformer 계열 백본을 활용하면서 특징 추출능력이 더욱 향상된 것으로 보인다. 향후 10,000장의 레이블 데이터베이스가 완성되면 추가적인 정확도 향상이 가능할 것으로 기대된다.

계층적 군집화 기반 Re-ID를 활용한 객체별 행동 및 표정 검출용 영상 분석 시스템 (Video Analysis System for Action and Emotion Detection by Object with Hierarchical Clustering based Re-ID)

  • 이상현;양성훈;오승진;강진범
    • 지능정보연구
    • /
    • 제28권1호
    • /
    • pp.89-106
    • /
    • 2022
  • 최근 영상 데이터의 급증으로 이를 효과적으로 처리하기 위해 객체 탐지 및 추적, 행동 인식, 표정 인식, 재식별(Re-ID)과 같은 다양한 컴퓨터비전 기술에 대한 수요도 급증했다. 그러나 객체 탐지 및 추적 기술은 객체의 영상 촬영 장소 이탈과 재등장, 오클루전(Occlusion) 등과 같이 성능을 저하시키는 많은 어려움을 안고 있다. 이에 따라 객체 탐지 및 추적 모델을 근간으로 하는 행동 및 표정 인식 모델 또한 객체별 데이터 추출에 난항을 겪는다. 또한 다양한 모델을 활용한 딥러닝 아키텍처는 병목과 최적화 부족으로 성능 저하를 겪는다. 본 연구에서는 YOLOv5기반 DeepSORT 객체추적 모델, SlowFast 기반 행동 인식 모델, Torchreid 기반 재식별 모델, 그리고 AWS Rekognition의 표정 인식 모델을 활용한 영상 분석 시스템에 단일 연결 계층적 군집화(Single-linkage Hierarchical Clustering)를 활용한 재식별(Re-ID) 기법과 GPU의 메모리 스루풋(Throughput)을 극대화하는 처리 기법을 적용한 행동 및 표정 검출용 영상 분석 시스템을 제안한다. 본 연구에서 제안한 시스템은 간단한 메트릭을 사용하는 재식별 모델의 성능보다 높은 정확도와 실시간에 가까운 처리 성능을 가지며, 객체의 영상 촬영 장소 이탈과 재등장, 오클루전 등에 의한 추적 실패를 방지하고 영상 내 객체별 행동 및 표정 인식 결과를 동일 객체에 지속적으로 연동하여 영상을 효율적으로 분석할 수 있다.