• 제목/요약/키워드: DeepLab

검색결과 191건 처리시간 0.025초

드론 항공영상을 이용한 딥러닝 기반 앙상블 토지 피복 분할 알고리즘 개발 (Development of Deep Learning Based Ensemble Land Cover Segmentation Algorithm Using Drone Aerial Images)

  • 박해광;백승기;정승현
    • 대한원격탐사학회지
    • /
    • 제40권1호
    • /
    • pp.71-80
    • /
    • 2024
  • 이 연구에서는 무인 항공기(Unmanned Aerial Vehicle, UAV)가 캡처한 이미지의 의미론적 토지 피복 분할 성능을 향상시키기 위한 앙상블 학습 기법을 제안하고 있다. 도시 계획과 같은 분야에서 UAV 사용이 증가함에 따라 토지 피복 분할을 위한 딥러닝 분할 방법을 활용한 기술 개발이 활발히 이루어지고 있다. 이 연구는 대표적인 분할 모델인 U-Net, DeepLabV3 그리고 Fully Convolutional Network (FCN)를 사용하여 분할 예측 성능을 개선하는 방법을 제안한다. 제안된 접근 방식은 세 가지 분할 모델의 훈련 손실, 검증 정확도 및 클래스별 점수를 통합하여 앙상블 모델을 개발하고 전반적인 예측 성능을 향상시킨다. 이 방법은 건물, 도로, 주차장, 논, 밭, 나무, 빈 공간, 미분류 영역을 포함하는 일곱 가지 클래스가 있는 토지 피복 분할 문제에 적용하여 평가하였다. 앙상블 모델의 성능은 mean Intersection over Union (mIoU)으로 평가하였으며, 제안된 앙상블 모델과 기존의 세 가지 분할 방법을 비교한 결과 mIoU 성능이 향상되었음이 나타났다. 따라서 이 연구는 제안된 기술이 의미론적 분할 모델의 성능을 향상시킬 수 있음을 확인하였다.

고숙련자 공장작업지식 자산화를 위한 CCTV-동영상 객체능동화의 개념적 아키텍처와 실험적 검증 (A Conceptual Architecture and its Experimental Validation of CCTV-Video Object Activitization for Tangible Assets of Experts' Visual Knowledge in Smart Factories)

  • 조은비;팜딘람;선경희;김광훈
    • 인터넷정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.101-111
    • /
    • 2024
  • 본 논문에서는 스마트공장의 대표적인 비정형데이터인 CCTV-동영상의 물리적 구성요소인 비디오-프레임을 묘사할 수 있는 기본 요소인 객체(Objects), 행위(Motions), 물리적환경(Physical Environment) 특성들을 중에서 인공지능-딥러닝 모델들을 적용하여 탐지할 수 있는 영상-객체를 텍스트데이터유형의 XML-능동데이터로 수집·저장·관리할 수 있는 소위 CCTV-동영상 객체능동화(Object Activitization)1) 개념을 실현할 수 있는 개념적 아키텍처와 그의 구현을 위한 접근방법을 제안한다. 결과적으로, 본 논문에서 제안한 접근방법의 궁극적 목표는 다양한 산업의 작업 및 공정현장에서 수집되는 정형·비정형 데이터로부터 고숙련 작업자 중심의 현장지식을 체계적으로 수집·저장·관리하는 고숙련작업자 중심 현장작업지식 자산화를 위한 스마트공장 현장지식 공유 플랫폼을 구현하는데 있다.

Attention 기법에 기반한 적대적 공격의 강건성 향상 연구 (Improving Adversarial Robustness via Attention)

  • 김재욱;오명교;박래현;권태경
    • 정보보호학회논문지
    • /
    • 제33권4호
    • /
    • pp.621-631
    • /
    • 2023
  • 적대적 학습은 적대적 샘플에 대한 딥러닝 모델의 강건성을 향상시킨다. 하지만 기존의 적대적 학습 기법은 입력단계의 작은 섭동마저도 은닉층의 특징에 큰 변화를 일으킨다는 점을 간과하여 adversarial loss function에만집중한다. 그 결과로 일반 샘플 또는 다른 공격 기법과 같이 학습되지 않은 다양한 상황에 대한 정확도가 감소한다. 이 문제를 해결하기 위해서는 특징 표현 능력을 향상시키는 모델 아키텍처에 대한 분석이 필요하다. 본 논문에서는 입력 이미지의 attention map을 생성하는 attention module을 일반 모델에 적용하고 PGD 적대적학습을수행한다. CIFAR-10 dataset에서의 제안된 기법은 네트워크 구조에 상관없이 적대적 학습을 수행한 일반 모델보다 적대적 샘플에 대해 더 높은 정확도를 보였다. 특히 우리의 접근법은 PGD, FGSM, BIM과 같은 다양한 공격과 더 강력한 adversary에 대해서도 더 강건했다. 나아가 우리는 attention map을 시각화함으로써 attention module이 적대적 샘플에 대해서도 정확한 클래스의 특징을 추출한다는 것을 확인했다.

국내 심부 암반지하수에서의 고농도 불소 산출과 관련된 수리지구화학 진화 (Hydrogeochemical Evolution Related to High Fluoride Concentrations in Deep Bedrock Groundwaters, Korea)

  • 김경호;윤성택;채기탁;김성용;권장순;고용권
    • 자원환경지질
    • /
    • 제39권1호
    • /
    • pp.27-38
    • /
    • 2006
  • 국내 심부 암반지하수에서의 고농도 불소의 산출을 지배하는 지질 및 수리지구화학적 환경을 이해하고자, 온천 개발 목적으로 착정한 심부지하수 관정(평균 심도 약 600m)에서 취득된 총 367개의 지하수 분석 자료에 대하여 지구화학적 고찰을 수행하였다. 이들 지하수에서의 불소 농도는 매우 높아 평균 5.65mg/L에 이르며, 특히 연구 대상 지하수 중 $72\%$에서 먹는 물 수질기준(1.5mg/L)을 초과하였다. 불소 함량은 일차적으로 지질 조건의 지배를 강하게 나타냄을 확인하였는데 가장 높은 농도는 화강암류 및 화강편마암 지역에서 산출되는 반면 화산암 및 퇴적암 지역에서는 가장 낮았다. 지하수의 수리지구화학상과 관련하여 보면, 중성 내지 약알칼리성인 $Ca-HCO_3$형 지하수에 비하여 알칼리성의 $Na-HCO_3$형 지하수가 현저히 높은 불소 함량을 나타내었다. 화강암류 및 화강편마암 지역에서 지하수의 심부 순환에 수반되는 장기간의 물-암석 반응이 고농도 불소 산출의 가장 중요한 이유로 생각된다. 방해석 침전 또는 양이온교환에 의한 Ca 이온의 감소, 그리고 뒤따라 발생하는 사장석과 불소 함유 수산화광물(특히 흑운모)의 용해로 특징되는 일련의 수리지구화학 반응이 이러한 환경 하에서의 고불소 지하수 생성의 원인으로 해석된다. 따라서 불소과다에 의한 물 공급 문제의 발생 가능성은 높은 pH 및 매우 높은 Na/Ca농도비를 나타내는 화강암류 및 화강편마암 지역의 지하수에서 가장 높다고 볼 수 있다

무인잠수정 해미래 활용 동해 저서환경 심해탐사 (Deep-sea floor exploration in the East Sea using ROV HEMIRE)

  • 민원기;김종욱;김웅서;김동성;이판묵;강정훈
    • 한국산학기술학회논문지
    • /
    • 제17권4호
    • /
    • pp.222-230
    • /
    • 2016
  • 국내 심해 저서환경의 접근 한계로 서식생물과 인근환경 연구를 위한 정밀채집이 불가능하였으나, 6,000 미터급 심해 무인잠수정 해미래의 개발로 가능성이 열렸다. 활용가능성 확인을 위해, 2015년 6월에 2주간 동해에서 연구선 온누리호와 무인잠수정 해미래를 이용하여 울릉분지와 후포퇴 사면의 8개 정점에서 심해 종합해양연구를 국내최초로 수행하였다. 수심 범위가 194~2,080m인 조사해역에서 총 10회 잠수를 수행하였고, 잠수시간은 운용조건에 따라 약 1~6시간 소요되었다. 조사 결과, 1) 주요 심해 해저면의 실제 영상, 2) 주요 수산자원인 홍게류의 서식밀도 및 미기록 생물종을 포함한 심해생물상 자료, 3) 해저협곡의 경사면 등 특이 지형 확인, 4) 압력주상채니기를 이용한 퇴적물 주상시료 채집, 5) 육상폐기물 해양 투기현황을 확인 및 획득하였다. 본 탐사결과 심해 저서환경 및 생물의 직접관찰 및 채집이 가능함을 확인하였다.

A modified U-net for crack segmentation by Self-Attention-Self-Adaption neuron and random elastic deformation

  • Zhao, Jin;Hu, Fangqiao;Qiao, Weidong;Zhai, Weida;Xu, Yang;Bao, Yuequan;Li, Hui
    • Smart Structures and Systems
    • /
    • 제29권1호
    • /
    • pp.1-16
    • /
    • 2022
  • Despite recent breakthroughs in deep learning and computer vision fields, the pixel-wise identification of tiny objects in high-resolution images with complex disturbances remains challenging. This study proposes a modified U-net for tiny crack segmentation in real-world steel-box-girder bridges. The modified U-net adopts the common U-net framework and a novel Self-Attention-Self-Adaption (SASA) neuron as the fundamental computing element. The Self-Attention module applies softmax and gate operations to obtain the attention vector. It enables the neuron to focus on the most significant receptive fields when processing large-scale feature maps. The Self-Adaption module consists of a multiplayer perceptron subnet and achieves deeper feature extraction inside a single neuron. For data augmentation, a grid-based crack random elastic deformation (CRED) algorithm is designed to enrich the diversities and irregular shapes of distributed cracks. Grid-based uniform control nodes are first set on both input images and binary labels, random offsets are then employed on these control nodes, and bilinear interpolation is performed for the rest pixels. The proposed SASA neuron and CRED algorithm are simultaneously deployed to train the modified U-net. 200 raw images with a high resolution of 4928 × 3264 are collected, 160 for training and the rest 40 for the test. 512 × 512 patches are generated from the original images by a sliding window with an overlap of 256 as inputs. Results show that the average IoU between the recognized and ground-truth cracks reaches 0.409, which is 29.8% higher than the regular U-net. A five-fold cross-validation study is performed to verify that the proposed method is robust to different training and test images. Ablation experiments further demonstrate the effectiveness of the proposed SASA neuron and CRED algorithm. Promotions of the average IoU individually utilizing the SASA and CRED module add up to the final promotion of the full model, indicating that the SASA and CRED modules contribute to the different stages of model and data in the training process.

Fast Fourier Transform Analysis of Welding Penetration Depth Using 2 kW CW Nd:YAG Laser Welding Machine

  • Kim, Do-Hyung;Chung, Chin-Man;Baik, Sung-Hoon;Kim, Koung-Suk;Kim, Jin-Tae
    • 비파괴검사학회지
    • /
    • 제28권4호
    • /
    • pp.372-376
    • /
    • 2008
  • We report experimental results on the correlations between welding penetration depth and the frequencies of the radiation from the welding pool. Various welding samples such as SUS304, brass, SUS316, etc. have been investigated with 2 kW CW Nd:YAG laser welding machine. The radiation signals from the plume generated by the interactions between the welding sample and laser with respect to the defocusing length was measured with fiber system collecting the plume signal. Analysis of the frequencies by using fast Fourier transform (FFT) shows that the penetration depth is deep as plume signal frequencies are low, shallow penetration depth for high frequencies. Frequencies up to 250 Hz for obtained signals can be analyzed with the discrete FFT. This is the useful method fur closed loop control of the laser power with respect to the welding penetration depth and is used for real time inspection of the welding quality.

균형 잡힌 데이터 증강 기반 영상 감정 분류에 관한 연구 (A Study on Visual Emotion Classification using Balanced Data Augmentation)

  • 정치윤;김무섭
    • 한국멀티미디어학회논문지
    • /
    • 제24권7호
    • /
    • pp.880-889
    • /
    • 2021
  • In everyday life, recognizing people's emotions from their frames is essential and is a popular research domain in the area of computer vision. Visual emotion has a severe class imbalance in which most of the data are distributed in specific categories. The existing methods do not consider class imbalance and used accuracy as the performance metric, which is not suitable for evaluating the performance of the imbalanced dataset. Therefore, we proposed a method for recognizing visual emotion using balanced data augmentation to address the class imbalance. The proposed method generates a balanced dataset by adopting the random over-sampling and image transformation methods. Also, the proposed method uses the Focal loss as a loss function, which can mitigate the class imbalance by down weighting the well-classified samples. EfficientNet, which is the state-of-the-art method for image classification is used to recognize visual emotion. We compare the performance of the proposed method with that of conventional methods by using a public dataset. The experimental results show that the proposed method increases the F1 score by 40% compared with the method without data augmentation, mitigating class imbalance without loss of classification accuracy.

머신러닝 스태킹 앙상블을 이용한 자율주행 자동차 RADAR 성능 향상 (Enhancing Autonomous Vehicle RADAR Performance Prediction Model Using Stacking Ensemble)

  • 장시연;최혜림;오윤주
    • 인터넷정보학회논문지
    • /
    • 제25권2호
    • /
    • pp.21-28
    • /
    • 2024
  • 레이다는 자율주행 차에 있어 필수적인 센서 부품으로, 레이다가 활용되는 시장은 점차 커지고 있으며 제품 종류도 다양해지고 있다. 본 연구에서는 평가 공정에서부터 레이다의 불량 여부를 예측해 자율주행의 안정성과 효율성을 높일 수 있도록 성능 예측 모델을 구축하고 평가하였다. 레이더 공정 과정의 39607개 입력 데이터로 모델을 학습하였으며, 결과적으로 17개 모델을 스태킹 앙상블했을 때 Meta Ridge 모델이 가장 높은 학습률을 나타내는 것을 확인하였다. 이러한 연구 결과가 제품의 불량을 공정 단계에서 우선 예측해 수율을 극대화하고 불량으로 인한 제품 폐기 비용을 감축하는 데 도움이 될 것으로 기대 한다.

아웃페인팅 기반 반려동물 자세 추정에 관한 예비 연구 (A Pilot Study on Outpainting-powered Pet Pose Estimation)

  • 이규빈;이영찬;유원상
    • 융합신호처리학회논문지
    • /
    • 제24권1호
    • /
    • pp.69-75
    • /
    • 2023
  • 최근 동물 행동 분석 및 건강관리 분야를 중심으로 딥러닝 기반 동물 자세 추정 기법에 대한 관심이 높아지고 있다. 그러나 기존 동물 자세 추정 기법은 영상에서 신체 부위가 가려지거나 존재하지 않을 경우 좋은 성능을 보이지 않는다. 특히 꼬리나 귀가 가려진 경우, 반려견의 행동 및 감정 분석의 성능에도 심각한 영향을 미친다. 본 논문에서는 이러한 다루기 힘든 문제를 해결하기 위해, 이미지 아웃페인팅 네트워크를 자세 추정 네트워크에 연결하여 이미지 외부에 존재하는 반려견의 신체를 복원한 확장된 이미지를 생성하여 반려견의 자세를 추정하는 단순하면서도 새로운 접근방법을 제안하였고, 제안된 방법의 실현가능성을 검토하는 예비 연구를 수행하였다. 이미지 아웃페인팅 모델로는 CE-GAN과 트랜스포머 기반의 BAT-Fill을 사용하였고, 자세 추정 모델로는 SimpleBaseline을 사용하였다. 실험 결과, 크롭된 입력 이미지에서 반려견의 자세를 추정하였을 때보다, BAT-Fill을 사용하여 아웃페인팅된 확장 이미지에서 반려견의 자세를 추정하였을 때 자세 추정의 성능이 향상되었다.