• 제목/요약/키워드: DeepU-Net

검색결과 181건 처리시간 0.028초

MEDU-Net+: a novel improved U-Net based on multi-scale encoder-decoder for medical image segmentation

  • Zhenzhen Yang;Xue Sun;Yongpeng, Yang;Xinyi Wu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권7호
    • /
    • pp.1706-1725
    • /
    • 2024
  • The unique U-shaped structure of U-Net network makes it achieve good performance in image segmentation. This network is a lightweight network with a small number of parameters for small image segmentation datasets. However, when the medical image to be segmented contains a lot of detailed information, the segmentation results cannot fully meet the actual requirements. In order to achieve higher accuracy of medical image segmentation, a novel improved U-Net network architecture called multi-scale encoder-decoder U-Net+ (MEDU-Net+) is proposed in this paper. We design the GoogLeNet for achieving more information at the encoder of the proposed MEDU-Net+, and present the multi-scale feature extraction for fusing semantic information of different scales in the encoder and decoder. Meanwhile, we also introduce the layer-by-layer skip connection to connect the information of each layer, so that there is no need to encode the last layer and return the information. The proposed MEDU-Net+ divides the unknown depth network into each part of deconvolution layer to replace the direct connection of the encoder and decoder in U-Net. In addition, a new combined loss function is proposed to extract more edge information by combining the advantages of the generalized dice and the focal loss functions. Finally, we validate our proposed MEDU-Net+ MEDU-Net+ and other classic medical image segmentation networks on three medical image datasets. The experimental results show that our proposed MEDU-Net+ has prominent superior performance compared with other medical image segmentation networks.

Landsat 8 기반 SPARCS 데이터셋을 이용한 U-Net 구름탐지 (U-Net Cloud Detection for the SPARCS Cloud Dataset from Landsat 8 Images)

  • 강종구;김근아;정예민;김서연;윤유정;조수빈;이양원
    • 대한원격탐사학회지
    • /
    • 제37권5_1호
    • /
    • pp.1149-1161
    • /
    • 2021
  • 컴퓨터 비전 기술이 위성영상에 적용되면서, 최근 들어 딥러닝 영상인식을 이용한 구름 탐지가 관심을 끌고 있다. 본연구에서는 SPARCS (Spatial Procedures for Automated Removal of Cloud and Shadow) Cloud Dataset과 영상자료증대 기법을 활용하여 U-Net 구름탐지 모델링을 수행하고, 10폴드 교차검증을 통해 객관적인 정확도 평가를 수행하였다. 512×512 화소로 구성된 1800장의 학습자료에 대한 암맹평가 결과, Accuracy 0.821, Precision 0.847, Recall 0.821, F1-score 0.831, IoU (Intersection over Union) 0.723의 비교적 높은 정확도를 나타냈다. 그러나 구름그림자 중 14.5%, 구름 중 19.7% 정도가 땅으로 잘못 예측되기도 했는데, 이는 학습자료의 양과 질을 보다 더 향상시킴으로써 개선 가능할 것으로 보인다. 또한 최근 각광받고 있는 DeepLab V3+ 모델이나 NAS(Neural Architecture Search) 최적화 기법을 통해 차세대중형위성 1, 2, 4호 등의 구름탐지에 활용 가능할 것으로 기대한다.

복소 스펙트럼 기반 음성 향상의 성능 향상을 위한 time-frequency self-attention 기반 skip-connection 기법 연구 (A study on skip-connection with time-frequency self-attention for improving speech enhancement based on complex-valued spectrum)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제42권2호
    • /
    • pp.94-101
    • /
    • 2023
  • 음성 향상에서 많이 사용되는 U-Net과 같이 인코더와 디코더로 구성된 심층 신경망 모델은 skip-connection을 통해 인코더의 특징을 디코더에 연결하는 구조로 구성되어 있다. Skip-connection은 디코더에서 향상된 스펙트럼을 재구성하는데 도움을 주며 인코더를 통해 손실된 정보를 보완해줄 수 있다. 이때 skip-connection을 통해 연결되는 인코더의 특징과 디코더의 특징의 의미는 서로 다르다. 본 논문에서는 복소 스펙트럼 기반 음성 향상의 성능 향상을 위해 디코더에 연결되는 인코더의 특징을 디코더 특징의 의미에 가깝게 변환해주도록 skip-connection에 Self-Attention(SA)을 적용하는 방안을 연구하였다. SA는 시퀀스-시퀀스 문제에서 출력 시퀀스를 생성할 때, 입력 시퀀스의 가중 산술 평균을 이용하여 결정적인 부분을 집중해서 볼 수 있도록 하는 기법으로, 음성 향상 분야에서도 이를 적용함으로써 성능 향상에 효과적임을 입증하는 연구가 진행되었다. SA를 skip-connection에 적용하기 위해 인코더 특징과 디코더 특징을 이용하는 총 3가지의 방법에 대해 연구하였다. TIMIT 데이터베이스를 이용한 음성 향상 실험 결과, 제안하는 방법이 기존 skip-connection으로만 연결된 Deep Complex U-Net(DCUNET)과 비교하여 모든 성능 평가 지표에서 향상된 결과를 보였다.

Comparing U-Net convolutional network with mask R-CNN in Nuclei Segmentation

  • Zanaty, E.A.;Abdel-Aty, Mahmoud M.;ali, Khalid abdel-wahab
    • International Journal of Computer Science & Network Security
    • /
    • 제22권3호
    • /
    • pp.273-275
    • /
    • 2022
  • Deep Learning is used nowadays in Nuclei segmentation. While recent developments in theory and open-source software have made these tools easier to implement, expert knowledge is still required to choose the exemplary model architecture and training setup. We compare two popular segmentation frameworks, U-Net and Mask-RCNN, in the nuclei segmentation task and find that they have different strengths and failures. we compared both models aiming for the best nuclei segmentation performance. Experimental Results of Nuclei Medical Images Segmentation using U-NET algorithm Outperform Mask R-CNN Algorithm.

Domain Shift 문제를 해결하기 위해 안개 특징을 이용한 딥러닝 기반 안개 제거 방법 (Deep learning-based de-fogging method using fog features to solve the domain shift problem)

  • 심휘보;강봉순
    • 한국멀티미디어학회논문지
    • /
    • 제24권10호
    • /
    • pp.1319-1325
    • /
    • 2021
  • It is important to remove fog for accurate object recognition and detection during preprocessing because images taken in foggy adverse weather suffer from poor quality of images due to scattering and absorption of light, resulting in poor performance of various vision-based applications. This paper proposes an end-to-end deep learning-based single image de-fogging method using U-Net architecture. The loss function used in the algorithm is a loss function based on Mahalanobis distance with fog features, which solves the problem of domain shifts, and demonstrates superior performance by comparing qualitative and quantitative numerical evaluations with conventional methods. We also design it to generate fog through the VGG19 loss function and use it as the next training dataset.

Multi-Tasking U-net 기반 파프리카 병해충 진단 (Multi-Tasking U-net Based Paprika Disease Diagnosis)

  • 김서정;김형석
    • 스마트미디어저널
    • /
    • 제9권1호
    • /
    • pp.16-22
    • /
    • 2020
  • 본 연구에서는 Multi-Tasking U-net를 사용하여 영역 세분화 작업(Segmentation) 과 분류 작업(Classification) 이 동시에 수행되게 함으로써 파프리카 병과 충 진단을 수행하였다. 시설 농장의 파프리카에는 병의 종류가 다양하지 않다. 이 연구에서는 비교적 발생빈도가 높은 흰가루병과 응애에 의한 피해, 정상 잎 3개의 클래스에 대해서만 진단 할 수 있도록 하였다. 이를 위한 중추 모델로는 U-net을 사용하였다. 또, 이 모델의 Encoder와 Decoder의 최종 단을 활용하여 분류 작업과 영역 세분화 작업이 각 각 수행되게하여, U-net의 Encoder가 분류작업과 영역 세분화 작업에 공유되도록 하였다. 학습 데이터로는 정상 잎 680장, 응애에 의한 피해 잎 450장, 흰가루병 370장을 사용하였다. 테스트 데이터로는 정상 잎 130장, 응애에 의한 피해 잎 100장, 흰가루병 90장을 사용하였고, 이를 통한 테스트 결과로는 89%의 인식률을 얻었다.

Improvement of learning concrete crack detection model by weighted loss function

  • Sohn, Jung-Mo;Kim, Do-Soo;Hwang, Hye-Bin
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권10호
    • /
    • pp.15-22
    • /
    • 2020
  • 본 연구에서는 가중치 오차 함수를 적용하여, 미세한 콘크리트 균열을 감지하는 U-Net 모델을 만들 수 있도록 개선 방안을 제안한다. 콘크리트 균열은 안전을 위협하는 요소이기 때문에 그 상태를 주기적으로 파악하고 신속하게 초기 대응을 하는 것이 중요하다. 하지만 현재는 점검자가 직접 육안으로 검사하고 평가하는 외관 검사법이 주로 사용되고 있다. 이는 정확성뿐만 아니라 비용과 시간, 안전성 측면에서도 한계점을 가진다. 이에 콘크리트 구조물에 생성되는 미세한 균열을 신속하고 정밀하게 탐지할 수 있도록 딥러닝을 활용한 기술들이 연구되고 있다. 본 연구에서 U-Net을 활용한 균열 탐지를 시도한 결과, 미세한 균열을 탐지하지 못하는 것을 확인하였다. 이에 제시한 가중치 오차 함수를 적용하여 학습한 모델에 대해 성능을 검증한 결과, 정확도(Accuracy) 99% 이상, 조화평균(F1_Score) 89%에서 92%의 신뢰성 높은 수치를 도출해내었고, 미세한 균열을 정확하고 선명하게 탐지한 결과를 통해 학습 개선 방안의 성능을 검증하였다.

임베디드 보드에서 실시간 의미론적 분할을 위한 심층 신경망 구조 (A Deep Neural Network Architecture for Real-Time Semantic Segmentation on Embedded Board)

  • 이준엽;이영완
    • 정보과학회 논문지
    • /
    • 제45권1호
    • /
    • pp.94-98
    • /
    • 2018
  • 본 논문은 자율주행을 위한 실시간 의미론적 분할 방법으로 최적화된 심층 신경망 구조인 Wide Inception ResNet (WIR Net)을 제안한다. 신경망 구조는 Residual connection과 Inception module을 적용하여 특징을 추출하는 인코더와 Transposed convolution과 낮은 층의 특징 맵을 사용하여 해상도를 높이는 디코더로 구성하였고 ELU 활성화 함수를 적용함으로써 성능을 올렸다. 또한 신경망의 전체 층수를 줄이고 필터 수를 늘리는 방법을 통해 성능을 최적화하였다. 성능평가는 NVIDIA Geforce gtx 1080과 TX1 보드를 사용하여 주행환경의 Cityscapes 데이터에 대해 클래스와 카테고리별 IoU를 평가하였다. 실험 결과를 통해 클래스 IoU 53.4, 카테고리 IoU 81.8의 정확도와 TX1 보드에서 $640{\times}360$, $720{\times}480$ 해상도 영상처리에 17.8fps, 13.0fps의 실행속도를 보여주는 것을 확인하였다.

SPADE 기반 U-Net을 이용한 고해상도 위성영상에서의 도시 변화탐지 (Urban Change Detection for High-resolution Satellite Images Using U-Net Based on SPADE)

  • 송창우;;정지훈;홍성재;김대희;강주형
    • 대한원격탐사학회지
    • /
    • 제36권6_2호
    • /
    • pp.1579-1590
    • /
    • 2020
  • 본 논문에서는 고해상도의 위성영상을 활용하여 도시의 변화 양상을 분석하기 위하여 SPADE기반의 U-Net과 객체 영역기반 변화탐지 방법을 제안한다. 제안하는 네트워크는 기존의 U-Net에서 공간 정보를 잃지 않기 위해 SPADE를 사용했다. 고해상도 위성영상을 활용한 변화탐지 방법은 계획, 예측 등 다양한 도시 문제를 해결하기 위해 활용할 수 있다. IR-MAD 등 전통적인 방법인 화소 기반의 변화탐지를 수행할 경우, 다중 시기 영상 간의 기후, 계절 변화 등에 의해 화소의 변화가 민감하기 때문에 미변화 지역들이 변화 지역으로 오탐지될 가능성이 매우 크다. 이에 본 논문에서는 시계열 위성영상에서 도시를 구성하는 객체에 대한 변위를 정확하게 탐지하기 위해 도시를 구성하는 주요 공간 객체를 정의하고, 딥러닝 기반 영상 분할을 통해 추출한 후 영역 간의 변위 오차를 분석하여 변화탐지를 수행한다. 변화 양상을 분석하기 위한 공간 객체로 건축물, 도로, 농경지, 비닐하우스, 산림 영역, 수변 영역의 6개로 정의하였다. KOMPSAT-3A 위성영상으로 학습한 각 네트워크 모델을 시계열 KOMPSAT-3 위성영상에 대한 변화탐지를 수행한다. 객관적인 성능 평가를 위한 변화탐지 지표는 F1-score, Kappa를 사용한다. 제안하는 변화탐지 기법은 U-Net, UNet++ 대비 뛰어난 결과를 보이며, 평균 F1 score는 0.77, kappa는 77.29의 성능을 확인할 수 있다.

무인기 영상 기반 옥수수 재배필지 추출을 위한 Attention U-NET 적용 및 평가 (Application and Evaluation of the Attention U-Net Using UAV Imagery for Corn Cultivation Field Extraction)

  • 신형섭;송석호;이동호;박종화
    • Ecology and Resilient Infrastructure
    • /
    • 제8권4호
    • /
    • pp.253-265
    • /
    • 2021
  • 본 연구에서는 위성영상 촬영 한계를 극복하고 재배 필지 현황 파악 기술 발전에 기여하고자 무인기 영상 및 딥러닝 모형을 이용하여 옥수수 재배 필지 추출 방법을 제안하였다. 연구대상지역은 충북 괴산군 감물면 이담리 일대로 설정하고, 무인기 촬영을 통해 해당지역의 정사영상을 취득하였다. 모형에 필요한 학습자료는 현장조사 자료와 팜맵을 이용하여 구축하였다. 본 연구에 적용한 딥러닝 모형은 의미론적 분할 모형인 Attention U-Net을 이용하였다. 모형의 성능 평가는 학습과정을 거친 후 비학습 자료를 이용하여 옥수수 재배 필지 추출에 대해서 실시 하였다. 모형 성능평가 결과 정밀도는 0.94, 재현율은 0.96 및 F1-Score는 0.92로 나타났다. 본 연구에 적용한 Attention U-Net방법은 옥수수 재배 필지를 효과적으로 추출할 수 있는 방법임을 확인하였다. 따라서 본 연구 방법은 옥수수는 물론 다른 작물에 대한 재배 필지 구분에도 유용하게 활용될 수 있을 것으로 기대된다.