• 제목/요약/키워드: image augmentation

검색결과 217건 처리시간 0.023초

Accuracy evaluation of liver and tumor auto-segmentation in CT images using 2D CoordConv DeepLab V3+ model in radiotherapy

  • An, Na young;Kang, Young-nam
    • 대한의용생체공학회:의공학회지
    • /
    • 제43권5호
    • /
    • pp.341-352
    • /
    • 2022
  • Medical image segmentation is the most important task in radiation therapy. Especially, when segmenting medical images, the liver is one of the most difficult organs to segment because it has various shapes and is close to other organs. Therefore, automatic segmentation of the liver in computed tomography (CT) images is a difficult task. Since tumors also have low contrast in surrounding tissues, and the shape, location, size, and number of tumors vary from patient to patient, accurate tumor segmentation takes a long time. In this study, we propose a method algorithm for automatically segmenting the liver and tumor for this purpose. As an advantage of setting the boundaries of the tumor, the liver and tumor were automatically segmented from the CT image using the 2D CoordConv DeepLab V3+ model using the CoordConv layer. For tumors, only cropped liver images were used to improve accuracy. Additionally, to increase the segmentation accuracy, augmentation, preprocess, loss function, and hyperparameter were used to find optimal values. We compared the CoordConv DeepLab v3+ model using the CoordConv layer and the DeepLab V3+ model without the CoordConv layer to determine whether they affected the segmentation accuracy. The data sets used included 131 hepatic tumor segmentation (LiTS) challenge data sets (100 train sets, 16 validation sets, and 15 test sets). Additional learned data were tested using 15 clinical data from Seoul St. Mary's Hospital. The evaluation was compared with the study results learned with a two-dimensional deep learning-based model. Dice values without the CoordConv layer achieved 0.965 ± 0.01 for liver segmentation and 0.925 ± 0.04 for tumor segmentation using the LiTS data set. Results from the clinical data set achieved 0.927 ± 0.02 for liver division and 0.903 ± 0.05 for tumor division. The dice values using the CoordConv layer achieved 0.989 ± 0.02 for liver segmentation and 0.937 ± 0.07 for tumor segmentation using the LiTS data set. Results from the clinical data set achieved 0.944 ± 0.02 for liver division and 0.916 ± 0.18 for tumor division. The use of CoordConv layers improves the segmentation accuracy. The highest of the most recently published values were 0.960 and 0.749 for liver and tumor division, respectively. However, better performance was achieved with 0.989 and 0.937 results for liver and tumor, which would have been used with the algorithm proposed in this study. The algorithm proposed in this study can play a useful role in treatment planning by improving contouring accuracy and reducing time when segmentation evaluation of liver and tumor is performed. And accurate identification of liver anatomy in medical imaging applications, such as surgical planning, as well as radiotherapy, which can leverage the findings of this study, can help clinical evaluation of the risks and benefits of liver intervention.

딥러닝 기반 지하공동구 제어반 문열림 인식 (Deep Learning-based Object Detection of Panels Door Open in Underground Utility Tunnel)

  • 김경환;김지은;정우석
    • 한국재난정보학회 논문집
    • /
    • 제19권3호
    • /
    • pp.665-672
    • /
    • 2023
  • 연구목적: 지하공동구는 도시 지하에 전기, 수도, 가스 등의 인프라를 공동 수용하는 시설로 공기 흐름이 부족하여 계절에 상관없이 결로가 자주 발생한다. 결로는 전기 설비의 누전 화재를 일으키는 원인이 되므로 지하공동구 내의 조명 등 각종 시설물 관리를 위해 필요한 제어반은 결로에 노출되지 않도록 문이 닫힌 상태로 관리되어야 한다. 본 논문에서는 딥러닝 객체인식 기술을 활용하여 수km 거리에 반복 배치된 공동구 제어반의 문 열림 여부를 이동 카메라 조건과 조명이 꺼진 조건에서도 인식하고자 한다. 연구방법: 지하공동구를 순찰하는 로봇이 촬영한 영상데이터를 이용하여 딥러닝 객체인식 모델인 YOLO를 모자이크 이미지 증강기법으로 학습시켜 제어반 문 열림과 문 닫힘을 인식한다. 연구결과: 모자이크 이미지 증강기법으로 학습시킨 모델과 사용하지 않은 모델의 성능을 비교한 결과, 모자이크 학습 모델이 더 우수한 성능(모든 클래스에 대한 mAP가 0.994 이상임)을 보이는 것을 확인하였다. 결론: 지하공동구의 조명이 꺼진 상태에서도, 공동구 내부 시설물이 복잡한 환경에서도 제어반의 문열림 여부를 우수한 성능으로 인식하여 지하공동구 재난안전관리에 도움이 될 것으로 기대된다.

드론 촬영 이미지 데이터를 기반으로 한 도로 균열 탐지 딥러닝 모델 개발 (Development of Deep Learning Model for Detecting Road Cracks Based on Drone Image Data)

  • 권영주;문성호
    • 토지주택연구
    • /
    • 제14권2호
    • /
    • pp.125-135
    • /
    • 2023
  • 드론은 국토조사, 수송, 해양, 환경, 방재, 문화재, 건설 등 다양한 분야에서 활용되고 있다. 또한 사물인터넷(Internet of Things), 인공지능(Artificial Intelligence) 등과 관련하여 4차 산업 혁명의 핵심기술을 검증하고 적용시킬 수 있는 기술로 떠오르고 있다. 본 연구에서는 드론을 활용하여 균열을 자동으로 탐지할 수 있는 딥러닝 모델을 개발하고자 한다. 딥러닝 학습을 위한 이미지 데이터는 Mavic3 드론을 이용하여 수집하였고 촬영고도는 20m, ×7배율로 촬영하였다. 촬영 시 약 2m/s의 속도로 전진하여 영상을 찍고, 프레임을 추출하는 식으로 데이터를 수집하였다. 이런식으로 수집한 데이터를 통해 딥러닝 학습을 진행하였다. 본 연구에서는 딥러닝 학습모델로 Backbone으로는 Swin Transformer, Architecture로 UperNet을 사용하였다. 약 800장의 라벨링 된 데이터를 Augmentation기법으로 데이터 양을 증가시키고 3차에 걸쳐 학습을 진행하였다. 1차와 2차 학습 시 Cross-Entropy loss function을 사용하였고 3차 학습 시 Tversky Loss Function을 사용하였다. 학습결과, 균열 탐지와 균열율을 계산할 수 있는 모델을 개발하였다. 또한, 드론의 위치 정보를 이용해 특정 도로의 한 차선 균열율을 계산할 수 있는 모델을 개발하였다. 향후 추가적인 연구를 통하여 균열탐지모델의 고도화를 사물인터넷(IoT)과의 융합으로 이루었을 때 소파보수(Patching)나 포트홀(Pothole)의 탐지가 가능할 것으로 보인다. 또한 드론의 실시간 탐지 업무수행으로 포장 유지 보수구간에 대한 탐지를 신속하게 확보할 수 있을것으로 기대된다.

얼굴의 측면 윤곽선 개선을 위한 미용 코성형술 (Aesthetic Rhinoplasty for the Improvement of the Lateral Facial Profile; Image-up Rhinoplasty)

  • 김성민
    • Archives of Plastic Surgery
    • /
    • 제32권2호
    • /
    • pp.205-213
    • /
    • 2005
  • There are several characteristics of the nose of orientals. The dorsum of nose is flat and low, the skin is thick with severe tension, the nasal tip is bulbous, the nostril is wide, and the projection of the nose is limited due to a poorly developed alar cartilage with a short columella. In order to improve these untoward characteristics of the nose of Orientals aesthetically, plain augmentation of the dorsum and tip-plasty with conventional methods has been performed by many plastic surgeons. However these conventional rhinoplasty is not enough to obtain satisfactory results when transforming into a more beautiful and aesthetically charming appearance. In order to produce the optimal nasal shape and profile, it is extremely important to consider the aesthetic surgical factors, which are; the position of the nasion, the optimal nasolabial angle(95-100 degree in Orientals), the natural exposure of infra-tip lobule with and columella, the position of the tip defining point in harmony with the dorsal profile and the smooth and natural silhouette of the lateral nasal profile as it descends into the inferior portion of the nose. From April, 2003 to August, 2004, a total of 52 patients underwent open rhinoplasty, adhering to the strict aesthetic principles considered and described priorly. Surgical approach was done through a transcolumella incision and an alar rim incision. The nasal dorsum was augmented with a silicone implant and the shape of the columella and the nasolabial angle were finessed with a silicone strut implant which was placed in between the medial crurae in a manner of a non-visible graft. The nasal tip was corrected by alar cartilage suture technique and onlay graft of shield shaped Alloderm and Gore-Tex. Author obtained the optimal nasal shape and profile aesthetically, and the results, considered satisfactory in all patients without any complications, are as follows; 1. the average increase in nasal length was 2.5 mm, 2. the average decrease in nasal width was 2.1 mm, 3. the average increase in nasal tip projection was 3.2 mm, 4. the changes of nasolabial angles were from 85.5 degree to 94.7 degree, 5. the changes of the angle between the long axis of the external naris was from 101.3 degree to 89.5 degree. In conclusion, this surgical procedure is an effective, reliable and a valuable method in improving the nasal shape, tip projection, nasolabial angle and especially, the lateral facial profile of Orientals aesthetically.

증강현실 콘텐츠의 산업화 : 21세기 영화와 증강현실 예술을 중심으로 (Industrialization of Augmented Reality Contents : Focusing on the 21st Century's Films and Augmented Reality Arts)

  • 김희영
    • 만화애니메이션 연구
    • /
    • 통권35호
    • /
    • pp.347-374
    • /
    • 2014
  • 본 논문은 증강현실 기술을 사용한 21C 영화들의 영화적 상상과 증강현실 예술의 예술적 상상을 중심으로 증강현실 콘텐츠 산업화의 미래에 관하여 연구하였다. 영화에서는 영화적 상상을 통해 미래의 기술을 보여주는 동시에 미래상을 제시하는 역할을 하고, 증강현실 예술은 기술적으로 구현할 수 있는 현재의 기술을 통해 미래 예술과 사회의 거시적인 문화를 포착하는 역할을 하고 있다. 조사된 영화들을 증강현실 기술별로 분류한 결과, 제스처 인식은 투명 디스플레이어 관련 기술과 연계하여 발전하고, 홀로그램 기술은 개별화된 커뮤니케이션 방식으로 변화되며, 생체인식은 다중 생체인식으로의 발전 가능성이 있고, 웨어러블 컴퓨터는 물리적인 신체증강 측면으로도 발전하여 산업화될 것으로 전망된다. 증강현실 예술에서 아바타의 다양한 활용은 홀로그램과 관련이 있고, 인체의 생체 현상의 활용은 생체인식으로 연계되며, 현실세계와 가상세계의 혼합은 제스처 인식을 통해 디스플레이어를 활용하고, HMD의 새로운 시도는 웨어러블 컴퓨터의 다변화와 함께 산업화될 것으로 보인다. 영화와 예술에서 상상과 구현을 통해 나타난 증강현실 콘텐츠는 인간 생활의 조력자 역할을 담당하고, 동시에 인간과 환경 간에 매개 없이 융화되는 방식으로 산업화되는 미래상을 제시한다.

짧은 임플란트의 생존율과 변연골 흡수량에 관한 임상적 연구 (Clinical Study on the Survival Rate and Marginal Bone Resorption of Short Implants)

  • 명태수;정승현;김태영;김유리
    • 구강회복응용과학지
    • /
    • 제28권1호
    • /
    • pp.1-13
    • /
    • 2012
  • 짧은 임플란트는 상악동이나 하치조신경 등의 해부학적 구조물이 있거나 심한 치조골 흡수로 인해 제한적인 치조제 높이를 가지는 부위에서 사용되고 있다. 본 연구는 길이 10 mm 이하의 임플란트에서 임플란트의 길이, 직경, 식립 부위, 골이식술 유무, 보철물의 연결고정 유무가 임플란트의 생존율과 변연골 흡수에 미치는 영향을 알아보고자 하였다. 원광대학교 치과병원 임플란트센터에서 길이 10 mm 이하의 임플란트를 식립한 137명의 환자, 227개 임플란트를 대상으로 진료 기록부를 통해 임플란트의 길이, 직경, 식립 위치, 골이식 유무, 보철물의 연결고정 유무를 조사하였다. 변연골 흡수량은 Emago advanced v5.6(Oral diagnostic systems, Amsterdam, The Netherlands) 프로그램을 이용하여 측정하였다. 총 227개의 임플란트 중 8개가 실패하여, 전체 짧은 임플란트의 생존율은 96.5 %로 나타났다. 골이식 부위와 상악에 식립된 경우 더 높은 실패율을 보이는 경향이 있었으며, 임플란트의 길이와 직경은 변연골 흡수량에 영향을 미치지 않았다. 실패 요인을 조사하였을 때, 상악의 불량한 골질과 골이식 유무가 임플란트의 더 높은 실패율에 영향을 미쳤다. 10 mm 이하 임플란트에서 길이, 직경, 식립 부위, 골이식술과 보철물의 연결 고정은 임플란트 생존율과 변연골 흡수량에 영향을 끼치지 않았다.

YOLO 알고리즘을 활용한 터널 GPR 이미지 내 강지보재 탐지 (Detection of Steel Ribs in Tunnel GPR Images Based on YOLO Algorithm)

  • 배병규;안재훈;정현준;유창균
    • 한국지반공학회논문집
    • /
    • 제39권7호
    • /
    • pp.31-37
    • /
    • 2023
  • 터널은 지중에 건설되는 구조물이므로 육안으로 터널 강지보재의 위치 등의 확인이 불가능하다. 이에, 터널 유지관리시에는, 일반적으로 GPR 이미지를 활용하여 강지보재 탐지를 수행한다. 인공신경망을 통한 GPR 이미지 분석에 대한 연구는, 주로 지하배관, 도로 손상 등의 탐지에 집중되어 있으며, 강지보재 등의 터널 GPR 데이터를 분석한 사례는 해외와 국내 모두 제한적이다. 본 연구에서는, 합성곱 신경망을 기반으로 하는 1단계 객체인식 알고리즘인 YOLO를 활용하여, GPR 데이터를 바탕으로 한 터널 강지보재의 위치 탐지를 자동화하고, 그 성능을 분석한다. 원본 이미지 데이터는 총 512개이며 원본 이미지 데이터로 이루어진 데이터 세트와 원본 이미지 데이터와 증식기법이 적용된 이미지 데이터를 병합한 2,048개의 데이터로 이루어진 데이터 세트를 해석에 활용하였다. 증식한 데이터를 사용한 모델의 강지보재 누락율(전체 강지보재와 탐지하지 못한 지보재 숫자의 비율)은 0.38%, 원본 데이터만을 활용한 모델의 강지보재 누락율은 7.18%로 나타났다. 따라서, 분석 자동화 측면에서는, 증식기법이 적용된 데이터 세트를 활용하는 것이 더 실용적일 것으로 판단된다.

멀티 브랜치 네트워크 구조 탐색을 사용한 구름 영역 분할 (Semantic Segmentation of Clouds Using Multi-Branch Neural Architecture Search)

  • 정치윤;문경덕;김무섭
    • 대한원격탐사학회지
    • /
    • 제39권2호
    • /
    • pp.143-156
    • /
    • 2023
  • 인공위성이 촬영한 영상의 내용을 정확하게 분석하기 위해서는 영상에 존재하는 구름 영역을 정확하게 인지하는 것이 필요하다. 최근 다양한 분야에서 딥러닝(deep learning) 모델이 뛰어난 성능을 보여줌에 따라 구름 영역 검출을 위해 딥러닝 모델을 적용한 방법들이 많이 제안되고 있다. 하지만 현재 구름 영역 검출 방법들은 의미 영역 분할 방법의 네트워크 구조를 그대로 사용하여 구름 검출 성능을 향상하는 데는 한계가 있다. 따라서 본 논문에서는 구름 검출 데이터 세트에 다중 브랜치 네트워크 구조 탐색을 적용하여 구름 영역 검출에 최적화된 네트워크 모델을 생성함으로써 구름 검출 성능을 향상하는 방법을 제안한다. 또한 구름 검출 성능을 향상하기 위하여 의미 영역 분할 모델의 학습 단계와 평가 단계의 평가 기준 불일치를 해소하기 위해 제안된 soft intersection over union (IoU) 손실 함수를 사용하고, 다양한 데이터 증강 방법을 적용하여 학습 데이터를 증가시켰다. 본 논문에서 제안된 방법의 성능을 검증하기 위하여 아리랑위성 3/3A호에서 촬영한 영상으로 구성된 구름 검출 데이터 세트를 사용하였다. 먼저 제안 방법과 의미 영역 분할 데이터 세트에서 탐색된 기존 네트워크 모델의 성능을 비교하였다. 실험 결과, 제안 방법의 mean IoU는 68.5%이며, 기존 모델보다 mIoU 측면에서 4%의 높은 성능을 보여주었다. 또한 soft IoU 손실 함수를 포함한 다섯 개의 손실 함수를 적용하여 손실 함수에 따른 구름 검출 성능을 분석하였으며, 실험 결과 본 연구에서 사용한 soft IoU 함수가 가장 좋은 성능을 보여주었다. 마지막으로 의미 영역 분할 분야에서 활용되는 최신 네트워크 모델과 제안 방법의 구름 검출 성능을 비교하였다. 실험 결과, 제안 모델이 의미 영역 분할 분야의 최신 모델들보다 mIoU와 정확도 측면에서 더 나은 성능을 보여주는 것을 확인하였다.

Establishment of a deep learning-based defect classification system for optimizing textile manufacturing equipment

  • YuLim Kim;Jaeil Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제28권10호
    • /
    • pp.27-35
    • /
    • 2023
  • 본 논문에서는 복합소재 생산 분야에서 수요가 높은 프리프레그 섬유 제조 공정에 딥러닝 기반의 결함 검출 및 분류 시스템을 적용하여 생산성을 높이는 과정을 제안한다. 다양한 조건별 다량의 불량 발생으로 해결방안이 필요한 토우 프리프레그 제조 장비에 적용하기 위해 우선 결함 감지와 분류 모델 제작에 필요한 카메라 및 조명을 선정하여 최적의 환경을 구축하였다. 그리고 다중 분류 모델 제작에 필요한 데이터를 수집하고 정상 및 불량 조건에 따라 라벨링을 진행하였다. 다중 분류 모델은 CNN 기반으로 제작하였으며 VGGNet과 MobileNet, ResNet 등의 사전 학습모델을 적용하여 성능을 비교하고 정확도 및 손실 그래프로 개선 방향을 파악한다. 주요 문제로 과적합 문제를 확인하여 개선하기 위해 데이터 증강 및 Dropout 기법을 적용하여 보완하였다. 모델에 대한 성능 평가를 위해 혼돈행렬을 성능지표로 한 성능 평가를 진행하였으며 99% 이상의 성능을 확인하였다. 또한, 실제 공정에 적용하여 실시간 획득된 이미지에 대한 분류 결과를 확인해보며 판별 값이 정확히 도출되는지 확인한다.

U-net 딥러닝 기법을 활용한 PVA 섬유 보강 시멘트 복합체의 섬유 분리 (Phase Segmentation of PVA Fiber-Reinforced Cementitious Composites Using U-net Deep Learning Approach)

  • 서지우;한동석
    • 한국전산구조공학회논문집
    • /
    • 제36권5호
    • /
    • pp.323-330
    • /
    • 2023
  • PVA 섬유 보강 시멘트 복합체는 매우 복잡한 미세구조를 가지고 있으며, 재료의 거동을 정확히 평가하기 위해서는 미세구조 특성을 반영하여 실제 실험과 시너지효과를 내며 효율적인 재료 설계를 가능하게 하는 해석 모델의 개발이 중요하다. PVA 섬유 보강 시멘트 복합체의 역학적 성능은 PVA 섬유의 방향성에 큰 영향을 받는다. 그러나 마이크로-CT 이미지로부터 얻은 PVA 섬유의 회색조 값을 인접한 상과 구분하기 어려워, 섬유 분리 과정에 많은 시간이 소요된다. 본 연구에서는 섬유의 3차원 분포를 얻기 위하여 0.65㎛3의 복셀 크기를 가지는 마이크로-CT 이미지 촬영을 수행하였다. 학습에 사용될 학습 데이터를 생성하기 위해 히스토그램, 형상, 그리고 구배 기반 상 분리 방법을 적용하였다. 본 연구에서 제안된 U-net 모델을 활용하여 PVA 섬유 보강 시멘트 복합체의 마이크로- CT 이미지로부터 섬유를 분리하는 학습을 수행하였다. 훈련의 정확도를 높이기 위해 데이터 증강을 적용하였으며, 총 1024개의 이미지를 훈련 데이터로 사용하였다. 모델의 성능은 정확도, 정밀도, 재현율, F1 스코어를 평가하였으며, 학습된 모델의 섬유 분리 성능이 매우 높고 효율적이며, 다른 시편에도 적용될 수 있음을 확인하였다.