• 제목/요약/키워드: Deep Learning Dataset

검색결과 776건 처리시간 0.021초

멀티모달 방식을 통한 가스 종류 인식 딥러닝 모델 개발 (Development of Gas Type Identification Deep-learning Model through Multimodal Method)

  • 안서희;김경영;김동주
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제12권12호
    • /
    • pp.525-534
    • /
    • 2023
  • 가스 누출 감지 시스템은 가스의 폭발성과 독성으로 인한 인명 피해를 최소화할 핵심적인 장치이다. 누출 감지 시스템은 대부분 단일 센서를 활용한 방식으로, 가스 센서나 열화상 카메라를 통한 검출 방식으로 진행되고 있다. 이러한 단일 센서 활용의 가스 누출감지 시스템 성능을 고도화하기 위하여, 본 연구에서는 가스 센서와 열화상 이미지 데이터에 멀티모달형 딥러닝을 적용한 연구를 소개한다. 멀티모달 공인 데이터셋인 MultimodalGasData를 통해 기존 논문과의 성능을 비교하였고, 가스 센서와 열화상 카메라의 단일모달 모델을 기반하여 네 가지 멀티모달 모델을 설계 및 학습하였다. 이를 통해 가스 센서와 열화상 카메라는 각각 1D CNN, GasNet 모델이 96.3%와 96.4%의 가장 높은 성능을 보였다. 앞선 두 단일모달 모델을 기반한 Early Fusion 형식의 멀티모달 모델 성능은 99.3%로 가장 높았으며, 또한 기존 논문의 멀티모달 모델 대비 3.3% 높았다. 본 연구의 높은 신뢰성을 갖춘 가스 누출 감지 시스템을 통해 가스 누출로 인한 추가적인 피해가 최소화되길 기대한다.

Clinical Validation of a Deep Learning-Based Hybrid (Greulich-Pyle and Modified Tanner-Whitehouse) Method for Bone Age Assessment

  • Kyu-Chong Lee;Kee-Hyoung Lee;Chang Ho Kang;Kyung-Sik Ahn;Lindsey Yoojin Chung;Jae-Joon Lee;Suk Joo Hong;Baek Hyun Kim;Euddeum Shim
    • Korean Journal of Radiology
    • /
    • 제22권12호
    • /
    • pp.2017-2025
    • /
    • 2021
  • Objective: To evaluate the accuracy and clinical efficacy of a hybrid Greulich-Pyle (GP) and modified Tanner-Whitehouse (TW) artificial intelligence (AI) model for bone age assessment. Materials and Methods: A deep learning-based model was trained on an open dataset of multiple ethnicities. A total of 102 hand radiographs (51 male and 51 female; mean age ± standard deviation = 10.95 ± 2.37 years) from a single institution were selected for external validation. Three human experts performed bone age assessments based on the GP atlas to develop a reference standard. Two study radiologists performed bone age assessments with and without AI model assistance in two separate sessions, for which the reading time was recorded. The performance of the AI software was assessed by comparing the mean absolute difference between the AI-calculated bone age and the reference standard. The reading time was compared between reading with and without AI using a paired t test. Furthermore, the reliability between the two study radiologists' bone age assessments was assessed using intraclass correlation coefficients (ICCs), and the results were compared between reading with and without AI. Results: The bone ages assessed by the experts and the AI model were not significantly different (11.39 ± 2.74 years and 11.35 ± 2.76 years, respectively, p = 0.31). The mean absolute difference was 0.39 years (95% confidence interval, 0.33-0.45 years) between the automated AI assessment and the reference standard. The mean reading time of the two study radiologists was reduced from 54.29 to 35.37 seconds with AI model assistance (p < 0.001). The ICC of the two study radiologists slightly increased with AI model assistance (from 0.945 to 0.990). Conclusion: The proposed AI model was accurate for assessing bone age. Furthermore, this model appeared to enhance the clinical efficacy by reducing the reading time and improving the inter-observer reliability.

특성맵 차분을 활용한 커널 기반 비디오 프레임 보간 기법 (Kernel-Based Video Frame Interpolation Techniques Using Feature Map Differencing)

  • 서동혁;고민성;이승학;박종혁
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제13권1호
    • /
    • pp.17-27
    • /
    • 2024
  • 비디오 프레임 보간(Video Frame Interpolation)은 움직임의 연속성을 증가시켜 영상을 부드럽게 재생할 수 있어 영상, 미디어 분야에서 사용되는 중요한 기술이다. 딥러닝 기반 비디오 프레임 보간 연구에서 널리 사용되는 방법 중 하나인 커널 기반 방법(Kernel Based Method)의 경우, 지역적인 변화를 잘 포착하지만 전체적인 변화를 처리하는 데 한계가 있었다. 이에 본 논문에서는 주요 변화 포착에 집중하기 위한 특성맵 차분, Two Direction을 적용한 새로운 U-Net 구조를 통해 파라미터 수를 줄이면서 중간 프레임을 보다 정확하게 생성하고자 한다. 실험 결과 제안한 구조가 기존보다 Vimeo, Middle-burry 등의 일반적인 데이터셋과 새로운 YouTube 데이터셋에서 기존 모델보다 약 61% 더 적은 파라미터로 PSNR 수치가 최대 0.3 우수한 성능을 달성하였다. 본 논문에서 사용한 코드는 https://github.com/Go-MinSeong/SF-AdaCoF에서 확인 가능하다.

YOLOv8과 무인항공기를 활용한 고해상도 해안쓰레기 매핑 (High-Resolution Mapping Techniques for Coastal Debris Using YOLOv8 and Unmanned Aerial Vehicle)

  • 박수호;김흥민;김영민;이인지;박미소;김탁영;장선웅
    • 대한원격탐사학회지
    • /
    • 제40권2호
    • /
    • pp.151-166
    • /
    • 2024
  • 해안쓰레기 문제는 전 세계적으로 환경에 대한 심각한 위협이 되고 있다. 본 연구에서는 딥러닝과 원격탐사 기술을 활용하여 해안쓰레기의 모니터링 방법을 개선하고자 하였다. 이를 위해 You Only Look Once (YOLO)v8 모델을 이용한 객체 탐지 기법을 적용하여 우리나라 주요 해안쓰레기 11종에 대한 대규모 이미지 데이터셋을 구축하고, 실시간으로 쓰레기를 탐지 및 분석할 수 있는 프로토콜(Protocol)을 제안한다. 낙동강 하구에 위치한 신자도를 대상으로 드론 이미지 촬영 및 자체 개발한 YOLOv8 기반의 분석 프로그램을 적용하여 해안쓰레기 성상별 핫스팟을 식별하였다. 이러한 매핑(Mapping) 및 분석 기법의 적용은 해안쓰레기 관리에 효과적으로 활용될 수 있을 것으로 기대된다.

컨테이너 터미널 내 반출입 차량 체류시간 예측 모형 (Prediciton Model for External Truck Turnaround Time in Container Terminal)

  • 김영일;신재영
    • 한국항해항만학회지
    • /
    • 제48권1호
    • /
    • pp.27-33
    • /
    • 2024
  • 코로나 팬데믹 이후 컨테이너 터미널 내 혼잡도 증가에 따라 반출입 차량 작업 대기 및 체류시간이 급증하여 반출입 작업 비효율이 극심한 실정이다. 이에 항만 당국은 반출입예약시스템(Vehicle Booking System; VBS)을 구축하여 시범운영 중에 있으나 이해관계자 간 정보공유 문제 및 컨테이너 운송 주체의 미온적 참여 등으로 인해 개선효과가 뚜렷하지 않다. 따라서 본 연구에서는 반출입 차량의 작업 대기 및 체류시간 문제의 해결을 위한 기초자료로써, 딥러닝 기반의 반출입 차량 체류시간 예측 모형을 제시하였다. 실제 컨테이너 터미널의 반출입 운영 데이터를 통해 제시한 예측 모형을 실험하고 실제 데이터와 비교하여 예측 정확도를 검증한 결과 제시한 예측 모형이 높은 예측 정확도를 보이는 것을 확인하였다.

장소 정보를 학습한 딥하이퍼넷 기반 TV드라마 소셜 네트워크 분석 (Social Network Analysis of TV Drama via Location Knowledge-learned Deep Hypernetworks)

  • 남장군;김경민;장병탁
    • 정보과학회 컴퓨팅의 실제 논문지
    • /
    • 제22권11호
    • /
    • pp.619-624
    • /
    • 2016
  • Social-aware video는 자유로운 스토리 전개를 통해 인물들간의 관계뿐만 아니라 경제, 정치, 문화 등 다양한 지식을 사람에게 전달해주고 있다. 특히 장소에 따른 사람들간의 대화 습성과 행동 패턴은 사회관계를 분석하는데 있어서 아주 중요한 정보이다. 하지만 멀티모달과 동적인 특성으로 인해 컴퓨터가 비디오로부터 자동으로 지식을 습득하기에는 아직 많은 어려움이 있다. 이러한 문제점들을 해결하기 위해 기존의 연구에서는 딥하이퍼넷 모델을 사용하여 드라마 등장인물의 시각과 언어 정보를 기반으로 계층적 구조를 사용해 소셜 네트워크를 분석하였다. 하지만 장소 정보를 사용하지 않아 전반적인 스토리로부터 소셜 네트워크를 분석할 수밖에 없었다. 본 논문에서는 기존 연구를 바탕으로 장소 정보를 추가하여 각 장소에서의 인물 특성을 분석해 보았다. 본 논문에서는 총 4400분 분량의 TV드라마 "Friends"를 사용했고 C-RNN모델을 통해 등장인물을 인식하였으며 Bag of Features로 장소를 분류하였다. 그리고 딥하이퍼넷 모델을 통해 자동으로 소셜 네트워크를 생성하였고 각 장소에서의 인물 관계 변화를 분석하였다.

조식동물 탐지 및 모니터링을 위한 딥러닝 기반 객체 탐지 모델의 강인성 평가 (Evaluation of Robustness of Deep Learning-Based Object Detection Models for Invertebrate Grazers Detection and Monitoring)

  • 박수호;김흥민;김탁영;임재영;장선웅
    • 대한원격탐사학회지
    • /
    • 제39권3호
    • /
    • pp.297-309
    • /
    • 2023
  • 최근 조식동물로 인한 갯녹음 현상으로 인해 연안 생태계 및 어장환경의 황폐화가 가속화되고 있다. 이러한 갯녹음 현상을 모니터링하고 방지대책을 세우기 위해서는 광범위한 해역에 대한 원격탐사 기반의 모니터링 기술 도입이 필요하다. 본 연구에서는 수중에서 촬영된 동영상으로부터 조식동물을 탐지하고 모니터링하기 위한 딥러닝 기반 객체 탐지 모델의 강인성(robustness)을 비교 분석하였다. 우리나라 연안의 대표적인 조식동물 7종을 대상으로 이미지 데이터셋을 구축하였으며, 이를 활용하여 딥러닝 기반 객체 탐지 모델인 You Only Look Once (YOLO)v7과 YOLOv8을 훈련시켰다. 총 6개의 YOLO 모델(YOLOv7, YOLOv7x, YOLOv8s, YOLOv8m, YOLOv8l, YOLOv8x)에 대해 탐지 성능과 탐지 속도를 평가하였으며, 수중환경에서 촬영 시 발생할 수 있는 다양한 이미지 왜곡에 대해서 강인성 평가를 실시하였다. 평가결과 YOLOv8 계열 모델이 파라미터(parameter) 수 대비 더 높은 탐지 속도(약 71-141 FPS [frame per second])를 보였다. 탐지 성능에 있어서도 YOLOv8 계열 모델(mean average precision [mAP] 0.848-0.882)이 YOLOv7 계열 모델(mAP 0.847-0.850)에 비해 더 높은 성능을 보이는 것을 확인하였다. 모델의 강인함에 있어서 형태 왜곡에 대해서는 YOLOv7 계열 모델이 YOLOv8 계열 모델에 비해 강인한 것을 확인하였으며, 색상 왜곡에 대해서는 YOLOv8 계열 모델이 상대적으로 강인한 것을 확인 하였다. 따라서 실해역에서 수중 영상 촬영 시, 형태 왜곡은 발생 빈도가 낮으며 색상 왜곡은 연안에서 빈번하게 발생한다는 점을 고려했을 때, 연안해역에서 조식동물 탐지와 모니터링을 위해서는 YOLOv8 계열 모델을 활용하는 것이 타당한 것으로 판단된다.

사례분석을 통한 객체검출 기술의 건설현장 적용 방안에 관한 연구 (A Study on the Application of Object Detection Method in Construction Site through Real Case Analysis)

  • 이기석;강성원;신윤석
    • 한국재난정보학회 논문집
    • /
    • 제18권2호
    • /
    • pp.269-279
    • /
    • 2022
  • 연구목적: 본 연구의 목적은 건설현장의 재해 예방을 위해 딥러닝기반의 개인보호구 검출 모델을 개발하고, 실제 건설현장에 적용하여 분석하는 것이다. 연구방법: 본 연구의 수행 방법은 실제 환경의 데이터를 구축하고, 개발된 개인보호구 검출 모델을 적용하였다. 개인보호구 검출 모델은 크게 근로자 검출 및 개인보호구 착용 분류 모델로 구성되어 있다. 근로자 검출 모델은 딥러닝 기반의 알고리즘을 실제 현장에서 획득한 데이터셋을 구축하여 학습 및 근로자를 검출하였고, 개인보호구 착용 분류 모델은 앞단에서 추출된 근로자 검출영역에서 학습된 개인보호구 검출 알고리즘을 적용하였다. 구축된 모델의 검증을 위해 건설현장 3곳에서 획득된 데이터를 통해 실험결과를 도출하였다. 연구결과: 데이터베이스 12,000장을 구축하여 정상검출 9,460장(78.8%), 오검출 1,468(12.2%), 미검출 1,072장(8.9%)으로 나타났으며 주요 원인은 영상에서의 객체 크기, 객체간 중첩(Occulusion), 객체 잘림, 그림자에 의한 오검출로 분류되었다. 결론: 개인보호구 검출모델은 현장 상황마다 다른 검출률을 확인할 수 있었고, 본 연구의 결과가 차후 현장적용을 위한 연구에 활용될 수 있을 것으로 여겨진다.

인공지능 기반 임상의학 결정 지원 시스템 의료기기의 성능 및 안전성 검증을 위한 간 종양 표준 데이터셋 구축 (Construction of a Standard Dataset for Liver Tumors for Testing the Performance and Safety of Artificial Intelligence-Based Clinical Decision Support Systems)

  • 김승섭;이동호;이민우;김소연;신재승;최진영;최병욱
    • 대한영상의학회지
    • /
    • 제82권5호
    • /
    • pp.1196-1206
    • /
    • 2021
  • 목적 간 종양의 조영증강 컴퓨터단층촬영(이하 CT) 영상에 관한 인공지능 알고리즘의 성능과 안전성을 검증할 수 있는 표준 테스팅 데이터셋을 구축하고자 하였다. 대상과 방법 국내 4개 3차 의료기관의 복부 영상의학 전문가 4인이 모여 간 종양 진단 알고리즘의 성능과 안전성을 검증하기 위해 표준 데이터셋이 갖춰야 할 조건을 논의하였다. 각 기관마다 간세포암 75예, 전이암 75예, 그리고 양성 병변 30-50예씩 수집하여, 총 783명 환자의 CT 영상을 대상으로 하였다. 간세포암과 전이암의 경우 병리학적으로 확진된 경우만을 대상으로 하였다. 각 기관의 복부 영상의학 전문가들이 직접 환자의 임상정보를 추출하고 CT 영상에 관한 데이터 라벨링(labeling)을 수기로 시행하였다. CT 영상은 의료용 디지털 영상 및 통신(Digital Imaging and Communications in Medicine, DICOM) 파일로 저장하였다. 결과 복부 영상의학 전문가들이 수기 데이터 라벨링을 시행한 총 783 증례의 간 종양 조영증강 CT의 표준 데이터셋을 구축하였다. 알고리즘의 성능 및 안전성은 병변의 발견 여부 및 특성화의 정확도에 대해 민감도와 특이도를 계산하여 평가할 수 있다. 결론 본 연구에서 구축한 간 종양 조영증강 CT 영상의 표준 데이터셋은 임상의학 결정 지원시스템을 위한 기계학습 기반 인공지능 알고리즘을 평가하는 데에 활용될 수 있다.

Low-dose CT Image Denoising Using Classification Densely Connected Residual Network

  • Ming, Jun;Yi, Benshun;Zhang, Yungang;Li, Huixin
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권6호
    • /
    • pp.2480-2496
    • /
    • 2020
  • Considering that high-dose X-ray radiation during CT scans may bring potential risks to patients, in the medical imaging industry there has been increasing emphasis on low-dose CT. Due to complex statistical characteristics of noise found in low-dose CT images, many traditional methods are difficult to preserve structural details effectively while suppressing noise and artifacts. Inspired by the deep learning techniques, we propose a densely connected residual network (DCRN) for low-dose CT image noise cancelation, which combines the ideas of dense connection with residual learning. On one hand, dense connection maximizes information flow between layers in the network, which is beneficial to maintain structural details when denoising images. On the other hand, residual learning paired with batch normalization would allow for decreased training speed and better noise reduction performance in images. The experiments are performed on the 100 CT images selected from a public medical dataset-TCIA(The Cancer Imaging Archive). Compared with the other three competitive denoising algorithms, both subjective visual effect and objective evaluation indexes which include PSNR, RMSE, MAE and SSIM show that the proposed network can improve LDCT images quality more effectively while maintaining a low computational cost. In the objective evaluation indexes, the highest PSNR 33.67, RMSE 5.659, MAE 1.965 and SSIM 0.9434 are achieved by the proposed method. Especially for RMSE, compare with the best performing algorithm in the comparison algorithms, the proposed network increases it by 7 percentage points.