• 제목/요약/키워드: Image deep learning

검색결과 1,828건 처리시간 0.03초

컨볼루션 신경망에 기반한 비디오 월 컨트롤러의 블랙 스크린 감지 (Detection of Black Screen in Video Wall Controller Using CNN)

  • 김성진
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.524-526
    • /
    • 2021
  • 최근에 비디오 월 컨트롤러 시장이 빠르게 성장하면서 지금까지는 크게 이슈화 되지 않았던 문제들이 표면화 되고 있는데, 비디오 월 컨트롤러에서 블랙 스크린이 발생하는 현상도 그 중 하나일 것이다. 블랙 스크린은 비디오 월 컨트롤러의 멀티 스크린에 정상적인 영상이 아닌 블랙 스크린이 표출되는 현상이다. 블랙 스크린의 발생을 인지하고 해결하기 위해서는 인간의 개입이 불가피 하지만 운영자가 24시간 멀티 스크린을 모니터링 하는 것은 사실상 불가능하다. 따라서 본 논문에서는 비디오 월 컨트롤러에서 블랙 스크린이 발생하는 것을 자동으로 감지하는 모델을 제안한다. 블랙 스크린 감지 모델은 이미지 분류에 널리 활용되고 있는 컨볼루션 신경망으로 블랙 스크린의 발생 여부를 감지한다.

  • PDF

인공지능 기반 건전성 예측 및 관리에 관한 국내 연구 동향 분석 (Analysis of Domestic Research Trends on Artificial Intelligence-Based Prognostics and Health Management)

  • 정예은;김용수
    • 품질경영학회지
    • /
    • 제51권2호
    • /
    • pp.223-245
    • /
    • 2023
  • Purpose: This study aim to identify the trends in AI-based PHM technology that can enhance reliability and minimize costs. Furthermore, this research provides valuable guidelines for future studies in various industries Methods: In this study, I collected and selected AI-based PHM studies, established classification criteria, and analyzed research trends based on classified fields and techniques. Results: Analysis of 125 domestic studies revealed a greater emphasis on machinery in both diagnosis and prognosis, with more papers dedicated to diagnosis. various algorithms were employed, including CNN for image diagnosis and frequency analysis for signal data. LSTM was commonly used in prognosis for predicting failures and remaining life. Different industries, data types, and objectives required diverse AI techniques, with GAN used for data augmentation and GA for feature extraction. Conclusion: As studies on AI-based PHM continue to grow, selecting appropriate algorithms for data types and analysis purposes is essential. Thus, analyzing research trends in AI-based PHM is crucial for its rapid development.

죽상동맥경화증 진단을 위한 극좌표 변환과 SE-LSTMNet 모델 (SE-LSTMNet Model Using Polar Conversion for Diagnosis of Atherosclerosis)

  • 나인예;박현진
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.294-296
    • /
    • 2022
  • 죽상동맥경화증(atherosclerosis)은 동맥에 플라크가 쌓여 혈류 장애를 일으키는 만성 혈관염증 질환으로 심장병과 뇌졸중을 일으킬 수 있다. 하지만 대부분은 동맥이 심하게 좁아질 때까지 증상이 없기 때문에 조기 발견이 중요하다. 본 논문은 튜브 모양의 혈관에서 경화성 병변을 효과적으로 진단하기 위해 MRI 영상에 혈관 중심을 기준으로 극좌표 변환을 적용하였다. 그리고, 극좌표 영상의 각도별 연속된 신호정보를 이용하는 SE-LSTMNet 모델을 제안한다. 학습된 모델은 검증 데이터에 대해 정확도 0.9194, 민감도 0.9370, 특이도 0.8796, F1 score 0.8700, AUC 0.9719의 분류 성능을 보였다.

  • PDF

EMOS: Enhanced moving object detection and classification via sensor fusion and noise filtering

  • Dongjin Lee;Seung-Jun Han;Kyoung-Wook Min;Jungdan Choi;Cheong Hee Park
    • ETRI Journal
    • /
    • 제45권5호
    • /
    • pp.847-861
    • /
    • 2023
  • Dynamic object detection is essential for ensuring safe and reliable autonomous driving. Recently, light detection and ranging (LiDAR)-based object detection has been introduced and shown excellent performance on various benchmarks. Although LiDAR sensors have excellent accuracy in estimating distance, they lack texture or color information and have a lower resolution than conventional cameras. In addition, performance degradation occurs when a LiDAR-based object detection model is applied to different driving environments or when sensors from different LiDAR manufacturers are utilized owing to the domain gap phenomenon. To address these issues, a sensor-fusion-based object detection and classification method is proposed. The proposed method operates in real time, making it suitable for integration into autonomous vehicles. It performs well on our custom dataset and on publicly available datasets, demonstrating its effectiveness in real-world road environments. In addition, we will make available a novel three-dimensional moving object detection dataset called ETRI 3D MOD.

회전된 객체 분류를 위한 CNN 기법들의 성능 비교 분석 (Comparative Analysis of CNN Techniques designed for Rotated Object Classifiation)

  • 한희일
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.181-187
    • /
    • 2024
  • 이미지 공간에서 무작위로 회전된 객체에 대한 분류 성능이 우수한 기법으로는 군 등변 CNN과 steerable 필터를 이용한 CNN 등이 있다. 본 논문에서는 이들의 수학적 구조를 설명하고 구현 방법을 소개한다. 기존의 CNN을 포함한 세 개의 모델에 대하여 동일한 필터 수를 갖도록 구현한 다음, 무작위로 회전된 MNIST를 이용하여 실험하고 이들의 성능을 비교분석한다. 실험 결과에 의하면 steerable CNN은 CNN보다 6.5% 이상의 인식률 향상을 보여준다. 특히, steerable CNN은 학습할 파라미터의 수가 상대적으로 적어서 훈련 데이터셋의 크기를 줄여도 성능 열화가 비교적 크지 않음을 실험 결과로 확인한다.

A dual path encoder-decoder network for placental vessel segmentation in fetoscopic surgery

  • Yunbo Rao;Tian Tan;Shaoning Zeng;Zhanglin Chen;Jihong Sun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제18권1호
    • /
    • pp.15-29
    • /
    • 2024
  • A fetoscope is an optical endoscope, which is often applied in fetoscopic laser photocoagulation to treat twin-to-twin transfusion syndrome. In an operation, the clinician needs to observe the abnormal placental vessels through the endoscope, so as to guide the operation. However, low-quality imaging and narrow field of view of the fetoscope increase the difficulty of the operation. Introducing an accurate placental vessel segmentation of fetoscopic images can assist the fetoscopic laser photocoagulation and help identify the abnormal vessels. This study proposes a method to solve the above problems. A novel encoder-decoder network with a dual-path structure is proposed to segment the placental vessels in fetoscopic images. In particular, we introduce a channel attention mechanism and a continuous convolution structure to obtain multi-scale features with their weights. Moreover, a switching connection is inserted between the corresponding blocks of the two paths to strengthen their relationship. According to the results of a set of blood vessel segmentation experiments conducted on a public fetoscopic image dataset, our method has achieved higher scores than the current mainstream segmentation methods, raising the dice similarity coefficient, intersection over union, and pixel accuracy by 5.80%, 8.39% and 0.62%, respectively.

2축식 드론 추적 로봇의 제어기 설계 및 선정 방안 연구 (Study on the Design and Selection of Controller for Two Axial Drone Tracking Robot)

  • 박승운;김보겸;박창대;임현준;이철희
    • 드라이브 ㆍ 컨트롤
    • /
    • 제21권3호
    • /
    • pp.28-35
    • /
    • 2024
  • This study compared performances of PID (Proportional Integral Derivative), SMC (Sliding Mode Control), and MPC (Model Predictive Control) strategies applied to a 2DOF (Degree Of Freedom) drone tracking robot. The developed 2DOF robot utilized a depth camera with an IMU (Inertial Measurement Unit), laser pointers, and servo motors to rapidly detect and track objects. Image processing was conducted using the YOLO deep learning model. Through this setup, controllers were attached to the robot to track random drone movements, comparing performances in terms of accuracy and energy consumption. This study revealed that while SMC demonstrated precise tracking without deviating from the path, both PID and MPC controllers showed deviations. Performance-wise, SMC is superior. However, considering economic aspects, PID is more advantageous due to its lower power consumption and relatively minor tracking errors.

비정형 데이터와 딥러닝을 활용한 내수침수 탐지기술 개발 (Development of a method for urban flooding detection using unstructured data and deep learing)

  • 이하늘;김형수;김수전;김동현;김종성
    • 한국수자원학회논문집
    • /
    • 제54권12호
    • /
    • pp.1233-1242
    • /
    • 2021
  • 본 연구에서는 비정형 데이터인 사진자료를 이용하여 침수의 발생여부를 판단하는 모델을 개발하였다. 침수분류를 모델 개발을 위하여 CNN기반의 VGG16, VGG19을 이용하였다. 모델을 개발하기 위하여 침수사진과 침수가 발생하지 않은 사진을 웹크롤링 방법을 이용하여 사진을 수집하였다. 웹크롤링 방법을 이용하여 수집한 데이터는 노이즈 데이터가 포함되어 있기 때문에 1차적으로 본 연구와 상관없는 데이터는 소거하였으며, 2차적으로 모델 적용을 위하여 224 × 224로 사진 사이즈를 일괄 변경하였다. 또한 사진의 다양성을 위해서 사진의 각도를 변환하여 이미지 증식을 수행하였으며. 최종적으로 침수사진 2,500장과 침수가 발생하지 않은 사진 2,500장을 이용하여 학습을 수행하였다. 모델 평가결과 모델의 평균 분류성능은 97%로 나타났으며. 향후 본 연구결과를 통하여 개발된 모델을 CCTV관제센터 시스템에 탑재한다면 신속하게 침수피해에 대한 대처가 이루어 질 수 있을 것이라 판단된다.

3차원 형상 복원을 위한 점진적 점유 예측 네트워크 (Progressive occupancy network for 3D reconstruction)

  • 김용규;김덕수
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제27권3호
    • /
    • pp.65-74
    • /
    • 2021
  • 3차원 형상 복원(3D reconstruction)은 이미지 또는 영상 속 물체를 3차원 형상으로 복원하는 것을 말한다. 본 연구는 물체의 전반적 형상을 넘어 세부적인 모습까지 복원할 수 있는 표현력을 가진 3차원 형상 복원 네트워크인, 점진적 점유 네트워크를 제안한다. 본 연구가 제안하는 네트워크는 이미지 전체의 정보를 담고 있는 특징(feature)을 사용하는 기존 점유 네트워크와 달리, 수용 영역(receptive field)의 크기에 따라 다양한 수준의 이미지 특징을 추출해서 사용한다. 그리고, 다양한 수준의 이미지 특징을 디코더(decoder) 내 디코더 블록(decoder block)들에 순차적으로 반영하여, 형상 복원의 품질이 단계적으로 개선하는 네트워크 구조를 제안한다. 본 연구는 또한, 다양한 수준의 이미지 특징을 적절히 조합하여 사용하는 디코더 블록구조를 제안한다. 본 연구는 제안하는 네트워크의 성능 검증을 위해 ShapeNet 데이터 세트를 사용하였으며, 기존의 점유 네트워크(ONet) 및 다양한 수준의 이미지 특징을 사용하는 최신 연구(DISN)와 성능 비교하였다. 그 결과, 기존 점유 네트워크 대비 세 가지 검증 지표 모두에서 높은 성능을 달성하였으며, DISN과는 대등한 수준의 성능을 보여주었다. 그리고 복원 형상의 시각적 비교 결과, 본 연구의 점진적 점유 네트워크가 기존 점유 네트워크 대비, 물체의 세부 모습을 잘 복원하는 것을 확인하였다. 또한, DISN이 복원 실패한 물체의 얇은 부분 또는 이미지에서 가려진 부분을 본 연구의 네트워크는 잘 잡아내는 결과를 확인할 수 있었다. 이러한 결과는 본 연구가 제안하는 점진적 점유 네트워크의 유용성을 검증하는 결과다.

초-고해상도 영상 스타일 전이 (Super High-Resolution Image Style Transfer)

  • 김용구
    • 방송공학회논문지
    • /
    • 제27권1호
    • /
    • pp.104-123
    • /
    • 2022
  • 신경망 기반 스타일 전이 기법은 영상의 고차원적 구조적 특징을 반영하여 높은 품질의 스타일 전이 결과를 제공함으로써 최근 크게 주목받고 있다. 본 논문은 이러한 신경망 기반 스타일 전이의 GPU 메모리 제한에 따른 해상도 한계에 대한 문제를 다룬다. 신경망 출력이 가진 제한적 수용장 특징을 바탕으로, 부분 영상 기반의 스타일 전이 손실함수 경사도 연산이 전체 영상을 대상으로 구한 경사도 연산과 동일한 결과를 생성할 수 있을 것으로 기대할 수 있다. 이러한 아이디어를 기반으로, 본 논문에서는, 스타일 전이 손실함수의 각 구성 요소에 대한 경사도 연산 구조를 분석하고, 이를 통해 부분 영상의 생성 및 패딩에 대한 필요조건을 구하고, 전체 영상의 신경망 출력에 좌우되는 경사도 연산 요구 데이터를 확인하여 구조화함으로써 재귀적 초고해상도 스타일 전이 알고리즘을 개발하였다. 제안된 기법은, 사용하는 GPU 메모리가 처리할 수 있는 크기로 초고해상도 입력을 분할하여 스타일 전이를 수행함으로써, GPU 메모리 한계에 따른 해상도 제한을 받지 않으며, 초고해상도 스타일 전이에서만 감상할 수 있는 독특한 세부 영역의 전이 스타일 특징을 제공할 수 있다.