• 제목/요약/키워드: Deep Learning Convergence Study

검색결과 321건 처리시간 0.023초

iOS 기반 실시간 객체 분리 및 듀얼 카메라 합성 개발 (Development of Real-Time Objects Segmentation for Dual-Camera Synthesis in iOS)

  • 장유진;김지영;이주현;황준
    • 인터넷정보학회논문지
    • /
    • 제22권3호
    • /
    • pp.37-43
    • /
    • 2021
  • 본 논문에서는 모바일 환경에서 실시간으로 전면과 후면 카메라의 객체를 인식하여 객체 픽셀의 영역을 분할하고 이미지 처리를 통해 합성하는 방법을 연구하였다. 이를 위해 Apple사의 iOS에서 제공하는 듀얼 카메라에 DeepLabV3 머신러닝 모델을 적용하여 객체를 분할하였다. 또한 이미지 합성 및 후처리를 위해 Apple사의 코어 이미지와 코어 그래픽 라이브러리를 이용하여 영역의 배경 제거 및 합성 방식을 제안하고 구현하였다. 또한, 이전 연구에 비해 CPU 사용량을 개선하였고 깊이와 DeepLabV3의 처리 속도를 비교하여 처리 결과에 영향을 주는 요소를 분석하였다. 마지막으로 이 두 방식을 활용한 카메라 애플리케이션을 개발하였다.

딥러닝 기반 불량노면 객체 인식 모델 개발 (Development of an abnormal road object recognition model based on deep learning)

  • 최미형;우제승;홍순기;박준모
    • 융합신호처리학회논문지
    • /
    • 제22권4호
    • /
    • pp.149-155
    • /
    • 2021
  • 본 연구에서는 전동 이동기기를 이용하는 교통약자의 이동을 제한하는 노면 불량 요소를 딥러닝을 이용해 자동 검출하는 불량 노면객체 인식모델을 개발하고자 한다. 이를 위하여 부산시 관내 5개 지역에서 실제 전동 이동 보조 장치가 이동할 것으로 예상되는 보행로, 주행로를 대상으로 하여 노면 정보를 수집하였으며 이때 도로 정보 수집은 데이터 수집을 보다 용이하게 하기 위하여 소형 차량을 이용하였다. 데이터는 노면과 주변을 그 주변을 구성하는 객체로 구분하여 영상을 수집하였다. 수집된 데이터로부터 교통약자의 이동을 저해하는 정도에 따라 분류하여 보도블록의 파손등급 검출과 같은 일련의 인식 항목을 정의하였고, YOLOv5 딥러닝 알고리즘을 해당 데이터에 적용하여 실시간으로 객체를 인식하는 불량노면 객체 인식 딥러닝 모델을 구현하였다. 연구의 최종단계에서 실제 주행을 통해 객체 단위로 분리 수집된 영상 데이터의 가공, 정제 및 어노테이션 과정을 수행한 후 모델 학습과 검증을 거쳐 불량노면객체를 자동으로 검출하는 딥러닝 모델의 성능 검증 과정을 진행하였다.

딥러닝을 이용한 리튬이온 배터리 잔여 유효수명 예측 (Deep Learning Approaches to RUL Prediction of Lithium-ion Batteries)

  • 정상진;허장욱
    • 한국기계가공학회지
    • /
    • 제19권12호
    • /
    • pp.21-27
    • /
    • 2020
  • Lithium-ion batteries are the heart of energy-storing devices and electric vehicles. Owing to their superior qualities, such as high capacity and energy efficiency, they have become quite popular, resulting in an increased demand for failure/damage prevention and useable life maximization. To prevent failure in Lithium-ion batteries, improve their reliability, and ensure productivity, prognosticative measures such as condition monitoring through sensors, condition assessment for failure detection, and remaining useful life prediction through data-driven prognostics and health management approaches have become important topics for research. In this study, the residual useful life of Lithium-ion batteries was predicted using two efficient artificial recurrent neural networks-ong short-term memory (LSTM) and gated recurrent unit (GRU). The proposed approaches were compared for prognostics accuracy and cost-efficiency. It was determined that LSTM showed slightly higher accuracy, whereas GRUs have a computational advantage.

Development of de-noised image reconstruction technique using Convolutional AutoEncoder for fast monitoring of fuel assemblies

  • Choi, Se Hwan;Choi, Hyun Joon;Min, Chul Hee;Chung, Young Hyun;Ahn, Jae Joon
    • Nuclear Engineering and Technology
    • /
    • 제53권3호
    • /
    • pp.888-893
    • /
    • 2021
  • The International Atomic Energy Agency has developed a tomographic imaging system for accomplishing the total fuel rod-by-rod verification time of fuel assemblies within the order of 1-2 h, however, there are still limitations for some fuel types. The aim of this study is to develop a deep learning-based denoising process resulting in increasing the tomographic image acquisition speed of fuel assembly compared to the conventional techniques. Convolutional AutoEncoder (CAE) was employed for denoising the low-quality images reconstructed by filtered back-projection (FBP) algorithm. The image data set was constructed by the Monte Carlo method with the FBP and ground truth (GT) images for 511 patterns of missing fuel rods. The de-noising performance of the CAE model was evaluated by comparing the pixel-by-pixel subtracted images between the GT and FBP images and the GT and CAE images; the average differences of the pixel values for the sample image 1, 2, and 3 were 7.7%, 28.0% and 44.7% for the FBP images, and 0.5%, 1.4% and 1.9% for the predicted image, respectively. Even for the FBP images not discriminable the source patterns, the CAE model could successfully estimate the patterns similarly with the GT image.

컨벌루션 신경망에서 활성 함수가 미치는 영상 분류 성능 비교 (Comparison of Image Classification Performance by Activation Functions in Convolutional Neural Networks)

  • 박성욱;김도연
    • 한국멀티미디어학회논문지
    • /
    • 제21권10호
    • /
    • pp.1142-1149
    • /
    • 2018
  • Recently, computer vision application is increasing by using CNN which is one of the deep learning algorithms. However, CNN does not provide perfect classification performance due to gradient vanishing problem. Most of CNN algorithms use an activation function called ReLU to mitigate the gradient vanishing problem. In this study, four activation functions that can replace ReLU were applied to four different structural networks. Experimental results show that ReLU has the lowest performance in accuracy, loss rate, and speed of initial learning convergence from 20 experiments. It is concluded that the optimal activation function varied from network to network but the four activation functions were higher than ReLU.

Design and Implementation of a Body Fat Classification Model using Human Body Size Data

  • Taejun Lee;Hakseong Kim;Hoekyung Jung
    • Journal of information and communication convergence engineering
    • /
    • 제21권2호
    • /
    • pp.110-116
    • /
    • 2023
  • Recently, as various examples of machine learning have been applied in the healthcare field, deep learning technology has been applied to various tasks, such as electrocardiogram examination and body composition analysis using wearable devices such as smart watches. To utilize deep learning, securing data is the most important procedure, where human intervention, such as data classification, is required. In this study, we propose a model that uses a clustering algorithm, namely, the K-means clustering, to label body fat according to gender and age considering body size aspects, such as chest circumference and waist circumference, and classifies body fat into five groups from high risk to low risk using a convolutional neural network (CNN). As a result of model validation, accuracy, precision, and recall results of more than 95% were obtained. Thus, rational decision making can be made in the field of healthcare or obesity analysis using the proposed method.

Real-time Smoke Detection Research with False Positive Reduction using Spatial and Temporal Features based on Faster R-CNN

  • Lee, Sang-Hoon;Lee, Yeung-Hak
    • 전기전자학회논문지
    • /
    • 제24권4호
    • /
    • pp.1148-1155
    • /
    • 2020
  • Fire must be extinguished as quickly as possible because they cause a lot of economic loss and take away precious human lives. Especially, the detection of smoke, which tends to be found first in fire, is of great importance. Smoke detection based on image has many difficulties in algorithm research due to the irregular shape of smoke. In this study, we introduce a new real-time smoke detection algorithm that reduces the detection of false positives generated by irregular smoke shape based on faster r-cnn of factory-installed surveillance cameras. First, we compute the global frame similarity and mean squared error (MSE) to detect the movement of smoke from the input surveillance camera. Second, we use deep learning algorithm (Faster r-cnn) to extract deferred candidate regions. Third, the extracted candidate areas for acting are finally determined using space and temporal features as smoke area. In this study, we proposed a new algorithm using the space and temporal features of global and local frames, which are well-proposed object information, to reduce false positives based on deep learning techniques. The experimental results confirmed that the proposed algorithm has excellent performance by reducing false positives of about 99.0% while maintaining smoke detection performance.

딥 뉴럴 네트워크의 적절한 구조 및 자가-지도 학습 방법에 따른 뇌신호 데이터 표현 기술 분석 및 고찰 (Analysis and Study for Appropriate Deep Neural Network Structures and Self-Supervised Learning-based Brain Signal Data Representation Methods)

  • 고원준
    • 한국전자통신학회논문지
    • /
    • 제19권1호
    • /
    • pp.137-142
    • /
    • 2024
  • 최근, 의료 데이터 표현 분야에서 딥러닝 방법들이 사실상의 표준으로 자리잡고 있다. 하지만, 딥러닝 기술은 내재적으로 많은 양의 학습 데이터를 필요로 하므로 대규모의 데이터를 확보하기 쉽지 않은 의료 분야에서는 직접적인 적용이 어려운 실정이다. 특히 뇌신호 모달리티의 경우, 변동성이 크기 때문에 여전히 데이터 부족 문제를 가진다. 이에, 최근 연구에서는 뇌신호의 시간-공간-주파수 특징을 적절하게 추출할 수 있는 딥 뉴럴 네트워크 구조를 설계하거나, 혹은 자가-지도 학습 방법을 도입하여 뇌신호의 신경생리학적 특징을 미리 학습하도록 한다. 본 논문에서는, 최근 각광받는 기술인 뇌-컴퓨터 인터페이스 및 피험자 상태 예측 등의 관점에서 소규모데이터를 다루기 위해 적용되는 방법론에 대한 분석 및 향후 기술 방향성을 제시한다. 먼저 현재 제안되고 있는 뇌신호 표현을 위한 딥 뉴럴 네트워크 구조에 대해 분석한다. 또한 뇌신호의 특성을 잘 학습하기 위한 자가-지도 학습 방법론을 분석한다. 끝으로, 딥러닝 기반 뇌신호 분석을 위한 중요 시사점 및 방향성에 관하여 논한다.

A Study on the Classification of Variables Affecting Smartphone Addiction in Decision Tree Environment Using Python Program

  • Kim, Seung-Jae
    • International journal of advanced smart convergence
    • /
    • 제11권4호
    • /
    • pp.68-80
    • /
    • 2022
  • Since the launch of AI, technology development to implement complete and sophisticated AI functions has continued. In efforts to develop technologies for complete automation, Machine Learning techniques and deep learning techniques are mainly used. These techniques deal with supervised learning, unsupervised learning, and reinforcement learning as internal technical elements, and use the Big-data Analysis method again to set the cornerstone for decision-making. In addition, established decision-making is being improved through subsequent repetition and renewal of decision-making standards. In other words, big data analysis, which enables data classification and recognition/recognition, is important enough to be called a key technical element of AI function. Therefore, big data analysis itself is important and requires sophisticated analysis. In this study, among various tools that can analyze big data, we will use a Python program to find out what variables can affect addiction according to smartphone use in a decision tree environment. We the Python program checks whether data classification by decision tree shows the same performance as other tools, and sees if it can give reliability to decision-making about the addictiveness of smartphone use. Through the results of this study, it can be seen that there is no problem in performing big data analysis using any of the various statistical tools such as Python and R when analyzing big data.

구글 맵 API를 이용한 딥러닝 기반의 드론 자동 착륙 기법 설계 (Design of Deep Learning-Based Automatic Drone Landing Technique Using Google Maps API)

  • 이지은;문형진
    • 산업융합연구
    • /
    • 제18권1호
    • /
    • pp.79-85
    • /
    • 2020
  • 최근 원격조종과 자율조종이 가능한 무인항공기(RPAS:Remotely Piloted Aircraft System)가 택배 드론, 소방드론, 구급 드론, 농업용 드론, 예술 드론, 드론 택시 등 각 산업 분야와 공공기관에서의 관심과 활용이 높아지고 있다. 자율조종이 가능한 무인드론의 안정성 문제는 앞으로 드론 산업의 발달과 함께 진화하면서 해결해야 할 가장 큰 과제이기도 하다. 드론은 자율비행제어 시스템이 지정한 경로로 비행하고 목적지에 정확하게 자동 착륙을 수행할 수 있어야 한다. 본 연구는 드론의 센서와 GPS의 위치 정보의 오류를 보완하는 방법으로서 착륙지점 영상을 통해 드론의 도착 여부를 확인하고 정확한 위치에서의 착륙을 제어하는 기법을 제안한다. 서버에서 도착지 영상을 구글맵 API로부터 수신받아 딥러닝으로 학습하고, 드론에 NAVIO2와 라즈베리파이, 카메라를 장착하여 착륙지점의 이미지를 촬영한 다음 이미지를 서버에 전송한다. Deep Learning으로 학습된 결과와 비교하여 임계치에 맞게 드론의 위치를 조정한 후 착륙지점에 자동으로 착륙할 수 있다.