• Title/Summary/Keyword: 합성곱신경망

검색결과 75건 처리시간 0.026초

립모션 센서 기반 증강현실 인지재활 훈련시스템을 위한 합성곱신경망 손동작 인식 (Hand Gesture Recognition with Convolution Neural Networks for Augmented Reality Cognitive Rehabilitation System Based on Leap Motion Controller)

  • 송근산;이현주;태기식
    • 대한의용생체공학회:의공학회지
    • /
    • 제42권4호
    • /
    • pp.186-192
    • /
    • 2021
  • In this paper, we evaluated prediction accuracy of Euler angle spectrograph classification method using a convolutional neural networks (CNN) for hand gesture recognition in augmented reality (AR) cognitive rehabilitation system based on Leap Motion Controller (LMC). Hand gesture recognition methods using a conventional support vector machine (SVM) show 91.3% accuracy in multiple motions. In this paper, five hand gestures ("Promise", "Bunny", "Close", "Victory", and "Thumb") are selected and measured 100 times for testing the utility of spectral classification techniques. Validation results for the five hand gestures were able to be correctly predicted 100% of the time, indicating superior recognition accuracy than those of conventional SVM methods. The hand motion recognition using CNN meant to be applied more useful to AR cognitive rehabilitation training systems based on LMC than sign language recognition using SVM.

건설현장에서 발생하는 폐기물 인식 모델 개발 (Development of a waste recognition model at construction sites)

  • 나승욱;허석재
    • 한국건축시공학회:학술대회논문집
    • /
    • 한국건축시공학회 2021년도 가을 학술논문 발표대회
    • /
    • pp.219-220
    • /
    • 2021
  • It is considered that the construction industry is one of the pivotal players in the national economy in terms of Gross Domestic Production (GDP) and employment. Behind the positive role of this industrial sector to the national economy, the construction industry generates approximately 50 % of the total waste generation from all the industrial sectors. There are several measures to mitigate the adverse impacts of the construction waste such as reduce, reuse and recycle. Recycling would be one of the effective strategies for waste minimisation, which would be able to reduce the demand upon new resources as well as enhance reusing the construction materials on sites. The automated construction waste classification system would make it possible not only to reduce the amount of labour input but also mitigate the possibility of errors during the manual classification process. In this study, we proposed an automated waste segmentation and classification system for recycling the construction and demolition waste in the real construction site context. Since the practical application to the real-world construction sites was one of the significant factors to develop the system, a YOLACT (You Only Look At CoefficienTs) algorithm was chosen to conduct the study. In this study, it is expected that the proposed system would make it possible to enhance the productivity as well as the cost efficiency by reducing the manpower for the construction and demolition waste management at the construction site.

  • PDF

팽창된 잔차 합성곱신경망을 이용한 KOMPSAT-3A 위성영상의 융합 기법 (A Pansharpening Algorithm of KOMPSAT-3A Satellite Imagery by Using Dilated Residual Convolutional Neural Network)

  • 최호성;서두천;최재완
    • 대한원격탐사학회지
    • /
    • 제36권5_2호
    • /
    • pp.961-973
    • /
    • 2020
  • 본 논문에서는 CNN (Convolutional Neural Network) 기반의 영상융합 기법을 제안하고자 하였다. 딥러닝 구조의 성능을 향상시키기 위하여, CNN 기법에서 대표적인 합성곱(convolution) 방법으로 알려진 팽창된 합성곱(dilated convolution) 모델을 활용하여 모델의 깊이와 복잡성을 증대시키고자 하였다. 팽창된 합성곱을 기반으로 하여 학습과정에서의 효율을 향상시키기 위하여 잔차 네트워크(residual network)도 활용하였다. 또한, 본 연구에서는 모델학습을 위하여 전통적인 L1 노름(norm) 기반의 손실함수와 함께, 공간 상관도를 활용하였다. 본 연구에서는 전정색 영상만을 이용하거나 전정색 영상과 다중분광 영상을 모두 활용하여 구조에 적용한 DRNet을 개발하여 실험을 수행하였다. KOMPSAT-3A를 활용한 전정색 영상과 다중분광 영상을 이용한 DRNet은 융합영상의 분광특성에 과적합되는 결과를 나타냈으며, 전정색 영상만을 이용한 DRNet이 기존 기법들과 비교하여 융합영상의 공간적 특성을 효과적으로 반영함을 확인하였다.

CCTV 영상을 활용한 합성곱 신경망 기반 강우강도 산정 (Revolutionizing rainfall estimation through convolutional neural networks leveraging CCTV imagery)

  • 변종윤;김현준;이진욱;전창현
    • 한국수자원학회:학술대회논문집
    • /
    • 한국수자원학회 2023년도 학술발표회
    • /
    • pp.120-120
    • /
    • 2023
  • 본 연구에서는 CCTV 영상 내 빗줄기의 특성을 바탕으로 강우강도를 산정하기 위한 합성곱 신경망(CNNs, Convolutional Neural Networks) 기반 강우강도 산정 모형을 제안하였다. 중앙대학교 및 한국건설생활환경시험연구원 내 대형기후환경시험실에서 얻은 CCTV 영상들을 대상으로 연구를 수행하고, 우적계 등과 같은 지상 관측자료와 강우강도 산정 결과를 비교·검증하였다. 먼저, CCTV 영상 내 빗줄기의 미세한 변동 특성을 반영하기 위해 데이터 전처리 작업을 진행하였다. 이는 원본 영상으로부터 빗줄기 층을 분리해내는 과정, 빗줄기 층에서 빗물 입자를 분리해내는 과정, 그리고 빗물 입자를 인식하는 과정 등 총 세 단계로 구분된다. 합성곱 신경망 기반 강우강도 산정 모형 구축을 위해 영상 전처리가 완료된 데이터들을 입력값으로 설정하고, 촬영 시점에 대응되는 지상관측 자료를 출력값으로 고려하여 강우강도 산정모형을 훈련시켰다. CCTV 원자료 내 특정 영역에 편향되어 강우강도를 산정하는 과적합 현상의 발생을 방지하기 위해 원자료 내 5개의 관심 영역(ROI, Region of Interest)을 설정하였다. 추가로, CCTV의 해상도를 총 4개(2560×1440, 1920×1080, 1280×720, 720×480)로 구분함으로써 해상도 변화에 따른 학습 결과의 차이를 분석·평가하였다. 이는 기존 사례들과 비교했을 때, CCTV 영상을 기반으로 빗줄기의 거동 특성과 같은 물리적인 현상을 직간접적으로 고려하여 강우강도를 산정했다는 점과 더불어 머신러닝을 적용하여 강우 이미지가 갖는 본질적인 특징들을 파악했다는 측면에서, 추후 본 연구에서 제안한 모형의 활용 가치가 극대화될 수 있을 것으로 판단된다.

  • PDF

합성곱 신경망을 이용한 전기 아크 신호 검출 (Electrical Arc Detection using Convolutional Neural Network)

  • 이상익;강석우;김태원;김만배
    • 방송공학회논문지
    • /
    • 제25권4호
    • /
    • pp.569-575
    • /
    • 2020
  • 전기화재의 원인중의 하나는 직렬 아크이다. 최근까지 아크 신호를 검출하기 위해 다양한 기법들이 진행되고 있다. 시간 신호에 푸리에 변환, 웨이블릿 변환, 또는 통계적 특징 등을 활용하여 아크 검출을 하는 방법들이 소개되었지만, 변환 및 특징 추출은 부가적인 처리 시간이 요구되는 단점이 있다. 반면에 최근의 딥러닝 모델은 종단간 학습으로 특징 추출 과정없이 직접 원시 데이터를 활용한다. 따라서, 1-D 시간 신호를 직접 활용하여 아크를 검출하는 것이 좋은데, 인공신경망의 분류 성능이 저하되는 문제점이 있다. 본 논문에서는 연속 입력 1-D 신호를 2-D로 변환한 후에, 합성곱신경망으로 분류하는 방법을 제안한다. 실험 데이터에 적용한 결과 합성곱신경망의 사용이 인공신경망보다 약 8.6%의 아크 분류 성능을 향상시켰다. 또한 2-D 데이터의 부족을 보완하기 위해서 데이터증강을 이용하여, 14%의 분류 성능을 개선하였다.

얼굴인식 성능 향상을 위한 얼굴 전역 및 지역 특징 기반 앙상블 압축 심층합성곱신경망 모델 제안 (Compressed Ensemble of Deep Convolutional Neural Networks with Global and Local Facial Features for Improved Face Recognition)

  • 윤경신;최재영
    • 한국멀티미디어학회논문지
    • /
    • 제23권8호
    • /
    • pp.1019-1029
    • /
    • 2020
  • In this paper, we propose a novel knowledge distillation algorithm to create an compressed deep ensemble network coupled with the combined use of local and global features of face images. In order to transfer the capability of high-level recognition performances of the ensemble deep networks to a single deep network, the probability for class prediction, which is the softmax output of the ensemble network, is used as soft target for training a single deep network. By applying the knowledge distillation algorithm, the local feature informations obtained by training the deep ensemble network using facial subregions of the face image as input are transmitted to a single deep network to create a so-called compressed ensemble DCNN. The experimental results demonstrate that our proposed compressed ensemble deep network can maintain the recognition performance of the complex ensemble deep networks and is superior to the recognition performance of a single deep network. In addition, our proposed method can significantly reduce the storage(memory) space and execution time, compared to the conventional ensemble deep networks developed for face recognition.

비디오 얼굴 식별 성능개선을 위한 다중 심층합성곱신경망 결합 구조 개발 (Development of Combined Architecture of Multiple Deep Convolutional Neural Networks for Improving Video Face Identification)

  • 김경태;최재영
    • 한국멀티미디어학회논문지
    • /
    • 제22권6호
    • /
    • pp.655-664
    • /
    • 2019
  • In this paper, we propose a novel way of combining multiple deep convolutional neural network (DCNN) architectures which work well for accurate video face identification by adopting a serial combination of 3D and 2D DCNNs. The proposed method first divides an input video sequence (to be recognized) into a number of sub-video sequences. The resulting sub-video sequences are used as input to the 3D DCNN so as to obtain the class-confidence scores for a given input video sequence by considering both temporal and spatial face feature characteristics of input video sequence. The class-confidence scores obtained from corresponding sub-video sequences is combined by forming our proposed class-confidence matrix. The resulting class-confidence matrix is then used as an input for learning 2D DCNN learning which is serially linked to 3D DCNN. Finally, fine-tuned, serially combined DCNN framework is applied for recognizing the identity present in a given test video sequence. To verify the effectiveness of our proposed method, extensive and comparative experiments have been conducted to evaluate our method on COX face databases with their standard face identification protocols. Experimental results showed that our method can achieve better or comparable identification rate compared to other state-of-the-art video FR methods.

합성곱 신경망을 이용하는 수퍼픽셀 기반 사과잎 병충해의 분류 (Superpixel-based Apple Leaf Disease Classification using Convolutional Neural Network)

  • 김만배;최창열
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.208-217
    • /
    • 2020
  • 원예작물을 카메라로 촬영하여 병해충의 종류를 판단하려는 연구가 오랫동안 있어왔다. 일반적으로 영역분할로 병해충 영역을 추출하고, 통계적 특징을 추출한 후 다양한 기계학습 기법으로 병해충 종류를 판단한다. 최근에는 딥러닝의 종단간 학습으로 병해충을 판별하는 연구가 많이 진행되고 있다. 영역분할은 조명 등의 주변 환경 변화에 따라 만족스러운 성능이 어렵고, 전체 잎 영상을 사용하는 종단간 신경망은 학습 영상과 실제 영상과의 차이 때문에 실제 적용이 어려운 문제가 있다. 이를 해결하기 위해서 본 논문에서는 수퍼픽셀 및 합성곱신경망을 이용하는 병해충 분류 방법을 제안한다. 실험에서는 PlantVilllage의 사과 병충해 영상들을 이용하여 실험한 결과, 분류정확도는 전체영상과 수퍼픽셀이 각각 (98.29, 92.43)%이고, 다변량 F1-score는 각각 (0.98. 0.93)이다. 제안하는 수퍼픽셀 기법은 성능 측면에서 약간 저하되지만, 현실적으로 실제 환경에서 적용 가능함을 확인하였다.

CNN기반의 학습모델을 활용한 거북목 증후군 자세 교정 시스템 (Turtle Neck Syndrome Posture Correction Service Using CNN-based Learning Model)

  • 한지예;박진호
    • 한국콘텐츠학회논문지
    • /
    • 제20권7호
    • /
    • pp.47-55
    • /
    • 2020
  • 스마트 기기 사용의 증가와 함께 현대인들의 거북목 증후군 발병률이 증가했다. 거북목 증후군은 목의 앞 근육이 길어지고, 위쪽 근육이 짧아져 몸통에 비해 머리가 앞으로 나와 있는 자세이며, 수술이나 약물치료보다 평소의 자세 습관을 고치는 방법이 효과적이다. 따라서 본 논문에서는 실시간으로 거북목 증후군을 유발할 수 있는 자세를 감지하고 경고하는 시스템을 제안한다. 올바른 자세와 거북목 자세의 이미지 데이터들을 수집하여 합성곱 신경망기반의 학습모델을 만든다. 웹캠만을 이용하여 카메라에 들어오는 앉은 자세를 학습모델로 실시간 검증하고, 거북목 자세일 경우 경고음을 발생하여 바른 자세를 앉도록 유도한다. 이 시스템은 평소 자세 습관을 교정하도록 유도하여 거북목증후군을 치료하고 목 디스크와 같은 더 심각한 질병을 예방할 수 있다.

Deep learning based Person Re-identification with RGB-D sensors

  • Kim, Min;Park, Dong-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권3호
    • /
    • pp.35-42
    • /
    • 2021
  • 본 연구에서는 3차원 RGB-D Xtion2 카메라를 이용하여 보행자의 골격좌표를 추출한 결과를 바탕으로 동적인 특성(속도, 가속도)을 함께 고려하여 딥러닝 모델을 통해 사람을 인식하는 방법을 제안한다. 본 논문의 핵심목표는 RGB-D 카메라로 손쉽게 좌표를 추출하고 새롭게 생성한 동적인 특성을 기반으로 자체 고안한 1차원 합성곱 신경망 분류기 모델(1D-ConvNet)을 통해 자동으로 보행 패턴을 파악하는 것이다. 1D-ConvNet의 인식 정확도와 동적인 특성이 정확도에 미치는 영향을 알아보기 위한 실험을 수행하였다. 정확도는 F1 Score를 기준으로 측정하였고, 동적인 특성을 고려한 분류기 모델(JCSpeed)과 고려하지 않은 분류기 모델(JC)의 정확도 비교를 통해 영향력을 측정하였다. 그 결과 동적인 특성을 고려한 경우의 분류기 모델이 그렇지 않은 경우보다 F1 Score가 약 8% 높게 나타났다.