• 제목/요약/키워드: CNN Algorithm

검색결과 474건 처리시간 0.019초

앙상블 딥러닝을 이용한 초음파 영상의 간병변증 분류 알고리즘 (Classification Algorithm for Liver Lesions of Ultrasound Images using Ensemble Deep Learning)

  • 조영복
    • 한국인터넷방송통신학회논문지
    • /
    • 제20권4호
    • /
    • pp.101-106
    • /
    • 2020
  • 현재 의료 현장에서 초음파 진단은 과거 청진기와 같다고 할 수 있다. 그러나 초음파의 특성상 검사자의 숙련도에 따라 결과 예측이 불확실하다는 단점을 가진다. 따라서 본 논문에서는 이런 문제를 해결하기 위해 딥러닝 기술을 기반으로 초음파 검사 중 간병변 탐지의 정확도를 높이고자 한다. 제안 논문에서는 CNN 모델과 앙상블 모델을 이용해 병변 분류의 정확도 비교 실험하였다. 실험결과 CNN 모델에서 분류 정확도는 평균 82.33%에서 앙상블모델의 경우 평균 89.9%로 약 7% 높은 것을 확인하였다. 또한 앙상블 모델이 평균 ROC커브에서도 0.97로 CNN모델보다 약 0.4정도 높은 것을 확인하였다.

소규모 합성곱 신경망을 사용한 연령 및 성별 분류 (Age and Gender Classification with Small Scale CNN)

  • ;류재흥
    • 한국전자통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.99-104
    • /
    • 2022
  • 인공지능은 놀라운 이점으로 우리 삶의 중요한 부분을 차지하고 있다. 기계는 이미지에서 물체를 인식하는 것, 특히 사람들을 정확한 나이와 성별 그룹으로 분류하는 것에 있어서 인간을 능가하고 있다. 이러한 측면에서 나이와 성별 분류는 최근 수십 년 동안 컴퓨터 비전 연구자들 사이에서 뜨거운 주제 중 하나였다. 심층 합성곱 신경망(CNN) 모델의 배포는 최첨단 성능을 달성했다. 그러나 대부분의 CNN 기반 아키텍처는 수십 개의 훈련 매개 변수로 매우 복잡하기 때문에 많은 계산 시간과 자원이 필요하다. 이러한 이유로 기존 방법에 비해 훈련 매개 변수와 훈련 시간이 현저히 적은 새로운 CNN기반 분류 알고리즘을 제안한다. 덜 복잡함에도 불구하고 우리 모델은 UTKFace 데이터 세트에서 연령 및 성별 분류의 더 나은 정확도를 보여준다.

CNN 잡음감쇠기에서 필터 수의 최적화 (Optimization of the Number of Filter in CNN Noise Attenuator)

  • 이행우
    • 한국전자통신학회논문지
    • /
    • 제16권4호
    • /
    • pp.625-632
    • /
    • 2021
  • 본 논문은 잡음감쇠기에서 CNN(Convolutional Neural Network) 계층의 필터 수가 성능에 미치는 영향을 연구하였다 이 시스템은 적응필터 대신 신경망 예측필터를 이용하며 심층학습방법으로 잡음을 감쇠한다. 64-뉴런, 16-커널 CNN 필터와 오차 역전파 알고리즘을 이용하여 잡음이 포함된 음성신호로부터 음성을 추정한다. 본 연구에서 필터 수에 대한 잡음감쇠기의 성능을 검증하기 위하여 Keras 라이브러리를 사용한 프로그램을 작성하고 시뮬레이션을 실시하였다. 시뮬레이션 결과, 본 시스템은 필터 수가 16일 때 MSE(Mean Squared Error) 및 MAE(Mean Absolute Error) 값이 가장 작은 것으로 나타났으며 필터가 4개 일 때 성능이 가장 낮은 것을 볼 수 있다. 그리고 필터가 8개 이상이 되면 필터 수에 따라 MSE 및 MAE 값이 크게 차이나지 않는 것을 보여주었다. 이러한 결과로부터 음성신호의 주요 특징을 표현하기 위해서는 약 8개 이상의 필터를 사용해야 한다는 것을 알 수 있다.

지능형 OCR 시스템을 위한 한글 필기체 생성 및 분류 모델에 관한 연구 (A Study on Hangul Handwriting Generation and Classification Mode for Intelligent OCR System)

  • 백진성;서지윤;정상중;정도운
    • 융합신호처리학회논문지
    • /
    • 제23권4호
    • /
    • pp.222-227
    • /
    • 2022
  • 본 논문에서는 다양한 산업분야에 적용 가능한 딥러닝 알고리즘 기반의 한글 필기체 생성 및 분류 모델을 구현하였다. 구현된 GAN 기반의 한글 필기체 생성 모델과 CNN 기반의 한글 필기체 분류 모델 2가지로 구성되어 있다. GAN 모델은 가짜 한글 필기체 데이터를 생성하기 위한 생성자 모델과 가짜 필기체 데이터를 판별하기 위한 판별자 모델로 구성된다. CNN 모델의 경우 'PHD08' 데이터세트를 활용하여 모델의 학습을 수행하였으며, 학습 결과 92.45% 정확도로 한글 필기체를 분류하는 것을 확인하였다. 구현된 GAN 모델을 통해 생성된 한글 필기체 데이터를 기존 CNN 모델의 학습 데이터세트와 통합하여 분류 모델의 성능평가를 진행한 결과 96.86%로 기존 분류 성능보다 우수하게 나타남을 확인하였다.

감시 비디오에서 등록 및 미등록 물체의 실시간 도난 탐지 (Realtime Theft Detection of Registered and Unregistered Objects in Surveillance Video)

  • 박혜승;박승철;주영복
    • 한국정보통신학회논문지
    • /
    • 제24권10호
    • /
    • pp.1262-1270
    • /
    • 2020
  • 최근 관심이 높아지고 있는 스마트 감시 비디오에 관한 연구는 주로 침입자 탐지 및 추적과 유기 물체 탐지에 초점이 맞춰져 왔고, 도난 물체의 실시간 탐지에 대한 연구는 중요성에 비해 상대적으로 미흡한 상황이다. 본 논문은 스마트 감시 비디오 적용 환경을 고려하여 두 가지의 서로 다른 도난 물체 탐지 알고리즘을 제시한다. 먼저 이중 배경 차감 모델(dual background subtraction model)을 사용하여 사전에 정적 및 동적으로 등록된 감시 대상 물체의 도난을 탐지하는 알고리즘을 제시한다. 그리고 이중 배경 차감 모델과 Mask R-CNN 기반의 객체 세그멘테이션 기술을 통합적으로 적용하여 일반 감시 물체의 도난을 탐지하는 알고리즘을 제시한다. 전자의 알고리즘은 등록된 감시 물체를 대상으로 계산 능력이 높지 않은 환경에서 경제적인 도난 탐지 서비스를 제공할 수 있고, 후자의 알고리즘은 충분한 계산 능력을 제공할 수 있는 환경에서 보다 광범위한 일반 감시 물체의 도난 탐지에 적용할 수 있다.

인코더와 디코더에 기반한 합성곱 신경망과 순환 신경망의 새로운 하이브리드 접근법 (New Hybrid Approach of CNN and RNN based on Encoder and Decoder)

  • 우종우;김건우;최근호
    • 경영정보학연구
    • /
    • 제25권1호
    • /
    • pp.129-143
    • /
    • 2023
  • 빅데이터 시대를 맞이하여 인공지능 분야는 괄목할만한 성장을 보이고 있으며 특히 딥러닝에 의한 이미지 분류 학습방법이 중요한 영역으로 자리하고 있다. 이미지 분류에서 많이 사용되어 온 CNN의 성능을 더욱 개선하기 위해 다양한 연구가 활발하게 진행되었는데, 이 중에서 대표적인 방법이 CRNN(Convolutional Recurrent Neural Network) 알고리즘이다. CRNN 알고리즘은 이미지 분류를 위한 CNN과 시계열적 요소를 인식하기 위한 RNN의 조합으로 구성되는데, CRNN의 RNN영역에서 사용하는 입력값은 학습 대상의 이미지를 합성곱과 풀링 기법을 적용하여 추출된 결과물을 flatten한 값이고, 이 입력값들은 이미지 내 동일 위상에 있는 픽셀값들이 서로 다른 순서로 나타나기 때문에, RNN에서 의도한 이미지 내 배열 순서를 제대로 학습하기 어렵다는 한계점을 지닌다. 따라서 본 연구는 인코더와 디코더의 개념을 응용한 CNN과 RNN의 새로운 하이브리드 방법을 제안하여, 이미지 분류 성능을 향상시키는 것을 목적으로 하였다. 본 연구에서는 다양한 알고리즘 비교 실험을 통해, 새로운 하이브리드 방법의 효과성을 검증하였다. 본 연구는 인코더와 디코더 개념의 적용 가능성을 넓히고, 제안한 방법이 기존 하이브리드 방법에 비해, 복잡도가 크게 증가하지 않아 모델 학습 시간과 인프라 구축 비용 측면에서 이점을 있다는 점에서 학문적 시사점을 가진다. 또한, 정확한 이미지 분류가 필요한 다양한 분야에서 제공되는 서비스의 품질을 높일 수 있는 가능성을 제시하였다는 점에서 실무적 시사점을 가진다.

Classification of Diabetic Retinopathy using Mask R-CNN and Random Forest Method

  • Jung, Younghoon;Kim, Daewon
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권12호
    • /
    • pp.29-40
    • /
    • 2022
  • 본 논문에서는 딥러닝 기법의 하나인 Mask R-CNN과 랜덤포레스트 분류기를 이용해 당뇨병성 망막병증의 병리학적인 특징을 검출하고 분석하여 자동 진단하는 시스템을 연구하였다. 당뇨병성 망막병증은 특수장비로 촬영한 안저영상을 통해 진단할 수 있는데 밝기, 색조 및 명암은 장치에 따라 다를 수 있으며 안과 전문의의 의료적 판단을 도울 인공지능을 이용한 자동진단 시스템 연구와 개발이 가능하다. 이 시스템은 미세혈관류와 망막출혈을 Mask R-CNN 기법으로 검출하고, 후처리 과정을 거쳐 랜덤포레스트 분류기를 이용하여 안구의 정상과 비정상 상태를 진단한다. Mask R-CNN 알고리즘의 검출 성능 향상을 위해 이미지 증강 작업을 실시하여 학습을 진행하였으며 검출 정확도 측정을 위한 평가지표로는 다이스 유사계수와 Mean Accuracy를 사용하였다. 비교군으로는 Faster R-CNN 기법을 사용하였고 본 연구를 통한 검출 성능은 평균 90%의 다이스 계수를 통한 정확도를 나타내었으며 Mean Accuracy의 경우 91% 정확도의 검출 성능을 보였다. 검출된 병리증상을 토대로 랜덤포레스트 분류기를 학습하여 당뇨병성 망막 병증을 진단한 경우 99%의 정확도를 보였다.

결합 신경망을 이용한 여권 MRZ 정보 인식 (Recognition of Passport MRZ Information Using Combined Neural Networks)

  • 김진호
    • 디지털산업정보학회논문지
    • /
    • 제15권4호
    • /
    • pp.149-157
    • /
    • 2019
  • In case of reading passport using a smart phone in contrast with a dedicated passport reading system, MRZ(Machine Readable Zone) character recognition can be hard when the character strokes were broken, touched or blurred according to the lighting condition, and the position and size of MRZ character lines were varied due to the camera distance and angle. In this paper, the effective recognition algorithm of the passport MRZ information using a combined neural network recognizer of CNN(Convolutional Neural Network) and ANN( Artificial Neural Network), is proposed under the various sized and skewed passport images. The MRZ line detection using connected component analysis algorithm and the skew correction using perspective transform algorithm are also designed in order to achieve effective character segmentation results. Each of the MRZ field recognition results is verified by using five check digits for deciding whether retrying the recognition process of passport MRZ information or not. After we implement the proposed recognition algorithm of passport MRZ information, the excellent recognition performance of the passport MRZ information was obtained in the experimental results for PC off-line mode and smart phone on-line mode.

신경망에 의한 테두리를 보존하는 영상압축 (Edge Preserving Image Compression with Weighted Centroid Neural Network)

  • 박동철;우영준
    • 한국통신학회논문지
    • /
    • 제24권10B호
    • /
    • pp.1946-1952
    • /
    • 1999
  • 무지도 경쟁학습을 이용하여 압축된 영상의 복원 후에 나타나는 테두리부분의 손상을 최소화하기 위한 영상압축 방법이 제안되었다. 제안된 영상압축방법은 영상데이터에서 테두리부분에 해당하는 데이터의 기하학적인 특징을 이용하는데, 영상데이터의 통계학적인 특성을 함께 이용하여 기존의 Centroid Neural Network을 일반화시키는 무지도 경쟁학습에 의하여 자동적으로 더욱 많은 code vector를 테두리부분에 배정함으로서 압축된 영상의 복원 후에 나타나는 테두리부분의 손상을 초소화하게 한다. 실험 결과, 기존의 SOM, M-SOM, M/R-CNN등과 비교하여 제안된 방법에 의해 압축된 영상의 복원된 테두리 부분에서 PSNR이 약 2dbv정도 향상된 결과를 보여줄 수 있었다.

  • PDF

딥 러닝 기반의 초해상도 이미지 복원 기법 성능 분석 (Performance Analysis of Deep Learning-based Image Super Resolution Methods)

  • 이현재;신현광;최규상;진성일
    • 대한임베디드공학회논문지
    • /
    • 제15권2호
    • /
    • pp.61-70
    • /
    • 2020
  • Convolutional Neural Networks (CNN) have been used extensively in recent times to solve image classification and segmentation problems. However, the use of CNNs in image super-resolution problems remains largely unexploited. Filter interpolation and prediction model methods are the most commonly used algorithms in super-resolution algorithm implementations. The major limitation in the above named methods is that images become totally blurred and a lot of the edge information are lost. In this paper, we analyze super resolution based on CNN and the wavelet transform super resolution method. We compare and analyze the performance according to the number of layers and the training data of the CNN.