• 제목/요약/키워드: Feature extractor

검색결과 73건 처리시간 0.023초

Binary Classification of Hypertensive Retinopathy Using Deep Dense CNN Learning

  • Mostafa E.A., Ibrahim;Qaisar, Abbas
    • International Journal of Computer Science & Network Security
    • /
    • 제22권12호
    • /
    • pp.98-106
    • /
    • 2022
  • A condition of the retina known as hypertensive retinopathy (HR) is connected to high blood pressure. The severity and persistence of hypertension are directly correlated with the incidence of HR. To avoid blindness, it is essential to recognize and assess HR as soon as possible. Few computer-aided systems are currently available that can diagnose HR issues. On the other hand, those systems focused on gathering characteristics from a variety of retinopathy-related HR lesions and categorizing them using conventional machine-learning algorithms. Consequently, for limited applications, significant and complicated image processing methods are necessary. As seen in recent similar systems, the preciseness of classification is likewise lacking. To address these issues, a new CAD HR-diagnosis system employing the advanced Deep Dense CNN Learning (DD-CNN) technology is being developed to early identify HR. The HR-diagnosis system utilized a convolutional neural network that was previously trained as a feature extractor. The statistical investigation of more than 1400 retinography images is undertaken to assess the accuracy of the implemented system using several performance metrics such as specificity (SP), sensitivity (SE), area under the receiver operating curve (AUC), and accuracy (ACC). On average, we achieved a SE of 97%, ACC of 98%, SP of 99%, and AUC of 0.98. These results indicate that the proposed DD-CNN classifier is used to diagnose hypertensive retinopathy.

주파수 공간상의 특징 데이터를 활용한 손목에 부착된 가속도 센서 기반의 낙상 감지 (Fall detection based on acceleration sensor attached to wrist using feature data in frequency space)

  • 노정현;김진헌
    • 스마트미디어저널
    • /
    • 제10권3호
    • /
    • pp.31-38
    • /
    • 2021
  • 낙상사고는 언제, 어디에서 일어날지 예측하기 어렵다. 또한 신속한 후속 조치가 수행되지 않으면 생명의 위협으로 이어지므로 낙상사고를 자동으로 감지할 수 있는 연구가 필요하게 되었다. 자동적인 낙상사고 감지기법 중 손목에 부착된 IMU 센서를 활용한 기법은 움직임이 많아 낙상사고 검출이 어렵지만, 착용의 간편함과 접근성이 뛰어난 기법으로 인식되고 있다. 낙상 데이터 확보의 어려움을 극복하기 위해 본 연구는 KNN과 SVM과 같은 머신러닝으로 적은 데이터를 효율적으로 학습하는 알고리즘을 제안한다. 또한, 이들 수학적 분류기의 성능을 높이기 위해 본 연구에서는 주파수 공간에서 취득한 특징 데이터를 활용하였다. 제안된 알고리즘은 표준 데이터세트를 활용한 실험을 통해 모델의 파라미터와 주파수 특징 추출기의 파라미터를 다각화하여 그 영향을 분석하였다. 제안된 알고리즘은 학습 데이터를 확보하기 어려운 현실적인 문제에 적절히 대처할 수 있었다. 또한 본 알고리즘이 다른 분류기보다 경량화되어 있기 때문에 SIMD(Single Instruction Multiple Data) 처리장치 탑재가 어려운 소형 임베디드시스템에도 구현이 용이했다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.

확장된 RNN을 활용한 사람재인식 시스템에 관한 연구 (A Study on Person Re-Identification System using Enhanced RNN)

  • 최석규;허문걸
    • 한국인터넷방송통신학회논문지
    • /
    • 제17권2호
    • /
    • pp.15-23
    • /
    • 2017
  • 사람의 빈번한 자세 변화, 그리고 background clutter과 occlusion으로 인해 Person Re-identificatio는 컴퓨터 비전 분야에서 가장 어려운 부분이다. 비겹침 카메라의 이미지는 어떤 사람을 다른 사람과 구별하기 어렵게 한다. 더욱 나은 성능 일치를 달성하기 위해 대부분의 방법은 특징 선택과 거리 메트릭을 개별적으로 사용한다. 그렇게 차별화된 표현과 적절한 거리를 얻을 수 있고, 사람과 중요한 특징의 무시 사이의 유사성을 설명할 수 있다. 이러한 상황은 우리가 이 문제를 다루는 새로운 방법을 고려하도록 한다. 본 논문에서는 Person Re-identification를 위한 3단 계층네트워크를 갖는 향상되고 반복적인 신경 회로망을 제안하였다. 특히 RNN(Revurrent Neural Network) 모델은 반복적인 EM(Expectation Maximum) 알고리즘과 3단 계층 네트워크를 포함하고, 차별적 특징과 지표 거리를 공동으로 학습한다. 반복적인 EM 알고리즘은 RNN 이전에 연속해 있는 CNN(Convoutional Neural Network)의 특징 추출 능력을 충분히 사용할 수 있다. 자율 학습을 통해 EM 프레임 워크는 패치의 레이블을 변경하고 더 큰 데이터 세트를 훈련할 수 있다. 네트워크를 더 잘 훈련시키기 위해 3단 계층 네트워크를 통해 CNN, RNN 및 풀링 계층이 공동으로 특징 추출을 할 수 있다. 실험 결과에 따르면 비전처리 분야에서 다른 연구자의 접근 방식과 비교할 때 이 방법은 경쟁력 있는 정확도를 얻을 수 있다. 이 방법에 대한 다른 요소의 영향은 향후 연구에서 분석되고 평가될 것이다.

Haarlike 기반의 고속 차량 검출과 SURF를 이용한 차량 추적 알고리즘 (Fast Vehicle Detection based on Haarlike and Vehicle Tracking using SURF Method)

  • 유재형;한영준;한헌수
    • 한국컴퓨터정보학회논문지
    • /
    • 제17권1호
    • /
    • pp.71-80
    • /
    • 2012
  • 본 논문에서는 단일 카메라를 이용하여 차량의 위치를 검출하고 연속적인 프레임에서의 차량의 움직임을 추적하는 알고리즘을 제안한다. 차량의 특징을 검출하기 위해 Haar-like 에지 검출기를 사용하고, 카메라의 캘리브레이션 정보를 이용하여 차량의 위치를 추정한다. 신뢰도를 높이기 위해 k 개의 연속적인 프레임에서의 누적된 차량 정보를 추출한다. 최종 검출된 차량을 템플릿으로 지정하고 SURF (Speeded Up Robust Features) 알고리즘을 통해 연속적으로 입력되는 프레임에서 동일한 차량을 추출한다. 이를 통해 동일 차량으로 추출된 차량 정보를 새로운 템플릿으로 업데이트 한다. 비교 검출을 위한 수행 시간을 줄이기 위해 이전 프레임에서 검출된 차량의 범위를 확장한 영역만을 관심 영역으로 지정한다. 이 과정은 공통된 대응점을 찾지 못할 때까지 검출과 추적 과정을 반복하여 진행한다. 실 도로 상에서 얻어진 영상에 대해 적용함으로써 제안된 알고리즘의 효율성을 보였다.

영상기반 콘크리트 균열 탐지 딥러닝 모델의 유형별 성능 비교 (A Comparative Study on Performance of Deep Learning Models for Vision-based Concrete Crack Detection according to Model Types)

  • 김병현;김건순;진수민;조수진
    • 한국안전학회지
    • /
    • 제34권6호
    • /
    • pp.50-57
    • /
    • 2019
  • In this study, various types of deep learning models that have been proposed recently are classified according to data input / output types and analyzed to find the deep learning model suitable for constructing a crack detection model. First the deep learning models are classified into image classification model, object segmentation model, object detection model, and instance segmentation model. ResNet-101, DeepLab V2, Faster R-CNN, and Mask R-CNN were selected as representative deep learning model of each type. For the comparison, ResNet-101 was implemented for all the types of deep learning model as a backbone network which serves as a main feature extractor. The four types of deep learning models were trained with 500 crack images taken from real concrete structures and collected from the Internet. The four types of deep learning models showed high accuracy above 94% during the training. Comparative evaluation was conducted using 40 images taken from real concrete structures. The performance of each type of deep learning model was measured using precision and recall. In the experimental result, Mask R-CNN, an instance segmentation deep learning model showed the highest precision and recall on crack detection. Qualitative analysis also shows that Mask R-CNN could detect crack shapes most similarly to the real crack shapes.

소형 임베디드 장치를 위한 경량 컨볼루션 모듈 기반의 검출 모델 (Lightweight Convolution Module based Detection Model for Small Embedded Devices)

  • 박찬수;이상훈;한현호
    • 융합정보논문지
    • /
    • 제11권9호
    • /
    • pp.28-34
    • /
    • 2021
  • 딥러닝을 이용한 객체 검출의 경우 정확도와 실시간성을 모두 요구한다. 그러나, 한정된 자원 환경에서는 수 많은 양의 데이터를 처리하는 딥러닝 모델을 사용하기 어렵다. 이러한 문제 해결을 위해 본 논문에서는 소형임베디드 장치를 위한 객체 검출을 모델을 제안하였다. 일반적인 검출 모델과 달리 사전 학습된 특징 추출기를 제거한 구조를 사용하여 모델 크기를 최소화하였다. 모델의 구조는 경량화된 컨볼루션 블록을 반복해서 쌓는 구조로 설계하였다. 또한, 검출 오버헤드를 줄이기 위해 영역 제안 횟수를 크게 줄였다. 제안하는 모델은 공개 데이터 셋인 PASCAL VOC를 사용하여 학습 및 평가하였다. 모델의 정량적 평가를 위해 검출 분야에서 사용하는 average precision으로 검출 성능을 측정하였다. 그리고 실제 임베디드 장치와 유사한 라즈베리 파이에서 검출 속도를 측정하였다. 실험을 통해 기존 검출 방법 대비 향상된 정확도와 빠른 추론 속도를 달성하였다.

모바일 기반 Air Writing을 위한 객체 탐지 및 광학 문자 인식 방법 (Object Detection and Optical Character Recognition for Mobile-based Air Writing)

  • 김태일;고영진;김태영
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제15권5호
    • /
    • pp.53-63
    • /
    • 2019
  • 모바일 환경에서 딥러닝을 통한 손 제스처 인터페이스를 제공하려면 높은 인식률을 제공하면서 실행속도의 저하를 막기 위한 네트워크 경량화의 연구가 필수적이다. 본 논문은 딥러닝 모델의 경량화를 통해 모바일 기기에서 손가락을 이용하여 공중에 쓴 문자를 실시간으로 인식하는 방법을 제안한다. MobileNet을 특징 추출기로 활용하는 객체 탐지 모델인 SSD (Single Shot Detector)를 기반으로 집게손가락을 탐지하고 손끝 경로를 이어 결과문자 영상을 생성한다. 이 영상은 서버로 전송되어 정규화 과정을 수행한 다음 학습된 OCR 모델을 이용하여 문자를 인식한다. 본 방법을 검증하기 위하여 12명의 사용자가 GALAXY S10+ 기기를 사용하여 1,000개의 단어를 실험한 결과 평균 88.6%의 정확도로 손가락을 인식하고 124 ms 이내로 인식된 텍스트가 출력되어 실시간으로 활용 가능함을 알 수 있었다. 본 연구결과는 모바일 환경에서 손가락을 이용한 간단한 문자 전송, 메모 및 공중 서명 등에 활용될 수 있다.

전이 학습을 이용한 VGG19 기반 말라리아셀 이미지 인식 (Malaria Cell Image Recognition Based On VGG19 Using Transfer Learning)

  • ;김강철
    • 한국전자통신학회논문지
    • /
    • 제17권3호
    • /
    • pp.483-490
    • /
    • 2022
  • 말라리아는 기생충에 의해 발생하는 질병으로 전 세계에 퍼져있다. 말라리아 셀을 인식하는데 일반적으로 두꺼운 혈흔과 얇은 혈흔 검사 방법이 사용되지만 이러한 방법은 많은 수작업 계산이 필요하여 효율성과 정확성이 매우 낮을 뿐만 아니라 빈민국에는 병리학자가 부족하여 말라리아 치명율이 높다. 본 논문에서는 특징 추출기, 잔류 구조와 완전 연결층으로 구성되고, 전이 학습을 이용한 말라리아셀 이미지를 인식하는 모델을 제안한다. VGG-19 모델의 사전 학습된 파라미터가 사용될 때 일부 컨볼루션층의 파라미터는 고정되고, 모델의 데이터에 맞추기 위하여 미세조정이 사용된다. 그리고 제안된 모델과 비교하기 위하여 잔류 구조가 없는 말라리아셀 인식 모델을 구현한다. 실험 결과 잔류 구조를 사용한 모델이 잔류 구조가 없는 모델에 비하여 성능이 우수 하였으며, 최신 논문과 비교하여 가장 높은 97.33%의 정확도를 보여주었다.

전이학습을 이용한 볼베어링의 진동진단 (Transfer Learning-Based Vibration Fault Diagnosis for Ball Bearing)

  • 홍수빈;이영대;문찬우
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.845-850
    • /
    • 2023
  • 본 논문에서는 전이학습을 이용하여 볼베어링의 진동진단을 수행하는 방법을 제안한다. 고장을 진단하기 위해 진동신호를 시간-주파수로 분석할 수 있는 STFT을 CNN의 입력으로 이용하였다. CNN 기반의 딥러닝 인공신경망을 빠르게 학습하고 진단 성능을 높이기 위해 전이학습 기반의 딥러닝 학습 기법을 제안하였다. 전이학습은 VGG 기반의 영상 분류 모델을 이용하여 특징 추출기와 분류기를 선택적으로 학습하였고, 학습에 사용한 데이터 세트는 Case Western Reserve University 대학에서 제공하는 공개된 볼베어링 진동 데이터를 사용하였으며, 성능평가는 기존의 CNN 모델과 비교하는 방법으로 수행하였다. 실험 결과 전이학습이 볼베어링 진동 데이터에서 상태 진단에 유용하다는 것을 증명할 수 있을 뿐만 아니라 이를 통해 다른 산업에서도 전이학습을 사용하여 상태 진단을 개선할 수 있다.