• 제목/요약/키워드: 1차원 컨볼루션

검색결과 10건 처리시간 0.037초

균형적인 신체활동을 위한 맞춤형 AI 운동 추천 서비스 (Customized AI Exercise Recommendation Service for the Balanced Physical Activity)

  • 김창민;이우범
    • 융합신호처리학회논문지
    • /
    • 제23권4호
    • /
    • pp.234-240
    • /
    • 2022
  • 본 논문은 직종별 근무 환경에 따른 상대적 운동량을 고려한 맞춤형 AI 운동 추천 서비스 방법을 제안한다. 가속도 및 자이로 센서를 활용하여 수집된 데이터를 18가지 일상생활의 신체활동으로 분류한 WISDM 데이터베이스를 기반으로 전신, 하체, 상체의 3가지 활동으로 분류한 후 인식된 활동 지표를 통해 적절한 운동을 추천한다. 본 논문에서 신체활동 분류를 위해서 사용하는 1차원 합성곱 신경망(1D CNN; 1 Dimensional Convolutional Neural Network) 모델은 커널 크기가 다른 다수의 1D 컨볼루션(Convolution) 계층을 병렬적으로 연결한 컨볼루션 블록을 사용한다. 컨볼루션 블록은 하나의 입력 데이터에 다층 1D 컨볼루션을 적용함으로써 심층 신경망 모델로 추출할 수 있는 입력 패턴의 세부 지역 특징을 보다 얇은 계층으로도 효과적으로 추출 할 수 있다. 제안한 신경망 모델의 성능 평가를 위해서 기존 순환 신경망(RNN; Recurrent Neural Network) 모델과 비교 실험한 결과 98.4%의 현저한 정확도를 보였다.

계층적 컨볼루션 신경망을 이용한 공작기계의 공구 상태 진단 (Machine Tool State Monitoring Using Hierarchical Convolution Neural Network)

  • 이경민
    • 융합신호처리학회논문지
    • /
    • 제23권2호
    • /
    • pp.84-90
    • /
    • 2022
  • 공작기계 상태 진단은 기계의 상태를 자동으로 감지하는 프로세스이다. 실제로 가공의 효율과 제조공정에서 제품의 품질은 공구 상태에 영향을 받으며 마모 및 파손된 공구는 공정 성능에 보다 심각한 문제를 일으키고 제품의 품질 저하를 일으킬 수 있다. 따라서 적절한 시기에 공구가 교체될 수 있도록 공구 마모 진행 및 공정 중 파손 방지 시스템 개발이 필요하다. 본 논문에서는 공구의 적절한 교체 시기 등을 진단하기 위해 딥러닝 기반의 계층적 컨볼루션 신경망을 이용하여 5가지 공구 상태를 진단하는 방법을 제안한다. 기계가 공작물을 절삭할 때 발생하는 1차원 음향 신호를 주파수 기반의 전력스펙트럼밀도 2차원 영상으로 변환하여 컨볼루션 신경망의 입력으로 사용한다. 학습 모델은 계층적 3단계를 거쳐 5가지 공구 상태를 진단한다. 제안한 방법은 기존의 방법과 비교하여 높은 정확도를 보였고, 실시간 연동을 통해 다양한 공작기계를 모니터링할 수 있는 스마트팩토리 고장 진단 시스템에 활용할 수 있을 것이다.

심층 학습 모델을 이용한 EPS 동작 신호의 인식 (EPS Gesture Signal Recognition using Deep Learning Model)

  • 이유라;김수형;김영철;나인섭
    • 스마트미디어저널
    • /
    • 제5권3호
    • /
    • pp.35-41
    • /
    • 2016
  • 본 논문에서는 심층 학습 모델 방법을 이용하여 EPS(Electronic Potential Sensor) 기반의 손동작 신호를 인식하는 시스템을 제안한다. 전기장 기반 센서인 EPS로부터 추출된 신호는 다량의 잡음이 포함되어 있어 이를 제거하는 전처리과정을 거쳐야 한다. 주파수 대역 특징 필터를 이용한 잡음 제거한 후, 신호는 시간에 따른 전압(Voltage) 값만 가지는 1차원적 특징을 지닌다. 2차원 데이터를 입력으로 하여 컨볼루션 연산을 하는 알고리즘에 적합한 형태를 갖추기 위해 신호는 차원 변형을 통해 재구성된다. 재구성된 신호데이터는 여러 계층의 학습 층(layer)을 가지는 심층 학습 기반의 모델을 통해 분류되어 최종 인식된다. 기존 확률 기반 통계적 모델링 알고리즘은 훈련 후 모델을 생성하는 과정에서 초기 파라미터에 결과가 좌우되는 어려움이 있었다. 심층 학습 기반 모델은 학습 층을 쌓아 훈련을 반복하므로 이를 극복할 수 있다. 실험에서, 제안된 심층 학습 기반의 서로 다른 구조를 가지는 컨볼루션 신경망(Convolutional Neural Networks), DBN(Deep Belief Network) 알고리즘과 통계적 모델링 기반의 방법을 이용한 인식 결과의 성능을 비교하였고, 컨볼루션 신경망 알고리즘이 다른 알고리즘에 비해 EPS 동작신호 인식에서 보다 우수한 성능을 나타냄을 보였다.

2차원 얼굴 인식을 위한 Convolutional RBFNNs 패턴 분류기 설계 (Design of Convolutional RBFNNs Pattern Classifier for Two dimensional Face Recognition)

  • 김종범;오성권
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2015년도 제46회 하계학술대회
    • /
    • pp.1355-1356
    • /
    • 2015
  • 본 논문에서는 Convolution기법 기반 RBFNNs 패턴 분류기를 사용한 2차원 얼굴인식 시스템을 설계한다. 제안된 방법은 특징 추출과 차원축소를 하는 컨볼루션 계층과 부분추출 계층을 교대로 연결하여 2차원 이미지를 1차원의 특징 배열로 만든다. 그 후, 만들어진 1차원의 특징 배열을 RBFNNs 패턴 분류기의 입력으로 사용하여 인식을 수행한다. RBFNNs의 조건부에는 FCM 클러스터링 알고리즘을 사용하며 연결가중치는 1차 선형식을 사용하였다. 또한 최소 자승법(LSE : Least Square Estimation)을 사용하여 다항식의 계수를 추정하였다. 제안된 모델의 성능을 평가하기 위해 CMU PIE Database를 사용한다.

  • PDF

딥러닝 기반 욕설 탐지 (Swear Word Detection through Convolutional Neural Network)

  • 김유민;강효빈;한수현;정희용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.685-686
    • /
    • 2021
  • 개인의 소셜미디어 활동이 활발해지면서 익명성을 악용하여 타인에게 욕설을 주저없이 해버리는 사용자가 늘고 있다. 본 연구는 욕설이 난무하는 채팅창에서 욕설 데이터를 크롤링하여 데이터셋을 구축하여 컨볼루션 네트워크로 학습시켰을 때 욕설을 탐지하고, 전체 문장에서 그 탐지한 욕설의 위치를 파악하여 블러링 처리를 할 수 있는지를 확인하는 것을 목적으로 한다. 전처리 작업으로 한글과 공백을 제외하고 형태소 단위로 토큰화한 후 불용어를 제거해서 패딩처리를 하였다. 학습 모델로는 1차원 컨볼루션을 사용하여 수집한 데이터의 80%를 훈련에 사용하고 나머지 20%를 테스트에 사용하였다. 키워드를 이용한 단순 분류 모델과 비교하였을 때, 본 연구에서 이용한 모델이 약 14% 정확도가 향상된 것을 확인할 수 있었다. 테스트에서 전체 문장에서 욕설이 포함되었을 때 욕설과 그 위치 정보를 잘 획득하는 것도 확인할 수 있었다.

격자 부호화 3차원 직교 주파수분할다중화 시스템 (A Trellis-Coded 3-Dimensional OFDM System)

  • 이상;강석근
    • 한국정보통신학회논문지
    • /
    • 제21권9호
    • /
    • pp.1635-1641
    • /
    • 2017
  • 본 논문에서는 격자 부호화 3차원 직교 주파수분할다중화 시스템을 제시하고 성능을 분석한다. 여기서는 격자 부호화를 위한 3차원 신호성상도에 대한 집합분할 기법도 제시한다. 부호율이 R = 1/3과 2/3인 회귀 체계적 컨볼루션 부호와 3차원 8진 성상도를 이용하여 격자 부호화된 제안된 시스템은 부호화되지 않은 직교 주파수분할다중화 시스템에 비하여 최대 7.8 dB까지 오류성능이 향상될 수 있음을 이론적으로 계산하였다. 또한 컴퓨터 모의실험을 통하여 제시된 이론적 분석과 거의 일치하는 결과를 도출함으로써 이론적 분석이 정확한 것을 확인하였다. 따라서 제안된 격자 부호화 3차원 직교 주파수분할다중화 시스템은 대역폭의 증가 없이 고품질 디지털 전송을 달성할 수 있는 효과적인 방법인 것으로 사료된다.

CNN 기반 초분광 영상 분류를 위한 PCA 차원축소의 영향 분석 (The Impact of the PCA Dimensionality Reduction for CNN based Hyperspectral Image Classification)

  • 곽태홍;송아람;김용일
    • 대한원격탐사학회지
    • /
    • 제35권6_1호
    • /
    • pp.959-971
    • /
    • 2019
  • 대표적인 딥러닝(deep learning) 기법 중 하나인 Convolutional Neural Network(CNN)은 고수준의 공간-분광 특징을 추출할 수 있어 초분광 영상 분류(Hyperspectral Image Classification)에 적용하는 연구가 활발히 진행되고 있다. 그러나 초분광 영상은 높은 분광 차원이 학습 과정의 시간과 복잡도를 증가시킨다는 문제가 있어 이를 해결하기 위해 기존 딥러닝 기반 초분광 영상 분류 연구들에서는 차원축소의 목적으로 Principal Component Analysis (PCA)를 적용한 바 있다. PCA는 데이터를 독립적인 주성분의 축으로 변환시킬 수 있어 분광 차원을 효율적으로 압축할 수 있으나, 분광 정보의 손실을 초래할 수 있다. PCA의 사용 유무가 CNN 학습의 정확도와 시간에 영향을 미치는 것은 분명하지만 이를 분석한 연구가 부족하다. 본 연구의 목적은 PCA를 통한 분광 차원축소가 CNN에 미치는 영향을 정량적으로 분석하여 효율적인 초분광 영상 분류를 위한 적절한 PCA의 적용 방법을 제안하는 데에 있다. 이를 위해 PCA를 적용하여 초분광 영상을 축소시켰으며, 축소된 차원의 크기를 바꿔가며 CNN 모델에 적용하였다. 또한, 모델 내의 컨볼루션(convolution) 연산 방식에 따른 PCA의 민감도를 분석하기 위해 2D-CNN과 3D-CNN을 적용하여 비교 분석하였다. 실험결과는 분류정확도, 학습시간, 분산 비율, 학습 과정을 통해 분석되었다. 축소된 차원의 크기가 분산 비율이 99.7~8%인 주성분 개수일 때 가장 효율적이었으며, 3차원 커널 경우 2D-CNN과는 다르게 원 영상의 분류정확도가 PCA-CNN보다 더 높았으며, 이를 통해 PCA의 차원축소 효과가 3차원 커널에서 상대적으로 적은 것을 알 수 있었다.

적외선 스테레오 카메라를 이용한 고속 이동객체의 위치에 대한 확률모델 (Statistical Model of 3D Positions in Tracking Fast Objects Using IR Stereo Camera)

  • 오준호;이상화;이부환;박종일
    • 전자공학회논문지
    • /
    • 제52권1호
    • /
    • pp.89-101
    • /
    • 2015
  • 본 논문에서는 비냉각방식 적외선 스테레오 카메라 시스템을 이용하여 고속으로 이동하는 고온의 소형 물체의 3차원 위치를 추정함에 있어서 무작위로 추정되는 그 위치를 확률 모델로 표현하는 방법을 제안한다. 본 논문에서 제안하는 확률적 위치 모델은 디지털 영상으로 인한 픽셀위치의 오차(pixel position error)와 비냉각식 적외선 카메라에서 영상을 취득하는 순간의 차이에 의한 지터오차(jitter error)로부터 유도되는데, 두 가지 오차를 결합한 통합 오차확률모델을 수학적으로 제시하고 실험을 통하여 그 효용성을 보여준다. 우선 본 논문에서 고안한 적외선 카메라의 지터 측정기를 이용하여 적외선 카메라에서 발생하는 타이밍 지터를 통계적으로 관찰하여 확률모델을 설정한다. 또한 디지털 영상의 스테레오 정합 과정에서 발생하는 픽셀 오차에 의하여 정확도가 떨어지는 측정거리를 확률모델로 정의한다. 실험 측정 결과, 지터는 가우시안 확률분포로 모델링하는 것이 가능하며, 픽셀오차는 균일 확률분포로 모델링된다. 이 두 가지 확률분포를 갖는 오차는 상호 독립으로서 선형 결합되는데, 전체 오차에 대한 확률분포는 지터오차 변수의 확률분포와 픽셀위치오차 변수의 확률분포를 컨볼루션함으로써 유도된다. 실제 고속 이동체에 대하여 정밀한 3차원 궤적측정기와 자체 구현한 적외선 스테레오 카메라 시스템을 이용하여 제안한 확률모델을 3차원 위치추적 실험에 적용한 결과 95% 신뢰도 구간에서 물체의 위치를 추정하는 것을 확인하였다. 즉, 물체의 위치를 정확하게 측정하는 것은 이론적으로는 불가능하며, 확률모델을 통하여 물체의 위치를 표현하는 것이 타당함을 확인할 수 있다. 본 논문에서 제안한 확률모델은 적외선 스테레오 카메라를 이용한 거리측정에서 부정확함을 확률적으로 모델링하여 위치정보에 대한 불확실성을 보정해주며, 특히 적외선 스테레오 카메라를 이용한 고속 물체의 위치추적 및 거리측정에서 이론적, 실험적 토대를 제공할 것으로 기대된다.

수어 번역을 위한 3차원 컨볼루션 비전 트랜스포머 (Three-Dimensional Convolutional Vision Transformer for Sign Language Translation)

  • 성호렬;조현중
    • 정보처리학회 논문지
    • /
    • 제13권3호
    • /
    • pp.140-147
    • /
    • 2024
  • 한국에서 청각장애인은 지체장애인에 이어 두 번째로 많은 등록 장애인 그룹이다. 하지만 수어 기계 번역은 시장 성장성이 작고, 엄밀하게 주석처리가 된 데이터 세트가 부족해 발전 속도가 더디다. 한편, 최근 컴퓨터 비전과 패턴 인식 분야에서 트랜스포머를 사용한 모델이 많이 제안되고 있는데, 트랜스포머를 이용한 모델은 동작 인식, 비디오 분류 등의 분야에서 높은 성능을 보여오고 있다. 이에 따라 수어 기계 번역 분야에서도 트랜스포머를 도입하여 성능을 개선하려는 시도들이 제안되고 있다. 본 논문에서는 수어 번역을 위한 인식 부분을 트랜스포머와 3D-CNN을 융합한 3D-CvT를 제안한다. 또, PHOENIX-Wether-2014T [1]를 이용한 실험을 통해 제안 모델은 기존 모델보다 적은 연산량으로도 비슷한 번역 성능을 보이는 효율적인 모델임을 실험적으로 증명하였다.

전이학습 기반 다중 컨볼류션 신경망 레이어의 활성화 특징과 주성분 분석을 이용한 이미지 분류 방법 (Transfer Learning using Multiple ConvNet Layers Activation Features with Principal Component Analysis for Image Classification)

  • 바트후 ?바자브;주마벡 알리하노브;팡양;고승현;조근식
    • 지능정보연구
    • /
    • 제24권1호
    • /
    • pp.205-225
    • /
    • 2018
  • Convolutional Neural Network (ConvNet)은 시각적 특징의 계층 구조를 분석하고 학습할 수 있는 대표적인 심층 신경망이다. 첫 번째 신경망 모델인 Neocognitron은 80 년대에 처음 소개되었다. 당시 신경망은 대규모 데이터 집합과 계산 능력이 부족하여 학계와 산업계에서 널리 사용되지 않았다. 그러나 2012년 Krizhevsky는 ImageNet ILSVRC (Large Scale Visual Recognition Challenge) 에서 심층 신경망을 사용하여 시각적 인식 문제를 획기적으로 해결하였고 그로 인해 신경망에 대한 사람들의 관심을 다시 불러 일으켰다. 이미지넷 첼린지에서 제공하는 다양한 이미지 데이터와 병렬 컴퓨팅 하드웨어 (GPU)의 발전이 Krizhevsky의 승리의 주요 요인이었다. 그러므로 최근의 딥 컨볼루션 신경망의 성공을 병렬계산을 위한 GPU의 출현과 더불어 ImageNet과 같은 대규모 이미지 데이터의 가용성으로 정의 할 수 있다. 그러나 이러한 요소는 많은 도메인에서 병목 현상이 될 수 있다. 대부분의 도메인에서 ConvNet을 교육하기 위해 대규모 데이터를 수집하려면 많은 노력이 필요하다. 대규모 데이터를 보유하고 있어도 처음부터 ConvNet을 교육하려면 많은 자원과 시간이 소요된다. 이와 같은 문제점은 전이 학습을 사용하면 해결할 수 있다. 전이 학습은 지식을 원본 도메인에서 새 도메인으로 전이하는 방법이다. 전이학습에는 주요한 두 가지 케이스가 있다. 첫 번째는 고정된 특징점 추출기로서의 ConvNet이고, 두번째는 새 데이터에서 ConvNet을 fine-tuning 하는 것이다. 첫 번째 경우, 사전 훈련 된 ConvNet (예: ImageNet)을 사용하여 ConvNet을 통해 이미지의 피드포워드 활성화를 계산하고 특정 레이어에서 활성화 특징점을 추출한다. 두 번째 경우에는 새 데이터에서 ConvNet 분류기를 교체하고 재교육을 한 후에 사전 훈련된 네트워크의 가중치를 백프로퍼게이션으로 fine-tuning 한다. 이 논문에서는 고정된 특징점 추출기를 여러 개의 ConvNet 레이어를 사용하는 것에 중점을 두었다. 그러나 여러 ConvNet 레이어에서 직접 추출된 차원적 복잡성을 가진 특징점을 적용하는 것은 여전히 어려운 문제이다. 우리는 여러 ConvNet 레이어에서 추출한 특징점이 이미지의 다른 특성을 처리한다는 것을 발견했다. 즉, 여러 ConvNet 레이어의 최적의 조합을 찾으면 더 나은 특징점을 얻을 수 있다. 위의 발견을 토대로 이 논문에서는 단일 ConvNet 계층의 특징점 대신에 전이 학습을 위해 여러 ConvNet 계층의 특징점을 사용하도록 제안한다. 본 논문에서 제안하는 방법은 크게 세단계로 이루어져 있다. 먼저 이미지 데이터셋의 이미지를 ConvNet의 입력으로 넣으면 해당 이미지가 사전 훈련된 AlexNet으로 피드포워드 되고 3개의 fully-connected 레이어의 활성화 틀징점이 추출된다. 둘째, 3개의 ConvNet 레이어의 활성화 특징점을 연결하여 여러 개의 ConvNet 레이어의 특징점을 얻는다. 레이어의 활성화 특징점을 연결을 하는 이유는 더 많은 이미지 정보를 얻기 위해서이다. 동일한 이미지를 사용한 3개의 fully-connected 레이어의 특징점이 연결되면 결과 이미지의 특징점의 차원은 4096 + 4096 + 1000이 된다. 그러나 여러 ConvNet 레이어에서 추출 된 특징점은 동일한 ConvNet에서 추출되므로 특징점이 중복되거나 노이즈를 갖는다. 따라서 세 번째 단계로 PCA (Principal Component Analysis)를 사용하여 교육 단계 전에 주요 특징점을 선택한다. 뚜렷한 특징이 얻어지면, 분류기는 이미지를 보다 정확하게 분류 할 수 있고, 전이 학습의 성능을 향상시킬 수 있다. 제안된 방법을 평가하기 위해 특징점 선택 및 차원축소를 위해 PCA를 사용하여 여러 ConvNet 레이어의 특징점과 단일 ConvNet 레이어의 특징점을 비교하고 3개의 표준 데이터 (Caltech-256, VOC07 및 SUN397)로 실험을 수행했다. 실험결과 제안된 방법은 Caltech-256 데이터의 FC7 레이어로 73.9 %의 정확도를 얻었을 때와 비교하여 75.6 %의 정확도를 보였고 VOC07 데이터의 FC8 레이어로 얻은 69.2 %의 정확도와 비교하여 73.1 %의 정확도를 보였으며 SUN397 데이터의 FC7 레이어로 48.7%의 정확도를 얻었을 때와 비교하여 52.2%의 정확도를 보였다. 본 논문에 제안된 방법은 Caltech-256, VOC07 및 SUN397 데이터에서 각각 기존에 제안된 방법과 비교하여 2.8 %, 2.1 % 및 3.1 %의 성능 향상을 보였다.