• Title/Summary/Keyword: 심층 합성 곱 신경망

Search Result 78, Processing Time 0.024 seconds

1D CNN과 기계 학습을 사용한 낙상 검출 (1D CNN and Machine Learning Methods for Fall Detection)

  • 김인경;김대희;노송;이재구
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권3호
    • /
    • pp.85-90
    • /
    • 2021
  • 본 논문에서는 고령자를 위한 개별 웨어러블(Wearable) 기기를 이용한 낙상 감지에 대해 논한다. 신뢰할 수 있는 낙상 감지를 위한 저비용 웨어러블 기기를 설계하기 위해서 대표적인 두 가지 모델을 종합적으로 분석하여 제시한다. 기계 학습 모델인 의사결정 나무(Decision Tree), 랜덤 포래스트(Random Forest), SVM(Support Vector Machine)과 심층 학습 모델인 일차원(One-Dimensional) 합성곱 신경망(Convolutional Neural Network)을 사용하여 낙상 감지 학습 능력을 정량화하였다. 또한 입력 데이터에 적용하기 위한 데이터 분할, 전처리, 특징 추출 방법 등을 고려하여 검토된 모델의 유효성을 평가한다. 실험 결과는 전반적인 성능 향상을 보여주며 심층학습 모델의 유효성을 검증한다.

KG_VCR: 지식 그래프를 이용하는 영상 기반 상식 추론 모델 (KG_VCR: A Visual Commonsense Reasoning Model Using Knowledge Graph)

  • 이재윤;김인철
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권3호
    • /
    • pp.91-100
    • /
    • 2020
  • 기존의 영상 기반 질문-응답(VQA) 문제들과는 달리, 새로운 영상 기반 상식 추론(VCR) 문제들은 영상에 포함된 사물들 간의 관계 파악과 답변 근거 제시 등과 같이 추가적인 심층 상식 추론을 요구한다. 본 논문에서는 영상 기반 상식 추론 문제들을 위한 새로운 심층 신경망 모델인 KG_VCR을 제안한다. KG_VCR 모델은 입력 데이터(영상, 자연어 질문, 응답 리스트 등)에서 추출하는 사물들 간의 관계와 맥락 정보들을 이용할 뿐만 아니라, 외부 지식 베이스인 ConceptNet으로부터 구해내는 상식 임베딩을 함께 활용한다. 특히 제안 모델은 ConceptNet으로부터 검색해낸 연관 지식 그래프를 효과적으로 임베딩하기 위해 그래프 합성곱 신경망(GCN) 모듈을 채용한다. VCR 벤치마크 데이터 집합을 이용한 다양한 실험들을 통해, 본 논문에서는 제안 모델인 KG_VCR이 기존의 VQA 최고 모델과 R2C VCR 모델보다 더 높은 성능을 보인다는 것을 입증한다.

Fast R-CNN을 이용한 객체 인식 기반의 도로 노면 파손 탐지 기법 (Road Surface Damage Detection based on Object Recognition using Fast R-CNN)

  • 심승보;전찬준;류승기
    • 한국ITS학회 논문지
    • /
    • 제18권2호
    • /
    • pp.104-113
    • /
    • 2019
  • 도로 관리 주체는 도로 파손을 보수하기 위해 적지 않은 비용을 투입한다. 이러한 파손은 자연 요인과 노후화로 인하여 필연적으로 발생을 하는데, 효율적인 보수를 위한 유지보수 기술이 필요하다. 이런 수요에 대응하기 위해 여러 가지 기술들이 개발되고 적용되고 있지만, 최근 들어서는 차량용 블랙박스 형태로 수집한 영상 정보를 바탕으로 도로 노면 파손 유지 보수기술이 개발되고 있다. 이 파손 영역을 추출하는 방법에는 여러 가지가 있지만, 본 논문에서는 최근 활발히 연구되고 있는 심층 신경망 구조의 영상인식 기술에 대해 논하고자 한다. 특히 영역 기반의 합성곱 알고리즘을 이용하여 영상 내에서 도로 파손 유무와 그 영역을 추정할 수 있는 새로운 심층 신경망을 소개한다. 이를 개발하기 위해 실제 주행을 통해서 600여장의 영상 데이터를 수집하였고, 이를 활용하여 학습을 수행하였다. 그 결과 기존 모델과 성능을 비교하여 10.67% 향상된 신경망을 개발하였다.

심층 신경망을 이용한 자연어 지시의 실시간 시각적 접지 (Real-Time Visual Grounding for Natural Language Instructions with Deep Neural Network)

  • 황지수;김인철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.487-490
    • /
    • 2019
  • 시각과 언어 기반의 이동(VLN)은 3차원 실내 환경에서 실시간 입력 영상과 자연어 지시들을 이해함으로써, 에이전트 스스로 목적지까지 이동해야 하는 인공지능 문제이다. 이 문제는 에이전트의 영상 및 자연어 이해 능력뿐만 아니라, 상황 추론과 행동 계획 능력도 함께 요구하는 복합 지능 문제이다. 본 논문에서는 시각과 언어 기반의 이동(VLN) 작업을 위한 새로운 심층 신경망 모델을 제안한다. 제안모델에서는 입력 영상에서 합성곱 신경망을 통해 추출하는 시각적 특징과 자연어 지시에서 순환 신경망을 통해 추출하는 언어적 특징 외에, 자연어 지시에서 언급하는 장소와 랜드마크 물체들을 영상에서 별도로 탐지해내고 이들을 추가적으로 행동 선택을 위한 특징들로 이용한다. 다양한 3차원 실내 환경들을 제공하는 Matterport3D 시뮬레이터와 Room-to-Room(R2R) 벤치마크 데이터 집합을 이용한 실험들을 통해, 본 논문에서 제안하는 모델의 높은 성능과 효과를 확인할 수 있었다.

심층강화학습에 은닉 상태 정보 활용을 통한 학습 성능 개선에 대한 고찰 (A Study on Learning Performance Improvement by Using Hidden States in Deep Reinforcement Learning)

  • 최요한;석영준;김주봉;한연희
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.528-530
    • /
    • 2022
  • 심층강화학습에 완전 연결 신경망과 합성곱 신경망은 잘 활용되는 것에 반해 순환 신경망은 잘 활용되지 않는다. 이는 강화학습이 마르코프 속성을 전제로 하기 때문이다. 지금까지의 강화학습은 환경이 마르코프 속성을 만족하도록 사전 작업이 필요했다, 본 논문에서는 마르코프 속성을 따르지 않는 환경에서 이러한 사전 작업 없이도 순환 신경망의 은닉 상태를 통해 마르코프 속성을 학습함으로써 학습 성능을 개선할 수 있다는 것을 소개한다.

민첩한 활성함수를 이용한 합성곱 신경망의 성능 향상 (Performance Improvement Method of Convolutional Neural Network Using Agile Activation Function)

  • 공나영;고영민;고선우
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제9권7호
    • /
    • pp.213-220
    • /
    • 2020
  • 합성곱 신경망은 합성곱층과 완전연결층으로 구성되어 있다. 합성곱층과 완전연결층의 각 층에서는 비선형 활성함수를 사용하고 있다. 활성함수는 뉴런 간에 신호를 전달할 때 입력신호가 일정 기준 이상이면 신호를 전달하고 기준에 도달하지 못하면 신호를 보내지 않을 수 있는 뉴런의 정보전달 방법을 모사하는 함수이다. 기존의 활성함수는 손실함수와 관계성을 가지고 있지 않아 최적해를 찾아가는 과정이 늦어지는 점을 개선하기 위해 활성함수를 일반화한 민첩한 활성함수를 제안하였다. 민첩한 활성함수의 매개변수는 역전파 과정에서, 매개변수에 대한 손실함수의 1차 미분계수를 이용한 학습과정을 통해 최적의 매개변수를 선택하는 방법으로 손실함수를 감소시킴으로써 심층신경망의 성능을 향상시킬 수 있다. MNIST 분류문제를 통하여 민첩한 활성함수가 기존의 활성함수에 비해 우월한 성능을 가짐을 확인하였다.

시각 장애인을 위한 영상 기반 심층 합성곱 신경망을 이용한 화재 감지기 (Fire Detection using Deep Convolutional Neural Networks for Assisting People with Visual Impairments in an Emergency Situation)

  • 보라시 콩;원인수;권장우
    • 재활복지
    • /
    • 제21권3호
    • /
    • pp.129-146
    • /
    • 2017
  • 본 연구는 실내에서 화재 발생시 시각 장애인들을 지원하기 위한 영상 기반의 화재감지기를 제안한다. 건물 내에 화재가 발생하는 비상 상황 발생시 시각 장애인은 일반인보다 상황을 인지하는 것이 늦기 때문에 위험한 상황에 노출되기 쉽다. 기존의 연기 감지기와 같은 현재의 화재 감지 방법은 화재 발생시 발생하는 화학 센서 기반 기술을 사용함으로써 감지가 상대적으로 늦으며 화재가 확산된 후에 감지가 되는 등 낮은 신뢰성이 문제가 될 수 있다. 이를 보완하기 위해 영상 기반의 화재 감지 기술이 개발되었지만 낮은 정확도가 문제가 되어 실용화되지 못하였다. 최근 인공 지능을 위한 심층 학습 분야의 큰 발전으로 영상 내의 물체 인식률이 높아짐에 따라 관련 연구가 활발히 진행되고 있다. 따라서 본 연구에서는 보안 카메라 영상을 사용하여 화재를 감지할 수 있는 심층 학습 기반의 화재 감지기를 제안한다. 심층 학습 기반의 접근법은 영상에서 자동으로 특징을 학습할 수 있으므로 일반적으로 복잡한 상황에 대해서도 일반화가 가능하다. 본 논문에서는 화재감지 정확도와 속도 측면의 균형을 고려하여 두 개의 심층 합성곱 신경망 모델을 제안하였다. 실험을 통해 두 모델 모두 99%의 평균 정밀도로 화재를 감지할 수 있으며 첫 번째 모델은 초당 30장의 처리 속도와 76%의 정확도를 나타냈다. 두번째 모델은 초당 50장의 처리 속도와 61%의 정확도를 나타낸다. 또한 두 개의 모델의 메모리 사용량을 서로 비교하였으며 다양한 실제 화재 시나리오에서 테스트하여 신뢰할 수 있는 모델임을 증명하였다. 본 논문에 제안한 영상 기반 화재 감지기가 상용화된다면 상대적으로 실내 화재에 취약한 시각 장애인들의 안전에 도움이 될 것이다.

합성곱 신경망 모델과 극단 모델에 기반한 발화자 연령 예측 (Prediction of the age of speakers based on Convolutional Neural Networks and polarization model)

  • 허탁성;김지수;오병두;김유섭
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.614-615
    • /
    • 2018
  • 본 연구는 심층학습 기법을 활용하여 양극 데이터에 대해 학습된 모델로부터 예측된 결과를 바탕으로 언어 장애 여부를 판단하고, 이를 바탕으로 효율적인 언어 치료를 수행할 수 있는 방법론을 제시한다. 발화자의 개별 발화에 대해 데이터화를 하여 합성곱 신경망 모델(CNN)을 학습한다. 이를 이용하여 발화자의 연령 집단을 예측하고 결과를 분석하여 발화자의 언어 연령 및 장애 여부를 판단을 할 수 있다.

  • PDF

회전한 상표 이미지의 진위 결정을 위한 기계 학습 데이터 확장 방법 (Machine Learning Data Extension Way for Confirming Genuine of Trademark Image which is Rotated)

  • 구본근
    • Journal of Platform Technology
    • /
    • 제8권1호
    • /
    • pp.16-23
    • /
    • 2020
  • 상표권 보호를 위한 상표 이미지의 진위 결정에 심층 신경망인 합성곱 신경망을 이용할 수 있다. 이를 위해, 상표로 등록되어 있는 한 장의 상표 이미지를 반복적으로 학습하는 것은 기계학습의 성능을 감소시키는 원인이 된다. 따라서, 이러한 응용에서 학습 데이터는 다양한 방법으로 생성된다. 하지만 대상 이미지가 회전되어 있으면 원본이라 하더라도 인식하지 못하거나 위조 상표로 분류되기도 한다. 본 논문에서는 회전한 상표 이미지의 진위 결정을 위한 기계학습 데이터의 확장 방법을 제안한다. 본 논문에서 제안하는 학습 데이터 확장 방법은 기울어진 이미지를 생성하고 이를 학습 데이터로 사용하는 것이다. 본 논문에서 제안하는 학습 데이터 확장 방법의 유효성 검증을 위해 대학의 로고를 대상으로 학습 데이터를 생성하였으며, 이를 활용하여 합성곱 신경망을 학습시킨 후 검증용 데이터를 이용하여 정확도를 평가하였다. 정확도 평가 결과에 따르면 본 논문에서 제안한 방법으로 생성한 학습 데이터를 활용하면 회전한 상표를 대상으로 한 진위 여부 결정에 합성곱 신경망을 활용할 수 있다.

  • PDF

합성곱-장단기 기억 신경망의 하이브리드 결합 모델을 이용한 부정맥 분류 (Arrhythmia Classification using Hybrid Combination Model of CNN-LSTM)

  • 조익성;권혁숭
    • 한국정보통신학회논문지
    • /
    • 제26권1호
    • /
    • pp.76-84
    • /
    • 2022
  • 부정맥은 심장 박동이 비정상 혹은 불규칙하게 뛰고 있는 상태를 말하며, 실신이나 심장돌연사 등과 같은 위험한 상황을 유발할 수 있기 때문에 이의 조기 검출은 매우 중요하다. 하지만 심전도 신호의 개인차로 인해 분류 시 성능하락이 나타날 수밖에 없다. 본 연구에서는 CNN-LSTM 하이브리드 결합 모델을 이용한 부정맥 분류 방법을 제안한다. 이를 위해 먼저 잡음을 제거한 ECG 신호에서 R파를 검출하고 단일 비트 세그먼트를 추출하였다. 이후 부정맥 신호의 특징을 세밀하게 추출하도록 8개의 합성곱 계층으로 구성하고 이를 LSTM의 입력으로 사용한 후 가중치를 학습시키고 검증 데이터로 모델을 평가한 후 정상 및 부정맥 분류의 변화를 확인하였다. 제안한 방법의 타당성 검증을 위해 MIT-BIH 부정맥 데이터베이스를 사용하여 정확도(accuracy), 정밀도(precision), 재현율(recall), F1 스코어가 사용되었다. 성능평가 결과, 정확도, 정밀도, 재현율, F1 스코어는 각각 92.3%, 90.98%, 92.20%, 90.72%의 우수한 분류율을 나타내었다.