• 제목/요약/키워드: DNN모델

검색결과 184건 처리시간 0.027초

DNN-HMM 기반 시스템을 이용한 효과적인 구개인두부전증 환자 음성 인식 (Effective Recognition of Velopharyngeal Insufficiency (VPI) Patient's Speech Using DNN-HMM-based System)

  • 윤기무;김우일
    • 한국정보통신학회논문지
    • /
    • 제23권1호
    • /
    • pp.33-38
    • /
    • 2019
  • 본 논문에서는 효과적으로 VPI 환자 음성을 인식하기 위해 DNN-HMM 하이브리드 구조의 음성 인식 시스템을 구축하고 기존의 GMM-HMM 기반의 음성 인식 시스템과의 성능을 비교한다. 정상인의 깨끗한 음성 데이터베이스를 이용하여 초기 모델을 학습하고 정상인의 VPI 모의 음성을 이용하여 VPI 환자 음성에 대한 화자 인식을 위한 기본 모델을 생성한다. VPI 환자의 화자 적응 시에는 DNN의 각 층 별 가중치 행렬을 부분적으로 학습하여 성능을 관찰한 결과 GMM-HMM 인식기보다 높은 성능을 나타냈다. 성능 향상을 위해 DNN 모델 적응을 적용하고 LIN 기반의 DNN 모델 적용 결과 평균 2.35%의 인식률 향상을 나타냈다. 또한 소량의 데이터를 사용했을 때 GMM-HMM 기반 음성인식 기법에 비해 DNN-HMM 기반 음성 인식 기법이 향상된 VPI 음성 인식 성능을 보인다.

DNN과 LSTM 기반의 대기질 예측 모델 성능 비교 연구 (A Comparative Study on the Performance of Air Quality Prediction Model Based on DNN and LSTM)

  • 조성재;김준석;김성희;윤주상
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.577-579
    • /
    • 2020
  • 최근 인공지능을 활용한 대기질 예측 모델 개발 연구가 활발히 진행 중이다. 특히 시계열 데이터 기반 예측 시스템 개발에 장점을 가진 DNN, LSTM 알고리즘을 활용한 다양한 예측 시스템이 제안되고 있다. 본 논문에서는 LSTM을 활용한 모델과 Fully-Connected 기반의 DNN 모델을 활용한 대기질 예측 시스템을 개발하고 두 모델의 예측 정확도를 비교한다. 성능 평가 결과를 보면 LSTM 모델이 DNN 모델보다 모든 면에서 좋은 결과를 보여줬다. 그리고 이산화황(SO2), 이산화질소(NO2), 초미세먼지 (PM2.5)에 대해서는 그 차이가 두드러지게 나타났다.

양방향 DNN 해석을 이용한 삼성분계 콘크리트의 배합 산정에 관한 연구 (A Study on the Calculation of Ternary Concrete Mixing using Bidirectional DNN Analysis)

  • 최주희;고민삼;이한승
    • 한국건축시공학회지
    • /
    • 제22권6호
    • /
    • pp.619-630
    • /
    • 2022
  • 콘크리트의 배합설계와 압축강도 평가는 지속가능한 구조물의 내구성을 위한 기초적인 자료로서 활용되고 있다. 하지만, 콘크리트 배합설계는 최근 배합요소의 다변화 등의 이유로 인하여 정확한 배합요소 산정이나 기준값 설정에 어려움을 겪고 있다. 본 연구에서는 인공지능 기법 중 하나인 딥러닝 기법을 사용하여 삼성분계 콘크리트의 배합요소를 산정하는 양방향 해석의 예측모델을 설계하는 것을 목적으로 한다. 콘크리트 배합요소 산정을 위한 DNN 기반 예측모 델은 층 수, 은닉 뉴런 수를 변수로 한 총 8개의 모델을 사용하여 성능평가 및 비교를 실시하였으며, 이후 학습된 DNN 모델을 사용하여 소요압축강도에 따른 콘크리트 배합 산정 결과를 출력하였다. 모델의 성능평가 결과, 콘크리트 압축 강도 인자에 대하여 평균 약 1.423%의 오류율을 나타내었으며, 삼성분계 콘크리트 배합인자 예측에 대하여 평균 8.22%의 MAPE 오차를 만족하였다. DNN 모델의 구조별 성능평가 비교 결과, 모든 배합인자에 대하여 DNN5L-2048 모델이 가장 높은 성능을 보였다. 학습된 DNN 모델을 사용하여 30, 50MPa의 소요압축강도를 가지는 삼성분계 콘크 리트 배합표 예측을 진행하였으며, 추후 학습을 위한 데이터 세트 확장과 실제 콘크리트 배합표와 DNN 모델 출력 콘 크리트 배합표 간의 비교를 통한 검증 과정이 필요할 것으로 판단된다.

TPMP : ARM TrustZone을 활용한 DNN 추론 과정의 기밀성 보장 기술 (TPMP: A Privacy-Preserving Technique for DNN Prediction Using ARM TrustZone)

  • 송수현;박성환;권동현
    • 정보보호학회논문지
    • /
    • 제32권3호
    • /
    • pp.487-499
    • /
    • 2022
  • 딥러닝과 같은 기계학습 기술은 최근에 광범위하게 활용되고 있다. 이러한 딥러닝은 최근 낮은 컴퓨팅 성능을 가지는 임베디드 기기 및 엣지 디바이스에서 보안성 향상을 위해 ARM TrustZone과 같은 신뢰 수행 환경에서 수행되는데, 이와 같은 실행 환경에서는 제한된 컴퓨팅 자원으로 인해 정상적인 수행에 방해를 받는다. 이를 극복하기 위해 DNN 모델 partitioning을 통해 TEE의 제한된 memory를 효율적으로 사용하며 DNN 모델을 보호하는 TPMP를 제안한다. TPMP는 최적화된 memory 스케줄링을 통해 기존의 memory 스케줄링 방법으로 수행할 수 없었던 모델들을 TEE 내에서 수행하여 시스템 자원 소모를 거의 증가시키지 않으면서 DNN의 높은 기밀성을 달성한다.

Deep Neural Network 기반 프로야구 일일 관중 수 예측 : 광주-기아 챔피언스 필드를 중심으로 (Deep Neural Network Based Prediction of Daily Spectators for Korean Baseball League : Focused on Gwangju-KIA Champions Field)

  • 박동주;김병우;정영선;안창욱
    • 스마트미디어저널
    • /
    • 제7권1호
    • /
    • pp.16-23
    • /
    • 2018
  • 본 연구는 Deep Neural Network(DNN)을 이용하여 광주-기아 챔피언스 필드의 일일 관중 수를 예측함으로써 이를 통해 구단과 관련기업의 마케팅 자료제공 및 구장 내 부대시설의 재고관리에 자료로 쓰임을 목적으로 수행 되었다. 본 연구에서는 Artificial Neural Network(ANN)의 종류인 DNN 모델을 이용하였으며 DNN 모델의 과적합을 막기 위해 Dropout과 Batch normalization 적용한 모델을 바탕으로 총 4종류를 설계하였다. 각각 10개의 DNN을 만들어 예측값의 Root Mean Square Error(RMSE)와 Mean Absolute Percentage Error(MAPE)의 평균값을 낸 모델과 예측값의 평균으로 RMSE와 MAPE를 평가한 Ensemble 모델을 만들었다. 모델의 학습 데이터는 2008년부터 2017년까지의 관중 수 데이터를 수집하여 수집된 데이터의 80%를 무작위로 선정하였으며, 나머지 20%는 테스트 데이터로 사용하였다. 총 100회의 데이터 선정, 모델구성 그리고 학습 및 예측을 한 결과 Ensemble 모델은 DNN 모델의 예측력이 가장 우수하게 나왔으며, 다중선형회귀 모델 대비 RMSE는 15.17%, MAPE는 14.34% 높은 예측력을 보이고 있다.

잡음 환경 음성 인식을 위한 심층 신경망 기반의 잡음 오염 함수 예측을 통한 음향 모델 적응 기법 (Model adaptation employing DNN-based estimation of noise corruption function for noise-robust speech recognition)

  • 윤기무;김우일
    • 한국음향학회지
    • /
    • 제38권1호
    • /
    • pp.47-50
    • /
    • 2019
  • 본 논문에서는 잡음 환경에서 효과적인 음성 인식을 위하여 DNN(Deep Neural Network) 기반의 잡음 오염 함수 예측을 이용한 음향 모델 적응 기법을 제안한다. 깨끗한 음성과 잡음 정보를 입력으로 하고 오염된 음성에 대한 특징 벡터를 출력으로 하는 DNN을 학습하여 비선형 관계를 갖는 잡음 오염 함수를 예측한다. 예측된 잡음 오염 함수를 음향모델의 평균 벡터에 적용하여 잡음 환경에 적응된 음향 모델을 생성한다. Aurora 2.0 데이터를 이용한 음성 인식 성능 평가에서 본 논문에서 제안한 모델 적응 기법이 기존의 전처리, 모델 적응 기법에 비해 일치, 불일치 잡음 환경에서 모두 평균적으로 우수한 성능을 나타낸다. 특히 불일치 잡음 환경에서 평균 오류율이 15.87 %의 상대 향상률을 나타낸다.

Deep Neural Network를 활용한 초미세먼지 농도 예측에 관한 연구 (A Study on Prediction of PM2.5 Concentration Using DNN)

  • 최인호;이원영;은범진;허정숙;장광현;오종민
    • 환경영향평가
    • /
    • 제31권2호
    • /
    • pp.83-94
    • /
    • 2022
  • 본 연구는 국가측정망(에어코리아)에서 제공하는 2017년, 2019년 및 2020년도 대기질확정 데이터를 이용하여 Deep Neural Network(DNN) 모델을 학습하고, 2016년과 2018년도 데이터를 이용하여 학습된 모델을 평가·검증하였다. 피어슨 상관계수 0.2를 기준으로 SO2, CO, NO2, PM10 항목을 독립변수로 하여 초기 모델링을 진행하였고, 예측의 정확도를 높이기 위한 방법으로 시계열적 요소를 반영한 월별 모델링(개선모델)을 진행하여 초기모델과 비교·분석하였다. 분석에 사용한 지표는 RMSE(Root mean square error) 방법으로 오차를 계산하였으며, 예측 결과 초기모델의 RMSE값은 5.78로 국가측정망의 예측이동 평균모델의 결과(10.77)와 비교하여 초기모델에서 약 46% 오차가 감소하였다. 또한, 개선모델의 경우, 초기모델 대비 11월 모델을 제외한 모든 월별모델에서 정확도 향상이 있었다. 따라서, 본 연구에서는 DNN 모델링이 PM2.5 농도 예측에 효과적인 방법임을 제안할 수 있었으며, 향후 추가적인 독립변수 선정 및 시계열 요소를 고려한 방법으로 모델의 정확도 개선 가능성을 확인할 수 있었다.

DNN 모델을 이용한 기계 학습 기반 k-최근접 질의 처리 최적화 기법 (k-NN Query Optimization Scheme Based on Machine Learning Using a DNN Model)

  • 위지원;최도진;이현병;임종태;임헌진;복경수;유재수
    • 한국콘텐츠학회논문지
    • /
    • 제20권10호
    • /
    • pp.715-725
    • /
    • 2020
  • 본 논문에서는 고차원의 특징 벡터에서 질의와 가장 가까운 k개의 데이터를 찾는 k-최근접 질의 최적화 방법을 제안한다. k-최근접 질의는 k개의 데이터를 포함할 가능성이 있는 범위를 기반으로 범위 질의로 변환되어 처리하는 기법이다. 본 논문에서는 처리 비용을 감소시키고 검색 속도를 가속화 할 수 있는 최적의 범위를 도출하기 위해 k-최근접 질의 처리 시 DNN 모델을 이용한 최적화 기법을 제안한다. 제안하는 기법은 온라인 모듈과 오프라인 모듈로 구성된다. 온라인 모듈에서는 클라이언트로부터 요청을 받아 실제 질의를 처리한다. 오프라인 모듈에서는 과거 최적화 기법의 결과를 학습 로그로 사용한 DNN 모델로 최적의 범위를 도출하고 온라인 모듈로 전달한다. 제안하는 기법의 우수성 및 타당성의 입증을 위하여 다양한 성능 평가를 수행한다.

DNN 기반 수어 번역 모델을 통한 성능 분석 (Performance Analysis Using a DNN-Based Sign Language Translation Model)

  • 정민재;노승환;홍준기
    • 한국빅데이터학회지
    • /
    • 제9권1호
    • /
    • pp.187-196
    • /
    • 2024
  • 본 연구에서는 수어의 좌표를 압축하여 학습 시간을 획기적으로 단축시킬 수 있는 DNN (Deep Neural Network) 기반 수어 번역 모델을 제안하고 수어 좌표 압축 유무에 따른 정확도와 모델 학습 시간을 비교 분석하였다. 제안한 모델을 사용하여 수어를 번역한 결과, 수어 영상을 압축하기 전과 후의 정확도는 약 5.9% 감소한 반면, 학습 시간은 56.57% 감소하여 수어 번역 정확도 손실 대비 학습 시간에서 많은 이득을 얻는 것을 확인하였다.

Haar Cascade와 DNN 기반의 실시간 얼굴 표정 및 음성 감정 분석기 구현 (Implementation of Real Time Facial Expression and Speech Emotion Analyzer based on Haar Cascade and DNN)

  • 유찬영;서덕규;정유철
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제63차 동계학술대회논문집 29권1호
    • /
    • pp.33-36
    • /
    • 2021
  • 본 논문에서는 인간의 표정과 목소리를 기반으로 한 감정 분석기를 제안한다. 제안하는 분석기들은 수많은 인간의 표정 중 뚜렷한 특징을 가진 표정 7가지를 별도의 클래스로 구성하며, DNN 모델을 수정하여 사용하였다. 또한, 음성 데이터는 학습 데이터 증식을 위한 Data Augmentation을 하였으며, 학습 도중 과적합을 방지하기 위해 콜백 함수를 사용하여 가장 최적의 성능에 도달했을 때, Early-stop 되도록 설정했다. 제안하는 표정 감정 분석 모델의 학습 결과는 val loss값이 0.94, val accuracy 값은 0.66이고, 음성 감정 분석 모델의 학습 결과는 val loss 결과값이 0.89, val accuracy 값은 0.65로, OpenCV 라이브러리를 사용한 모델 테스트는 안정적인 결과를 도출하였다.

  • PDF