• Title/Summary/Keyword: CNN-LSTM

Search Result 210, Processing Time 0.031 seconds

Deep Learning based Sentence Analysis for Query Generation (검색어 생성을 위한 딥 러닝 기반 문장 분석 연구)

  • Na, Seong-Won;Yoon, Kyoungro
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2018.06a
    • /
    • pp.336-337
    • /
    • 2018
  • 최근 이미지의 Visual 정보를 추출하고 Multi label 분류를 통해 나온 결과의 상관관계를 modeling하여 문장으로 출력하는 CNN-RNN 아키텍처가 많은 발전을 이뤘다. 이 아키텍처의 출력은 이미지의 정보가 요약되어 문장으로 표현되기 때문에 Semantic정보가 풍부하여 유사 콘텐츠 검색에도 사용 가능하다. 하지만 결과 문장에 사람이 포함 되면 광범위한 검색 결과를 얻게 되고 부정확한 결과를 초래하게 된다. 이에 본 논문에서는 문장에서 사람을 인식하여 Identity를 부여함으로써 검색어를 좀 더 구체적으로 생성하고자 한다. 이 문제를 해결하기 위해 자연어 처리의 분야 중 하나인 개체명 인식(Named Entity Recognition) 문제로 다루며, 가장 많이 사용되고 있는 모델인 Bidirectional-LSTM-CRF와 CoNLL2003 dataset을 사용하여 수행 한다.

  • PDF

Behavior Recognition of Moving Object based on Multi-Fusion Network (다중 융합 네트워크 기반 이동 객체 행동 인식)

  • Kim, Jinah;Moon, Nammee
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.05a
    • /
    • pp.641-642
    • /
    • 2022
  • 단일 데이터로부터의 이동 객체에 대한 행동 인식 연구는 데이터 수집 과정에서 발생하는 노이즈의 영향을 크게 받는다. 본 논문은 영상 데이터와 센서 데이터를 이용하여 다중 융합 네트워크 기반 이동 객체 행동 인식 방법을 제안한다. 영상으로부터 객체가 감지된 영역의 추출과 센서 데이터의 이상치 제거 및 결측치 보간을 통해 전처리된 데이터들을 융합하여 시퀀스를 생성한다. 생성된 시퀀스는 CNN(Convolutional Neural Networks)과 LSTM(Long Short Term Memory)기반 다중 융합 네트워크 모델을 통해 시계열에 따른 행동 특징들을 추출하고, 깊은 FC(Fully Connected) 계층을 통해 특징들을 융합하여 행동을 예측한다. 본 연구에서 제시된 방법은 사람을 포함한 동물, 로봇 등의 다양한 객체에 적용될 수 있다.

Multimodal depression detection system based on attention mechanism using AI speaker (AI 스피커를 활용한 어텐션 메커니즘 기반 멀티모달 우울증 감지 시스템)

  • Park, Junhee;Moon, Nammee
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2021.06a
    • /
    • pp.28-31
    • /
    • 2021
  • 전세계적으로 우울증은 정신 건강 질환으로써 문제가 되고 있으며, 이를 해결하기 위해 일상생활에서의 우울증 탐지에 대한 연구가 진행되고 있다. 따라서 본 논문에서는 일상생활에 밀접하게 연관되어 있는 AI 스피커를 사용한 어텐션 메커니즘(Attention Mechanism) 기반 멀티모달 우울증 감지 시스템을 제안한다. 제안된 방법은 AI 스피커로부터 수집할 수 있는 음성 및 텍스트 데이터를 수집하고 CNN(Convolutional Neural Network)과 BiLSTM(Bidirectional Long Short-Term Memory Network)를 통해 각 데이터에서의 학습을 진행한다. 학습과정에서 Self-Attention 을 적용하여 특징 벡터에 추가적인 가중치를 부여하는 어텐션 메커니즘을 사용한다. 최종적으로 음성 및 텍스트 데이터에서 어텐션 가중치가 추가된 특징들을 합하여 SoftMax 를 통해 우울증 점수를 예측한다.

  • PDF

Cross-Validated Ensemble Methods in Natural Language Inference (자연어 추론에서의 교차 검증 앙상블 기법)

  • Yang, Kisu;Whang, Taesun;Oh, Dongsuk;Park, Chanjun;Lim, Heuiseok
    • Annual Conference on Human and Language Technology
    • /
    • 2019.10a
    • /
    • pp.8-11
    • /
    • 2019
  • 앙상블 기법은 여러 모델을 종합하여 최종 판단을 산출하는 기계 학습 기법으로서 딥러닝 모델의 성능 향상을 보장한다. 하지만 대부분의 기법은 앙상블만을 위한 추가적인 모델 또는 별도의 연산을 요구한다. 이에 우리는 앙상블 기법을 교차 검증 방법과 결합하여 앙상블 연산을 위한 비용을 줄이며 일반화 성능을 높이는 교차 검증 앙상블 기법을 제안한다. 본 기법의 효과를 입증하기 위해 MRPC, RTE 데이터셋과 BiLSTM, CNN, BERT 모델을 이용하여 기존 앙상블 기법보다 향상된 성능을 보인다. 추가로 교차 검증에서 비롯한 일반화 원리와 교차 검증 변수에 따른 성능 변화에 대하여 논의한다.

  • PDF

Determination of voice phishing based on deep learning and sentiment analysis (딥러닝과 감성 분석에 따른 보이스피싱 여부 판별)

  • Kim, Won-Woong;Kang, Yea-Jun;Kim, Hyun-Ji;Yang, Yu-Jin;Oh, Yu-Jin;Lee, Min-Woo;Lim, Se-Jin;Seo, Hwa-Jeong
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2021.11a
    • /
    • pp.811-814
    • /
    • 2021
  • 본 논문에서는 점차 진화되어가는 보이스피싱 수법에 대하여 딥러닝 기반 네트워크인 DNN(Deep Neural Network)를 통한 보이스피싱 여부 판별할 뿐만 아니라, CNN, Bi-LSTM을 활용한 다양한 관점에서의 감성 분석을 통하여 보이스피싱 조직원의 감성 상태를 파악하여 판별된 결과에 신뢰도를 높여주는 모델을 제안하였다.

Prediction of solar power generation for power brokerage based on Federated Learning (연합학습 기반 전력 중개용 태양광 발전 예측)

  • Lee, Mirinae;Yeom, Sungwoong;Kim, Kyungbaek
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2022.11a
    • /
    • pp.577-579
    • /
    • 2022
  • 최근 대두된 환경문제로 인해 다양한 재생 에너지의 실리적인 활용 방법에 귀추가 주목되고 있다. 특히 '그린뉴딜', 'K-RE100' 등 정부 주도의 정책으로 태양광 발전 시장 규모가 확대되면서, 소규모 발전 사업자의 태양광 발전 참여율도 매년 증가 추세를 보이고 있다. 이로 인해 소규모 발전 사업자의 수익을 산정하는 전력 중개 시스템의 태양광 발전 예측은 에너지 시장의 핵심요소로 부각되었다. 하지만 전력 중개용 태양광 발전 예측에는 기후의 간헐성으로 인한 예측 정확도 감소, 소규모 발전 사업자의 개인정보 보호 등 제약이 존재한다. 이 논문에서는 전력 중개용 태양광 발전 예측의 제약을 해소하고, 전력 중개 활성화를 지원키 위한 CNN-LSTM 기반 연합학습 기법을 제안한다.

A Design of Behavioral Prediction through Diffusion Model-based Sensor Data Frequency Interpolation (Diffusion Model 기반 센서 데이터 주파수 보간을 통한 행동 예측 설계)

  • Jeong Hyeon Park;Jun Hyeok Go;Siung Kim;Nammee Moon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.05a
    • /
    • pp.633-635
    • /
    • 2023
  • 센서 데이터를 예측 또는 분석하여 시스템을 제어하거나 모니터링할 수 있다. 센서 데이터를 이용한 예측의 신뢰성을 확보하기 위해서는 데이터의 적절한 빈도수가 중요하다. 이를 위해 본 논문에서는 Diffusion Model을 사용한 센서 데이터 주파수 보간을 통해 행동을 예측하는 방법을 제시하고자 한다. 주파수 보간은 반려동물 행동별 25hz 센서 데이터로 학습된 Diffusion Model을 사용한다. 학습된 Diffusion Model에 1hz 센서 데이터와 가우시안 노이즈를 결합한 데이터를 입력으로 사용해 센서데이터를 보간한다. 제안한 방법은 CNN-LSTM 모델 학습 후 예측 성능 비교를 통해 검증한다.

Performance Comparison of Neural Network Models for Adversarial Attacks by Autonomous Ships (자율주행 선박의 적대적 공격에 대한 신경망 모델의 성능 비교)

  • Tae-Hoon Her;Ju-Hyeong Kim;Na-Hyun Kim;So-Yeon Kim
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2023.11a
    • /
    • pp.1106-1107
    • /
    • 2023
  • 자율주행 선박의 기술 발전에 따라 적대적 공격에 대한 위험성이 대두되고 있다. 이를 해결하기 위해 본 연구는 다양한 신경망 모델을 활용하여 적대적 공격을 탐지하는 성능을 체계적으로 비교, 분석하였다. CNN, GRU, LSTM, VGG16 모델을 사용하여 실험을 진행하였고, 이 중 VGG16 모델이 가장 높은 탐지 성능을 보였다. 본 연구의 결과를 통해 자율주행 선박에 적용될 수 있는 보안모델 구축에 대한 신뢰성 있는 방향성을 제시하고자 한다.

싱가폴 스트레이트에서 유지선박의 충돌회피협력 동작의 시점에 대한 연구

  • 이희진;박상아;김태연;박득진
    • Proceedings of the Korean Institute of Navigation and Port Research Conference
    • /
    • 2023.11a
    • /
    • pp.103-104
    • /
    • 2023
  • 이 연구는 충돌을 피할 수 없는 상황에서 유지선박의 충돌회피협력 동작 시점을 제시하기 위한 연구다. 관련된 기존 연구에서는 하나의 모델 선박을 본 선박과 상대 선박으로 간주 하였다. 그리고 선박의 항적 계산에 해상상태가 고려되지 않았다. 본 연구는 기존의 연구에서 식별된 한계점을 보완하였다. 선박의 항적은 조류, 파도, 바람을 고려하여 계산 되었고, CNN-LSTM을 통해 충돌 직전 항적을 예측 하였다. 모델선박은 벌크선박, 컨테이너선박을 본 선박으로 지정하였고, 상대 선박은 30미터 요트에서 400미터 대형 컨테이너선까지 고려하여, 다양한 상황에서 유지선박의 충돌회피 협력 동작 시점을 제시 하였다.

  • PDF

A Study on DNN-based STT Error Correction

  • Jong-Eon Lee
    • International journal of advanced smart convergence
    • /
    • v.12 no.4
    • /
    • pp.171-176
    • /
    • 2023
  • This study is about a speech recognition error correction system designed to detect and correct speech recognition errors before natural language processing to increase the success rate of intent analysis in natural language processing with optimal efficiency in various service domains. An encoder is constructed to embedded the correct speech token and one or more error speech tokens corresponding to the correct speech token so that they are all located in a dense vector space for each correct token with similar vector values. One or more utterance tokens within a preset Manhattan distance based on the correct utterance token in the dense vector space for each embedded correct utterance token are detected through an error detector, and the correct answer closest to the detected error utterance token is based on the Manhattan distance. Errors are corrected by extracting the utterance token as the correct answer.