• 제목/요약/키워드: Deep Learning Convergence Study

검색결과 321건 처리시간 0.027초

인공신경망 기계번역에서 디코딩 전략에 대한 연구 (Study on Decoding Strategies in Neural Machine Translation)

  • 서재형;박찬준;어수경;문현석;임희석
    • 한국융합학회논문지
    • /
    • 제12권11호
    • /
    • pp.69-80
    • /
    • 2021
  • 딥러닝 모델을 활용한 인공신경망 기계번역 (Neural machine translation)이 주류 분야로 떠오르면서 최고의 성능을 위해 모델과 데이터 언어 쌍에 대한 많은 투자와 연구가 활발하게 진행되고 있다. 그러나, 최근 대부분의 인공신경망 기계번역 연구들은 번역 문장의 품질을 극대화하는 자연어 생성을 위한 디코딩 전략 (Decoding strategy)에 대해서는 미래 연구 과제로 남겨둔 채 다양한 실험과 구체적인 분석이 부족한 상황이다. 기계번역에서 디코딩 전략은 번역 문장을 생성하는 과정에서 탐색 경로를 최적화 하고, 모델 변경 및 데이터 확장 없이도 성능 개선이 가능하다. 본 논문은 시퀀스 투 시퀀스 (Sequence to Sequence) 모델을 활용한 신경망 기반의 기계번역에서 고전적인 그리디 디코딩 (Greedy decoding)부터 최신의 방법론인 Dynamic Beam Allocation (DBA)까지 비교 분석하여 디코딩 전략의 효과와 그 의의를 밝힌다.

토지피복지도와 KOMPSAT-3A위성영상을 활용한 환경성평가지도의 구축 (Construction Method of ECVAM using Land Cover Map and KOMPSAT-3A Image)

  • 권희성;송아람;정세정;이원희
    • 한국측량학회지
    • /
    • 제40권5호
    • /
    • pp.367-380
    • /
    • 2022
  • 본 연구에서는 KOMPSAT-3A 위성영상과 세분류 토지피복지도를 이용한 환경가치등급 분류를 수행하여 국토환경성평가지도의 주기적인 갱신 및 제작 가능성을 제시하였다. 환경성평가지도(ECVAM: Environmental Conservation Value Assessment Map)는 62개의 법제적 평가항목과 8개의 환경·생태적 평가항목을 기준으로 국토의 환경적 가치를 5단계의 등급으로 평가한 지도이며, 1:25000과 1:5000의 두 가지 축척으로 제공되고 있다. 하지만 1:5000 축척의 환경성평가지도는 참조자료의 부재 및 상이한 제작년도 등 다양한 제약조건으로 인해 1년 단위의 느린 갱신주기로 제작되고 있다. 이에 본 연구에서는 KOMPSAT-3A 위성영상과 광학지수(SI: Spectral Indices) 그리고 세분류 토지피복지도를 활용하여 딥러닝 기법 중 하나인 CNN (Convolutional Neural Network)을 기반으로 정확하고 최신정보가 반영된 1:5000 환경성평가지도를 구축 가능성을 확인하고자 한다. 실험 결과, 본 연구에서 제시한 방법으로 제작한 환경성평가지도의 정확도는 각각 87.25%, 85.88%로 산출되었다. 연구의 결과를 통하여 위성영상, 광학지수 그리고 토지피복분류를 활용한 환경성평가지도의 구축 가능성을 확인할 수 있었다.

딥러닝과 드론을 이용한 동일 모양 건축 자재 수량 측정에 관한 실증적 연구 (Empirical study for counting same shaped building material quantity using UAV and deep learning)

  • 문지환;송누리;최재갑;박진호;김계영
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2019년도 춘계학술발표대회
    • /
    • pp.649-652
    • /
    • 2019
  • 최근에 카메라를 사용하여 물체를 인식하고 수량을 측정하는 연구가 진행되고 있다. 하지만 건축 자재와 같이 인접한 동일 물체의 경우, 인식과 측정이 어려우며, 이와 관련된 연구는 부족한 실정이다. 본 논문에서는 이러한 문제를 해결하기 위해 딥러닝과 드론을 사용하는 방법을 통하여 자재 더미의 윗면과 측면의 촬영, 드론 로그를 사용하한 드론 높이와 Yaw값 획득, 영상 내 자재 종류와 영역 정보 등 미리 학습된 딥러닝 모델을 사용한 획득방법, 드론 촬영 시의 Yaw값 차이를 이용해 윗면과 측면이 공통으로 가지는 직선 검색, 자재 더미의 가로, 세로, 높이의 비율 등을 통한 각 화소 비율과 자재 개수의 영역별 가상의 체적값 분석, 드론의 화각, 높이를 사용한 체적 사진측량값 획득, 가상 체적과 사진측량법 사이의 오차 최소화 비율 등을 연구하였다.

Human Detection using Real-virtual Augmented Dataset

  • Jongmin, Lee;Yongwan, Kim;Jinsung, Choi;Ki-Hong, Kim;Daehwan, Kim
    • Journal of information and communication convergence engineering
    • /
    • 제21권1호
    • /
    • pp.98-102
    • /
    • 2023
  • This paper presents a study on how augmenting semi-synthetic image data improves the performance of human detection algorithms. In the field of object detection, securing a high-quality data set plays the most important role in training deep learning algorithms. Recently, the acquisition of real image data has become time consuming and expensive; therefore, research using synthesized data has been conducted. Synthetic data haves the advantage of being able to generate a vast amount of data and accurately label it. However, the utility of synthetic data in human detection has not yet been demonstrated. Therefore, we use You Only Look Once (YOLO), the object detection algorithm most commonly used, to experimentally analyze the effect of synthetic data augmentation on human detection performance. As a result of training YOLO using the Penn-Fudan dataset, it was shown that the YOLO network model trained on a dataset augmented with synthetic data provided high-performance results in terms of the Precision-Recall Curve and F1-Confidence Curve.

딥러닝 모형을 이용한 팔당대교 지점에서의 유량 예측 (Flow rate prediction at Paldang Bridge using deep learning models)

  • 성연정;박기두;정영훈
    • 한국수자원학회논문집
    • /
    • 제55권8호
    • /
    • pp.565-575
    • /
    • 2022
  • 최근의 수자원공학 분야는 4차산업혁명과 더불어 비약적으로 발전된 딥러닝 기술을 활용한 시계열 수위 및 유량의 예측에 대한 관심이 높아지고 있다. 또한 시계열 자료의 예측이 가능한 LSTM 모형과 GRU 모형을 활용하여 수위 및 유량 예측을 수행하고 있지만 시간 변동성이 매우 큰 하천에서의 유량 예측 정확도는 수위 예측 정확도에 비해 낮게 예측되는 경향이 있다. 본 연구에서는 유량변동이 크고 하구에서의 조석의 영향이 거의 없는 한강의 팔당대교 관측소를 선택하였다. 또한, LSTM 모형과 GRU 모형의 입력 및 예측 자료로 활용될 유량변동이 큰 시계열 자료를 선택하였고 총 자료의 길이는 비교적 짧은 2년 7개월의 수위 자료 및 유량 자료를 수집하였다. 시간변동성이 큰 시계열 수위를 2개의 모형에서 학습할 경우, 2개의 모형 모두에서 예측되는 수위 결과는 관측 수위와 비교하여 적정한 정확도가 확보되었으나 변동성이 큰 유량 자료를 2개의 모형에서 직접 학습시킬 경우, 예측되는 유량 자료의 정확도는 악화되었다. 따라서, 본 연구에서는 급변하는 유량을 정확히 예측하기 위하여 2개 모형으로 예측된 수위 자료를 수위-유량관계곡선의 입력자료로 활용하여 유량의 예측 정확도를 크게 향상시킬 수 있었다. 마지막으로 본 연구성과는 수문자료의 별도 가공없이 관측 길이가 상대적으로 충분히 길지 않고 유출량이 급변하는 도시하천에서의 홍수예경보 자료로 충분히 활용할 수 있을 것으로 기대된다.

인공신경망 기계번역에서 말뭉치 간의 균형성을 고려한 성능 향상 연구 (A study on performance improvement considering the balance between corpus in Neural Machine Translation)

  • 박찬준;박기남;문현석;어수경;임희석
    • 한국융합학회논문지
    • /
    • 제12권5호
    • /
    • pp.23-29
    • /
    • 2021
  • 최근 딥러닝 기반 자연언어처리 연구들은 다양한 출처의 대용량 데이터들을 함께 학습하여 성능을 올리고자 하는 연구들을 진행하고 있다. 그러나 다양한 출처의 데이터를 하나로 합쳐서 학습시키는 방법론은 성능 향상을 막게 될 가능성이 존재한다. 기계번역의 경우 병렬말뭉치 간의 번역투(의역, 직역), 어체(구어체, 문어체, 격식체 등), 도메인 등의 차이로 인하여 데이터 편차가 발생하게 되는데 이러한 말뭉치들을 하나로 합쳐서 학습을 시키게 되면 성능의 악영향을 미칠 수 있다. 이에 본 논문은 기계번역에서 병렬말뭉치 간의 균형성을 고려한 Corpus Weight Balance (CWB) 학습 방법론을 제안한다. 실험결과 말뭉치 간의 균형성을 고려한 모델이 그렇지 않은 모델보다 더 좋은 성능을 보였다. 더불어 단일 말뭉치로도 고품질의 병렬 말뭉치를 구축할 수 있는 휴먼번역 시장과의 상생이 가능한 말뭉치 구축 프로세스를 추가로 제안한다.

비트코인 가격 예측을 위한 LSTM 모델의 Hyper-parameter 최적화 연구 (A Study on the Hyper-parameter Optimization of Bitcoin Price Prediction LSTM Model)

  • 김준호;성한울
    • 한국융합학회논문지
    • /
    • 제13권4호
    • /
    • pp.17-24
    • /
    • 2022
  • 비트코인은 정부나 금융기관에 의존되어 있지 않은 전자 거래를 지향하며 만들어진 peer-to-peer 방식의 암호화폐이다. 비트코인은 최초 발행 이후 거대한 블록체인 금융 시장을 생성했고, 이에 따라 기계 학습을 이용한 비트코인 가격 데이터를 예측하는 연구들이 활발해졌다. 그러나 기계 학습 연구의 비효율적인 Hyper-parameter 최적화 과정이 연구 진행에 있어 비용적인 측면을 악화시키고 있다. 본 논문은 LSTM(Long Short-Term Memory) 층을 사용하는 비트코인 가격 예측 모델에서 가장 대표적인 Hyper-parameter 중 Timesteps, LSTM 유닛의 수, 그리고 Dropout 비율의 전체 조합을 구성하고 각각의 조합에 대한 예측 성능을 측정하는 실험을 통해 정확한 비트코인 가격 예측을 위한 Hyper-parameter 최적화의 방향성을 분석하고 제시한다.

LDAM 손실 함수를 활용한 클래스 불균형 상황에서의 옷차림 T.P.O 추론 모델 학습 (Learning T.P.O Inference Model of Fashion Outfit Using LDAM Loss in Class Imbalance)

  • 박종혁
    • 한국융합학회논문지
    • /
    • 제12권3호
    • /
    • pp.17-25
    • /
    • 2021
  • 의복을 착용하는데 있어 목적 상황에 부합하는 옷차림을 구성하는 것은 중요하다. 따라서 인공지능 기반의 다양한 패션 추천 시스템에서 의복 착용의 T.P.O(Time, Place, Occasion)를 고려하고 있다. 하지만 옷차림으로부터 직접 T.P.O를 추론하는 연구는 많지 않은데, 이는 문제 특성 상 다중 레이블 및 클래스 불균형 문제가 발생하여 모델 학습을 어렵게 하기 때문이다. 이에 본 연구에서는 label-distribution-aware margin(LDAM) loss를 도입하여 옷차림의 T.P.O를 추론할 수 있는 모델을 제안한다. 모델의 학습 및 평가를 위한 데이터셋은 패션 쇼핑몰로부터 수집되었고 이를 바탕으로 성능을 측정한 결과, 제안 모델은 비교 모델 대비 모든 T.P.O 클래스에서 균형잡힌 성능을 보여주는 것을 확인할 수 있었다.

앙상블 Voting 기법을 활용한 배추 가격 예측에 관한 연구 (A Study on the Prediction of Cabbage Price Using Ensemble Voting Techniques)

  • 이창민;송성광;정성욱
    • 융합정보논문지
    • /
    • 제12권3호
    • /
    • pp.1-10
    • /
    • 2022
  • 배추와 같은 채소류는 자연재해의 영향을 많이 받기 때문에 폭우나 병해와 같은 재해로 인해 가격 변동이 심해져 농가 경제에 영향을 미치게 된다. 이러한 문제를 해결하기 위해서 농산물 가격 예측을 위한 다양한 노력이 행해졌지만 극심한 가격 예측 변동을 예측하기는 어렵다. 본 연구에서는 단일 분류기를 결합하여 다양한 여러 개의 분류기를 통해 최종 예측 결과를 결정하는 방식인 앙상블 Voting 기법으로 배추 가격을 분석하였다. 또한 시계 열 분석 방법인 LSTM과 부스팅 기법인 XGBoost와 RandomForest로 결과 비교를 하였다. 가격 데이터는 일별 데이터를 사용하였고 배추 가격에 영향을 주는 기상정보와 물가지수 등을 사용하였다. 연구 결과로는 실제값과 예측값의 차이를 보여주는 RMSE 값이 약 236 수준이다. 이 연구를 활용하여 농산물 가격 예측과 같은 다른 시계 열 분석 연구 모델 선정에 활용할 수 있을 것으로 기대된다.

Accuracy Measurement of Image Processing-Based Artificial Intelligence Models

  • Jong-Hyun Lee;Sang-Hyun Lee
    • International journal of advanced smart convergence
    • /
    • 제13권1호
    • /
    • pp.212-220
    • /
    • 2024
  • When a typhoon or natural disaster occurs, a significant number of orchard fruits fall. This has a great impact on the income of farmers. In this paper, we introduce an AI-based method to enhance low-quality raw images. Specifically, we focus on apple images, which are being used as AI training data. In this paper, we utilize both a basic program and an artificial intelligence model to conduct a general image process that determines the number of apples in an apple tree image. Our objective is to evaluate high and low performance based on the close proximity of the result to the actual number. The artificial intelligence models utilized in this study include the Convolutional Neural Network (CNN), VGG16, and RandomForest models, as well as a model utilizing traditional image processing techniques. The study found that 49 red apple fruits out of a total of 87 were identified in the apple tree image, resulting in a 62% hit rate after the general image process. The VGG16 model identified 61, corresponding to 88%, while the RandomForest model identified 32, corresponding to 83%. The CNN model identified 54, resulting in a 95% confirmation rate. Therefore, we aim to select an artificial intelligence model with outstanding performance and use a real-time object separation method employing artificial function and image processing techniques to identify orchard fruits. This application can notably enhance the income and convenience of orchard farmers.