• 제목/요약/키워드: 딥러닝 융합연구

검색결과 434건 처리시간 0.027초

고해상도 위성영상을 이용한 농촌 도로 매핑을 위한 영상 분류 및 영상 분할 방법 비교에 관한 연구 (Comparative Research of Image Classification and Image Segmentation Methods for Mapping Rural Roads Using a High-resolution Satellite Image)

  • 정윤재;구본엽
    • 한국지리정보학회지
    • /
    • 제24권3호
    • /
    • pp.73-82
    • /
    • 2021
  • 농촌 도로는 농촌 지역의 개발과 관리를 위한 핵심 기반시설로서 원격탐사 자료를 활용한 농촌 도로 관리 기술은 농촌 교통 인프라 확대, 농촌 주민의 삶의 질 개선을 위해 매우 중요하다. 본 연구에서는 농촌 지역을 촬영한 고해상도 위성영상을 활용하여 농촌 도로를 매핑하기 위해 영상 분류 방법과 영상 분할 방법을 다음의 과정을 통하여 비교하였다. 영상 분류의 경우, 심층 신경망 기반 딥러닝 기법을 주어진 고해상도 위성영상에 적용하여 고정밀 객체 분류 지도를 제작하였고 이로부터 농촌 도로 객체를 추출함으로써 농촌 도로를 매핑하였다. 영상 분할의 경우, multiresolution segmentation 기법을 동일한 위성영상에 적용하여 세그먼트 영상을 제작하였고 농촌 도로에 위치한 다중 객체들을 선택하고 이들을 최종적으로 융합하여 농촌 도로를 매핑하였다. 영상 분류 및 영상 분할 방법을 통해 매핑한 농촌 도로의 정확도 검증을 위해 100개의 검사점을 사용하였고 다음과 같은 결론을 도출하였다. 영상 분류 방법에서는 객체 분류 지도 내 오분류 에러로 인해 영상 내 일부 농촌 도로의 인식이 불가능하였으나 영상 분할 방법에서는 영상 내 모든 농촌 도로의 인식이 가능하였으므로 영상 분할 방법이 영상 분류 방법보다 위성영상을 이용한 농촌 도로 매핑 작업에 더 적합한 방법이었다. 그러나 영상 분할 방법을 통해 매핑한 농촌 도로를 구성하는 일부 세그먼트들이 농촌 도로 외 객체를 포함하고 있어 영상 내 일부 농촌 도로에서 오분류 에러가 발생하였다. 추후 연구에서는 객체 기반 분류 또는 합성곱 신경망 등 다양한 정밀 객체 인식 기법을 고해상도 위성영상에 적용하여 농촌 도로의 정확도를 개선할 계획이다.

역 원근변환 기법을 이용한 터널 영상유고시스템의 원거리 감지 성능 향상에 관한 연구 (A study for improvement of far-distance performance of a tunnel accident detection system by using an inverse perspective transformation)

  • 이규범;신휴성
    • 한국터널지하공간학회 논문집
    • /
    • 제24권3호
    • /
    • pp.247-262
    • /
    • 2022
  • 국내 200 m 이상 연장의 터널에서는 CCTV 설치가 의무화되어 있으며, 터널 내 돌발 상황을 자동으로 인지한 다음 터널 관리자에게 알릴 수 있는 터널 영상유고시스템의 운영이 권고된다. 여기서 터널 내 설치된 CCTV는 터널 구조물의 공간적인 한계로 인해 낮은 높이로 설치된다. 이에 따라 이동차량과 매우 인접하므로, 이동차량과 CCTV와의 거리에 따른 원근현상이 매우 심하다. 이로 인해, 기존 터널 영상유고시스템은 터널 CCTV로부터 멀리 떨어질수록 차량의 정차 및 역주행, 보행자 출현 및 화재 발생과 같은 터널 내 유고상황을 인지하기 매우 어려우며, 100 m 이상의 거리에서는 높은 유고상황 인지 성능을 기대하기 어려운 것으로 알려져 있다. 이 문제를 해결하기 위해 관심영역 설정 및 역 원근변환(Inverse perspective transform)을 도입하였으며, 이 과정을 통해 얻은 변환영상은 먼 거리에 있는 객체의 크기가 확대된다. 이에 따라 거리에 따라 객체의 크기가 비교적 일정하게 유지되므로, 거리에 따른 객체 인식 성능과 영상에서 보이는 차량의 이동속도 또한 일관성을 유지할 수 있다. 이를 증명하기 위해 본 논문에서는 터널 CCTV의 원본영상과 변환영상을 바탕으로 동일한 조건을 가지는 데이터셋을 각각 제작 및 구성하였으며, 영상 내 차량의 실제 위치의 변화에 따른 겉보기 속도와 객체 크기를 비교하였다. 그 다음 딥러닝 객체인식 모델의 학습 및 추론을 통해 각 영상 데이터셋에 대한 거리에 따른 객체인식 성능을 비교하였다. 결과적으로 변환영상을 사용한 모델은 200 m 이상의 거리에서도 객체인식 성능과 이동차량의 유고상황 인지 성능을 확보할 수 있음을 보였다.

인공지능 스피커의 세대별 온라인 리뷰 분석을 통한 사용자 경험 요인 탐색 (Exploring user experience factors through generational online review analysis of AI speakers)

  • 박정은;양동욱;김하영
    • 한국융합학회논문지
    • /
    • 제12권7호
    • /
    • pp.193-205
    • /
    • 2021
  • 인공지능 스피커 시장은 꾸준히 성장하고 있지만, 실제 스피커 사용자들의 만족도는 42%에 그치고 있다. 따라서, 본 연구에서는 인공지능 스피커의 세대별 토픽 변화와 감성 변화를 통해 사용자 경험을 저해하는 요소는 무엇인지 분석해 보고자 한다. 이를 위해 아마존 에코 닷 3세대와 4세대 모델에 대한 리뷰를 수집하였다. 토픽모델링 분석 기법을 사용하여 세대별로 리뷰를 이루는 주제 및 주제의 변화를 찾아내고, 딥러닝 기반 감성 분석을 통해 토픽에 대한 사용자 감성이 세대에 따라 어떻게 변화되었는지 살펴보았다. 토픽모델링 결과, 세대별로 5개의 토픽이 도출되었다. 3세대의 경우 스피커의 일반적 속성을 나타내는 토픽은 제품에 긍정적 반응 요인으로 작용했고, 사용자 편의 기능은 부정적 반응 요인으로 작용했다. 반대로 4세대에서는 일반적 속성은 부정적으로, 사용자 편의 기능은 긍정적으로 도출되었다. 이와 같은 분석은 방법론 측면에서 어휘적 특징뿐 아니라 문장 전체의 문맥적 특징이 고려된 분석결과를 제시할 수 있다는 것에 그 의의가 있다.

도시침수 모의 기술 국내 연구동향 리뷰: 2001-2022 (A review on urban inundation modeling research in South Korea: 2001-2022)

  • 이승수;김보미;최현진;노성진
    • 한국수자원학회논문집
    • /
    • 제55권10호
    • /
    • pp.707-721
    • /
    • 2022
  • 본 총설연구에서는 도시침수 모의 기술의 체계와 발전 과정을 정리하고, 주요 성과와 한계점을 파악하여 향후 연구 방향과 도전 과제를 제시하였다. 이를 위해 2000년대 이후 국내 주요 학술논문집에 수록된 도시침수 모의 관련 논문 160여편을 분석하여 연구의 핵심 주제와 내용을 살펴본 후, 물리 및 데이터 기반 모형의 침수모의 세부 방법론별로 기술의 발전 현황에 대해 정리하였다. 또한, 국내 도시침수 모의 기술의 활용목적별 동향, 국외 및 연관 분야 연구동향에 대해서도 분석하였다. 국내 도시침수 모의 연구에서 Storm Water Management Model (SWMM) 모형을 활용하는 비율이 60%를 넘는 것으로 조사되었으며, 이중 배제(dual drainage)의 도시침수 물리 과정을 상세히 해석하는 국내 기술에 대한 연구가 필요한 것으로 판단되었다. 한편, 딥러닝(deep learning) 등 데이터 기반 모의 기술은 도시침수 해석의 새로운 분야로 자리매김하였다. 다만, 모형 훈련을 위한 극한기상조건에 대한 침수자료는 관측 만으로 확보할 수 없으므로, 고정확도 물리 모형과 데이터 기반 모형 연구는 상호보완적으로 진행되어야 할 필요가 있다. 도시침수 모의 기술은 인공지능이나 IoT, 메타버스 등 타 분야 신기술과의 접목이 활발히 이루어지고 있으며, 기후 위기 적응과 재해 피해 저감을 위해 지속적인 사회적 투자와 융합 연구가 필요한 분야로 판단된다.

항공 LiDAR 및 RGB 정사 영상을 이용한 딥러닝 기반의 도시녹지 분류 (Classification of Urban Green Space Using Airborne LiDAR and RGB Ortho Imagery Based on Deep Learning)

  • 손보경;이연수;임정호
    • 한국지리정보학회지
    • /
    • 제24권3호
    • /
    • pp.83-98
    • /
    • 2021
  • 도시녹지는 도시 생태계 건강성 증진을 위한 중요한 요소이며, 건강한 도시 생태계 유지 및 관리를 위해서는 도시녹지의 공간적인 현황 파악이 필요하다. 환경부에서는 2010년 이후부터 총 41개의 분류 항목을 갖는 1m 급 해상도의 세분류 토지피복지도를 제공해오고 있으나, 가로수와 같은 도시 내 고해상도 상세 녹지 정보는 기타 초지로 분류되거나 누락되어 오고 있다. 따라서, 본 연구에서는 수원시 지역을 대상으로 1m 이하 급의 고해상도 원격탐사 자료(항공 LiDAR 및 RGB 정사영상)를 이용하여, 기존 세분류 토지피복지도에서는 나타나지 않는 고해상도의 상세 도시 녹지(수목, 관목 및 초지) 정보를 분류하고자 하였다. 분류 기법으로는 딥러닝 기반의 이미지 분할방법인 U-Net 구조의 모델을 활용하였으며, 분류 항목의 수 및 사용하는 자료의 종류에 따라 총 3가지의 모델(LRGB10, LRGB5, 및 RGB5)을 제안하고 성능을 평가하였다. 검증 지역에 대한 세 모델의 평균 전체 정확도는 각 83.40%(LRGB10), 89.44%(LRGB5), 74.76%(RGB5)이며, 항공 LiDAR와 RGB 정사영상을 함께 사용하여 총 5개의 항목(수목, 관목, 초지, 건물, 및 그 외)을 분류하는 LRGB5 모델의 성능이 가장 높게 나타났다. 수원시의 수목, 관목 및 초지 기준의 전체 녹지 현황은 각 45.61%(LRGB10), 43.47%(LRGB5), 및 44.22%(RGB5)로 나타났으며, 세 모델 모두 기존 세분류 토지피복지도와 비교하여 평균 13.40%의 도시 수목 정보를 더 제공할 수 있는 것으로 나타났다. 더불어 이러한 도시녹지 분류 결과는 향후 중분류 토지피복지도와 같은 기존 GIS 정보와의 융합을 통해 가로수 녹지 비율 현황 등 추가적인 상세 녹지 현황 정보를 제공할 수 있어, 다양한 도시녹지 연구 및 정책의 기초 자료로 활용될 수 있을 것으로 기대된다.

익스플리싯 피드백 환경에서 추천 시스템을 위한 최신 지식증류기법들에 대한 성능 및 정확도 평가 (State-of-the-Art Knowledge Distillation for Recommender Systems in Explicit Feedback Settings: Methods and Evaluation)

  • 배홍균;김지연;김상욱
    • 스마트미디어저널
    • /
    • 제12권9호
    • /
    • pp.89-94
    • /
    • 2023
  • 추천 시스템은 사용자가 아이템에 남긴 익스플리싯 또는 임플리싯 피드백을 바탕으로 각 사용자가 선호할 법한 아이템들을 추천하는 기술이다. 최근, 추천 시스템에 사용되는 딥 러닝 기반 모델의 사이즈가 커짐에 따라, 높은 추천 정확도를 유지하며 추론 시간은 줄이기 위한 목적의 연구가 활발히 진행되고 있다. 대표적으로 지식증류기법을 이용한 추천 시스템에 관한 연구가 있으며, 지식증류기법이란 큰 사이즈의 모델(즉, 교사)로부터 추출된 지식을 통해 작은 사이즈의 모델(즉, 학생)을 학습시킨 뒤, 학습이 끝난 작은 사이즈의 모델을 추천 모델로서 이용하는 방법이다. 추천 시스템을 위한 지식증류기법들에 관한 기존의 연구들은 주로 임플리싯 피드백 환경만을 대상으로 수행되어 왔었으며, 본 논문에서 우리는 이들을 익스플리싯 피드백 환경에 적용할 경우의 성능 및 정확도를 관찰하고자 한다. 실험을 위해 우리는 총 5개의 최신 지식증류기법들과 3개의 실세계 데이터셋을 사용하였다.

정지궤도 기상위성 및 수치예보모델 융합을 통한 Multi-task Learning 기반 태풍 강도 실시간 추정 및 예측 (Multi-task Learning Based Tropical Cyclone Intensity Monitoring and Forecasting through Fusion of Geostationary Satellite Data and Numerical Forecasting Model Output)

  • 이주현;유철희;임정호;신예지;조동진
    • 대한원격탐사학회지
    • /
    • 제36권5_3호
    • /
    • pp.1037-1051
    • /
    • 2020
  • 최근 기후변화로 인해 강도가 높은 태풍의 빈도가 높아짐에 따라 태풍 예측의 중요성이 강조되고 있는 데, 태풍경로예측에 비해 태풍강도예측에 대한 연구는 미비한 상황이다. 이에 본 연구에서는 딥러닝 모델인 Multi-task learning (MTL) 기법을 활용하여 정지궤도기상위성을 활용한 관측자료와 수치예보모델을 융합한 실시간 추정 및 6시간, 12시간 후의 태풍강도예측 모델을 제안하고자 한다. 본 연구에서는 2011년에서 2016년까지 북서태평양에서 발생한 총 142개의 태풍을 대상으로 강도 예측 연구를 시행하였다. 한국 최초의 기상위성인 Communication, Ocean and Meteorological Satellite (COMS) Meteorological Imager (MI)를 활용하여 태풍의 관측영상을 추출하였고, National Center of Environmental Prediction (NCEP)에서 제공하는 Climate Forecast System version 2 (CFSv2)를 활용하여 6시간, 12시간 후의 태풍 주변 대기 및 해양 예측변수를 추출하였다. 본 연구에서는 각 입력자료의 활용성을 정량화 하기 위하여, 위성 기반 태풍관측영상만을 활용한 MTL 모델(Scheme 1)과 수치예보모델을 융합적으로 활용한 MTL 모델(Scheme 2)을 구축하고, 각 모델의 훈련 및 검증 성능을 정량적으로 비교하였다. 실시간 강도 추정의 결과 scheme 1과 scheme 2에서 비슷한 성능을 보이는 반면, 6시간, 12시간 후 태풍강도예측의 경우 scheme 2에서 각각 13%, 16% 개선된 결과를 보였다. 태풍 단계별 예측성능에 대한 분석을 시행한 결과, 저강도 태풍일수록 낮은 평균제곱근오차를 보인 반면, 대부분의 강도 단계에서 평균제곱근편차비는 30% 미만의 값을 보이며 유의미한 검증 결과를 보였다. 이에 본 연구에서 제시한 두가지 모델을 기반으로 2014년 발생한 태풍 HALONG의 시계열검증을 시행하였다. 그 결과, scheme 1의 경우 태풍 초기발달단계에서 태풍의 강도를 약 20 kts가량 과대 추정하는 경향을 보이는데, 환경예측자료를 융합한 scheme 2에서는 오차가 약 5 kts가량으로 과대 추정 경향이 줄어들었다. 본 연구에서 제시하는 현재, 6시간, 12시간 후 강도를 동시에 추출하는 MTL 모델은 Single-tasking model 대비 약 300%의 시간 효율을 보이며, 향후 신속한 태풍 예보 정보 추출에 큰 기여를 할 수 있을 것으로 기대된다.

A3C를 활용한 블록체인 기반 금융 자산 포트폴리오 관리 (Blockchain Based Financial Portfolio Management Using A3C)

  • 김주봉;허주성;임현교;권도형;한연희
    • 정보처리학회논문지:컴퓨터 및 통신 시스템
    • /
    • 제8권1호
    • /
    • pp.17-28
    • /
    • 2019
  • 금융투자 관리 전략 중에서 여러 금융 상품을 선택하고 조합하여 분산 투자하는 것을 포트폴리오 관리 이론이라 부른다. 최근, 블록체인 기반 금융 자산, 즉 암호화폐들이 몇몇 유명 거래소에 상장되어 거래가 되고 있으며, 암호화폐 투자자들이 암호화폐에 대한 투자 수익을 안정적으로 올리기 위하여 효율적인 포트폴리오 관리 방안이 요구되고 있다. 한편 딥러닝이 여러 분야에서 괄목할만한 성과를 보이면서 심층 강화학습 알고리즘을 포트폴리오 관리에 적용하는 연구가 시작되었다. 본 논문은 기존에 발표된 심층강화학습 기반 금융 포트폴리오 투자 전략을 바탕으로 대표적인 비동기 심층 강화학습 알고리즘인 Asynchronous Advantage Actor-Critic (A3C)를 적용한 효율적인 금융 포트폴리오 투자 관리 기법을 제안한다. 또한, A3C를 포트폴리오 투자 관리에 접목시키는 과정에서 기존의 Cross-Entropy 함수를 그대로 적용할 수 없기 때문에 포트폴리오 투자 방식에 적합하게 기존의 Cross-Entropy를 변형하여 그 해법을 제시한다. 마지막으로 기존에 발표된 강화학습 기반 암호화폐 포트폴리오 투자 알고리즘과의 비교평가를 수행하여, 본 논문에서 제시하는 Deterministic Policy Gradient based A3C 모델의 성능이 우수하다는 것을 입증하였다.

그래프 트랜스포머 기반 농가 사과 품질 이미지의 그래프 표현 학습 연구 (A Study about Learning Graph Representation on Farmhouse Apple Quality Images with Graph Transformer)

  • 배지훈;이주환;유광현;권경주;김진영
    • 스마트미디어저널
    • /
    • 제12권1호
    • /
    • pp.9-16
    • /
    • 2023
  • 최근 농가의 사과 품질 선별 작업에서 인적자원의 한계를 극복하기 위해 합성곱 신경망(CNN) 기반 시스템이 개발되고 있다. 그러나 합성곱 신경망은 동일한 크기의 이미지만을 입력받기 때문에 샘플링 등의 전처리 과정이 요구될 수 있으며, 과도 샘플링의 경우 화질 저하, 블러링 등 원본 이미지의 정보손실 문제가 발생한다. 본 논문에서는 위 문제를 최소화하기 위하여, 원본 이미지의 패치 기반 그래프를 생성하고 그래프 트랜스포머 모델의 랜덤워크 기반 위치 인코딩 방법을 제안한다. 위 방법은 랜덤워크 알고리즘 기반 위치정보가 없는 패치들의 위치 임베딩 정보를 지속적으로 학습하고, 기존 그래프 트랜스포머의 자가 주의집중 기법을 통해 유익한 노드정보들을 집계함으로써 최적의 그래프 구조를 찾는다. 따라서 무작위 노드 순서의 새로운 그래프 구조와 이미지의 객체 위치에 따른 임의의 그래프 구조에서도 강건한 성질을 가지며, 좋은 성능을 보여준다. 5가지 사과 품질 데이터셋으로 실험하였을 때, 다른 GNN 모델보다 최소 1.3%에서 최대 4.7%의 학습 정확도가 높았으며, ResNet18 모델의 23.52M보다 약 15% 적은 3.59M의 파라미터 수를 보유하여 연산량 절감에 따른 빠른 추론 속도를 보이며 그 효과를 증명한다.

물체탐색과 전경영상을 이용한 인공지능 멀티태스크 성능 비교 (Comparison of Artificial Intelligence Multitask Performance using Object Detection and Foreground Image)

  • 정민혁;김상균;이진영;추현곤;이희경;정원식
    • 방송공학회논문지
    • /
    • 제27권3호
    • /
    • pp.308-317
    • /
    • 2022
  • 딥러닝 기반 머신 비전 기술을 이용한 영상분석 과정에서 전송되고 저장되는 방대한 양의 동영상 데이터의 용량을 효율적으로 줄이기 위한 연구들이 진행 중이다. MPEG(Moving Picture Expert Group)은 VCM(Video Coding for Machine)이라는 표준화 프로젝트를 신설해 인간을 위한 동영상 부호화가 아닌 기계를 위한 동영상 부호화에 대한 연구를 진행 중이다. 그 중 한 번의 영상 입력으로 여러가지 태스크를 수행하는 멀티태스크에 대한 연구를 진행하고 있다. 본 논문에서는 효율적인 멀티태스크를 위한 파이프라인을 제안한다. 제안하는 파이프라인은 물체탐지를 선행해야 하는 각 태스크들의 물체탐지를 모두 수행하지 않고 한번만 선행하여 그 결과를 각 태스크의 입력으로 사용한다. 제안하는 멀티태스크 파이프라인의 효율성을 알아보기 위해 입력영상의 압축효율, 수행시간, 그리고 결과 정확도에 대한 비교 실험을 수행한다. 실험 결과 입력 영상의 용량이 97.5% 이상 감소한데 반해 결과 정확도는 소폭 감소하여 멀티태스크에 대한 효율적인 수행 가능성을 확인할 수 있었다.