• 제목/요약/키워드: 평가 데이터셋

검색결과 463건 처리시간 0.028초

R2와 어텐션을 적용한 유넷 기반의 영상 간 변환에 관한 연구 (Image-to-Image Translation Based on U-Net with R2 and Attention)

  • 임소현;전준철
    • 인터넷정보학회논문지
    • /
    • 제21권4호
    • /
    • pp.9-16
    • /
    • 2020
  • 영상 처리 및 컴퓨터 비전 분야에서 하나의 영상을 통해 다른 영상으로 재구성하거나 새로운 영상을 생성하는 문제는 하드웨어의 발전에 따라 꾸준히 주목받고 있다. 그러나 컴퓨터를 통해 생성한 이미지를 사람의 눈으로 바라봤을 때 자연스럽지 않다는 문제 또한 계속해서 대두되고 있다. 최근 딥러닝 분야에 대한 연구가 활발히 진행됨에 따라 이를 활용한 영상 생성 및 개선 문제 또한 활발히 연구되고 있으며 그 중에서도 적대적 생성 신경망(Generative Adversarial Network)이라는 네트워크가 영상 생성 분야에 있어 좋은 결과를 보이고 있다. 적대적 생성 신경망이 제안된 이후 이를 기반으로 하는 다양한 네트워크가 제시됨에 따라 영상 생성 분야에서 더 자연스러운 영상을 생성하는 것이 가능해졌다. 그 중 pix2pix은 조건 적대적 생성 신경망 모델로 다양한 데이터셋에서도 좋은 성능을 보이는 범용적인 네트워크이다. pix2pix는 U-Net을 기반으로 두고 있으나 U-Net을 기반으로 하는 네트워크 중에서는 더 좋은 성능을 보이는 네트워크가 다수 존재한다. 때문에 본 연구에서는 pix2pix의 U-Net에 다양한 네트워크를 적용해 영상을 생성하고 그 결과를 상호 비교 평가한다. 각 네트워크를 통해 생성된 영상을 통해 기존의 U-Net을 사용한 pix2pix 모델보다 어텐션, R2, 어텐션-R2 네트워크를 적용한 pix2pix 모델이 더 좋은 성능을 보이는 것을 확인하고 그 중 가장 성능이 뛰어난 네트워크의 한계점을 향후 연구로 제시한다.

위성영상과 머신러닝 모델을 이용한 폭염기간 고해상도 기온 추정 연구 (A Study for Estimation of High Resolution Temperature Using Satellite Imagery and Machine Learning Models during Heat Waves)

  • 이달근;이미희;김보은;유정흠;오영주;박진이
    • 대한원격탐사학회지
    • /
    • 제36권5_4호
    • /
    • pp.1179-1194
    • /
    • 2020
  • 본 연구에서는 지상기상센서가 설치되지 않은 미 관측지점의 기온정보를 추정하기 위하여 K-최근접 이웃, 랜덤 포레스트, 신경망 알고리즘을 대상으로 위성영상을 이용하여 기온자료를 산출하고 그 정확성을 평가·분석하고자 하였다. 위성영상자료는 2019년에 취득된 Landsat-8과 MODIS Aqua/Terra을 이용하였으며, 기상자료는 기상청과 산림청의 AWS/ASOS 자료를 이용하였다. 또한 추정 정확도를 향상시키기 위하여 수치표면 모델, 일사량, 경사방향, 경사도를 생성하여 이용하였다. 머신러닝 알고리즘 정확도 비교는 10-fold 교차검증을 통하여 R2(결정계수) 및 RMSE(평균제곱근오차)의 통계량을 계산하여 대상지역별 추정결과를 비교하였다. 그 결과 신경망 알고리즘이 R2=0.805, RMSE=0.508로 세 알고리즘 중 가장 안정적인 결과를 나타내었다. 신경망 알고리즘을 구축된 위성영상 데이터셋에 적용하여 2019년 6월부터 9월까지의 평균기온 지도를 생성할 수 있었으며 세밀한 기온 정보를 관측할 수 있음을 확인하였다. 연구 성과는 폭염 대응 정책, 열섬완화 연구 등 국가재난안전 관리에 활용 될 수 있을 것으로 기대된다.

SLI(Street-level Imagery)와 2D 지도간의 합성을 위한 위치 편차 제거 (The Removal of Spatial Inconsistency between SLI and 2D Map for Conflation)

  • 가칠오;이정호;양성철;유기윤
    • 대한공간정보학회지
    • /
    • 제20권2호
    • /
    • pp.63-71
    • /
    • 2012
  • 최근 포털 사이트들을 중심으로 거리 기반의 파노라마 영상 서비스(Street-Level Imagery, SLI)가 제공되고 있다. SLI는 거리상에서 실세계를 바라보는 것과 동일한 영상으로 매우 직관적이고 상세한 정보 제공이 가능하다. 이러한 특성을 가지는 SLI는 타 공간정보와 합성을 통하여 활용성이 더욱 증대될 수 있다. 하지만, 서로 다른 공간정보 데이터셋을 합성할 경우 실세계의 동일 객체가 서로 다른 위치에 표현되는 위치 편차 문제는 합성의 품질을 저하시키는 요인이 된다. 따라서 본 연구는 SLI를 현재 가장 널리 활용되고 있는 2D 지도와 합성하기 위한 상호간의 위치 편차 제거를 목표로 한다. 위치 편차 제거는 (1) 컨트롤 포인트 쌍 탐색을 위한 SLI 촬영 궤적과 2D 지도의 도로 레이어간 교차로 매칭, (2) 경향성 분석을 통한 부정확한 컨트롤 포인트 쌍 제거, (3) 정확한 컨트롤 포인트 쌍을 이용한 국지적 조정 등의 세부 프로세스를 포함한다. 또한, SLI를 포함하는 합성 결과에 적합한 정확도 평가 방법을 제시하고, 이를 통하여 위치 편차 제거의 효과를 검증한다.

관심 지점 명칭의 단어와 문맥 정보를 활용한 관심 지점의 분류 (Categorization of POIs Using Word and Context information)

  • 최수정;박성배
    • 한국지능시스템학회논문지
    • /
    • 제24권5호
    • /
    • pp.470-476
    • /
    • 2014
  • 관심 지점이란 상점이나 공원, 음식점 등과 같이 사람들이 관심을 가지거나 유용하다고 생각하는 특정한 지리적 위치를 의미한다. 관심 지점은 명칭과 제공 서비스, 카테고리 등과 같은 여러 정보들로 구성되어 있다. 이와 같은 정보들은 위치기반 어플리케이션에서 필수적인 정보이고, 그 중에서도 카테고리 정보는 위치기반 서비스에서 가장 핵심적인 역할을 한다. 그러나 관심 지점의 카테고리 정보를 직접 모으는 것은 많은 비용과 노력이 들기 때문에 자동으로 수집되어야 한다. 본 논문에서는 카테고리를 자동으로 추정하기 위해서 관심 지점 명칭의 단어 정보와 제한적 주변 문맥 정보를 결합하여 사용하는 방법을 제안한다. 관심 지점 명칭의 단어에는 카테고리를 반영하는 단어들을 포함하고 있어 카테고리를 추정하는데 있어서 중요한 단서가 된다. 제한적 주변 문맥 정보는 관심 지점의 명칭이 언급된 문서에서 명칭이 언급된 주변의 문맥을 의미한다. 명칭이 언급된 주변의 문맥에는 관심 지점의 카테고리를 추정할 정보들을 포함하고 있어 카테고리를 추정하는 것에 있어서 가치있는 정보를 제공한다. 우리는 제안한 모델의 성능을 측정하기 위해 두 가지 데이터셋에서 성능을 평가한 결과, 각 정보를 따로 사용하여 카테고리를 추정한 성능보다 결합하여 사용한 모델의 성능이 더 높게 나타났다.

딥러닝 기반의 Semantic Segmentation을 위한 DeepLabv3+에서 강조 기법에 관한 연구 (A Study on Attention Mechanism in DeepLabv3+ for Deep Learning-based Semantic Segmentation)

  • 신석용;이상훈;한현호
    • 한국융합학회논문지
    • /
    • 제12권10호
    • /
    • pp.55-61
    • /
    • 2021
  • 본 논문에서는 정밀한 semantic segmentation을 위해 강조 기법을 활용한 DeepLabv3+ 기반의 인코더-디코더 모델을 제안하였다. DeepLabv3+는 딥러닝 기반 semantic segmentation 방법이며 자율주행 자동차, 적외선 이미지 분석 등의 응용 분야에서 주로 사용된다. 기존 DeepLabv3+는 디코더 부분에서 인코더의 중간 특징맵 활용이 적어 복원 과정에서 손실이 발생한다. 이러한 복원 손실은 분할 정확도를 감소시키는 문제를 초래한다. 따라서 제안하는 방법은 하나의 중간 특징맵을 추가로 활용하여 복원 손실을 최소화하였다. 또한, 추가 중간 특징맵을 효과적으로 활용하기 위해 작은 크기의 특징맵부터 계층적으로 융합하였다. 마지막으로, 디코더에 강조 기법을 적용하여 디코더의 중간 특징맵 융합 능력을 극대화하였다. 본 논문은 거리 영상 분할연구에 공통으로 사용되는 Cityscapes 데이터셋에서 제안하는 방법을 평가하였다. 실험 결과는 제안하는 방법이 기존 DeepLabv3+와 비교하여 향상된 분할 결과를 보였다. 이를 통해 제안하는 방법은 높은 정확도가 필요한 응용 분야에서 활용될 수 있다.

교사 학생 심층신경망을 활용한 다채널 원거리 화자 인증 (Multi channel far field speaker verification using teacher student deep neural networks)

  • 정지원;허희수;심혜진;유하진
    • 한국음향학회지
    • /
    • 제37권6호
    • /
    • pp.483-488
    • /
    • 2018
  • 원거리 발성은 화자 인증 시스템의 성능을 하락시키는 주요 요인으로 알려져 있다. 본 논문에서는 교사 학생 학습을 이용하여 원거리 발성에 의한 화자 인증 시스템의 성능 하락을 보상하는 기법을 제안한다. 교사 학생 학습은 미리 학습된 교사 심층신경망의 출력과 학생 신경망의 출력이 같아지도록 학생 신경망을 학습하는 기법이다. 여기서 교사 신경망에는 근거리 발성을, 학생 신경망에는 원거리 발성을 입력한 뒤, 두 신경망의 출력을 동일하게 만드는 과정을 통해 원거리 발성을 보상할 수 있을 것이라고 기대하였다. 하지만 원거리 발성을 보상하는 과정에서, 근거리 발성에 대한 인식률이 저하되는 현상을 실험적으로 발견하였다. 위와 같은 현상을 예방하기 위해 본 논문에서는 교사 심층신경망을 학생 심층신경망의 초깃값으로 사용하는 기법과 학생 심층신경망을 근거리 발성에 대해서도 학습하는 기법을 제안하였다. 모든 실험은 원 음성을 입력 받는 심층신경망을 활용해 수행하였다. 동일한 발성을 각각 4 채널로 근거리와 원거리에서 자체적으로 수집한 문장 종속 데이터셋을 활용하였다. 동일 오류율을 기준으로 근거리 / 원거리 발성에 대한 화자 인증 성능을 평가한 결과 교사 학생 학습을 사용하지 않을 경우 2.55 % / 2.8 %, 기존의 교사 학생 학습을 사용할 경우 9.75 % / 1.8 %, 제안한 기법들을 적용한 경우 2.5 % / 2.7 %의 오류율을 확인하였다.

수목 동정을 위한 수피 분류 데이터셋 구축과 합성곱 신경망 기반 53개 수종의 동정 모델 개발 (Construction of a Bark Dataset for Automatic Tree Identification and Developing a Convolutional Neural Network-based Tree Species Identification Model)

  • 김태경;백규헌;김현석
    • 한국산림과학회지
    • /
    • 제110권2호
    • /
    • pp.155-164
    • /
    • 2021
  • 자연환경에 대한 국민들의 관심 증가로 스마트폰과 같은 휴대용 기기를 이용한 수목 동정의 자동화에 대한 요구가 증가하고 있다. 최근 딥러닝 기술의 발전에 힘입어, 외국에서는 수목 인식 분야에의 적용이 활발하게 이루어지고 있다. 수목의 분류를 위해 꽃, 잎 등 다양한 형질들을 대상으로 연구가 진행되고 있지만, 접근성을 비롯한 여러 장점을 가진 수피의 경우 복잡도가 높고 자료가 부족하여 연구가 제한적이었다. 본 연구에서는 국내에서 흔히 관찰 가능한 수목 54종의 사진자료를 약 7,000 여장 수집 및 공개하였고, 이를 해외의 20 수종에 대한 BarkNet 1.0의 자료와 결합하여 학습에 충분한 수의 사진 수를 가지는 53종을 선정하고, 사진들을 7:3의 비율로 나누어 훈련과 평가에 활용하였다. 분류 모델의 경우, 딥러닝 기법의 일종인 합성곱 신경망을 활용하였는데, 가장 널리 쓰이는 VGGNet (Visual Geometry Group Network) 16층, 19층 모델 두 가지를 학습시키고 성능을 비교하였다. 또한 본 모형의 활용성 및 한계점을 확인하기 위하여 학습에 사용하지 않은 수종과 덩굴식물과 같은 방해 요소가 있는 사진들에 대한 모델의 정확도를 확인하였다. 학습 결과 VGG16과 VGG19는 각각 90.41%와 92.62%의 높은 정확도를 보였으며, 더 복잡도가 높은 모델인 VGG19가 조금 더 나은 성능을 보임을 확인하였다. 학습에 활용되지 않은 수목을 동정한 결과 80% 이상의 경우에서 같은 속 또는 같은 과에 속한 수종으로 예측하는 것으로 드러났다. 반면, 이끼, 만경식물, 옹이 등의 방해 요소가 존재할 경우 방해요소가 자치하는 비중에 따라 정확도가 떨어지는 것이 확인되어 실제 현장에서 이를 보완하기 위한 방법들을 제안하였다.

QZSS-CLAS의 Compact SSR을 이용한 다중 위성항법 기반의 Code-PPP 개발 (Development of Code-PPP Based on Multi-GNSS Using Compact SSR of QZSS-CLAS)

  • 이해창;박관동
    • 한국측량학회지
    • /
    • 제38권6호
    • /
    • pp.521-531
    • /
    • 2020
  • QZSS (Quasi-Zenith Satellite System)는 위성의 L6 밴드를 통해서 CLAS (Centimeter Level Augmentation Service)를 제공한다. CLAS는 현재 GPS (Global Positioing System), Galileo 그리고, QZSS 위성군에 대한 보정정보를 제공하며, 이러한 보정정보를 C-SSR (Compact - Space State Representation)라고 한다. 본 연구에서는 L6 밴드를 수신할 수 있는 GPS 수신기인 Septentrio의 AsteRx4를 이용하여 CLAS 메시지를 수신하고, 그 메시지를 디코딩하여 C-SSR을 획득하였다. 그리고, GPS, Galileo, QZSS의 코드의사거리 관측치에 Compact SSR을 적용하여 GNSS (Global Navigation Satellite System) 오차를 보정하고, 비선형 최소제곱법으로 수신기의 3차원 위치 및 위성군의 시계오차들을 추정하는 다중 위성항법 기반의 Code-PPP (Precise Point Positioning)를 개발하였다. 개발한 알고리즘의 정확도를 평가하기 위해서 IGS (International GNSS Service) 사이트 중 하나인 TSK2 (Tsukuba)를 대상으로 정지측위를 수행하고, 일본의 가와니시(Kawanishi)시의 이나강(Ina river) 주변을 주행하며 이동측위를 수행하였다. 그 결과, 정지측위의 경우 모든 데이터셋의 평균 RMSE (Root Mean Squared Error)는 수평방향으로 0.35 m, 수직방향으로 0.57 m의 정확도를 나타냈다. 그리고 이동측위의 경우 VRS의 RTK-FIX 값과 비교해 봤을 때 수평방향은 약 0.82 m, 수직방향은 약 3.56 m의 정확도를 나타냈다.

선박패스(V-Pass) 자료를 활용한 어업활동 지도 제작 연구 - 남해동부해역을 중심으로 - (A Study on the Mapping of Fishing Activity using V-Pass Data - Focusing on the Southeast Sea of Korea -)

  • 한재림;김태훈;최은영;최현우
    • 한국지리정보학회지
    • /
    • 제24권1호
    • /
    • pp.112-125
    • /
    • 2021
  • 해양공간계획은 해양을 체계적이고 합리적으로 관리하기 위해 9가지 용도구역으로 지정한다. 그 중 하나가 어업활동의 보호와 육성을 비롯한 수산물의 지속 가능한 생산을 위해 필요한 어업활동 보호구역이다. 본 연구는 V-Pass 자료를 활용하여 어업활동 지도를 제작하고 어업활동 밀집 공간을 도출함으로써 어업활동보호구역 지정에 필요한 요소 중 하나인 어업활동 공간을 정량적으로 파악하고자 한다. 이를 위해 V-Pass 자료를 정적 정보와 동적 정보가 결합된 데이터셋 구축, 어선 속도 계산, 어업활동 지점 추출, 비어업활동 공간 내의 자료 제거와 같은 전처리를 수행하였다. 최종적으로 선별된 V-Pass 점 자료를 이용하여 커널밀도추정으로 어업활동 지도를 제작하고 어업활동이 밀집된 공간을 분석하였다. 또한 어선의 업종과 계절에 따라 어업활동의 공간분포는 차이가 있음을 확인하였다. 본 연구를 통해 수행한 대용량 V-Pass 자료의 전처리 기법과 어업활동의 공간밀도 분석 방법은 향후 어업활동에 대한 공간특성평가 연구에 기여할 것으로 기대된다.

심층 신경망을 활용한 진료 기록 문헌에서의 종단형 개체명 및 관계 추출 비교 연구 - 파이프라인 모델과 결합 모델을 중심으로 - (A Comparative Research on End-to-End Clinical Entity and Relation Extraction using Deep Neural Networks: Pipeline vs. Joint Models)

  • 최성필
    • 한국문헌정보학회지
    • /
    • 제57권1호
    • /
    • pp.93-114
    • /
    • 2023
  • 정보추출은 문헌 내에 존재하는 개체명을 인식함과 동시에 이들 간의 의미적 관계까지도 식별하여 최종적으로 문헌 내에 포함된 의미적 트리플을 자동으로 추출하여 활용할 수 있으므로 문헌에 대한 심층적인 분석과 이해에 많은 도움을 줄 수 있다. 그러나 지금까지 대부분의 정보추출에 대한 연구는 개체명 인식과 관계추출이 개별 연구로 각각 분리되어 진행되었으며, 그 결과 입력 문헌에 대한 정보추출의 최종 출력인 의미적 트리플 추출 성능에 대한 객관적이고 정확한 평가가 제대로 이루어지지 않았다. 이에 본 논문에서는 진료 기록 문헌에 나타나는 개체명과 그들 간의 관계를 트리플 형태로 직접 추출할 수 있는 종단형 정보추출의 2가지 모델인 파이프라인 및 결합형 모델을 구축하는 구체적인 방법론을 제시하고 성능 비교 실험을 진행하였다. 우선 파이프라인 모델은 양방향 GRU-CRFs를 활용한 개체명 인식 모듈과 다중 인코딩 기반 관계추출 모듈로 구현되었고, 결합형 모델을 위해서는 다중 헤드 레이블링 기반의 양방향 GRU-CRFs이 적용되었다. 두 가지 시스템을 바탕으로 진료기록 문헌 내의 개체명과 관계를 모두 태깅하여 구축된 i2b2/VA 2010 데이터셋을 활용한 비교 실험에서 파이프라인 모델의 성능이 5.5%(F-measure) 더 높게 나타났다. 추가적으로, 대규모 신경망 언어모델과 수작업으로 구축된 자질 정보를 활용한 최고 수준의 기존 시스템과의 비교 실험을 통해, 본 논문에서 구현한 종단형 모델의 객관적인 성능 수준을 파악할 수 있었다.