• 제목/요약/키워드: 영상 학습데이터셋

검색결과 213건 처리시간 0.023초

개방형 다중 데이터셋을 활용한 Combined Segmentation Network 기반 드론 영상의 의미론적 분할 (Semantic Segmentation of Drone Images Based on Combined Segmentation Network Using Multiple Open Datasets)

  • 송아람
    • 대한원격탐사학회지
    • /
    • 제39권5_3호
    • /
    • pp.967-978
    • /
    • 2023
  • 본 연구에서는 다양한 드론 영상 데이터셋을 효과적으로 학습하여 의미론적 분할의 정확도를 향상시키기 위한 combined segmentation network (CSN)를 제안하고 검증하였다. CSN은 세 가지 드론 데이터셋의 다양성을 고려하기 위하여 인코딩 영역의 전체를 공유하며, 디코딩 영역은 독립적으로 학습된다. CSN의 경우, 학습 시 모든 데이터셋에 대한 손실값을 고려하기 때문에 U-Net 및 pyramid scene parsing network (PSPNet)으로 단일 데이터셋을 학습할 때보다 학습 효율이 떨어졌다. 그러나 국내 자율주행 드론 영상에 CSN을 적용한 결과, CSN이 PSPNet에 비해 초기 학습 없이도 영상 내 화소를 적절한 클래스로 분류할 수 있는 것을 확인하였다. 본 연구를 통하여 CSN이 다양한 드론 영상 데이터셋을 효과적으로 학습하고 새로운 지역에 대한 객체 인식 정확성을 향상시키는 데 중요한 도구로써 활용될 수 있을 것으로 기대할 수 있다.

영역별 화소값 분석을 통한 흉부 X선 오픈 데이터셋 품질 평가 (Quality Evaluation of Chest X-ray Open Dataset through Pixel Value Analysis by Region)

  • 최현진;배수빈;선주성;이정원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 춘계학술발표대회
    • /
    • pp.614-617
    • /
    • 2022
  • 인공지능의 발전으로 의료영상 분야에서 딥러닝 기반 질병 진단 연구가 활발하다. 그러나 모델 개발 시 학습 데이터의 개수와 품질은 매우 중요한데, 의료 분야 특성상 접근 가능한 데이터셋이 적으며 오픈 데이터셋은 서로 다른 기관에서 배포되거나 웹상에서 수집된 것으로 진단에 적합한 품질을 기대하기 어렵다. 또한, 기존 연구는 데이터셋이 학습에 적합한지에 대한 품질검증 없이 사용한다. 따라서 본 논문에서는 임상에서 사용하는 화질 평가 요소에 근거를 두고 영역별 화소값 분석을 통한 흉부 X선 영상 품질 평가 기법을 제안한다. 오픈 데이터셋 JSRT, Chest14와 국내 A 병원 데이터셋 AUH에 제안한 기법을 적용한 결과 민감도 91.5%, 특이도 96.1%의 우수한 성능을 확인하였다.

회전 영상 기반 다면 영상 데이터셋 구축 방법 (Multi-faceted Image Dataset Construction Method Based on Rotational Images.)

  • 김지성;허경용;장시웅
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2021년도 추계학술대회
    • /
    • pp.75-77
    • /
    • 2021
  • 딥러닝 기술을 통해 영상 내의 객체를 찾아내기 위해서는 학습을 위한 영상 데이터셋이 필요하다. 객체의 인식률을 높이기 위해서는 많은 양의 영상 학습 데이터가 필요하다. 많은 양의 데이터셋을 구축하는 데에는 많은 비용이 들기 때문에 개인이 구축하기에 어려움이 있다. 본 논문에서는 회전 영상을 촬영하여 객체의 여러 면을 포함하는 영상 데이터셋을 보다 손쉽게 구축하는 방법을 소개한다. 회전판 위에 객체를 올려둔 뒤 촬영하고 촬영된 영상을 필요에 맞게 분할, 합성하여 데이터셋을 구축하는 방법을 제안한다.

  • PDF

학습데이터 증폭 소프트웨어 개발 (Development of dataset amplification software)

  • 서경덕;고석주;신재원;박형석;조성윤;김경래
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 하계학술대회
    • /
    • pp.664-666
    • /
    • 2020
  • 데이터의 다양성은 학습에 따른 모델의 성능을 좌지우지하는 중요한 요소이다. 그렇기 때문에 많은 양의 데이터를 확보하는 것은 학습에 있어서 아주 중요하다. 하지만, 데이터를 수집하는 것은 시간과 비용이 많이 드는 단계 중 하나이다. 본 논문에서는 제한된 데이터를 가지고 이미지 처리를 거쳐 대량의 데이터로 증폭시켜 많은 양의 데이터를 확보하는 과정에 대해 제안한다. 가지고 있는 YOLOv4용 학습 데이터 셋을 활용하여 사용자로부터 입력받은 확대/축소 비율, 각도로 데이터를 변형하고, 이렇게 추가로 생성된 데이터 셋을 기존 학습 데이터 셋에 재포함시키는 소프트웨어를 개발하는 것을 목표로 한다. 구현된 소프트웨어로 증폭된 대량의 데이터 셋을 다시 원본 학습 데이터 셋에 추가하고, 같은 영상에 대해서 원본 데이터 셋만 학습시킨 경우의 객체 검출 결과와 증폭된 학습 데이터 셋이 포함된 데이터 셋의 경우의 객체 검출 결과를 비교하여 그 성능을 검증하고 분석하도록 한다.

  • PDF

터널 콘크리트 라이닝 균열 분석을 위한 의미론적 분할 모델 학습 (Training a semantic segmentation model for cracks in the concrete lining of tunnel)

  • 함상우;배수현;김휘영;이임평;이규필;김동규
    • 한국터널지하공간학회 논문집
    • /
    • 제23권6호
    • /
    • pp.549-558
    • /
    • 2021
  • 터널과 지하시설물을 비롯한 콘크리트 토목구조물을 안전하게 관리하려면 균열 발생 여부를 정기적인 점검을 통해 알아내야 한다. 터널의 콘크리트 라이닝 표면에 발생한 균열의 위치와 형태를 검사하는 일은 주로 고소작업차를 투입하여 이루어진다. 이러한 작업은 차로를 통제한 채 이루어지므로 교통 체증을 일으키며, 점검 종사자가 위험한 환경에 노출되며, 매번 같은 종사자가 같은 터널의 같은 부위를 조사하기 어려우므로 검사 결과의 일관성이 저해된다. 본 연구는 기존 터널 영상 취득 시스템을 대상으로 딥러닝 기술을 적용해 터널 내 콘크리트 라이닝의 균열을 자동으로 탐지하는 방법을 다음과 같이 제시한다. 구체적으로는 의미론적 분할(semantic segmentation)을 수행하는 딥러닝 모델을 공개 데이터셋으로 학습시키고, 터널 영상 취득 시스템으로 취득한 데이터셋을 딥러닝 모델에 입력했을 때 성능을 알아본다. 첫 번째, 공개 데이터셋을 전부 학습시켰을 경우, 두 번째, 공개 데이터셋 중 기존 터널 영상 취득 시스템 데이터셋과 관련성이 높은 데이터셋만 선택하여 학습시켰을 경우, 마지막으로 관련성이 높은 데이터셋과 균열이 없는 영상(negative example)을 선택하여 학습시켰을 경우에 대하여 성능을 비교하여 효율적인 모델 학습 방안을 모색한다. 그 결과 공개 데이터셋에서 관련성이 높은 영상과 균열이 없는 영상을 골라 학습시켰을 경우의 성능이 가장 좋았다. 향후 딥러닝 알고리즘을 터널 영상 취득 시스템에 적용할 때 효율적인 모델 학습 방안을 수립하는데 기여할 것으로 기대한다.

얼굴 표정 인식을 위한 유전자 알고리즘 기반 심층학습 모델 최적화 (Optimization of Deep Learning Model Based on Genetic Algorithm for Facial Expression Recognition)

  • 박장식
    • 한국전자통신학회논문지
    • /
    • 제15권1호
    • /
    • pp.85-92
    • /
    • 2020
  • 심층학습은 많은 양의 데이터셋을 학습에 활용하여 객체 분류, 검출, 분할 등의 영상 분석에 탁월한 성능을 나타내고 있다. 본 논문에서는 데이터셋의 종류가 다양한 얼굴 표정인식 데이터셋들을 활용하여 학습 데이터셋의 특성이 심층학습 성능에 영향을 줄 수 있음을 확인하고, 각 학습 데이터셋에 적합한 심층학습 모델의 구성 요소를 설정하는 방법을 제안한다. 제안하는 방법은 심층학습 모델의 성능에 영향을 주는 구성 요소인 활성함수, 그리고 최적화 알고리즘을 유전 알고리즘을 이용하여 선정한다. CK+, MMI, KDEF 데이터셋에 대해서 널리 활용되고 있는 심층학습 모델의 각 구성 요소별 다양한 알고리즘을 적용하여 성능을 비교 분석하고, 유전 알고리즘을 적용하여 최적의 구성 요소를 선정할 수 있음을 시뮬레이션을 통하여 확인한다.

CycleGAN을 활용한 항공영상 학습 데이터 셋 보완 기법에 관한 연구 (A Study on the Complementary Method of Aerial Image Learning Dataset Using Cycle Generative Adversarial Network)

  • 최형욱;이승현;김형훈;서용철
    • 한국측량학회지
    • /
    • 제38권6호
    • /
    • pp.499-509
    • /
    • 2020
  • 본 연구에서는 최근 영상판독 분야에서 활발히 연구되고, 활용성이 발전하고 있는 인공지능 기반 객체분류 학습 데이터 구축에 관한 내용을 다룬다. 영상판독분야에서 인공지능을 활용하여 정확도 높은 객체를 인식, 추출하기 위해서는 알고리즘에 적용할 많은 양의 학습데이터가 필수적으로 요구된다. 하지만, 현재 공동활용 가능한 데이터 셋이 부족할 뿐만 아니라 데이터 생성을 위해서는 많은 시간과 인력 및 고비용을 필요로 하는 것이 현실이다. 따라서 본 연구에서는 소량의 초기 항공영상 학습데이터를 GAN (Generative Adversarial Network) 기반의 생성기 신경망을 활용하여 오버샘플 영상 학습데이터를 구축하고, 품질을 평가함으로써 추가적 학습 데이터 셋으로 활용하기 위한 실험을 진행하였다. GAN을 이용하여 오버샘플 학습데이터를 생성하는 기법은 딥러닝 성능에 매우 중요한 영향을 미치는 학습데이터의 양을 획기적으로 보완할 수 있으므로 초기 데이터가 부족한 경우에 효과적으로 활용될 수 있을 것으로 기대한다.

자동-레이블링 기반 영상 학습데이터 제작 시스템 (An Auto-Labeling based Smart Image Annotation System)

  • 이용;장래영;박민우;이건우;최명석
    • 한국콘텐츠학회논문지
    • /
    • 제21권6호
    • /
    • pp.701-715
    • /
    • 2021
  • 최근 딥러닝 기술의 급속한 발전과 함께 학습데이터가 크게 주목을 받고 있다. 일반적으로 딥러닝 방식에서는 모델을 훈련시키기 위해 충분한 학습데이터가 준비되어 있어야 한다. 하지만, 딥러닝 모델 설계 작업과 달리 데이터셋을 제작하는 데 상당한 시간과 노력이 필요하다. 영상 데이터를 주로 다루는 시각지능 분야에서도 학습데이터 제작자들은 전문적인 학습데이터 제작 도구를 사용해 이미지 단위로 레이블링을 수작업으로 하고 있어 여전히 많은 시간과 노력이 필요한 상황이다. 따라서, 다양한 분야에서 필요한 충분한 영상 학습데이터셋을 확보하기 위해 기존의 수작업 방식을 대체할 수 있는 레이블링 기술이 필요하다. 본 논문에서는, 영상 학습데이터셋 동향을 소개하고, 학습데이터 제작 환경에 대해 분석한다 특히, 수작업으로 이루어지는 반복적이고 수고스러운 레이블링 과정을 자동화하여, '확인과 수정'의 단계를 비약적으로 단축시킬 수 있는 '스마트 영상학습데이터 제작 시스템'을 제안한다. 그리고, 실험을 통해 영상 학습데이터 제작 과정에서 이미지에 박스형 및 폴리곤형 객체영역을 지정하여 레이블링하는 데 소요되는 시간을 크게 줄이기 위한 자동레이블링 방식의 효과를 검증한다. 마지막으로, 제안하는 시스템의 실험에서 추가적으로 검증되어야 하는 부분과 함께 이를 개선하기 위한 향후 연구 계획에 대해 논의한다.

다양한 조명 환경에 강인한 seven-segment OCR 방법 (Robust seven-segment OCR method for various illumination environments)

  • 김진성;노가은;남현길;박종일
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.235-238
    • /
    • 2022
  • 본 논문은 인식이 어려운 조명 환경에도 강인한 seven-segment 문자 인식을 위해서, 영상 내에 다양한 조명 연출이 가능하도록 합성 데이터 셋을 생성하고 학습할 수 있는 OCR 방법을 제안한다. 기존 연구에서는 deblurring 과 같이 영상 이미지의 해상도를 높여 문자 인식의 정확도를 향상시키는 것에 초점을 두었으나, 여러 조명 환경에 대비할 수 있는 OCR 관련 연구들은 부족하다. 이를 해결하기 위해 본 논문에서는 문자가 포함된 자연스러운 배경 영상에, seven-segment 문자를 합성시킨 후 relighting 을 적용함으로써 실제 환경과 유사한 장면을 연출해 새로운 합성 데이터 셋을 생성한다. 그리고 생성된 데이터 셋을 딥러닝 기반 학습시켜 다양한 조명에도 강인한 문자 인식기를 만들고자 한다. 합성 데이터 셋의 사용여부와 일반적인 데이터 augmentation 기법의 사용 여부를 비교하여, 본 논문에서 제안한 방법의 효과를 확인할 수 있었다. 이를 통해서 seven-segment 문자 인식 뿐만 아니라, 다양한 문자에 대해서도 적용될 수 있는 초석이 될 것으로 기대된다.

  • PDF

인공지능 학습용 토공 건설장비 영상 데이터셋 구축 및 타당성 검토 (Building-up and Feasibility Study of Image Dataset of Field Construction Equipments for AI Training)

  • 나종호;신휴성;이재강;윤일동
    • 대한토목학회논문집
    • /
    • 제43권1호
    • /
    • pp.99-107
    • /
    • 2023
  • 최근 건설 현장의 안전사고 비율은 전체 산업에서 가장 높은 비중을 차지한다. 인공지능 기술을 건설 현장에 접목하기 위해서는 기초 학습 자료로 활용될 수 있는 데이터셋 확보가 필수적이다. 본 논문에서는 실제 현장 확보를 통해 원천 데이터를 수집하였으며, 토목 현장에서 주로 운용되고 있는 주요 건설장비 객체를 선정하고 약 9만장의 정지영상 데이터셋 가공을 통해 최적의 학습 데이터셋 구축을 완료하였다. 또한, 객체 인식분야의 대표적인 모델인 YOLO를 활용하여 구축된 데이터의 검증 작업을 수행하였고 90 % 근접한 검출 성능을 확인해 데이터 신뢰성을 확보하였다. 본 연구에서 사용되는 학습 데이터셋은 공공데이터포털에서 활용 가능하도록 공개를 완료하였다. 본 데이터셋은 향후 건설안전 분야의 객체 인식 기술의 건설현장 적용을 위한 기반 데이터로 활용 가능하리라 판단된다.