• 제목/요약/키워드: 이미지 학습

검색결과 1,382건 처리시간 0.027초

전이학습 기반 황반변성 진단모델의 개발 (Development of A Macular Degeneration Predictive Model Based on Transfer Learning)

  • 김경민;오세종
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.43-45
    • /
    • 2022
  • 본 논문은 황반변성 진단 모델 개발을 위해 안저 사진을 이용한 MobileNet2 전이학습 모델 개발과 안정적인 모델 성능을 위한 이미지 증강 방법 및 모델 성능 향상을 위한 파라미터 조정 방법을 제안한다. 보유하고 있는 이미지의 수가 매우 적다고 하더라도 적절한 전이학습 모델을 사용하고 이미지 증강 시 증강 방법과 증강한 이미지와 정상 이미지와의 비율을 적절히 고려할 경우 충분히 안정적인 결과를 얻어낼 수 있다. 또한 파라미터 조정을 통해서 성능 향상을 도모할 수 있다

영상 분할을 활용한 화학 구조 문서 이해 (Understanding Documents With Chemical Structures Using Image Segmentation)

  • 양혜윤;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1297-1300
    • /
    • 2022
  • Document layout analysis는 문서 이미지의 구조와 구성요소를 파악하는 기술이다. 기존 딥러닝을 사용한 학습 기반 방법에는 각 구성 요소를 검출하는 detection 기반 방식이 많으나 이는 다양한 형식의 문서 이미지에 확장될 수 있는 가능성이 낮다는 한계가 존재한다. 특히, 다양한 모양과 크기의 화학 구조를 포함하는 화학 문서 이미지에 적용하기 어렵다. 본 논문에서는 영상분할을 활용하여 화학 구조 문서를 이해하는 연구를 진행하였다. 기존의 블록 단위로 레이블링된 벤치마크와 다르게 객체 단위로 레이블링한 학습 데이터를 가지고 DeepLabv3 구조의 네트워크를 학습하여 화학 문서 이미지를 효과적으로 분할하였다. 객체 단위 레이블링과 영상 분할을 사용한 방식이 문서 이해 및 화학 구조 검출에 준수한 성능을 보이는 것을 확인하였고 이 방식이 다양한 형식의 문서 이미지에 확장될 수 있음을 보였다.

  • PDF

이미지 분석을 위한 퓨샷 학습의 최신 연구동향 (Recent advances in few-shot learning for image domain: a survey)

  • 석호식
    • 전기전자학회논문지
    • /
    • 제27권4호
    • /
    • pp.537-547
    • /
    • 2023
  • 퓨삿학습(few-shot learning)은 사전에 확보한 관련 지식과 소규모의 학습데이터를 이용하여 학습데이터의 부족으로 인한 어려움을 해결할 수 있는 가능성을 제시해주어 최근 많은 주목을 받고 있다. 본 논문에서는 퓨삿학습의 개념과 주요 접근방법을 빠르게 파악할 수 있도록 데이터 증강, 임베딩과 측도학습, 메타학습의 세 관점에서 최신연구동향을 설명한다. 또한 퓨샷학습을 적용하려는 연구자들에게 도움을 제공할 수 있도록 주요 벤치마크 데이터셋에 대하여 간략하게 소개하였다. 퓨삿학습은 이미지 분석과 자연어 처리 등 다양한 분야에서 활용되고 있으나, 본 논문은 이미지 처리를 위한 퓨삿학습의 접근법에 집중하였다.

Multi Cycle Consistent Adversarial Networks for Multi Attribute Image to Image Translation

  • Jo, Seok Hee;Cho, Kyu Cheol
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권9호
    • /
    • pp.63-69
    • /
    • 2020
  • 이미지-이미지 변환은 입력 이미지를 통해서 목적 이미지를 만들어내는 기술로 최근 비지도 학습 구조인 GAN을 활용하여 더 실제와 같은 이미지를 만들어내는 높은 성과를 보였다. 이에 따라 GAN을 활용한 이미지-이미지 변환 연구는 다양하게 진행되고 있다. 이때 일반적으로 이미지-이미지 변환은 하나의 속성 변환을 목표한다. 그러나 실제 생활에서 사용되고 얻을 수 있는 자료들은 한 가지 특징으로 설명하기 힘든 다양한 특징으로 이루어진다. 그래서 다양한 속성을 활용하기 위하여 속성별로 이미지 생성 과정을 나누어 학습할 수 있도록 하는 다중 속성 변화를 목표로 한다면 더 이미지-이미지 변환의 역할을 잘 수행할 수 있을 것이다. 본 논문에서는 GAN을 활용한 이미지-이미지 변환 구조 중 높은 성과를 보인 CycleGAN을 활용해 이중 속성 변환 구조인 Multi CycleGAN을 제안한다. 이 구조는 입력 도메인을 두 가지의 속성에 대하여 학습하기 위하여 3개의 도메인이 양방향 학습을 진행하는 이중 변환 구조를 구현하였다. 새로운 구조를 통해 생성된 이미지와 기존 이미지-이미지 변환 구조들을 통해 생성된 이미지를 비교할 수 있도록 실험을 진행하였다. 실험 결과 새로운 구조를 통한 이미지는 입력 도메인의 속성을 유지하며 목표한 속성이 적용되는 높은 성능을 보였다. 이 구조를 활용한다면 앞으로 더 다양한 이미지를 생성하는 일이 가능지기 때문에 더 다양한 분야에서의 이미지 생성의 활용을 기대할 수 있다.

패턴인식을 이용한 콘크리트침목의 자동균열검출 알고리즘 개발 (Development of Automatic Crack Identification Algorithm for a Concrete Sleeper Using Pattern Recognition)

  • 김민수;김경호;최상현
    • 한국철도학회논문집
    • /
    • 제20권3호
    • /
    • pp.374-381
    • /
    • 2017
  • 국내 대부분의 선구에 부설된 콘크리트침목은 적절히 유지관리되지 않을 경우 열차 운행의 안전성을 심각하게 위협하는 요소가 될 수 있다. 이 연구에서는 최근 가장 강력한 적응성(adaptive)을 갖는 기법으로 활용 범위를 넓히고 있는 Adaboost를 이용하여 고해상도카메라로 촬영한 침목이미지에서 균열을 자동검출할 수 있는 알고리즘을 개발하였다. 개발된 알고리즘은 실제 침목에 발생한 균열 및 비균열 이미지를 분석한 후 도출한 균열특징을 이용하여 학습하였다. 침목균열 자동검출 알고리즘의 적용성은 48개의 학습이미지와 11개의 비학습이미지를 이용하여 검토하였다. 검토 결과 학습이미지와 비학습이미지 모두 균열폭과 균열길이에 대한 인식률이 90% 이상으로 나타났으며, 충분한 균열인식 성능을 갖는 것으로 나타났다.

AI 개발을 위한 노 코드 플랫폼의 개발 방향 (The direction of development of the no code platform for AI model development)

  • 신유진;양희진;장다영;장현준;고석주;한동희
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.172-175
    • /
    • 2021
  • 4차 산업혁명이 시작된 이래로 다양한 산업 분야에서 AI가 활용되고 있고, 그 중에서도 컴퓨터 비전 분야에서 딥러닝 기술이 각광받고 있다. 하지만 딥러닝 기술은 높은 전문 지식이 요구되어 관련 지식이 없는 일반인들은 활용하기 어렵다. 본 논문에서는 AI 관련 배경지식이 없는 사용자들도 UI를 통해 쉽게 이미지 분류 모델을 학습시킬 수 있는 노 코드 플랫폼에 관하여 기술하고, django 프레임워크를 이용해 웹 개발과 딥러닝 모델 학습을 통합 개발을 위한 아키텍처와 방향성을 제시하고자 한다. 사용자가 웹서버에 업로드한 이미지들을 웹 인터페이스를 통해 라벨링 하여 학습 데이터를 생성한 후, 이 데이터를 사용하여 모델을 학습시킨다. CNN 모델에 데이터를 학습시키는 과정과 생성된 모델 기반으로 이미지 예측하는 모듈을 통해 전문지식이 없는 사용자가 딥러닝 기술에 대해 쉽게 이해하고 이용하는 것을 기대할 수 있다.

  • PDF

전이학습을 이용한 전반사가 있는 월패드 분류 (Glaring Wall Pad classification by transfer learning)

  • 이용준;조근식
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.35-36
    • /
    • 2021
  • 딥러닝을 이용한 이미지 처리에서 데이터 셋이 반드시 필요하다. 월패드는 널리 보급되는 다양한 성능을 포함한 IoT가전으로 그 기능의 사용을 돕기 위해서는 해당 월패드에 해당하는 매뉴얼을 제공해야 하고 이를 위해 딥러닝을 이용한 월패드 분류를 이용 할 수 있다. 하지만 월패드 중 일부 모델은 화면의 전반사가 매우 심해 기존의 작은 데이터 셋으로는 딥러닝을 이용한 이미지 분류 성능이 좋지 못하다. 본 논문은 이를 해결하기 위해 추가적으로 데이터 셋을 구축하고 이를 이용해 대규모 데이터로 사전 학습된 VGG16, VGG19, ResNet50, MobileNet 등을 이용해 전이학습을 통해 월패드를 분류한다.

  • PDF

Re-Destyle: 개선된 Facial Destylization 을 활용한 예시 기반 신경망 스타일 전이 연구 (Re-Destyle: Exemplar-Based Neural Style Transfer using Improved Facial Destylization)

  • 유주원
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1339-1342
    • /
    • 2022
  • 예술적 스타일 전이는 예술 작품이 지닌 특징을 다른 이미지에 적용하는 이미지 처리의 오랜 화두 중 하나로, 최근에는 StyleGAN 과 같이 미리 학습된 GAN(생성적 적대 신경망)을 통해 제한된 데이터로도 고해상도의 예술적 초상화를 생성하도록 학습하는 연구가 다양한 방면에서 성과를 내고 있다. 본 논문에서는 2 가지 경로의 StyleGAN과 Facial Destylization 을 통해 고해상도의 예시 기반 스타일 전이를 달성한 DualStyleGAN 연구에 대해 소개하고, 기존 연구에서 사용된 Facial Destylization 방법이 지닌 한계점을 분석한 뒤, 이를 개선한 새로운 방법, Re-Destyle을 제안한다. 새로운 Re-Destyle 방법으로 Facial Destylization 을 적용할 경우 학습 시간을 기존 연구의 방법보다 20 배 이상 개선할 수 있으며 그 결과 1000 개 이하의 적은 데이터와 1~2 시간의 추가 학습만으로도 원하는 타겟 초상화 스타일에 대해 1024×1024 수준의 고해상도의 예시 기반 초상화 스타일 전이 및 이미지 생성 모델을 학습할 수 있다.

  • PDF

Xception 모델링을 이용한 욕창이미지 크기별 비교분석 (Comparative analysis by pressure ulcer image size using Xception modeling)

  • 서진범;유하나;조영복
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.19-20
    • /
    • 2023
  • 전이학습은 영상 분류를 진행한 모델을 사용하여 다른 종류의 영상 분류에 적용하여 문제를 푸는 것을 의미하며, 모델 설계부터 진행한 학습 모델보다 빠른 속도와 높은 정확도를 달성할 수 있다. 또한, 적은 데이터셋에 대하여 학습을 진행하여 좋은 결과를 도출할 수 있는 장점이 존재한다. 본 논문에서는 전이학습으로 사용되는 모델 중 Xception 모델을 사용하며, 욕창 이미지의 모델 입력 크기를 256, 512, 1024의 크기로 설정하여 학습을 진행 후 욕창 이미지 크기별 성능을 비교분석을 진행하고자 한다.

  • PDF

내용 정보를 이용한 이미지 자동 태깅 (Automatic Annotation of Image using its Content)

  • 장현웅;조수선
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2015년도 춘계학술발표대회
    • /
    • pp.841-844
    • /
    • 2015
  • 이미지 인식과 내용분석은 이미지 검색과 멀티미디어 데이터 활용 분야에서 핵심기술이라 할 수 있다. 특히 최근 스마트폰, 디지털 카메라, 블랙박스 등에서 수집되는 영상 데이터 양이 급격히 증가하고 있다. 이에 따라 이미지를 인식하고 내용을 분석하여 활용할 수 있는 기술에 대한 요구가 점차 증대되고 있다. 본 논문에서는 이미지 내용정보를 이용하여 자몽으로 이미지로부터 태그정보를 추출하는 방법을 제안한다. 이 방법은 기계학습 기법인 CNN(Convolutional Neural Network)에 ImageNet의 이미지 데이터와 라벨을 학습시킨 후, 새로운 이미지로부터 라벨정보를 추출하는 것이다. 추출된 라벨을 태그로 간주하고 검색에 활용한다면 기존 검색시스템의 정확도를 향상시킬 수 있다는 것을 실험을 통하여 확인하였다.