• 제목/요약/키워드: 이미지 학습

검색결과 1,404건 처리시간 0.033초

이미지 복원을 위한 네트워크 파라미터의 동적 업데이트를 위한 기법

  • 김태현
    • 방송과미디어
    • /
    • 제25권2호
    • /
    • pp.27-35
    • /
    • 2020
  • 최근 많은 연구 결과물에서 빅데이터를 이용하여 학습된 뉴럴 네트워크가 영상 내 노이즈를 제거하는데 매우 효과적임이 입증되었다. 여기에서 한 걸음 더 나아가, 입력으로 주어진 노이즈가 있는 영상의 특징을 분석하여, 사전에 학습된 네트워크의 파라미터를 테스트 타임에 동적으로 업데이트함으로써 주어진 입력 영상을 더욱 잘 처리할 수 있도록 하는 연구들이 시도되고 있다. 본 원고에서는 이와 같이 테스트 타임에 주어지는 입력 영상을 네트워크 학습에 사용하는(self-supervision) 이미지 복원 기법들을 소개한다. 다음으로, 기존의 self-supervision을 이용하는 기법들 대비 학습 효율성과 정확도를 더욱 향상시킬 수 있는 새로운 형태의 네트워크 파라미터 업데이트 기법을 설명하고, 제안하는 기법의 우수성을 다양한 실험 결과를 통해 분석 및 입증한다.

의미 분석법에 의한 공과대학 신입생의 물리 이미지 및 관심 여부 (Physics Image Analysis by Sematic Method and Interest in Physics of Freshman Students in the Engineering College)

  • 송영욱
    • 과학교육연구지
    • /
    • 제44권2호
    • /
    • pp.214-224
    • /
    • 2020
  • 물리 이미지 및 관심은 물리 학습에 영향을 미치는 요인 중에 하나이다. 공과대학 신입생은 고등학교 때에 다양한 학습 환경 조건에서 대학에 입학한다. 대학 물리교육을 위하여 공과대학 신입생의 특성에 따른 물리 이미지 및 관심을 조사할 필요가 있다. 이 연구는 공과대학 신입생의 성별과 고등학교 때 물리 이수 여부에 따른 물리 이미지와 관심 여부를 조사하여, 공과대학 학생의 대학 물리 학습에 대한 교육적 시사점을 논의한다. 연구 대상은 공과대학 1학년 공과 계열 286명, 정보기술 계열 242명, 건설환경 계열 136명 총 664명이다. 분석 내용은 공과대학 신입생의 성별과 고등학교 때 물리 이수 여부에 따른 물리 이미지 및 관심 여부를 분석한다. 분석결과 첫째, 물리 이미지는 공과대학 신입생의 물리 이수 여부에 따라 유의미한 차이가 나타났다. 고등학교 때 물리를 배우지 않은 학생의 물리 이미지 점수가 물리I 또는 물리I,II를 배운 학생보다 높게 나타났다. 둘째, 물리 관심 여부는 성별과 물리 이수 여부에 따라 유의미한 차이가 나타났다. 성별에서는 남학생이 여학생보다 물리 관심이 높았고 고등학교 때 물리 이수 여부에서는 고등학교 때 물리를 이수하지 않은 학생이 물리를 이수한 학생보다 물리 관심이 높았다. 끝으로 공과대학 학생의 대학 물리 학습에 대한 교육적 시사점을 논의한다.

컨볼루션 오토인코더를 이용한 마스크 착용 얼굴 이미지 생성 (Generation of Masked Face Image Using Deep Convolutional Autoencoder)

  • 이승호
    • 한국정보통신학회논문지
    • /
    • 제26권8호
    • /
    • pp.1136-1141
    • /
    • 2022
  • 코로나19 팬데믹으로 인해 마스크 착용이 일상화되면서 마스크 착용 얼굴을 식별하는 얼굴인식 연구에 대한 중요도가 높아지고 있다. 안정된 얼굴인식 성능을 위해서는 인식 대상에 대한 풍부한 학습용 이미지 확보가 필요하지만 인물 별로 마스크 착용 얼굴 이미지를 다량 확보하는 것은 쉽지 않다. 본 논문에서는 마스크 미착용 얼굴 이미지에 가상의 마스크 패턴을 합성하는 새로운 방법을 제안한다. 제안 방법은 동일 인물에 대해 마스크 미착용 얼굴 이미지와 마스크 착용 얼굴 이미지를 쌍으로 컨볼루션 오토인코더에 입력하여 얼굴과 마스크의 기하학적 관계를 학습한다. 학습이 완료된 컨볼루션 오토인코더는 학습에 사용되지 않은 새로운 마스크 미착용 얼굴 이미지에 가상의 마스크 패턴을 자연스러운 형태로 합성해준다. 제안 방법은 고속으로 대량의 마스크 착용 얼굴 이미지를 생성할 수 있으며, 얼굴 특징점 추출에 기반하는 마스크 합성 방법에 비해 실용적이다.

얼굴 마스크 정보를 활용한 다중 속성 얼굴 편집 (Multi-attribute Face Editing using Facial Masks)

  • ;박인규;홍성은
    • 방송공학회논문지
    • /
    • 제27권5호
    • /
    • pp.619-628
    • /
    • 2022
  • 얼굴 인식 및 얼굴 생성이 다양한 분야에서 큰 주목을 받고 있지만, 얼굴 이미지를 모델 학습에 사용하는데 따른 개인 정보 문제는 최근 큰 문제가 되고 있다. 본 논문에서는 소수의 실제 얼굴 이미지와 안면 마스크 정보로부터 다양한 속성을 가진 얼굴 이미지를 생성함으로써 개인 정보 침해 이슈를 줄일 수 있는 얼굴 편집 네트워크를 제안한다. 다수의 실제 얼굴 영상을 이용하여 얼굴 속성을 학습하는 기존의 방법과 달리 제안하는 방법은 얼굴 분할 마스크와 얼굴 부분 텍스처 영상을 스타일 정보로 사용하여 새로운 얼굴 이미지를 생성한다. 이후 해당 이미지는 각 참조 이미지의 스타일과 위치를 학습하기 위한 훈련에 사용된다. 제안하는 네트워크가 학습되면 소수의 실제 얼굴 영상과 얼굴 분할 정보만을 사용하여 다양한 얼굴 이미지를 생성할 수 있다. 실험에서 제안 기법이 실제 얼굴 이미지를 매우 적게 사용함에도 불구하고 새로운 얼굴을 생성할 뿐만 아니라 얼굴 속성 편집을 지역화하여 수행할 수 있음을 보인다.

Attentional View Pooling을 이용한 조립 부품 이미지 기반 3 차원 물체 검색 (Assembly Part Image-based 3D Shape Retrieval using Attentional View Pooling)

  • 이은지;강이삭;김민우;박선지;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.72-75
    • /
    • 2020
  • 조립 부품 이미지에 해당하는 3D CAD 모델 매칭 기술은 최근 로봇 조립 기술의 발전으로 필요성이 대두되고 있다. 이미지 기반 3 차원 모델 매칭 연구는 진행되어 왔지만 가구 부품 이미지와는 특성이 다른 RGB[5] 이미지나 스케치 이미지를 다루는[1] 접근들이었다. 딥러닝을 사용하는 스케치 이미지 기반 3 차원 물제 검색 연구에서는 대부분 3 차원 이미지를 다각도에서 렌더링한 view 이미지들에서 feature를 추출하고 pooling 하여 하나의 feature를 출력한다. 그러나 기존의 view pooling 방식은 단순한 평균 방식으로, 부품 이미지에 따른 view를 반영하기에는 한계가 있었다. 따라서 본 논문에서는 조립 부품 이미지 기반 3 차원 물체 검색을 위해 query 부품 이미지에 따라 다른 view 이미지에 집중할 수 있는 방식의 attentional view pooling을 제안한다. 또한 조립 부품 데이터의 특성 상 class 당 CAD 모델이 하나인 상황이므로 학습 데이터가 터무니없이 부족하여 이를 해결하기 위한 학습 데이터 증강 방법을 제안한다. 실험은 의자 부품 11가지에 대해 진행하였고 이를 통해 제안하는 방식의 성능을 입증하였다.

  • PDF

심층 신경망 검색 기법을 통한 이미지 고해상도화 (Image Super Resolution Using Neural Architecture Search)

  • 안준영;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2019년도 추계학술대회
    • /
    • pp.102-105
    • /
    • 2019
  • 본 논문에서는 심층 신경망 검색 방법을 사용하여 이미지 고해상도화를 위한 심층 신경망을 설계하는 방법을 구현하였다. 일반적으로 이미지 고해상도화, 잡음 제거 및 번짐 제거를 위한 심층신경망 구조는 사람이 설계하였다. 최근에는 이미지 분류 등 다른 영상처리 기법에서 사용하는 심층 신경망 구조를 검색하기 위한 방법이 연구되었다. 본 논문에서는 강화학습을 사용하여 이미지 고해상도화를 위한 심층 신경망 구조를 검색하는 방법을 제안하였다. 제안된 방법은 policy gradient 방법의 일종인 REINFORCE 알고리즘을 사용하여 심층 신경망 구조를 출력하여 주는 제어용 RNN(recurrent neural network)을 학습하고, 최종적으로 이미지 고해상도화를 잘 실현할 수 있는 심층 신경망 구조를 검색하여 설계하였다. 제안된 심층 신경망 구조를 사용하여 이미지 고해상도화를 구현하였고, 약 36.54dB 의 피크 신호 대비 잡음 비율(PSNR)을 가지는 것을 확인할 수 있었다.

  • PDF

효율적인 옷감 모델링을 위한 경계 합성곱 신경망 기반의 이미지 슈퍼 해상도 기법 (Efficient Cloth Modeling Using Boundary CNN based Image Super-Resolution Method)

  • 김종현;김동희
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2020년도 제62차 하계학술대회논문집 28권2호
    • /
    • pp.425-428
    • /
    • 2020
  • 본 논문에서는 경계 합성곱 신경망(Convolutional neural network, CNN)기반의 슈퍼 해상도 기법을 이용하여 저해상도 옷감 메쉬를 슈퍼 해상도로 노이즈 없이 안정적으로 표현할 수 있는 기법을 제안한다. 저해상도와 고해상도 메쉬들 간의 쌍은 옷감 시뮬레이션을 통해 얻을 수 있으며, 이렇게 얻어진 데이터를 이용하여 고해상도-저해상도 데이터 쌍을 설정한다. 학습할 때 사용되는 데이터는 옷감 메쉬를 지오메트리 이미지로 변환하여 사용한다. 우리가 제안하는 경계 합성곱 신경망은 저해상도 이미지를 고해상도 이미지로 업스케일링 시키는 이미지 합성기를 학습시키기 위해 사용된다. 테스트 결과로 얻어진 고해상도 이미지가 고해상도 메쉬로 다시 변환되면, 저해상도 메쉬에 비해 주름이 잘 표현되며, 경계 부근에서 나타나는 노이즈 문제가 완화된다. 합성 결과에 대한 성능으로는 전통적인 물리 기반 시뮬레이션보다 약 10배 정도 빠른 성능을 보여준다.

  • PDF

가사의 감정 분석을 이용한 GAN 기반 댄스 공연 배경 생성 방법 (GAN-based Dance Performance Visual Background Generation Method using Emotion Analysis on Lyrics)

  • 윤혜원;곽정훈;성연식
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.530-531
    • /
    • 2020
  • 최근 인공지능을 활용하여 예술 작품에 몰입할 수 있도록 무대 효과를 디자인하는 연구가 진행되고 있다. 무대 효과 중에서 무대 배경은 공연의 분위기를 형성한다. 춤의 장르별로 무대 배경에 사용되는 이미지를 생성하기 위해 소셜 미디어 기반 무대 배경 생성 시스템이 있다. 하지만 같은 장르 춤은 동일한 무대 배경 이미지가 제공되는 문제가 있다. 같은 장르의 춤이지만 노래의 분위기를 반영하여 차별된 무대 배경 이미지를 제공하는 것이 필요하다. 본 논문은 노래 가사의 감정을 활용하여 Generative Adversarial Network(GAN)을 통해 각 노래의 분위기를 고려한 무대 배경 이미지를 생성하는 방법을 제안한다. GAN은 노래에 포함된 단락별 감정 단어를 추출하여 스타일을 생성하도록 학습된다. 학습된 GAN은 노래 가사에 포함된 감정 단어를 활용하여 곡의 분위기를 반영한 무대 배경 이미지를 생성한다. 노래 가사를 고려하여 무대 배경 이미지를 생성함으로써 곡의 분위기가 고려된 무대 배경 이미지 생성이 가능하다.

이질적 이미지의 딥러닝 분석을 위한 적대적 학습기반 이미지 보정 방법론 (Adversarial Learning-Based Image Correction Methodology for Deep Learning Analysis of Heterogeneous Images)

  • 김준우;김남규
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권11호
    • /
    • pp.457-464
    • /
    • 2021
  • 빅데이터 시대의 도래는 데이터에서 스스로 규칙을 배우는 딥러닝의 비약적인 발전을 가능하게 하였으며, 특히 CNN 알고리즘이 거둔 성과는 모델의 구조를 넘어 소스 데이터 자체를 조정하는 수준에 이르렀다. 하지만 기존의 이미지 처리 방법은 이미지 데이터 자체를 다룰 뿐, 해당 이미지가 생성된 이질적 환경을 충분히 고려하지 않았다. 이질적 환경에서 촬영된 이미지는 동일한 정보임에도 촬영 환경에 따라 각 이미지의 특징(Feature)이 상이하게 표현될 수 있다. 이는 각 이미지가 갖는 상이한 환경 정보뿐 아니라 이미지 고유의 정보조차 서로 상이한 특징으로 표현되며, 이로 인해 이들 이미지 정보는 서로 잡음(Noise)으로 작용해 모델의 분석 성능을 저해할 수 있음을 의미한다. 따라서 본 논문은 이질적 환경에서 생성된 이미지 데이터들을 동시에 사용하는 앤드-투-앤드(End-To-End) 구조의 적대적 학습(Adversarial Learning) 기반의 이미지 색 항상성 모델 성능 향상 방안을 제안한다. 구체적으로 제안 방법론은 이미지가 촬영된 환경인 도메인을 예측하는 '도메인 분류기'와 조명 값을 예측하는 '조명 예측기'의 상호 작용으로 동작하며, 도메인 분류의 성능을 떨어뜨리는 방향의 학습을 통해 도메인 특성을 제거한다. 제안 방법론의 성능을 평가하기 위해 이질적 환경에서 촬영된 이미지 데이터 셋 7,022장에 대한 색 항상성 실험을 수행한 결과, 제안 방법론이 기존 방법론에 비해 Angular Error 측면에서 우수한 성능을 나타냄을 확인하였다.

딥러닝 기반 CCTV 화재 감지 시스템 (Deep Learning Based CCTV Fire Detection System)

  • 임지현;박현호;이원재;김성현;이용태
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 추계학술대회
    • /
    • pp.139-141
    • /
    • 2017
  • 화재는 다른 재난보다 확산 속도가 빠르기 때문에 신속하고 정확한 감지와 지속적인 감시가 요구된다. 최근, 신속하고 정확한 화재 감지를 위해, CCTV(Closed-Circuit TeleVision)으로 획득한 이미지를 기계학습(Machine Learning)을 이용해 화재 발생 여부를 감지하는 화재 감지 시스템이 주목받고 있다. 본 논문에서는 기계학습의 기술 중 정확도가 가장 높은 딥러닝(Deep Learning)기반의 CCTV 화재 감지 시스템을 제안한다. 본 논문의 시스템은 딥러닝 기술 적용뿐만이 아니라, CCTV 이미지 전처리 과정을 보완함으로써 딥러닝에서의 미지 데이터(unseen data)의 낮은 분류 정확도 문제인 과적합(overfitting)문제를 해결하였다. 본 논문의 시스템은 약 80,000 개의 CCTV 이미지 데이터를 학습하여, 90% 이상의 화재 이미지 분류 정확도의 성능을 보여주었다.

  • PDF