• 제목/요약/키워드: Gan

검색결과 864건 처리시간 0.028초

GAN 알고리즘을 이용한 음악 생성 (Music Generation using Generative Adversarial Network)

  • 임홍갑;이성연;심재헌;이세훈
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2018년도 제58차 하계학술대회논문집 26권2호
    • /
    • pp.397-398
    • /
    • 2018
  • 본 논문에서는 음악 전공자가 아니어도 원하는 악기를 선택하여 손쉽게 자신의 음악을 만들 수 있는 GAN(Generative Adversarial Network) 알고리즘 기반 음악생성 프로그램을 개발하였다. 음악분야는 진입장벽이 높아 음악 전공자가 아니면 자신만의 음악을 제작하기 힘들다. 행사나 소소한 이벤트에서도 쓸 수 있는 자신만의 음악, 방송이나 1인 미디어 등에서도 저작권 걱정 없이 쓸 수 있는 자신만의 음악을 이 GAN 알고리즘 기반 음악생성 프로그램을 이용하여 비전공자라도 손쉽게 음악을 만들 수 있다.

  • PDF

심층 GAN을 이용한 이미지 완성 어플리케이션 (A application for Image completion with Deep GAN)

  • 조상현;김종득
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2017년도 추계학술발표대회
    • /
    • pp.774-777
    • /
    • 2017
  • 사진에는 의도하지 않은 노이즈나 찍는 과정 중에 발생한 실수나 문제로 원치 않게 가려진 부분이 있을 수 있는데, 이미지 완성 어플리케이션은 사용자가 전문적인 프로그램이나 전문가의 도움 없이 노이즈나 가려진 부분을 제거할 수 있도록 하였다. 본 논문에서는 GAN(Generative Adversial Network) 모델에 노이즈가 있는 사진을 입력으로 넣어 노이즈가 제거 된 사진을 생성하도록 하였고, 생성 된 사진과 기존 이미지가 자연스럽게 합성 될 수 있도록 보정을 하여 완성 된 이미지를 출력하는 어플리케이션을 제안한다. GAN 분류 모델의 시그모이드 교차-엔트로피와 생성이미지와 원본이미지간의 평균 제곱 오차를 함께 최소화 하도록 생성 모델을 학습시켰고, 낮은 평균 제곱 오차를 가지는 완성 이미지를 생성 할 수 있었다. 이미지 보정을 통해 생성 된 이미지와 입력 이미지와의 밝기 차이를 해소시켜 좀 더 자연스러운 완성 이미지 결과를 얻을 수 있었다.

생성적 적대 신경망(GAN)을 이용한 한국어 문서에서의 문맥의존 철자오류 교정 (Context-Sensitive Spelling Error Correction Techniques in Korean Documents using Generative Adversarial Network)

  • 이정훈;권혁철
    • 한국멀티미디어학회논문지
    • /
    • 제24권10호
    • /
    • pp.1391-1402
    • /
    • 2021
  • This paper focuses use context-sensitive spelling error correction using generative adversarial network. Generative adversarial network[1] are attracting attention as they solve data generation problems that have been a challenge in the field of deep learning. In this paper, sentences are generated using word embedding information and reflected in word distribution representation. We experiment with DCGAN[2] used for the stability of learning in the existing image processing and D2GAN[3] with double discriminator. In this paper, we experimented with how the composition of generative adversarial networks and the change of learning corpus influence the context-sensitive spelling error correction In the experiment, we correction the generated word embedding information and compare the performance with the actual word embedding information.

Frontal Face Generation Algorithm from Multi-view Images Based on Generative Adversarial Network

  • Heo, Young- Jin;Kim, Byung-Gyu;Roy, Partha Pratim
    • Journal of Multimedia Information System
    • /
    • 제8권2호
    • /
    • pp.85-92
    • /
    • 2021
  • In a face, there is much information of person's identity. Because of this property, various tasks such as expression recognition, identity recognition and deepfake have been actively conducted. Most of them use the exact frontal view of the given face. However, various directions of the face can be observed rather than the exact frontal image in real situation. The profile (side view) lacks information when comparing with the frontal view image. Therefore, if we can generate the frontal face from other directions, we can obtain more information on the given face. In this paper, we propose a combined style model based the conditional generative adversarial network (cGAN) for generating the frontal face from multi-view images that consist of characteristics that not only includes the style around the face (hair and beard) but also detailed areas (eye, nose, and mouth).

GAN 을 이용한 압축된 동영상 품질 향상 (GAN-based Quality Enhancement of Compressed Video)

  • 김용성;이유진;김범윤;전병우
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 추계학술대회
    • /
    • pp.191-192
    • /
    • 2022
  • 본 논문에서는 딥러닝의 주요 기법 중 하나인 GAN 을 활용하여 압축된 영상의 품질을 개선하는 방법을 제안한다. 제안하는 GAN 의 생성자는 U-Net 과 ResNet 을 기반으로 구성되었으며, 판별자는 합성곱층과 전연결층으로 구성하였다. 네트워크의 학습은 HEVC (High Efficiency Video Coding)의 테스트 모델인 HM16.25 를 사용하여 RA (Random Access) 구성하에 양자화 계수 37 로 압축된 영상을 입력으로 하여 수행되었다. 제안하는 네트워크의 성능 확인을 위해 학습 시와 동일한 조건으로 압축된 다른 영상을 입력으로 하여 실험하였다. 실험 결과 영상의 평균 PSNR 은 34.20dB 에서 34.24dB 로 0.04dB 의 품질 향상이 이루어진 것을 확인할 수 있었다.

  • PDF

GAN 모델을 이용한 배터리 셀 불량 분석 기법에 관한 연구 (A Study on the Battery Cell Defect Analysis Method Using the GAN Model)

  • 김제연;박한규;윤혜수;강선경
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.168-169
    • /
    • 2022
  • 전기차 시장이 급격하게 성장함에 따라 배터리 시장의 크기도 그에 따라 기하급수적으로 커지고 있다. 전기차에 탑재되는 배터리에 대한 품질 제어 기술의 발전 속도와 배터리 양산화 속도의 괴리로 인해 배터리에 대한 많은 내구성 문제가 발생하고 있다. 대다수 사고는 전기적 요인에 발생하나 이를 신속하게 검사할 수 있는 기술이 존재하지 않는다. 본 논문에서는 GAN 모델을 이용해 배터리 셀의 불량을 신속하게 분석하는 방법에 대해 제안하려 한다.

  • PDF

CycleGAN을 이용한 인터랙티브 웹페이지 (Interactive Web using CycleGAN)

  • 김지원;정해정;김동호
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.280-282
    • /
    • 2021
  • 최근에 딥러닝 기술인 GAN (Generative Adversarial Networks) 연구는 Image-to-Image translation 분야에서 활발하게 이뤄지고 있다. 이러한 기술을 바탕으로 사용자에게 편의와 재미를 제공하는 서비스가 애플리케이션 및 웹사이트의 형태로 개발되고 있다. 이에 본 논문은 CycleGAN 모델을 사용하여 이미지를 변환하고, 이를 인터랙티브 웹페이지를 통해 사용자와 실시간으로 상호작용하며 결과 이미지를 제공할 수 있는 방법을 연구하였다. 모델을 구현하기 위해 Tensorflow 및 Keras를 사용하였고, Django와 HTML5, CSS, JavaScript를 사용하여 웹사이트를 제작하였다.

  • PDF

FACS 기반 GAN 기술을 이용한 가상 영상 아바타 합성 기술 (Video Synthesis Method for Virtual Avatar Using FACS based GAN)

  • 김건형;박수현;이상호
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 춘계학술발표대회
    • /
    • pp.340-342
    • /
    • 2021
  • 흔히 DeepFake로 불리는 GAN 기술은 소스 영상과 타겟 이미지를 합성하여 타겟 이미지 내의 사람이 소스 영상에서 나타나도록 합성하는 기술이다. 이러한 GAN 기반 영상 합성 기술은 2018년을 기점으로 급격한 성장세를 보이며 다양한 산업에 접목되어지고 있으나 학습 모델을 얻는 데 걸리는 시간이 너무 오래 소요되고, 감정 표현을 인지하는 데 어려움이 있었다. 본 논문에서는 상기 두가지 문제를 해결하기 위해 Facial Action Coding System(FACS) 및 음성 합성 기술[4]을 적용한 가상 아바타 생성 방법에 대해 제안하고자 한다.

GAN 기반 고해상도 의료 영상 생성을 위한 연구 (GAN-based research for high-resolution medical image generation)

  • 고재영;조백환;정명진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2020년도 춘계학술발표대회
    • /
    • pp.544-546
    • /
    • 2020
  • 의료 데이터를 이용하여 인공지능 기계학습 연구를 수행할 때 자주 마주하는 문제는 데이터 불균형, 데이터 부족 등이며 특히 정제된 충분한 데이터를 구하기 힘들다는 것이 큰 문제이다. 본 연구에서는 이를 해결하기 위해 GAN(Generative Adversarial Network) 기반 고해상도 의료 영상을 생성하는 프레임워크를 개발하고자 한다. 각 해상도 마다 Scale 의 Gradient 를 동시에 학습하여 빠르게 고해상도 이미지를 생성해낼 수 있도록 했다. 고해상도 이미지를 생성하는 Neural Network 를 고안하였으며, PGGAN, Style-GAN 과의 성능 비교를 통해 제안된 모델이 양질의 고해상도 의료영상 이미지를 더 빠르게 생성할 수 있음을 확인하였다. 이를 통해 인공지능 기계학습 연구에 있어서 의료 영상의 데이터 부족, 데이터 불균형 문제를 해결할 수 있는 Data augmentation 이나, Anomaly detection 등의 연구에 적용할 수 있다.

GAN 기반 관절 데이터 생성을 통한 행동 인식 방법 설계 (A Design of Behavior Recognition method through GAN-based skeleton data generation)

  • 김진아;문남미
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2022년도 추계학술발표대회
    • /
    • pp.592-593
    • /
    • 2022
  • 다중 데이터 기반의 행동 인식 과정에서 데이터 수집 반경이 비교적 제한되는 영상 데이터의 결측에 대한 보완이 요구된다. 본 논문에서는 6축 센서 데이터를 이용하여 결측된 영상 데이터를 생성함으로써 행동 인식의 성능을 개선하는 방법을 제안한다. 가속도와 자이로 센서로부터 수집된 행동 데이터를 이용하여 GAN(Generative Adversarial Network)을 통해 영상에서의 관절(Skeleton) 움직임에 대한 데이터를 생성하고자 한다. 이를 위해 DeepLabCut 기반 모델 학습을 통해 관절 좌표를 추출하며, 전처리된 센서 시퀀스 데이터를 가지고 GRU 기반 GAN 모델을 통해 관절 좌표에 대한 영상 시퀀스 데이터를 생성한다. 생성된 영상 시퀀스 데이터는 영상 데이터의 결측이 발생했을 때 대신 행동 인식 모델의 입력값으로 활용될 수 있어 성능 향상을 기대할 수 있다.