• 제목/요약/키워드: AI Image generator

검색결과 10건 처리시간 0.021초

인공지능 이미지 생성기의 창작·예술 분야 활용 방향성에 대한 연구 (A Study on the Application of AI Image Generators in the Creative and Art Field)

  • 이동후
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제67차 동계학술대회논문집 31권1호
    • /
    • pp.85-88
    • /
    • 2023
  • 미국 콜로라도주 박람회 미술전에서 신인 디지털 아티스트 부문에서 1위를 차지한 게임 디자이너인 제이슨 앨런의 작품 스페이스오페라 극장'이 AI Image generator Midjourney를 활용해서 완성된 작품이라는 것이 알려지면서 창작과 예술 분야에 AI 활용이라는 논쟁이 가속화되고 있다. 창작과 예술을 돕는 탁월한 기능을 가진 툴로 바라보거나 창작과 예술 활동에 아이디어를 제공하고 작품을 구체화하는 과정의 조력자로 환영하는 입장과 예술가의 작품을 허가 없이 훔쳐서 만들어 낸 이미지일 뿐이라는 이상도 이하도 아니며 도덕적으로 허락되어서는 안되다는 입장이 크게 충돌하고 있다. 하루가 다르게 빠르게 발전하고 있는 주요 AI Image generator를 살펴보고 창작과 예술 분야에 AI 활용은 어떤 변화를 가져올지, AI 활용의 긍정적인 측면을 예측하고 연구해 보고자 한다.

  • PDF

Transforming Text into Video: A Proposed Methodology for Video Production Using the VQGAN-CLIP Image Generative AI Model

  • SukChang Lee
    • International Journal of Advanced Culture Technology
    • /
    • 제11권3호
    • /
    • pp.225-230
    • /
    • 2023
  • With the development of AI technology, there is a growing discussion about Text-to-Image Generative AI. We presented a Generative AI video production method and delineated a methodology for the production of personalized AI-generated videos with the objective of broadening the landscape of the video domain. And we meticulously examined the procedural steps involved in AI-driven video production and directly implemented a video creation approach utilizing the VQGAN-CLIP model. The outcomes produced by the VQGAN-CLIP model exhibited a relatively moderate resolution and frame rate, and predominantly manifested as abstract images. Such characteristics indicated potential applicability in OTT-based video content or the realm of visual arts. It is anticipated that AI-driven video production techniques will see heightened utilization in forthcoming endeavors.

A Comparative Analysis Between <Leonardo.Ai> and <Meshy> as AI Texture Generation Tools

  • Pingjian Jie;Xinyi Shan;Jeanhun Chung
    • International Journal of Advanced Culture Technology
    • /
    • 제11권4호
    • /
    • pp.333-339
    • /
    • 2023
  • In three-dimensional(3D) modeling, texturing plays a crucial role as a visual element, imparting detail and realism to models. In contrast to traditional texturing methods, the current trend involves utilizing AI tools such as Leonardo.Ai and Meshy to create textures for 3D models in a more efficient and precise manner. This paper focuses on 3D texturing, conducting a comprehensive comparative study of AI tools, specifically Leonardo.Ai and Meshy. By delving into the performance, functional differences, and respective application scopes of these two tools in the generation of 3D textures, we highlight potential applications and development trends within the realm of 3D texturing. The efficient use of AI tools in texture creation also has the potential to drive innovation and enhancement in the field of 3D modeling. In conclusion, this research aims to provide a comprehensive perspective for researchers, practitioners, and enthusiasts in related fields, fostering further innovation and development in this domain.

창작·예술 분야의 생성형 aI 활용 방법에 대한 연구 (A Study on the use of generative AI in creative and artistic fields)

  • 이동후
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.569-572
    • /
    • 2023
  • 최근 하루가 다르게 발전하고 있는 생성형 AI가 창작과 예술 분야에 어떤 영향을 미칠 수 있는지, 새롭게 등장하고 있는 다양한 분야에서 활용 가능한 획기적인 기능 등을 살펴보고 이를 바탕으로 새로운 창작 방향을 제시할 수 있는 방법들을 살펴보려 한다. 최근, 작곡가와 소설가들은 물론, 디지털 아티스트들까지도 생성형 AI를 활용하여 독특한 음악, 글, 그리고 이미지를 창조하는데 성공했다는 사례들이 속속 드러나고 있고 영상, 게임, 웹툰 등 많은 산업현장에서 직접적인 활용방법에 대한 연구결과가 등장하고 실제 적용 사례도 늘어나고 있다. 이미지 생성기인 미드저니와 스테이블디퓨전 같은 도구들은 혁신적인 방법으로 빠르게 높은 퀄리티의 이미지를 생성하고 다양한 아이디어를 제공 받을 수 있는 도구로 창작과 예술 분야에서 큰 관심을 받고 있다. 이러한 발전은 창작과 예술 분야에서 생성형 AI의 무한한 가능성을 보여주는 한편, 인간의 창의성 침해와 예술가들의 노력 희석에 대한 비판적 시각을 불러일으키기도 한다. 본 연구는 이런 다양한 관점에서 창작·예술 분야의 생성형 AI 활용을 깊이 있게 탐구한다. 그 과정에서 여러 생성형 AI 도구들, 특히 이미지 생성기 미드저니와 스테이블디퓨전의 기능과 활용 방안, 그로 인한 사회적, 윤리적 측면을 분석하며, 창작·예술 분야에서의 생성형 AI 활용의 적절한 방향성과 미래 전망을 제시해 보고자 한다.

  • PDF

한국형 멀티모달 몽타주 앱을 위한 생성형 AI 연구 (Research on Generative AI for Korean Multi-Modal Montage App)

  • 임정현;차경애;고재필;홍원기
    • 서비스연구
    • /
    • 제14권1호
    • /
    • pp.13-26
    • /
    • 2024
  • 멀티모달 (multi-modal) 생성이란 텍스트, 이미지, 오디오 등 다양한 정보를 기반으로 결과를 도출하는 작업을 말한다. AI 기술의 비약적인 발전으로 인해 여러 가지 유형의 데이터를 종합적으로 처리해 결과를 도출하는 멀티모달 기반 시스템 또한 다양해지는 추세이다. 본 논문은 음성과 텍스트 인식을 활용하여 인물을 묘사하면, 몽타주 이미지를 생성하는 AI 시스템의 개발 내용을 소개한다. 기존의 몽타주 생성 기술은 서양인들의 외형을 기준으로 이루어진 반면, 본 논문에서 개발한 몽타주 생성 시스템은 한국인의 안면 특징을 바탕으로 모델을 학습한다. 따라서, 한국어에 특화된 음성과 텍스트의 멀티모달을 기반으로 보다 정확하고 효과적인 한국형 몽타주 이미지를 만들어낼 수 있다. 개발된 몽타주 생성 앱은 몽타주 초안으로 충분히 활용 가능하기 때문에 기존의 몽타주 제작 인력의 수작업을 획기적으로 줄여줄 수 있다. 이를 위해 한국지능정보사회진흥원의 AI-Hub에서 제공하는 페르소나 기반 가상 인물 몽타주 데이터를 활용하였다. AI-Hub는 AI 기술 및 서비스 개발에 필요한 인공지능 학습용 데이터를 구축하여 원스톱 제공을 목적으로 한 AI 통합 플랫폼이다. 이미지 생성 시스템은 고해상도 이미지를 생성하는데 사용하는 딥러닝 모델인 VQGAN과 한국어 기반 영상생성 모델인 KoDALLE 모델을 사용하여 구현하였다. 학습된 AI 모델은 음성과 텍스트를 이용해 묘사한 내용과 매우 유사한 얼굴의 몽타주 이미지가 생성됨을 확인할 수 있다. 개발된 몽타주 생성 앱의 실용성 검증을 위해 10명의 테스터가 사용한 결과 70% 이상이 만족한다는 응답을 보였다. 몽타주 생성 앱은 범죄자 검거 등 얼굴의 특징을 묘사하여 이미지화하는 여러 분야에서 다양하게 사용될 수 있을 것이다.

YOLOv5에서 가상 번호판 생성을 통한 차량 번호판 인식 시스템에 관한 연구 (A Study on Vehicle License Plate Recognition System through Fake License Plate Generator in YOLOv5)

  • 하상현;정석찬;전영준;장문석
    • 한국산업융합학회 논문집
    • /
    • 제24권6_2호
    • /
    • pp.699-706
    • /
    • 2021
  • Existing license plate recognition system is used as an optical character recognition method, but a method of using deep learning has been proposed in recent studies because it has problems with image quality and Korean misrecognition. This requires a lot of data collection, but the collection of license plates is not easy to collect due to the problem of the Personal Information Protection Act, and labeling work to designate the location of individual license plates is required, but it also requires a lot of time. Therefore, in this paper, to solve this problem, five types of license plates were created using a virtual Korean license plate generation program according to the notice of the Ministry of Land, Infrastructure and Transport. And the generated license plate is synthesized in the license plate part of collectable vehicle images to construct 10,147 learning data to be used in deep learning. The learning data classifies license plates, Korean, and numbers into individual classes and learn using YOLOv5. Since the proposed method recognizes letters and numbers individually, if the font does not change, it can be recognized even if the license plate standard changes or the number of characters increases. As a result of the experiment, an accuracy of 96.82% was obtained, and it can be applied not only to the learned license plate but also to new types of license plates such as new license plates and eco-friendly license plates.

심층 적대적 생성 신경망의 오류 재학습을 이용한 얼굴 영상 생성 모델 (Photo-realistic Face Image Generation by DCGAN with error relearning)

  • 하용욱;홍동진;차의영
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2018년도 추계학술대회
    • /
    • pp.617-619
    • /
    • 2018
  • 본 논문에서는 계층형 적대적 생성 신경망(GAN: Generative Adversarial Network)에서 오류 판별자를 추가하여 영상 생성 성능을 개선하는 방안을 제안한다. 제안하는 영상 생성 방법에서는 영상 생성자가 빈번히 발생시키는 오류에 대해 별도로 학습을 수행하는 판별자를 모델에 추가하여 계층형 적대적 생성 신경망을 구성하였다. 본 논문에서 제안한 모델을 이용하여 생성한 영상의 효용성을 검증하는 방법으로는 Inception Score를 사용하였다. 학습 데이터로 celebA의 유명인 얼굴 이미지 중 정면 이미지 155,680장을 이용하였다. 본 논문의 모델로 생성한 10,000장의 얼굴 이미지를 Inception Score로 평가한 결과, 평균 1.742p의 성능을 나타내어 기존의 영상 생성 방법보다 높은 점수를 얻을 수 있었으며, 효용성을 확인할 수 있었다.

  • PDF

인공지능(AI)을 활용한 제주 오름 이미지의 재해석 (Re-interpretation of Jeju Oreum image using artificial intelligence)

  • 강묘선;양소희;박진우;좌동훈;김민철
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.252-254
    • /
    • 2022
  • 본 연구는 최근 제주 현대미술가들의 작업을 지속해서 수용하며 활발한 작업을 끌어내고 있다는 점에 연구 배경을 갖고, 제주 미술 작가의 작품과 제주 관광산업에 이바지할 방안에 관해 연구하기 위한 것이다. 이러한 연구 목적을 달성하는 방안으로서 딥드림 제너레이터(Deep Dream Generator) 소프트웨어는 본 연구를 추진하는 데 효과적인 방법이라 판단하였다. 구체적인 연구 과정으로서, 딥드림 제너레이터를 활용해 제주 작가 작품과 딥드림 제너레이터에서 제공하는 저명한 해외 작가들의 작품 각각을 직접 찍은 제주 오름 사진과 합성해 그 결과물을 전시하며, 인공지능을 이용한 제주 오름의 재해석을 시도하고자 한다. 또한, 나온 결과물을 이용해 제주 관광상품에 활용하는 방안을 모색함으로써 제주의 미술 작품과 관광을 활성화할 것으로 기대된다.

  • PDF

인공지능 기반 DALL-E2 활용 쓰기 활동에 대한 영어학습자들의 인식 조사 (A Pilot Study of English Learners' Perception on Writing Activities using AI-Based DALL-E2)

  • 윤택남
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.121-127
    • /
    • 2023
  • 본 예비연구의 목적은 이미지 생성 인공지능 도구인 DALL-E2를 활용하여 영어 작문 활동을 실시한 후 중학생들의 영어 학습에 미치는 반응을 살펴보는 데 있다. 이를 위하여 15명의 중학교 영어학습자를 대상으로 3주간 실험 수업을 진행하였으며 그 결과를 정리하면 다음과 같다. 첫째, DALL-E2 활용 영어 작문 활동에 대한 설문조사 결과, 자신감, 흥미 및 인공지능 기반 도구 활용 쓰기에 대한 인식이 긍정적으로 변화하였음을 알 수 있었다. 아울러 통계적으로 유의미한 차이가 나타났음을 확인하였으며 이는 인공지능 활용 학습이 영어 작문 및 전반적인 영어 학습에 있어 긍정적인 영향을 미쳤다는 것을 의미하였다. 둘째, DALL-E2 활용 영어 작문 활동에 대한 소감문을 내용분석을 통해 분석한 결과, 핵심 주제를 3가지(인지적, 정의적, 심동적 특성)로 추출할 수 있었으며 영어 학습에 있어 인공지능 기반의 DALL-E2의 활용과 접목은 학습에 대한 새로운 흥미와 도전, 의지, 적극성을 높이며 궁극적으로는 영어표현력(productive skill) 향상에 일부 기여한 것으로 해석할 수 있었다.

Pix2Pix의 수용 영역 조절을 통한 전통 고궁 이미지 복원 연구 (A Study on the Restoration of Korean Traditional Palace Image by Adjusting the Receptive Field of Pix2Pix)

  • 황원용;김효관
    • 한국정보전자통신기술학회논문지
    • /
    • 제15권5호
    • /
    • pp.360-366
    • /
    • 2022
  • 본 논문은 흑백 사진으로만 남아 있는 한국의 전통 고궁 사진을 적대적 생성 신경망 기법의 하나인 Pix2Pix를 활용하여 컬러 사진으로 복원하기 위한 학습 모델 구조를 제시한다. Pix2Pix는 합성 이미지를 생성기와 합성 여부를 판정하는 판별기의 학습 모델 조합으로 구성된다. 본 논문은 판별기의 수용 영역을 조절하여 인공지능 모델을 학습하고 그 결과를 고궁 사진이 가지는 특성을 고려하여 분석하는 내용을 다룬다. 기존에 흑백 사진 복원에 사용하는 Pix2Pix의 수용 영역은 주로 고정된 크기로 사용하였으나 이미지의 변화가 다양한 고궁 사진을 복원함에 있어서는 고정된 수용 영역을 일률적으로 적용하기에 적합하지 않다. 본 논문에서는 고궁의 특성을 반영할 수 있는 판별기의 수용 영역을 확인하기 위해 기존의 고정된 수용 영역의 크기를 변화시켜 나타나는 결과를 관찰하였다. 실험은 사전에 준비한 고궁 사진을 기반으로 판별기의 수용 영역을 조정하고 모델의 학습을 진행하였다. 판별기의 수용 영역 변화에 따른 모델의 손실을 측정하고 최종 학습한 학습 모델을 복원 대상 흑백 사진에 대입하여 복원 결과를 확인한다.