• 제목/요약/키워드: AI 생성 이미지

검색결과 90건 처리시간 0.03초

GAN을 활용한 기상조건에 따른 하늘 이미지 생성 (Creating Sky Images according to Weather Conditions Using GAN)

  • 조규철;조강현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.293-296
    • /
    • 2024
  • 현재 생성형 AI가 활발히 연구되고 있는 가운데, 대부분의 이미지 생성 AI는 프롬프트를 기반으로 한 Text-To-Image 방식을 주로 사용하고 있다. 하지만, 프롬프트 기반의 생성 AI는 실제 서비스에 도입하기 어려운 점이 많다. 여러 이미지 중, 하늘 이미지는 메타버스 등 가상 공간에서 매우 자주 사용되는 이미지 중 하나이면서 여러 입력값에 의해 이미지가 달라진다. 이 논문에서는 GAN을 활용해 기상 조건에 적합한 하늘 이미지를 생성하는 프로그램을 설계 및 구현한다.

  • PDF

창작·예술 분야의 생성형 aI 활용 방법에 대한 연구 (A Study on the use of generative AI in creative and artistic fields)

  • 이동후
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.569-572
    • /
    • 2023
  • 최근 하루가 다르게 발전하고 있는 생성형 AI가 창작과 예술 분야에 어떤 영향을 미칠 수 있는지, 새롭게 등장하고 있는 다양한 분야에서 활용 가능한 획기적인 기능 등을 살펴보고 이를 바탕으로 새로운 창작 방향을 제시할 수 있는 방법들을 살펴보려 한다. 최근, 작곡가와 소설가들은 물론, 디지털 아티스트들까지도 생성형 AI를 활용하여 독특한 음악, 글, 그리고 이미지를 창조하는데 성공했다는 사례들이 속속 드러나고 있고 영상, 게임, 웹툰 등 많은 산업현장에서 직접적인 활용방법에 대한 연구결과가 등장하고 실제 적용 사례도 늘어나고 있다. 이미지 생성기인 미드저니와 스테이블디퓨전 같은 도구들은 혁신적인 방법으로 빠르게 높은 퀄리티의 이미지를 생성하고 다양한 아이디어를 제공 받을 수 있는 도구로 창작과 예술 분야에서 큰 관심을 받고 있다. 이러한 발전은 창작과 예술 분야에서 생성형 AI의 무한한 가능성을 보여주는 한편, 인간의 창의성 침해와 예술가들의 노력 희석에 대한 비판적 시각을 불러일으키기도 한다. 본 연구는 이런 다양한 관점에서 창작·예술 분야의 생성형 AI 활용을 깊이 있게 탐구한다. 그 과정에서 여러 생성형 AI 도구들, 특히 이미지 생성기 미드저니와 스테이블디퓨전의 기능과 활용 방안, 그로 인한 사회적, 윤리적 측면을 분석하며, 창작·예술 분야에서의 생성형 AI 활용의 적절한 방향성과 미래 전망을 제시해 보고자 한다.

  • PDF

패션디자인 개발을 위한 AI 이미지 생성 도구의 활용 가능성 연구 -미드저니(Midjourney)의 활용을 중심으로 (Study on the feasibility of using AI image generation tool for fashion design development -Focused on the use of Midjourney)

  • 박근수
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.237-244
    • /
    • 2023
  • 오늘날 AI는 여러 산업 분야에 적용되면서 전반적인 산업의 패러다임의 변화를 이끌고 있다. 패션 산업 분야에서도 트렌드 예측이나 소비자를 위한 다양한 서비스를 위하여 AI가 활용되고 있으며 특히 AI 이미지 생성 도구는 패션디자인 개발을 위한 도구로서의 가능성을 가진다. 본 연구는 AI 이미지 생성 도구 중에서 미드저니를 사용하여 이미지를 생성해보고 그 특징을 파악함으로써 패션디자인 개발을 위하여 미드저니의 활용 가능성과 한계점을 알아보았다. 미드저니에서 생성되는 이미지의 특징은 다음과 같다. 첫째, 명령어에 해당하는 이미지들을 직관적으로 적용 또는 조합하여 이미지를 생성하는 직관성을 가진다. 둘째, 동일한 명령어라도 시차를 두고 입력할 때 다른 이미지가 생성되는 무작위성을 가진다. 셋째, 기존의 이미지와 명령어를 함께 사용할 경우 미드저니에서 생성된 이미지는 명령어보다 기존의 이미지에 더 의존적이다. 결론적으로 미드저니의 다양한 이미지 생성 기능과 명령어에 따라 이미지가 변하는 특징은 독창적인 패션디자인을 개발하는 데 도움이 될 수 있겠다. 다만 착용이나 제작이 불가한 패션디자인이 제시되기도 한다는 점은 주의해야 할 부분이다. 본 연구 결과가 패션디자인 개발을 위한 AI 이미지 생성 도구의 활용에 있어 기초 자료가 되기를 기대한다.

AI 이미지 생성 프로그램에서 나타난 패션 이미지의 특징 분석 연구 (A study on the analysis of characteristics of fashion images shown in an AI image generation program)

  • 박근수
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.199-207
    • /
    • 2024
  • 오늘날 AI 이미지 생성 기술은 산업 전반으로 확대되어 활용되고 있다. 이에 따라 패션 산업 분야에 최적화된 다양한 AI 이미지 생성 프로그램들이 개발되어 상용화되고 있다. 본 연구에서는 플레이그라운드, 미드저니, 더뉴블랙 등의 AI 이미지 생성 프로그램에서 생성한 패션 이미지의 시각적 특징을 비교 분석하여 각 프로그램의 특징을 파악하고 각 프로그램이 활용될 수 있는 분야와 문제점을 짚어보았다. 연구 결과는 다음과 같다. 첫째, 플레이그라운드와 미드저니는 명령어의 내용을 직관적으로 적용하여 실제 패션 트랜드와는 다른 이미지를 생성하는 반면 뎌뉴블랙은 패션 트랜드와 비교적 유사한 이미지를 생성하였다. 둘째, 플레이그라운드는 명령어 내용에 해당하는 이미지를 분리 또는 조합하는 반면 미드저니는 다양한 디테일을 추가하여 융합함으로써 새로운 이미지를 생성하는 경향이 있다. 셋째, 플레이그라운드에서는 명령어에 제시되지 않은 색상이 배색되어 나타나는 무작위성이 있으며 더뉴브랙에서는 명령어에 포함되지 않은 색상이 코디네이션되어 나타나고 미드저니는 명령어에 지시한 색상을 비교적 정확히 생성한다. 결론적으로 미드저니는 독특하고 창의적인 패션디자인 개발을 위한 영감을 얻고자 할 때 활용할 수 있으며 더 뉴 블랙은 패션 트랜드를 참고하거나 패션 스타일링에 도움이 될 수 있겠다. 반면 플레이그라운드는 색상 생성에 있어 다소 혼돈이 있을 수 있으니 주의할 부분이라고 할 수 있다. 본 연구를 통하여 패션디자인 개발에 있어 AI 이미지 생성 도구가 더욱 효율적으로 활용될 수 있기를 기대한다.

패션디자인을 위한 AI 생성 이미지 색상 비교 연구 -미드저니의 활용을 중심으로- (A Study on the Color of AI-Generated Images for Fashion Design -Focused on the Use of Midjourney)

  • 박근수
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.343-348
    • /
    • 2024
  • 오늘날 AI 이미지 생성 프로그램은 패션 상품 광고, 맞춤형 패션 스타일 제안, 디자인 개발 등 패션 산업 분야의 세분화된 목적에 알맞게 개발되고 있다. 한편 색상은 강력한 조형 요소로서 상품이나 패션 스타일 제안을 위한 이미지 표현에 중요한 역할을 한다. 본 연구는 AI 이미지 생성 도구 중에서 미드저니를 사용하여 생성한 의상 이미지에 나타나는 색상과 배색 관계에 중점을 두어 그 특징을 파악함으로써 미드저니의 활용에 대한 이해를 넓히고자 한다. 본 연구의 결과는 다음과 같다. 첫째, 미드저니에서 생성한 초기의 이미지는 명령어에 지시한 색상보다 이미지 생성을 위하여 사용한 기존의 이미지 색상에 더 의존적으로 반영되어 나타난다. 둘째, 미드저니에서 생성된 이미지의 의상에 나타난 배색의 특징은 의상의 구조에 따라 구분되는 부위별로 다른 색상이 표현된 분리배색과 의상의 한 부위에 다른 색상들이 무늬 형태로 표현된 혼합배색이 생성된다. 분리배색에 표현된 색상들의 비율은 명령어에 지시한 색상 순서의 영향을 받는다. 혼합배색에 조합되어 나타난 색상 수는 미드저니에서 이미지 생성을 위하여 사용한 기존의 이미지 속 의상의 색상 수와 명령어에 지시한 색상 수의 총합보다 적은 수의 색상으로 조합되어 나타난다. 셋째, 미드저니는 생성하는 이미지의 배경도 색상 표현을 위한 대상으로 인식하며 이에 따른 배경색의 변화는 이미지 속의 의상에 대한 사용자의 색지각과 의상 이미지 형성에 영향을 미칠 수 있으므로 주의가 필요하다. 본 연구 결과가 패션디자인 교육과 실무에 있어 미드저니에서 생성되는 이미지의 색상 배색에 대한 이해를 넓히고 이를 통하여 미드저니의 활용에 도움이 되기를 기대한다.

이미지 생성형 AI의 창작 과정 분석을 통한 사용자 경험 연구: 사용자의 창작 주체감을 중심으로 (A Study on User Experience through Analysis of the Creative Process of Using Image Generative AI: Focusing on User Agency in Creativity)

  • 한다은;최다혜;오창훈
    • 문화기술의 융합
    • /
    • 제9권4호
    • /
    • pp.667-679
    • /
    • 2023
  • 이미지 생성형 AI의 등장으로 미술, 디자인 전문가가 아니어도 텍스트 입력을 통해 완성도 높은 그림 작품을 만들 수 있게 되었다. 생성 이미지의 활용 가능성과 예술 산업에 미치는 영향력이 높아짐에 따라 사용자가 AI와 공동 창작하는 과정을 어떻게 인식하는지에 대해 연구 필요성이 제기되고 있다. 이에 본 연구에서는 일반 사용자들을 대상으로 이미지 생성형 AI 창작에 대한 예상 과정과 체감 과정을 알아보고 어떤 과정이 사용자의 창작 주체감에 영향을 미치는지 알아보는 실험 연구를 진행하였다. 연구 결과 사용자들이 기대한 창작 과정과 체감한 창작 과정 간 격차가 있는 것으로 나타났으며 창작 주체감은 낮게 인식하는 경향을 보였다. 이에 AI가 사용자의 창작 의도를 지원하는 조력자의 역할로 작용하여 사용자가 높은 창작 주체감을 경험할 수 있도록 8가지 방법을 제언한다. 본 연구를 통해 사용자 중심적인 창작 경험을 고려하여 향후 이미지 생성형 AI의 발전에 기여할 수 있다.

O2O 상점의 객체 인식을 위한 생성 AI 기반의 진열대 상품 데이터 증강 (Data Augmentation of Shelf Product for Object Recognition in O2O Stores Based on Generative AI)

  • 시종욱;김성영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.77-78
    • /
    • 2024
  • 본 논문에서는 O2O 상점의 자동화에 필수적인 객체 인식 모델의 성능 향상을 목표로, 생성 AI 기술을 이용한 데이터 증강 방법을 제시한다. 제안하는 방법은 텍스트 프롬프트를 활용하여 진열대 상품 이미지를 포함한 다양한 고품질 이미지를 생성할 수 있음을 보인다. 또한, 실제에 더 가까운 상세한 이미지를 생성하기 위한 최적화된 프롬프트를 제안하고, Stable-Diffusion과 DALL-E2의 생성 결과를 통해 비교 분석한다. 이러한 접근 방법은 객체 인식 모델의 성능 향상에 영향을 미칠 것으로 기대된다.

  • PDF

딥러닝 모델을 이용한 2D 레고 조립 설명서 생성 (Generating 2D LEGO Instruction Manual Using Deep Learning Model)

  • 안종석;이승현;김철희;강동희
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.481-484
    • /
    • 2024
  • 본 논문에서는 레고(LEGO®) 조립 설명서를 생성하기 위해 딥러닝을 이용한 조립 및 설명서 생성 시스템을 제안한다. 이 시스템은 사용자가 제공한 단일 이미지를 기반으로 레고 조립 설명서를 자동 생성한다. 해당 시스템은 딥러닝 기반 이미지 분할 기술을 활용하여 물체를 배경으로부터 분리하고 이를 통해 조립 설명서를 생성하는 과정을 포함하며, 조립을 위한 알고리즘을 새로 설계하였다. 이 시스템은 기존 레고 제품의 한계를 극복하고, 사용자에게 주어진 부품으로 다양한 모델을 자유롭게 조립할 수 있게 한다. 또한, 복잡한 레고 조립 과정을 간소화하고, 조립의 장벽을 낮추는 데 도움을 준다.

  • PDF

A Design and Implementation of Generative AI-based Advertising Image Production Service Application

  • Chang Hee Ok;Hyun Sung Lee;Min Soo Jeong;Yu Jin Jeong;Ji An Choi;Young-Bok Cho;Won Joo Lee
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권5호
    • /
    • pp.31-38
    • /
    • 2024
  • 본 논문에서는 생성형 AI 기반의 광고 이미지 자동 제작 서비스를 제공하는 ASAP(AI-driven Service for Advertisement Production) 애플리케이션을 제안한다. 이 애플리케이션은 GPT-3.5 Turbo Instruct를 이용하여 사용자가 입력한 키워드에 적합한 배경 분위기와 홍보 문구를 생성한다. 이를 입력으로 하여 배경 이미지와 텍스트 이미지를 생성하기 위해 OpenAI사의 DALL·E 3 모델과 Stability AI사의 SDXL 모델을 활용한다. 추가적으로 OCR 기술을 활용하여 텍스트 이미지의 정확도를 높이고, 생성된 출력물들을 모두 합성하여 최종적인 광고를 제작한다. 또한 PILLOW, OpenCV 라이브러리의 텍스트 박스를 이용하여 전화번호, 영업시간 등 세부 사항을 홍보물의 가장자리에 삽입할 수 있도록 구현한다. 본 애플리케이션은 광고 제작에 어려움이 많은 소상공인들에게 광고를 쉽고 편리하게 제작할 수 있고, 광고 제작 비용을 절감할 수 있는 효과를 제공한다.

주파수 영역을 활용한 GAN (GAN using Frequency Domain)

  • 이채은;정성훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.567-569
    • /
    • 2023
  • GAN은 이미지 생성모델로서 이미지 공간에서 좋은 결과를 보여왔다. 우리는 이러한 GAN의 능력을 더욱 향상하기 위하여 본 연구에서 주파수 영역에서 이미지를 학습하고 생성하는 새로운 방법을 제안한다. 이를 위하여 먼저 학습데이터를 2D FFT로 주파수 영역으로 변환한 후 변환된 학습데이터를 GAN이 학습하게 한다. 학습 후에 GAN은 새로운 이미지를 생성하며 생성된 이미지를 2D IFFT하여 이미지 공간으로 변환한다. 이렇게 주파수 영역에서 이미지를 생성하는 방법은 이미지 공간에서 생성하는 방법보다 다양한 장점이 있다. 생성된 이미지의 품질을 평가하기 위하여 4개 데이터 셋에 4개의 평가지표를 사용하여 평가한 결과 주파수 영역에서 생성한 이미지가 IS, P&R, D&C 측면에서 더 좋은 것으로 평가되었다.