• 제목/요약/키워드: AI 이미지 생성 도구

검색결과 11건 처리시간 0.023초

AI 기반 이미지 생성 기술의 농업 적용 가능성 (Agricultural Applicability of AI based Image Generation)

  • 윤승리;이예영;정은규;안태인
    • 생물환경조절학회지
    • /
    • 제33권2호
    • /
    • pp.120-128
    • /
    • 2024
  • 2022년 ChatGPT 출시 이후, 생성형 AI 산업은 엄청난 규모로 성장하였으며, 인지 작업에 혁신을 가져올 것으로 기대되고 있다. 특히 AI 기반 이미지 생성 기술은 현재 디지털 세계의 핵심적인 변화를 주도하고 있다. 본 연구는 대표적인 AI 이미지 생성 도구인 미드저니, 스테이블 디퓨전, 그리고 파이어플라이의 기술적 원리를 분석하고, 이미지 생성 결과를 비교함으로써 그 유용성을 평가하였다. 실험 결과, 이 AI 도구들은 대표 시설원예 작물인 토마토, 딸기, 파프리카, 오이의 과실 이미지를 실제와 유사하게 재현하였다. 특히 파이어플라이는 실제 온실 재배 작물 이미지를 매우 사실적으로 묘사하는 능력을 보여주었다. 그러나 모든 도구들은 작물이 자라는 온실의 환경적 맥락을 완전히 반영하는 데에 있어서 다소 한계를 보였다. 프롬프트 개선 및 레퍼런스 이미지를 활용하여 딸기과실 이미지와 시설 딸기재배 시스템을 보다 정교하게 생성하는 과정도 포함되었으며, 이러한 접근은 AI 이미지 생성 기술의 세밀한 조정이 가능함을 보여준다. 오이 과실 이미지 생성능력을 비교한 결과, AI 생성 도구들은 실제 이미지와 매우 유사한 이미지를 생성해 냄으로써 이미지 생성 점수(CLIP score)에 있어서 통계적 차이를 보이지 않았다. 본 연구는 AI 기반 이미지 생성 이미지 기술이 농업 분야에 활용될 수 있는 방안을 모색하며, 생성형 AI의 농업에 대한 적용을 긍정적으로 전망한다.

패션디자인 개발을 위한 AI 이미지 생성 도구의 활용 가능성 연구 -미드저니(Midjourney)의 활용을 중심으로 (Study on the feasibility of using AI image generation tool for fashion design development -Focused on the use of Midjourney)

  • 박근수
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.237-244
    • /
    • 2023
  • 오늘날 AI는 여러 산업 분야에 적용되면서 전반적인 산업의 패러다임의 변화를 이끌고 있다. 패션 산업 분야에서도 트렌드 예측이나 소비자를 위한 다양한 서비스를 위하여 AI가 활용되고 있으며 특히 AI 이미지 생성 도구는 패션디자인 개발을 위한 도구로서의 가능성을 가진다. 본 연구는 AI 이미지 생성 도구 중에서 미드저니를 사용하여 이미지를 생성해보고 그 특징을 파악함으로써 패션디자인 개발을 위하여 미드저니의 활용 가능성과 한계점을 알아보았다. 미드저니에서 생성되는 이미지의 특징은 다음과 같다. 첫째, 명령어에 해당하는 이미지들을 직관적으로 적용 또는 조합하여 이미지를 생성하는 직관성을 가진다. 둘째, 동일한 명령어라도 시차를 두고 입력할 때 다른 이미지가 생성되는 무작위성을 가진다. 셋째, 기존의 이미지와 명령어를 함께 사용할 경우 미드저니에서 생성된 이미지는 명령어보다 기존의 이미지에 더 의존적이다. 결론적으로 미드저니의 다양한 이미지 생성 기능과 명령어에 따라 이미지가 변하는 특징은 독창적인 패션디자인을 개발하는 데 도움이 될 수 있겠다. 다만 착용이나 제작이 불가한 패션디자인이 제시되기도 한다는 점은 주의해야 할 부분이다. 본 연구 결과가 패션디자인 개발을 위한 AI 이미지 생성 도구의 활용에 있어 기초 자료가 되기를 기대한다.

창작·예술 분야의 생성형 aI 활용 방법에 대한 연구 (A Study on the use of generative AI in creative and artistic fields)

  • 이동후
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.569-572
    • /
    • 2023
  • 최근 하루가 다르게 발전하고 있는 생성형 AI가 창작과 예술 분야에 어떤 영향을 미칠 수 있는지, 새롭게 등장하고 있는 다양한 분야에서 활용 가능한 획기적인 기능 등을 살펴보고 이를 바탕으로 새로운 창작 방향을 제시할 수 있는 방법들을 살펴보려 한다. 최근, 작곡가와 소설가들은 물론, 디지털 아티스트들까지도 생성형 AI를 활용하여 독특한 음악, 글, 그리고 이미지를 창조하는데 성공했다는 사례들이 속속 드러나고 있고 영상, 게임, 웹툰 등 많은 산업현장에서 직접적인 활용방법에 대한 연구결과가 등장하고 실제 적용 사례도 늘어나고 있다. 이미지 생성기인 미드저니와 스테이블디퓨전 같은 도구들은 혁신적인 방법으로 빠르게 높은 퀄리티의 이미지를 생성하고 다양한 아이디어를 제공 받을 수 있는 도구로 창작과 예술 분야에서 큰 관심을 받고 있다. 이러한 발전은 창작과 예술 분야에서 생성형 AI의 무한한 가능성을 보여주는 한편, 인간의 창의성 침해와 예술가들의 노력 희석에 대한 비판적 시각을 불러일으키기도 한다. 본 연구는 이런 다양한 관점에서 창작·예술 분야의 생성형 AI 활용을 깊이 있게 탐구한다. 그 과정에서 여러 생성형 AI 도구들, 특히 이미지 생성기 미드저니와 스테이블디퓨전의 기능과 활용 방안, 그로 인한 사회적, 윤리적 측면을 분석하며, 창작·예술 분야에서의 생성형 AI 활용의 적절한 방향성과 미래 전망을 제시해 보고자 한다.

  • PDF

AI 이미지 생성 프로그램에서 나타난 패션 이미지의 특징 분석 연구 (A study on the analysis of characteristics of fashion images shown in an AI image generation program)

  • 박근수
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.199-207
    • /
    • 2024
  • 오늘날 AI 이미지 생성 기술은 산업 전반으로 확대되어 활용되고 있다. 이에 따라 패션 산업 분야에 최적화된 다양한 AI 이미지 생성 프로그램들이 개발되어 상용화되고 있다. 본 연구에서는 플레이그라운드, 미드저니, 더뉴블랙 등의 AI 이미지 생성 프로그램에서 생성한 패션 이미지의 시각적 특징을 비교 분석하여 각 프로그램의 특징을 파악하고 각 프로그램이 활용될 수 있는 분야와 문제점을 짚어보았다. 연구 결과는 다음과 같다. 첫째, 플레이그라운드와 미드저니는 명령어의 내용을 직관적으로 적용하여 실제 패션 트랜드와는 다른 이미지를 생성하는 반면 뎌뉴블랙은 패션 트랜드와 비교적 유사한 이미지를 생성하였다. 둘째, 플레이그라운드는 명령어 내용에 해당하는 이미지를 분리 또는 조합하는 반면 미드저니는 다양한 디테일을 추가하여 융합함으로써 새로운 이미지를 생성하는 경향이 있다. 셋째, 플레이그라운드에서는 명령어에 제시되지 않은 색상이 배색되어 나타나는 무작위성이 있으며 더뉴브랙에서는 명령어에 포함되지 않은 색상이 코디네이션되어 나타나고 미드저니는 명령어에 지시한 색상을 비교적 정확히 생성한다. 결론적으로 미드저니는 독특하고 창의적인 패션디자인 개발을 위한 영감을 얻고자 할 때 활용할 수 있으며 더 뉴 블랙은 패션 트랜드를 참고하거나 패션 스타일링에 도움이 될 수 있겠다. 반면 플레이그라운드는 색상 생성에 있어 다소 혼돈이 있을 수 있으니 주의할 부분이라고 할 수 있다. 본 연구를 통하여 패션디자인 개발에 있어 AI 이미지 생성 도구가 더욱 효율적으로 활용될 수 있기를 기대한다.

패션 도식화와 미드저니의 활용을 통하여 생성한 패션디자인의 특징 변화 연구 (A study on the Change in the Characteristics of Fashion Design Created through the Use of Fashion Flat Drawing and Midjourney )

  • 박근수
    • 문화기술의 융합
    • /
    • 제10권5호
    • /
    • pp.397-406
    • /
    • 2024
  • 오늘날 현대 패션디자인 분야에서는 새로운 디자인 도구로써 AI가 적극적으로 활용되고 있으며 디자이너와 AI와의 협업이라는 새로운 패러다임을 견인하게 되었다. 본 연구는 인간 디자이너와 AI와의 협업을 통한 융합적 패션디자인 개발 방법에 관한 연구이다. 본 연구의 목적은 패션 도식화를 AI 생성 프로그램 미드저니에 사용하여 생성한 패션디자인 이미지의 시각적, 조형적 특징과 변화를 분석함으로써 패션디자인 개발에 있어 AI 이미지 생성 프로그램 활용에 대한 이해와 활용 방법의 확장을 꾀하는 데 있다. 본 연구의 결과는 다음과 같다. 첫째, 미드저니는 이미지 생성 시 명령어보다는 사용한 기존 이미지의 특징에 더 의존적인 특성이 있다. 또한 의상과 이미지 배경 사이에서 절충적 상호작용을 통하여 디자인을 분산하여 응용하는 방식으로 새로운 이미지를 생성하며 명령어에 패션 아이템 명칭을 배제하면 더욱 다양한 아이디어를 얻을 수 있는 이미지를 생성할 수 있다. 둘째, 미드저니는 색상 생성에 있어서 초기에는 패션 도식화에 사용된 색상으로 의상 색을 표현하고 점차 다양한 색상 계열로 확장하며 이미지 배경도 색상 생성의 대상으로 인식한다. 셋째, 미드저니가 이미지 생성 시 색상과 디자인 사이에서 일종의 절충적 상관관계가 있으며 이에 따라 이미지 배경과 의상 색을 특정하여 제한하면 더욱 다양하게 발전된 패션디자인 이미지를 생성할수 있다.

패션디자인을 위한 AI 생성 이미지 색상 비교 연구 -미드저니의 활용을 중심으로- (A Study on the Color of AI-Generated Images for Fashion Design -Focused on the Use of Midjourney)

  • 박근수
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.343-348
    • /
    • 2024
  • 오늘날 AI 이미지 생성 프로그램은 패션 상품 광고, 맞춤형 패션 스타일 제안, 디자인 개발 등 패션 산업 분야의 세분화된 목적에 알맞게 개발되고 있다. 한편 색상은 강력한 조형 요소로서 상품이나 패션 스타일 제안을 위한 이미지 표현에 중요한 역할을 한다. 본 연구는 AI 이미지 생성 도구 중에서 미드저니를 사용하여 생성한 의상 이미지에 나타나는 색상과 배색 관계에 중점을 두어 그 특징을 파악함으로써 미드저니의 활용에 대한 이해를 넓히고자 한다. 본 연구의 결과는 다음과 같다. 첫째, 미드저니에서 생성한 초기의 이미지는 명령어에 지시한 색상보다 이미지 생성을 위하여 사용한 기존의 이미지 색상에 더 의존적으로 반영되어 나타난다. 둘째, 미드저니에서 생성된 이미지의 의상에 나타난 배색의 특징은 의상의 구조에 따라 구분되는 부위별로 다른 색상이 표현된 분리배색과 의상의 한 부위에 다른 색상들이 무늬 형태로 표현된 혼합배색이 생성된다. 분리배색에 표현된 색상들의 비율은 명령어에 지시한 색상 순서의 영향을 받는다. 혼합배색에 조합되어 나타난 색상 수는 미드저니에서 이미지 생성을 위하여 사용한 기존의 이미지 속 의상의 색상 수와 명령어에 지시한 색상 수의 총합보다 적은 수의 색상으로 조합되어 나타난다. 셋째, 미드저니는 생성하는 이미지의 배경도 색상 표현을 위한 대상으로 인식하며 이에 따른 배경색의 변화는 이미지 속의 의상에 대한 사용자의 색지각과 의상 이미지 형성에 영향을 미칠 수 있으므로 주의가 필요하다. 본 연구 결과가 패션디자인 교육과 실무에 있어 미드저니에서 생성되는 이미지의 색상 배색에 대한 이해를 넓히고 이를 통하여 미드저니의 활용에 도움이 되기를 기대한다.

인공지능 기반 DALL-E2 활용 쓰기 활동에 대한 영어학습자들의 인식 조사 (A Pilot Study of English Learners' Perception on Writing Activities using AI-Based DALL-E2)

  • 윤택남
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.121-127
    • /
    • 2023
  • 본 예비연구의 목적은 이미지 생성 인공지능 도구인 DALL-E2를 활용하여 영어 작문 활동을 실시한 후 중학생들의 영어 학습에 미치는 반응을 살펴보는 데 있다. 이를 위하여 15명의 중학교 영어학습자를 대상으로 3주간 실험 수업을 진행하였으며 그 결과를 정리하면 다음과 같다. 첫째, DALL-E2 활용 영어 작문 활동에 대한 설문조사 결과, 자신감, 흥미 및 인공지능 기반 도구 활용 쓰기에 대한 인식이 긍정적으로 변화하였음을 알 수 있었다. 아울러 통계적으로 유의미한 차이가 나타났음을 확인하였으며 이는 인공지능 활용 학습이 영어 작문 및 전반적인 영어 학습에 있어 긍정적인 영향을 미쳤다는 것을 의미하였다. 둘째, DALL-E2 활용 영어 작문 활동에 대한 소감문을 내용분석을 통해 분석한 결과, 핵심 주제를 3가지(인지적, 정의적, 심동적 특성)로 추출할 수 있었으며 영어 학습에 있어 인공지능 기반의 DALL-E2의 활용과 접목은 학습에 대한 새로운 흥미와 도전, 의지, 적극성을 높이며 궁극적으로는 영어표현력(productive skill) 향상에 일부 기여한 것으로 해석할 수 있었다.

서브 이미지의 교정을 통한 이미지 기반의 CAPTCHA 시스템 (An Image-based CAPTCHA System with Correction of Sub-images)

  • 정우근;지승현;조환규
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권8호
    • /
    • pp.873-877
    • /
    • 2010
  • CAPTCHA은 스팸이나 로봇에 의한 사이트 자동가입을 막는 계정 생성방지 도구로써, 특정 언어 또는 그림을 해독할 수 있는 인간의 우수한 가독성을 이용한 것으로 일반적으로 컴퓨터 프로그램이 해독하기 어려운 기호, 글자 등을 입력하도록 하여 스팸 또는 자동화 도구 등을 무력화 시키는 보안 기술이다. 하지만 기존에 사용되었던 CAPTCHA 방식은 웹봇 또는 이미지프로세싱, 머신 러닝을 통하여 쉽게 통과할 수 있는 것으로 알려졌다. 본 논문에서는 기존에 사용되었던 Text 기반의 CAPTCHA 시스템과는 달리 이미지 기반의 새로운 CAPTCHA 시스템을 제안한다. 본 논문에서 제공되는 시스템은 일반적으로 현상된 사진의 부분적인 이미지를 추출하여 추출된 이미지의 회전을 통하여 CAPTCHA 시스템을 제공하는 것이다. 사용자 인증은 다음과 같이 검증한다. 먼저 총 8장의 사진에서 각각 서브 이미지를 추출하여, 추출된 서브 이미지를 무작위로 회전시킨다. 무작위로 회전된 서브 이미지를 사용자가 올바르게 교정하면 사용자가 인증된다.

AI 영화영상콘텐츠를 위한 AI 예술창작 사례연구 (AI Art Creation Case Study for AI Film & Video Content)

  • 전병원
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.85-95
    • /
    • 2021
  • 현재 우리는 창작도구로서 컴퓨터와 창작자로서 컴퓨터 사이에 서 있다. 또한 포스트 시네마적 상황이라 할 수 있는 새로운 장르의 영화들이 등장하고 있다. 본 논문은 AI 시네마의 출현 가능성을 진단하고자 한다. AI 시네마의 가능성을 확인하고자 영화 창작의 필요조건이라 할 수 있는 스토리, 서사의 창작, 이미지의 창작, 사운드의 창작이 인공지능에 의해 가능한지 사례조사를 통해 살펴보았다. 먼저 AI 페인팅 알고리즘인 Obvious, GAN 및 CAN의 시각이미지 생성을 확인했다. 둘째, AI 사운드, 음악은 이미 인간과 협력하여 유통 단계에 들어섰다. 셋째, AI는 이미 드라마 대본을 완성 할 수 있고, 빅 데이터를 활용한 자동 시나리오 제작 프로그램도 인기를 얻고 있다. 즉, 우리는 필수적인 영화 제작 요구 사항이 AI 알고리즘으로 충족될 수 있음을 확인할 수 있다. 마노 비치의 'AI 장르 컨벤션' 관점에서 웹 다큐멘터리와 데스크톱 다큐멘터리는 포스트 시네마로서 AI 시네마의 대표적인 장르라고 할 수 있다. AI, 웹 다큐멘터리, 데스크톱 다큐멘터리가 존재하고 있는 환경이 동일하기 때문이다. 본 논문은 포스트시네마의 창작자로서 AI에 대한 연구를 통해 4차 산업혁명시대 영화라는 매체가 개척해야 할 새로운 길을 제시하고 있다.

텍스트 마이닝 기법을 활용한 인공지능 기술개발 동향 분석 연구: 깃허브 상의 오픈 소스 소프트웨어 프로젝트를 대상으로 (A Study on the Development Trend of Artificial Intelligence Using Text Mining Technique: Focused on Open Source Software Projects on Github)

  • 정지선;김동성;이홍주;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.1-19
    • /
    • 2019
  • 제4차 산업혁명을 이끄는 주요 원동력 중 하나인 인공지능 기술은 이미지와 음성 인식 등 여러 분야에서 사람과 유사하거나 더 뛰어난 능력을 보이며, 사회 전반에 미치게 될 다양한 영향력으로 인하여 높은 주목을 받고 있다. 특히, 인공지능 기술은 의료, 금융, 제조, 서비스, 교육 등 광범위한 분야에서 활용이 가능하기 때문에, 현재의 기술 동향을 파악하고 발전 방향을 분석하기 위한 노력들 또한 활발히 이루어지고 있다. 한편, 이러한 인공지능 기술의 급속한 발전 배경에는 학습, 추론, 인식 등의 복잡한 인공지능 알고리즘을 개발할 수 있는 주요 플랫폼들이 오픈 소스로 공개되면서, 이를 활용한 기술과 서비스들의 개발이 비약적으로 증가하고 있는 것이 주요 요인 중 하나로 확인된다. 또한, 주요 글로벌 기업들이 개발한 자연어 인식, 음성 인식, 이미지 인식 기능 등의 인공지능 소프트웨어들이 오픈 소스 소프트웨어(OSS: Open Sources Software)로 무료로 공개되면서 기술확산에 크게 기여하고 있다. 이에 따라, 본 연구에서는 온라인상에서 다수의 협업을 통하여 개발이 이루어지고 있는 인공지능과 관련된 주요 오픈 소스 소프트웨어 프로젝트들을 분석하여, 인공지능 기술 개발 현황에 대한 보다 실질적인 동향을 파악하고자 한다. 이를 위하여 깃허브(Github) 상에서 2000년부터 2018년 7월까지 생성된 인공지능과 관련된 주요 프로젝트들의 목록을 검색 및 수집하였으며, 수집 된 프로젝트들의 특징과 기술 분야를 의미하는 토픽 정보들을 대상으로 텍스트 마이닝 기법을 적용하여 주요 기술들의 개발 동향을 연도별로 상세하게 확인하였다. 분석 결과, 인공지능과 관련된 오픈 소스 소프트웨어들은 2016년을 기준으로 급격하게 증가하는 추세이며, 토픽들의 관계 분석을 통하여 주요 기술 동향이 '알고리즘', '프로그래밍 언어', '응용분야', '개발 도구'의 범주로 구분하는 것이 가능함을 확인하였다. 이러한 분석 결과를 바탕으로, 향후 다양한 분야에서의 활용을 위해 개발되고 있는 인공지능 관련 기술들을 보다 상세하게 구분하여 확인하는 것이 가능할 것이며, 효과적인 발전 방향 모색과 변화 추이 분석에 활용이 가능할 것이다.