• 제목/요약/키워드: AI 이미지 생성 도구

검색결과 9건 처리시간 0.023초

패션디자인 개발을 위한 AI 이미지 생성 도구의 활용 가능성 연구 -미드저니(Midjourney)의 활용을 중심으로 (Study on the feasibility of using AI image generation tool for fashion design development -Focused on the use of Midjourney)

  • 박근수
    • 문화기술의 융합
    • /
    • 제9권6호
    • /
    • pp.237-244
    • /
    • 2023
  • 오늘날 AI는 여러 산업 분야에 적용되면서 전반적인 산업의 패러다임의 변화를 이끌고 있다. 패션 산업 분야에서도 트렌드 예측이나 소비자를 위한 다양한 서비스를 위하여 AI가 활용되고 있으며 특히 AI 이미지 생성 도구는 패션디자인 개발을 위한 도구로서의 가능성을 가진다. 본 연구는 AI 이미지 생성 도구 중에서 미드저니를 사용하여 이미지를 생성해보고 그 특징을 파악함으로써 패션디자인 개발을 위하여 미드저니의 활용 가능성과 한계점을 알아보았다. 미드저니에서 생성되는 이미지의 특징은 다음과 같다. 첫째, 명령어에 해당하는 이미지들을 직관적으로 적용 또는 조합하여 이미지를 생성하는 직관성을 가진다. 둘째, 동일한 명령어라도 시차를 두고 입력할 때 다른 이미지가 생성되는 무작위성을 가진다. 셋째, 기존의 이미지와 명령어를 함께 사용할 경우 미드저니에서 생성된 이미지는 명령어보다 기존의 이미지에 더 의존적이다. 결론적으로 미드저니의 다양한 이미지 생성 기능과 명령어에 따라 이미지가 변하는 특징은 독창적인 패션디자인을 개발하는 데 도움이 될 수 있겠다. 다만 착용이나 제작이 불가한 패션디자인이 제시되기도 한다는 점은 주의해야 할 부분이다. 본 연구 결과가 패션디자인 개발을 위한 AI 이미지 생성 도구의 활용에 있어 기초 자료가 되기를 기대한다.

창작·예술 분야의 생성형 aI 활용 방법에 대한 연구 (A Study on the use of generative AI in creative and artistic fields)

  • 이동후
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.569-572
    • /
    • 2023
  • 최근 하루가 다르게 발전하고 있는 생성형 AI가 창작과 예술 분야에 어떤 영향을 미칠 수 있는지, 새롭게 등장하고 있는 다양한 분야에서 활용 가능한 획기적인 기능 등을 살펴보고 이를 바탕으로 새로운 창작 방향을 제시할 수 있는 방법들을 살펴보려 한다. 최근, 작곡가와 소설가들은 물론, 디지털 아티스트들까지도 생성형 AI를 활용하여 독특한 음악, 글, 그리고 이미지를 창조하는데 성공했다는 사례들이 속속 드러나고 있고 영상, 게임, 웹툰 등 많은 산업현장에서 직접적인 활용방법에 대한 연구결과가 등장하고 실제 적용 사례도 늘어나고 있다. 이미지 생성기인 미드저니와 스테이블디퓨전 같은 도구들은 혁신적인 방법으로 빠르게 높은 퀄리티의 이미지를 생성하고 다양한 아이디어를 제공 받을 수 있는 도구로 창작과 예술 분야에서 큰 관심을 받고 있다. 이러한 발전은 창작과 예술 분야에서 생성형 AI의 무한한 가능성을 보여주는 한편, 인간의 창의성 침해와 예술가들의 노력 희석에 대한 비판적 시각을 불러일으키기도 한다. 본 연구는 이런 다양한 관점에서 창작·예술 분야의 생성형 AI 활용을 깊이 있게 탐구한다. 그 과정에서 여러 생성형 AI 도구들, 특히 이미지 생성기 미드저니와 스테이블디퓨전의 기능과 활용 방안, 그로 인한 사회적, 윤리적 측면을 분석하며, 창작·예술 분야에서의 생성형 AI 활용의 적절한 방향성과 미래 전망을 제시해 보고자 한다.

  • PDF

AI 이미지 생성 프로그램에서 나타난 패션 이미지의 특징 분석 연구 (A study on the analysis of characteristics of fashion images shown in an AI image generation program)

  • 박근수
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.199-207
    • /
    • 2024
  • 오늘날 AI 이미지 생성 기술은 산업 전반으로 확대되어 활용되고 있다. 이에 따라 패션 산업 분야에 최적화된 다양한 AI 이미지 생성 프로그램들이 개발되어 상용화되고 있다. 본 연구에서는 플레이그라운드, 미드저니, 더뉴블랙 등의 AI 이미지 생성 프로그램에서 생성한 패션 이미지의 시각적 특징을 비교 분석하여 각 프로그램의 특징을 파악하고 각 프로그램이 활용될 수 있는 분야와 문제점을 짚어보았다. 연구 결과는 다음과 같다. 첫째, 플레이그라운드와 미드저니는 명령어의 내용을 직관적으로 적용하여 실제 패션 트랜드와는 다른 이미지를 생성하는 반면 뎌뉴블랙은 패션 트랜드와 비교적 유사한 이미지를 생성하였다. 둘째, 플레이그라운드는 명령어 내용에 해당하는 이미지를 분리 또는 조합하는 반면 미드저니는 다양한 디테일을 추가하여 융합함으로써 새로운 이미지를 생성하는 경향이 있다. 셋째, 플레이그라운드에서는 명령어에 제시되지 않은 색상이 배색되어 나타나는 무작위성이 있으며 더뉴브랙에서는 명령어에 포함되지 않은 색상이 코디네이션되어 나타나고 미드저니는 명령어에 지시한 색상을 비교적 정확히 생성한다. 결론적으로 미드저니는 독특하고 창의적인 패션디자인 개발을 위한 영감을 얻고자 할 때 활용할 수 있으며 더 뉴 블랙은 패션 트랜드를 참고하거나 패션 스타일링에 도움이 될 수 있겠다. 반면 플레이그라운드는 색상 생성에 있어 다소 혼돈이 있을 수 있으니 주의할 부분이라고 할 수 있다. 본 연구를 통하여 패션디자인 개발에 있어 AI 이미지 생성 도구가 더욱 효율적으로 활용될 수 있기를 기대한다.

패션디자인을 위한 AI 생성 이미지 색상 비교 연구 -미드저니의 활용을 중심으로- (A Study on the Color of AI-Generated Images for Fashion Design -Focused on the Use of Midjourney)

  • 박근수
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.343-348
    • /
    • 2024
  • 오늘날 AI 이미지 생성 프로그램은 패션 상품 광고, 맞춤형 패션 스타일 제안, 디자인 개발 등 패션 산업 분야의 세분화된 목적에 알맞게 개발되고 있다. 한편 색상은 강력한 조형 요소로서 상품이나 패션 스타일 제안을 위한 이미지 표현에 중요한 역할을 한다. 본 연구는 AI 이미지 생성 도구 중에서 미드저니를 사용하여 생성한 의상 이미지에 나타나는 색상과 배색 관계에 중점을 두어 그 특징을 파악함으로써 미드저니의 활용에 대한 이해를 넓히고자 한다. 본 연구의 결과는 다음과 같다. 첫째, 미드저니에서 생성한 초기의 이미지는 명령어에 지시한 색상보다 이미지 생성을 위하여 사용한 기존의 이미지 색상에 더 의존적으로 반영되어 나타난다. 둘째, 미드저니에서 생성된 이미지의 의상에 나타난 배색의 특징은 의상의 구조에 따라 구분되는 부위별로 다른 색상이 표현된 분리배색과 의상의 한 부위에 다른 색상들이 무늬 형태로 표현된 혼합배색이 생성된다. 분리배색에 표현된 색상들의 비율은 명령어에 지시한 색상 순서의 영향을 받는다. 혼합배색에 조합되어 나타난 색상 수는 미드저니에서 이미지 생성을 위하여 사용한 기존의 이미지 속 의상의 색상 수와 명령어에 지시한 색상 수의 총합보다 적은 수의 색상으로 조합되어 나타난다. 셋째, 미드저니는 생성하는 이미지의 배경도 색상 표현을 위한 대상으로 인식하며 이에 따른 배경색의 변화는 이미지 속의 의상에 대한 사용자의 색지각과 의상 이미지 형성에 영향을 미칠 수 있으므로 주의가 필요하다. 본 연구 결과가 패션디자인 교육과 실무에 있어 미드저니에서 생성되는 이미지의 색상 배색에 대한 이해를 넓히고 이를 통하여 미드저니의 활용에 도움이 되기를 기대한다.

인공지능 기반 DALL-E2 활용 쓰기 활동에 대한 영어학습자들의 인식 조사 (A Pilot Study of English Learners' Perception on Writing Activities using AI-Based DALL-E2)

  • 윤택남
    • 문화기술의 융합
    • /
    • 제9권3호
    • /
    • pp.121-127
    • /
    • 2023
  • 본 예비연구의 목적은 이미지 생성 인공지능 도구인 DALL-E2를 활용하여 영어 작문 활동을 실시한 후 중학생들의 영어 학습에 미치는 반응을 살펴보는 데 있다. 이를 위하여 15명의 중학교 영어학습자를 대상으로 3주간 실험 수업을 진행하였으며 그 결과를 정리하면 다음과 같다. 첫째, DALL-E2 활용 영어 작문 활동에 대한 설문조사 결과, 자신감, 흥미 및 인공지능 기반 도구 활용 쓰기에 대한 인식이 긍정적으로 변화하였음을 알 수 있었다. 아울러 통계적으로 유의미한 차이가 나타났음을 확인하였으며 이는 인공지능 활용 학습이 영어 작문 및 전반적인 영어 학습에 있어 긍정적인 영향을 미쳤다는 것을 의미하였다. 둘째, DALL-E2 활용 영어 작문 활동에 대한 소감문을 내용분석을 통해 분석한 결과, 핵심 주제를 3가지(인지적, 정의적, 심동적 특성)로 추출할 수 있었으며 영어 학습에 있어 인공지능 기반의 DALL-E2의 활용과 접목은 학습에 대한 새로운 흥미와 도전, 의지, 적극성을 높이며 궁극적으로는 영어표현력(productive skill) 향상에 일부 기여한 것으로 해석할 수 있었다.

서브 이미지의 교정을 통한 이미지 기반의 CAPTCHA 시스템 (An Image-based CAPTCHA System with Correction of Sub-images)

  • 정우근;지승현;조환규
    • 한국정보과학회논문지:컴퓨팅의 실제 및 레터
    • /
    • 제16권8호
    • /
    • pp.873-877
    • /
    • 2010
  • CAPTCHA은 스팸이나 로봇에 의한 사이트 자동가입을 막는 계정 생성방지 도구로써, 특정 언어 또는 그림을 해독할 수 있는 인간의 우수한 가독성을 이용한 것으로 일반적으로 컴퓨터 프로그램이 해독하기 어려운 기호, 글자 등을 입력하도록 하여 스팸 또는 자동화 도구 등을 무력화 시키는 보안 기술이다. 하지만 기존에 사용되었던 CAPTCHA 방식은 웹봇 또는 이미지프로세싱, 머신 러닝을 통하여 쉽게 통과할 수 있는 것으로 알려졌다. 본 논문에서는 기존에 사용되었던 Text 기반의 CAPTCHA 시스템과는 달리 이미지 기반의 새로운 CAPTCHA 시스템을 제안한다. 본 논문에서 제공되는 시스템은 일반적으로 현상된 사진의 부분적인 이미지를 추출하여 추출된 이미지의 회전을 통하여 CAPTCHA 시스템을 제공하는 것이다. 사용자 인증은 다음과 같이 검증한다. 먼저 총 8장의 사진에서 각각 서브 이미지를 추출하여, 추출된 서브 이미지를 무작위로 회전시킨다. 무작위로 회전된 서브 이미지를 사용자가 올바르게 교정하면 사용자가 인증된다.

AI 영화영상콘텐츠를 위한 AI 예술창작 사례연구 (AI Art Creation Case Study for AI Film & Video Content)

  • 전병원
    • 문화기술의 융합
    • /
    • 제7권2호
    • /
    • pp.85-95
    • /
    • 2021
  • 현재 우리는 창작도구로서 컴퓨터와 창작자로서 컴퓨터 사이에 서 있다. 또한 포스트 시네마적 상황이라 할 수 있는 새로운 장르의 영화들이 등장하고 있다. 본 논문은 AI 시네마의 출현 가능성을 진단하고자 한다. AI 시네마의 가능성을 확인하고자 영화 창작의 필요조건이라 할 수 있는 스토리, 서사의 창작, 이미지의 창작, 사운드의 창작이 인공지능에 의해 가능한지 사례조사를 통해 살펴보았다. 먼저 AI 페인팅 알고리즘인 Obvious, GAN 및 CAN의 시각이미지 생성을 확인했다. 둘째, AI 사운드, 음악은 이미 인간과 협력하여 유통 단계에 들어섰다. 셋째, AI는 이미 드라마 대본을 완성 할 수 있고, 빅 데이터를 활용한 자동 시나리오 제작 프로그램도 인기를 얻고 있다. 즉, 우리는 필수적인 영화 제작 요구 사항이 AI 알고리즘으로 충족될 수 있음을 확인할 수 있다. 마노 비치의 'AI 장르 컨벤션' 관점에서 웹 다큐멘터리와 데스크톱 다큐멘터리는 포스트 시네마로서 AI 시네마의 대표적인 장르라고 할 수 있다. AI, 웹 다큐멘터리, 데스크톱 다큐멘터리가 존재하고 있는 환경이 동일하기 때문이다. 본 논문은 포스트시네마의 창작자로서 AI에 대한 연구를 통해 4차 산업혁명시대 영화라는 매체가 개척해야 할 새로운 길을 제시하고 있다.

텍스트 마이닝 기법을 활용한 인공지능 기술개발 동향 분석 연구: 깃허브 상의 오픈 소스 소프트웨어 프로젝트를 대상으로 (A Study on the Development Trend of Artificial Intelligence Using Text Mining Technique: Focused on Open Source Software Projects on Github)

  • 정지선;김동성;이홍주;김종우
    • 지능정보연구
    • /
    • 제25권1호
    • /
    • pp.1-19
    • /
    • 2019
  • 제4차 산업혁명을 이끄는 주요 원동력 중 하나인 인공지능 기술은 이미지와 음성 인식 등 여러 분야에서 사람과 유사하거나 더 뛰어난 능력을 보이며, 사회 전반에 미치게 될 다양한 영향력으로 인하여 높은 주목을 받고 있다. 특히, 인공지능 기술은 의료, 금융, 제조, 서비스, 교육 등 광범위한 분야에서 활용이 가능하기 때문에, 현재의 기술 동향을 파악하고 발전 방향을 분석하기 위한 노력들 또한 활발히 이루어지고 있다. 한편, 이러한 인공지능 기술의 급속한 발전 배경에는 학습, 추론, 인식 등의 복잡한 인공지능 알고리즘을 개발할 수 있는 주요 플랫폼들이 오픈 소스로 공개되면서, 이를 활용한 기술과 서비스들의 개발이 비약적으로 증가하고 있는 것이 주요 요인 중 하나로 확인된다. 또한, 주요 글로벌 기업들이 개발한 자연어 인식, 음성 인식, 이미지 인식 기능 등의 인공지능 소프트웨어들이 오픈 소스 소프트웨어(OSS: Open Sources Software)로 무료로 공개되면서 기술확산에 크게 기여하고 있다. 이에 따라, 본 연구에서는 온라인상에서 다수의 협업을 통하여 개발이 이루어지고 있는 인공지능과 관련된 주요 오픈 소스 소프트웨어 프로젝트들을 분석하여, 인공지능 기술 개발 현황에 대한 보다 실질적인 동향을 파악하고자 한다. 이를 위하여 깃허브(Github) 상에서 2000년부터 2018년 7월까지 생성된 인공지능과 관련된 주요 프로젝트들의 목록을 검색 및 수집하였으며, 수집 된 프로젝트들의 특징과 기술 분야를 의미하는 토픽 정보들을 대상으로 텍스트 마이닝 기법을 적용하여 주요 기술들의 개발 동향을 연도별로 상세하게 확인하였다. 분석 결과, 인공지능과 관련된 오픈 소스 소프트웨어들은 2016년을 기준으로 급격하게 증가하는 추세이며, 토픽들의 관계 분석을 통하여 주요 기술 동향이 '알고리즘', '프로그래밍 언어', '응용분야', '개발 도구'의 범주로 구분하는 것이 가능함을 확인하였다. 이러한 분석 결과를 바탕으로, 향후 다양한 분야에서의 활용을 위해 개발되고 있는 인공지능 관련 기술들을 보다 상세하게 구분하여 확인하는 것이 가능할 것이며, 효과적인 발전 방향 모색과 변화 추이 분석에 활용이 가능할 것이다.

비접촉 데이터 사회와 아카이브 재영토화 (Contactless Data Society and Reterritorialization of the Archive )

  • 조민지
    • 기록학연구
    • /
    • 제79호
    • /
    • pp.5-32
    • /
    • 2024
  • 한국 정부가 UN의 2022년 전자정부 발전 지수에서 UN가입 193개국 중 3위에 랭크됐다. 그동안 꾸준히 상위국으로 평가된 한국은 분명 세계 전자정부의 선도국이라 할 수 있다. 전자정부의 윤활유는 데이터다. 데이터는 그 자체로 정보가 아니고 기록도 아니지만 정보와 기록의 원천이며 지식의 자원이다. 전자적 시스템을 통한 행정 행위가 보편화된 이후 당연히 데이터에 기반한 기록의 생산과 기술이 확대되고 진화하고 있다. 기술은 가치중립적인 듯 보이지만 사실 그 자체로 특정 세계관을 반영하고 있다. 더구나 비물질적 유통을 기반으로 하는 디지털 세계, 온라인 네트워크의 또 다른 아이러니는 반드시 물리적 도구를 통해서만 접속하고 접촉할 수 있다는 점이다. 디지털 정보는 논리적 대상이지만 반드시 어떤 유형이든 그것을 중계할 장치 없이는 디지털 자원을 읽어 내거나 활용할 수 없다. 초연결, 초지능을 무기로 하는 새로운 기술의 디지털 질서는 전통적인 권력 구조에 깊은 영향력을 끼칠 뿐만 아니라 기존의 정보 및 지식 전달 매개체에도 마찬가지의 영향을 미치고 있다. 더구나 데이터에 기반한 생성형 인공지능을 비롯해 새로운 기술과 매개가 단연 화두다. 디지털 기술의 전방위적 성장과 확산이 인간 역능의 증강과 사유의 외주화 상황까지 왔다고 볼 수 있을 것이다. 여기에는 딥 페이크를 비롯한 가짜 이미지, 오토 프로파일링, 사실처럼 생성해 내는 AI 거짓말(hallucination), 기계 학습데이터의 저작권 침해에 이르기까지 다양한 문제점 또한 내포하고 있다. 더구나 급진적 연결 능력은 방대한 데이터의 즉각적 공유를 가능하게 하고 인지 없이 행위를 발생시키는 기술적 무의식에 의존하게 된다. 그런 점에서 지금의 기술 사회의 기계는 단순 보조의 수준을 넘어서고 있으며 기계의 인간 사회 진입은 고도의 기술 발전에 따른 자연적인 변화 양상이라고 하기에는 간단하지 않은 지점이 존재한다. 시간이 지나며 기계에 대한 관점이 변화하게 될 것이기 때문이다. 따라서 중요한 것은 기계를 통한 커뮤니케이션, 행위의 결과로서의 기록이 생산되고 사용되는 방식의 변화가 의미하는 사회문화적 함의에 있다. 아카이브 영역에서도 초지능, 초연결사회를 향한 기술의 변화로 인해 데이터 기반 아카이브 사회는 어떤 문제에 직면하게 될 것인지, 그리고 그 속에서 누가 어떻게 기록과 데이터의 지속적 활동성을 입증하고 매체 변화의 주요 동인이 될 것인가에 대한 연구가 필요한 시점이다. 본 연구는 아카이브가 행위의 결과인 기록뿐만 아니라 데이터를 전략적 자산으로 인식할 필요성에서 시작했다. 이를 통해 전통적 경계를 확장하고 데이터 중심 사회에서 어떻게 재영토화를 이룰 수 있을지를 알아보았다.