• Title/Summary/Keyword: 생성AI

검색결과 566건 처리시간 0.029초

AI 이미지 생성 프로그램에서 나타난 패션 이미지의 특징 분석 연구 (A study on the analysis of characteristics of fashion images shown in an AI image generation program)

  • 박근수
    • 문화기술의 융합
    • /
    • 제10권3호
    • /
    • pp.199-207
    • /
    • 2024
  • 오늘날 AI 이미지 생성 기술은 산업 전반으로 확대되어 활용되고 있다. 이에 따라 패션 산업 분야에 최적화된 다양한 AI 이미지 생성 프로그램들이 개발되어 상용화되고 있다. 본 연구에서는 플레이그라운드, 미드저니, 더뉴블랙 등의 AI 이미지 생성 프로그램에서 생성한 패션 이미지의 시각적 특징을 비교 분석하여 각 프로그램의 특징을 파악하고 각 프로그램이 활용될 수 있는 분야와 문제점을 짚어보았다. 연구 결과는 다음과 같다. 첫째, 플레이그라운드와 미드저니는 명령어의 내용을 직관적으로 적용하여 실제 패션 트랜드와는 다른 이미지를 생성하는 반면 뎌뉴블랙은 패션 트랜드와 비교적 유사한 이미지를 생성하였다. 둘째, 플레이그라운드는 명령어 내용에 해당하는 이미지를 분리 또는 조합하는 반면 미드저니는 다양한 디테일을 추가하여 융합함으로써 새로운 이미지를 생성하는 경향이 있다. 셋째, 플레이그라운드에서는 명령어에 제시되지 않은 색상이 배색되어 나타나는 무작위성이 있으며 더뉴브랙에서는 명령어에 포함되지 않은 색상이 코디네이션되어 나타나고 미드저니는 명령어에 지시한 색상을 비교적 정확히 생성한다. 결론적으로 미드저니는 독특하고 창의적인 패션디자인 개발을 위한 영감을 얻고자 할 때 활용할 수 있으며 더 뉴 블랙은 패션 트랜드를 참고하거나 패션 스타일링에 도움이 될 수 있겠다. 반면 플레이그라운드는 색상 생성에 있어 다소 혼돈이 있을 수 있으니 주의할 부분이라고 할 수 있다. 본 연구를 통하여 패션디자인 개발에 있어 AI 이미지 생성 도구가 더욱 효율적으로 활용될 수 있기를 기대한다.

멀티턴 대화를 활용한 레퍼런스 기반의 발화 생성 모델 (Reference-based Utterance Generation Model using Multi-turn Dialogue)

  • 박상민;손유리;금빛나;김홍진;김학수;김재은
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.88-91
    • /
    • 2022
  • 디지털 휴먼, 민원 상담, ARS 등 칫챗의 활용과 수요가 증가함에 따라 칫챗의 성능 향상을 위한 다양한 연구가 진행되고 있다. 특히, 오토 인코더(Auto-encoder) 기반의 생성 모델(Generative Model)은 높은 성능을 보이며 지속적인 연구가 이루어지고 있으나, 이전 대화들에 대한 충분한 문맥 정보의 반영이 어렵고 문법적으로 부적절한 답변을 생성하는 문제가 있다. 이를 개선하기 위해 검색 기반의 생성 모델과 관련된 연구가 진행되고 있으나, 현재 시점의 문장이 유사해도 이전 문장들에 따라 의도와 답변이 달라지는 멀티턴 대화 특징을 반영하여 대화를 검색하는 연구가 부족하다. 본 논문에서는 이와 같은 멀티턴 대화의 특징이 고려된 검색 방법을 제안하고 검색된 레퍼런스(준정답 문장)를 멀티턴 대화와 함께 생성 모델의 입력으로 활용하여 학습시키는 방안을 제안한다. 제안 방안으로 학습된 발화 생성 모델은 기존 모델과 비교 평가를 수행하며 Rouge-1 스코어에서 13.11점, Rouge-2 스코어에서 10.09점 Rouge-L 스코어에서 13.2점 향상된 성능을 보였고 이를 통해 제안 방안의 우수성을 입증하였다.

  • PDF

생성형 AI의 의료적 활용과 개인정보보호 (A Study on the Medical Application and Personal Information Protection of Generative AI)

  • 이수경
    • 의료법학
    • /
    • 제24권4호
    • /
    • pp.67-101
    • /
    • 2023
  • 생성형 AI의 활용은 교육계를 넘어서 이미 의료계에서도 의료 기기에 임상 소프트웨어 등의 도입 등으로 연구되고 있다. 생성형 AI는 대규모 대화형 언어모델을 활용하여 방대한 데이터를 이해하고 자료를 선별하는 시간과 에너지를 줄여주면서 사용자와 끊임없는 대화를 통한 정보의 전달이 가능하다. 바로 이러한 점이 인류에게 생성형 AI가 혁신적인 기술의 등장으로 인정받고 있는 점이기도 하다. 그러나 반면 사용자에게 제공되는 컨텐츠의 정합성은 출처나 근거 없이 사용자에게 판단의 영역으로 맡겨지고 있다. 그러나 이 글에서는 생성형 AI를 활용함에 있어서 가장 직접적으로 발생할 수 있는 쟁점을 우선적으로 살펴보기로 한다. 따라서 이 글에서는 생성형 AI의 대표적인 프로그램인 Chat GPT의 발전과 이용자의 활용에 대비하여 특히 개인정보 보호의 쟁점에 대하여 논의하였다. 이를 위하여 먼저 생성형 AI의 기술적인 특성을 살펴본 뒤에 발생 가능한 민사적 쟁점 가운데에서도 개인정보 보호에 관한 문제를 우선적으로 살펴보았다. 생성형 AI는 그 자체로서 학습 데이터의 편향이나 출처 없는 결과값의 제공 등 여러 문제점이 제기되고 있으나, 이러한 문제점은 윤리적 문제를 내포하는 것으로 당장 임상 소프트웨어로서 의료기기에서 활용될 경우 개인정보 보호법제와 보건의료데이터의 활용 가이드로 환자 혹은 이용자의 개인정보를 보호할 수 있을 것인가에 대한 의문에 대한 논의가 시급하다고 판단되었다. 우리나라의 개인정보 보호법제는 특히 보건의료데이터의 활용에서 특정 개인의 개인정보를 가명처리하고 비식별조치를 취하는 데에 적절한 프로세스를 갖추고 있는 것으로 보이나, 생성형 AI이 소프트웨어로서 의료기기에 적용되었을 경우에도 이 법제로서 개인정보 보호의 목적을 이루기에는 어려운 점이 있다. 임상 소프트웨어에서 활용될 생성형 AI의 기능을 대비하기 위해서는 생성형 AI에 걸맞는 개인정보 보호의 법제가 필요할 것으로 보인다.

한국형 멀티모달 몽타주 앱을 위한 생성형 AI 연구 (Research on Generative AI for Korean Multi-Modal Montage App)

  • 임정현;차경애;고재필;홍원기
    • 서비스연구
    • /
    • 제14권1호
    • /
    • pp.13-26
    • /
    • 2024
  • 멀티모달 (multi-modal) 생성이란 텍스트, 이미지, 오디오 등 다양한 정보를 기반으로 결과를 도출하는 작업을 말한다. AI 기술의 비약적인 발전으로 인해 여러 가지 유형의 데이터를 종합적으로 처리해 결과를 도출하는 멀티모달 기반 시스템 또한 다양해지는 추세이다. 본 논문은 음성과 텍스트 인식을 활용하여 인물을 묘사하면, 몽타주 이미지를 생성하는 AI 시스템의 개발 내용을 소개한다. 기존의 몽타주 생성 기술은 서양인들의 외형을 기준으로 이루어진 반면, 본 논문에서 개발한 몽타주 생성 시스템은 한국인의 안면 특징을 바탕으로 모델을 학습한다. 따라서, 한국어에 특화된 음성과 텍스트의 멀티모달을 기반으로 보다 정확하고 효과적인 한국형 몽타주 이미지를 만들어낼 수 있다. 개발된 몽타주 생성 앱은 몽타주 초안으로 충분히 활용 가능하기 때문에 기존의 몽타주 제작 인력의 수작업을 획기적으로 줄여줄 수 있다. 이를 위해 한국지능정보사회진흥원의 AI-Hub에서 제공하는 페르소나 기반 가상 인물 몽타주 데이터를 활용하였다. AI-Hub는 AI 기술 및 서비스 개발에 필요한 인공지능 학습용 데이터를 구축하여 원스톱 제공을 목적으로 한 AI 통합 플랫폼이다. 이미지 생성 시스템은 고해상도 이미지를 생성하는데 사용하는 딥러닝 모델인 VQGAN과 한국어 기반 영상생성 모델인 KoDALLE 모델을 사용하여 구현하였다. 학습된 AI 모델은 음성과 텍스트를 이용해 묘사한 내용과 매우 유사한 얼굴의 몽타주 이미지가 생성됨을 확인할 수 있다. 개발된 몽타주 생성 앱의 실용성 검증을 위해 10명의 테스터가 사용한 결과 70% 이상이 만족한다는 응답을 보였다. 몽타주 생성 앱은 범죄자 검거 등 얼굴의 특징을 묘사하여 이미지화하는 여러 분야에서 다양하게 사용될 수 있을 것이다.

협업 환경에서의 일관성 확보를 위한 GPT 기반 코딩 프로세스 (GPT-based Coding Process for Consistency in a Collaborative Environment)

  • 정한민;박정훈;유수현
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.437-439
    • /
    • 2023
  • 본 연구는 프로그래밍 협업 환경에서 생성형 AI인 ChatGPT-4를 활용한 코딩 프로세스를 제안한다. 일관성 있는 결과를 얻기 위해 프롬프트 생성, GPT 실행, 의사코드 변환, 코드 비교, 동일 코드 생성 여부 판단, 테스트 실행, 동일 결과 생성 여부 판단, 코드 검사 및 수정의 8단계를 거친다. 팀 프로젝트와 페어 프로그래밍 등의 다양한 협업 환경에 적용 가능한 이 프로세스를 통해 생성형 AI를 효과적으로 활용할 수 있음을 보여주었다는 점에서 그 의미가 있다. 본 연구는 생성형 AI를 활용한 협업 환경에서의 코딩이 본격적으로 이루어질 것으로 예상되는 이 시점에서, 인간-AI 협업 환경에서의 코딩 효율성 및 일관성을 높일 수 있을 것으로 기대한다. 이러한 연구는 인간과 AI가 함께 작업하는 미래를 위한 기초를 마련하는 데 중요한 역할을 할 것이다.

추가 데이터 및 도메인 적응을 위한 기계독해 질의 생성 (Question Generation of Machine Reading Comprehension for Data Augmentation and Domain Adaptation)

  • 이현구;장영진;김진태;왕지현;신동훈;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2019년도 제31회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.415-418
    • /
    • 2019
  • 기계독해 모델에 새로운 도메인을 적용하기 위해서는 도메인에 맞는 데이터가 필요하다. 그러나 추가 데이터 구축은 많은 비용이 발생한다. 사람이 직접 구축한 데이터 없이 적용하기 위해서는 자동 추가 데이터 확보, 도메인 적응의 문제를 해결해야한다. 추가 데이터 확보의 경우 번역, 질의 생성의 방법으로 연구가 진행되었다. 그러나 도메인 적응을 위해서는 새로운 정답 유형에 대한 질의가 필요하며 이를 위해서는 정답 후보 추출, 추출된 정답 후보로 질의를 생성해야한다. 본 논문에서는 이러한 문제를 해결하기 위해 듀얼 포인터 네트워크 기반 정답 후보 추출 모델로 정답 후보를 추출하고, 포인터 제너레이터 기반 질의 생성 모델로 새로운 데이터를 생성하는 방법을 제안한다. 실험 결과 추가 데이터 확보의 경우 KorQuAD, 경제, 금융 도메인의 데이터에서 모두 성능 향상을 보였으며, 도메인 적응 실험에서도 새로운 도메인의 문맥만을 이용해 데이터를 생성했을 때 기존 도메인과 다른 도메인에서 모두 기계독해 성능 향상을 보였다.

  • PDF

GAN을 활용한 기상조건에 따른 하늘 이미지 생성 (Creating Sky Images according to Weather Conditions Using GAN)

  • 조규철;조강현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.293-296
    • /
    • 2024
  • 현재 생성형 AI가 활발히 연구되고 있는 가운데, 대부분의 이미지 생성 AI는 프롬프트를 기반으로 한 Text-To-Image 방식을 주로 사용하고 있다. 하지만, 프롬프트 기반의 생성 AI는 실제 서비스에 도입하기 어려운 점이 많다. 여러 이미지 중, 하늘 이미지는 메타버스 등 가상 공간에서 매우 자주 사용되는 이미지 중 하나이면서 여러 입력값에 의해 이미지가 달라진다. 이 논문에서는 GAN을 활용해 기상 조건에 적합한 하늘 이미지를 생성하는 프로그램을 설계 및 구현한다.

  • PDF

Generative AI parameter tuning for online self-directed learning

  • Jin-Young Jun;Youn-A Min
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권4호
    • /
    • pp.31-38
    • /
    • 2024
  • 본 연구는 온라인 원격교육에서 코딩 교육 활성화를 위해, 생성형 AI 기반의 학습 지원 도구개발에 필요한 하이퍼 파라미터 설정을 제안한다. 연구를 위해 세 가지 다른 학습 맥락에 따라 하이퍼 파라미터를 설정할 수 있는 실험 도구를 구현하고, 실험 도구를 통해 생성형 AI의 응답 품질을 평가하였다. 생성형 AI 자체의 기본 하이퍼 파라미터 설정을 유지한 실험은 대조군으로, 연구에서 설정한 하이퍼 파라미터를 사용한 실험은 실험군으로 하였다. 실험 결과, 첫 번째 학습맥락인 "학습 지원"에서는 실험군과 대조군 사이의 유의한 차이가 관찰되지 않았으나, 두 번째와 세 번째 학습 맥락인 "코드생성"과 "주석생성"에서는 실험군의 평가점수 평균이 대조군보다 각각 11.6% 포인트, 23% 포인트 높은 것으로 나타났다. 또한, system content에 응답이 학습 동기에 미칠 수 있는 영향을 제시하면 학습 정서를 고려한 응답이 생성되는 것이 관찰되었다.

린 스타트업을 위한 생성형 AI 서비스 활용 심층 인터뷰 가이드라인 제안 (A suggestion of in-depth interview guidelines using generative AI services for lean startups)

  • 이수빈;정영욱
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.471-485
    • /
    • 2024
  • 본 연구는 린 스타트업 환경 내에서 생성형 AI를 활용한 심층 인터뷰의 효율적인 활용 방안을 탐구한다. 최근 기술적 진보에 따라 다양한 조직에서 생성형 AI를 활용하여 업무 생산성을 증진시키는 사례가 증가하고 있으며, 이는 린 스타트업 환경에서도 적용되고 있다. 본 연구는 린 스타트업에서 비교적 부족한 시간과 한정된 자본내에서도 실무자들이 AI를 활용하여 심층 인터뷰를 수행할 수 있도록 돕기 위해 구체적인 가이드라인과 가이드북을 개발했다. 제안된 가이드북은 실무자들이 신속하게 인터뷰를 설계하고 진행할 수 있도록 지원함으로써, 린 스타트업의 민첩하고 유연한 작업 환경을 촉진하는 것을 목표로 한다. 본 연구는 또한 ChatGPT 4, 뤼튼 등과 같은 텍스트 기반 생성형 AI 서비스를 디자인 및 인터뷰 분야에 활용하는 실무적 방법을 탐구하며, 이를 통해 학술적 논의와 실무적 적용의 기여를 하는 데에 의의가 있다.

AI 기반 텍스처 자동 생성 도구를 이용한 게임 그래픽 리소스 제작에 관한 연구 (A Study on Game Graphics Resource Production Using AI-based Automatic Texture Creation Tool)

  • 신수진
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.165-166
    • /
    • 2023
  • 게임 그래픽 제작 분야는 기술적 진보가 가속화 되어 가고 있는데 리소스 제작 도구의 다양한 출현과 개발자의 학습과 적절한 사용도 큰 몫을 담당하고 있다. 최근에 빠르게 발전하고 있는 분야인 AI기반의 콘텐츠 제작 도구가 게임 개발의 여러 영역에 다양한 영향을 줄 것으로 보인다. 그 중 비교적 개발 파이프라인에 빠르고 안정적인 도입이 가능한 AI 기반의 텍스쳐 자동 생성 도구를 기존에 사용하고 있는 텍스쳐 제작 도구와 비교 분석 해 보았다. 이를 통해 효과적인 텍스쳐 생성 프로세스 파이프라인 구축을 위해 AI 기반의 텍스쳐 자동 생성 도구의 적극적인 도입의 필요성과 함께 이후 연구의 방향을 제시한다.

  • PDF