• 제목/요약/키워드: 생성적 인공지능

검색결과 465건 처리시간 0.031초

GAN 으로 합성된 흉부 X-ray 를 활용한 의료 인공지능 교육 모델에 관한 사례 연구 (A Case Study on an Educational Model of Medical AI Using Chest X-ray Synthetized by GAN)

  • 이규빈;윤예빈;함소진;배현진;유원상
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2021년도 추계학술발표대회
    • /
    • pp.887-890
    • /
    • 2021
  • 최근 AI 를 활용한 의료 진단 솔루션 시장이 크게 성장함에 따라 의료 인공지능 기술에 대한 대학 교육에 대한 수요가 증가하고 있지만, 개인정보 유출의 위험성 등으로 인하여 의료 데이터를 대학 교육에 활용하기 어려운 실정이다. 본 논문에서는 실제 의료 데이터 대신 생성적 적대 신경망(GAN)으로 합성된 흉부 X-ray 영상을 활용한 의료 인공지능 교육 모델의 사례를 제시한다. 프로메디우스(주)에 의해 제공받은 흉부 X-ray 합성영상을 사용하여, VGG-16 모델을 훈련하고 성능을 검증 및 평가하며 미세조정을 통해 성능을 개선하는 교육 모델을 구성하였다. 또한 교육모델이 의료 인공지능에 대한 학생들의 이해력 향상에 기여한 효과를 정량적으로 평가하였다.

휴머노이드 로봇의 지능적 행위 구현에 관한 연구 (A Study on the Development of Intelligent Behavior of Humanoid Robot)

  • 서주희;장인우;우종우
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2008년도 추계학술발표대회
    • /
    • pp.23-26
    • /
    • 2008
  • 본 논문에서는 로봇의 지능적 행위를 구현하기 위하여 인공지능의 몇 가지 기법을 휴머노이드 로봇에 적용하고 이를 테스트 도메인에서 실험하는 연구결과를 기술하였다. 본 연구에서 적용한 기법들은, 인공지능의 계획기법에 기반한 로봇의 계획생성, A* 알고리즘을 적용한 길 찾기, 외부 센서 값에 기반한 장애물회피 및 로봇의 자기 위치인식, 그리고 원하는 물체를 파악하기 위해 템플릿 매칭을 이용한 영상인식 등 네 가지 방향으로 접근하였다. 전반적으로 로봇의 실험은, 웹 페이지로부터 사용자의 쇼핑 목록을 입력 받아, 인공지능의 계획기법에 기반하여 서버에서 이에 대한 실행계획을 만들고 난 후, 로봇이 서버로부터 TCP/IP 기반의 소켓 통신을 통하여 세부 실행계획을 전달받아 임무를 수행하게 된다. 또한 이러한 임무를 수행하기 위해서는 로봇자신의 현재위치에 대한 정보 및 목표물에 대한 위치인식이 요구되며, 이를 위해서 사전에 주어진 맵의 좌표를 찾아가는 방법을 사용하였다.

인공지능 기반 사회적 지지를 위한 대형언어모형의 공감적 추론 향상: 심리치료 모형을 중심으로 (Enhancing Empathic Reasoning of Large Language Models Based on Psychotherapy Models for AI-assisted Social Support)

  • 이윤경;이인주;신민정;배서연;한소원
    • 인지과학
    • /
    • 제35권1호
    • /
    • pp.23-48
    • /
    • 2024
  • 대형언어모형(LLM)을 현실에 적용하려는 지속적인 노력에도 불구하고, 인공지능이 맥락을 이해하고 사람의 의도에 맞게 사회적 지지를 제공하는 능력은 아직 제한적이다. 본 연구에서는 LLM이 사람의 감정 상태를 추론하도록 유도하기 위해, 심리 치료 이론을 기반으로 한 공감 체인(Chain of Empathy, CoE) 프롬프트 방법을 새로 개발했다. CoE 기반 LLM은 인지-행동 치료(CBT), 변증법적 행동 치료(DBT), 인간 중심 치료(PCT) 및 현실 치료(RT)와 같은 다양한 심리 치료 방식을 참고하였으며, 각 방식의 목적에 맞게 내담자의 정신 상태를 해석하도록 설계했다. CoE 기반 추론을 유도하지 않은 조건에서는 LLM이 사회적 지지를 구하는 내담자의 글에 주로 탐색적 공감 표현(예: 개방형 질문)만을 생성했으며, 추론을 유도한 조건에서는 각 심리 치료 모형을 대표하는 정신 상태 추론 방법과 일치하는 다양한 공감 표현을 생성했다. 공감 표현 분류 과제에서 CBT 기반 CoE는 감정적 반응, 탐색, 해석 등을 가장 균형적으로 분류하였으나, DBT 및 PCT 기반 CoE는 감정적 반응 공감 표현을 더 잘 분류하였다. 추가로, 각 프롬프트 조건 별로 생성된 텍스트 데이터를 정성적으로 분석하고 정렬 정확도를 평가하였다. 본 연구의 결과는 감정 및 맥락 이해가 인간-인공지능 의사소통에 미치는 영향에 대한 함의를 제공한다. 특히 인공지능이 안전하고 공감적으로 인간과 소통하는 데 있어 추론 방식이 중요하다는 근거를 제공하며, 이러한 추론 능력을 높이는 데 심리학의 이론이 인공지능의 발전과 활용에 기여할 수 있음을 시사한다.

Text-to-Image를 위한 아동 손그림 학습 모델 생성 연구 (Study on Generation of Children's Hand Drawing Learning Model for Text-to-Image)

  • 이은채;문미경
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제66차 하계학술대회논문집 30권2호
    • /
    • pp.505-506
    • /
    • 2022
  • 인공지능 기술은 점차 빠른 속도로 발전되며 응용 분야가 확대되어 창작 산업에서의 역할도 커져 예술, 영화 및 기타 창조적인 산업에도 영향을 주고 있다. 이러한 인공지능 기술을 이용하여 텍스트로 설명하면 다양한 스타일의 이미지를 생성해내는 기술이 있지만 아동이 직접 그린 손그림 스타일의 그림을 생성하지는 못한다. 본 논문에서는 아동 손그림 데이터를 통해 Text-to-Image를 학습시켜 새로운 학습 모델을 생성하는 과정에 대해서 기술한다. 이 연구를 통해 생성된 픽셀을 결합하여 텍스트를 기반으로 하나의 아동 손그림을 만들 수 있을 것으로 기대한다.

  • PDF

멀티턴 대화를 활용한 레퍼런스 기반의 발화 생성 모델 (Reference-based Utterance Generation Model using Multi-turn Dialogue)

  • 박상민;손유리;금빛나;김홍진;김학수;김재은
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.88-91
    • /
    • 2022
  • 디지털 휴먼, 민원 상담, ARS 등 칫챗의 활용과 수요가 증가함에 따라 칫챗의 성능 향상을 위한 다양한 연구가 진행되고 있다. 특히, 오토 인코더(Auto-encoder) 기반의 생성 모델(Generative Model)은 높은 성능을 보이며 지속적인 연구가 이루어지고 있으나, 이전 대화들에 대한 충분한 문맥 정보의 반영이 어렵고 문법적으로 부적절한 답변을 생성하는 문제가 있다. 이를 개선하기 위해 검색 기반의 생성 모델과 관련된 연구가 진행되고 있으나, 현재 시점의 문장이 유사해도 이전 문장들에 따라 의도와 답변이 달라지는 멀티턴 대화 특징을 반영하여 대화를 검색하는 연구가 부족하다. 본 논문에서는 이와 같은 멀티턴 대화의 특징이 고려된 검색 방법을 제안하고 검색된 레퍼런스(준정답 문장)를 멀티턴 대화와 함께 생성 모델의 입력으로 활용하여 학습시키는 방안을 제안한다. 제안 방안으로 학습된 발화 생성 모델은 기존 모델과 비교 평가를 수행하며 Rouge-1 스코어에서 13.11점, Rouge-2 스코어에서 10.09점 Rouge-L 스코어에서 13.2점 향상된 성능을 보였고 이를 통해 제안 방안의 우수성을 입증하였다.

  • PDF

불똥 입자의 이류과 삭제를 효율적으로 학습 표현하는 인공신경망 (An Artificial Neural Network for Efficiently Learning and Representation the Advection and Remove of Fire-Flake Particles)

  • 김동희;김종현
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2022년도 제65차 동계학술대회논문집 30권1호
    • /
    • pp.345-348
    • /
    • 2022
  • 본 논문에서는 유체 시뮬레이션(Fluid simulation)중 화염에서 표현되는 불똥 입자(Fire-flake particle)의 생성, 움직임과 삭제를 효율적으로 학습하고 표현할 수 있는 인공지능 기법에 대해 소개한다. 유체 시뮬레이션을 계산하기 위해서는 일반적으로 수치해석학과 같은 학문의 이해가 필요하며 불똥이나 거품과 같은 유체의 2차 효과(Secondary effect)는 기반유체(Underlying fluids)를 통해 추출되기 때문에 복잡하고 계산양이 많아진다. 이러한 문제를 완화하고자 본 논문에서는 인공신경망을 이용한 분류 모델 학습을 통해 격자 내에서 표현되어야 하는 불똥 입자의 생성을 학습하고, 다항 회귀 모델 학습을 통해 불똥 입자의 움직임을 예측한다. 또한, 불똥 입자가 삭제되어야하는 상태를 네트워크 학습을 통해 얻어내며, 수명(Lifespan) 임계값 조절하여 다양한 장면에서 불똥을 제어할 수 있다. 결과적으로 화염의 움직임을 기반으로 불똥의 움직임을 복잡한 수학식이나 디자이너에게 의존하지 않고 인공지능 학습을 통해 쉽게 제어하고 예측하는 결과를 보여준다.

  • PDF

창작·예술 분야의 생성형 aI 활용 방법에 대한 연구 (A Study on the use of generative AI in creative and artistic fields)

  • 이동후
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2023년도 제68차 하계학술대회논문집 31권2호
    • /
    • pp.569-572
    • /
    • 2023
  • 최근 하루가 다르게 발전하고 있는 생성형 AI가 창작과 예술 분야에 어떤 영향을 미칠 수 있는지, 새롭게 등장하고 있는 다양한 분야에서 활용 가능한 획기적인 기능 등을 살펴보고 이를 바탕으로 새로운 창작 방향을 제시할 수 있는 방법들을 살펴보려 한다. 최근, 작곡가와 소설가들은 물론, 디지털 아티스트들까지도 생성형 AI를 활용하여 독특한 음악, 글, 그리고 이미지를 창조하는데 성공했다는 사례들이 속속 드러나고 있고 영상, 게임, 웹툰 등 많은 산업현장에서 직접적인 활용방법에 대한 연구결과가 등장하고 실제 적용 사례도 늘어나고 있다. 이미지 생성기인 미드저니와 스테이블디퓨전 같은 도구들은 혁신적인 방법으로 빠르게 높은 퀄리티의 이미지를 생성하고 다양한 아이디어를 제공 받을 수 있는 도구로 창작과 예술 분야에서 큰 관심을 받고 있다. 이러한 발전은 창작과 예술 분야에서 생성형 AI의 무한한 가능성을 보여주는 한편, 인간의 창의성 침해와 예술가들의 노력 희석에 대한 비판적 시각을 불러일으키기도 한다. 본 연구는 이런 다양한 관점에서 창작·예술 분야의 생성형 AI 활용을 깊이 있게 탐구한다. 그 과정에서 여러 생성형 AI 도구들, 특히 이미지 생성기 미드저니와 스테이블디퓨전의 기능과 활용 방안, 그로 인한 사회적, 윤리적 측면을 분석하며, 창작·예술 분야에서의 생성형 AI 활용의 적절한 방향성과 미래 전망을 제시해 보고자 한다.

  • PDF

인공지능의 서사 지능 탐구 : 새로운 서사 생태계와 호모 나랜스의 진화 (Exploring Narrative Intelligence in AI: Implications for the Evolution of Homo narrans)

  • 권호창
    • 트랜스-
    • /
    • 제16권
    • /
    • pp.107-133
    • /
    • 2024
  • 내러티브는 인간의 인지와 사회 문화의 기본이며 개인과 사회가 의미를 구성하고 경험을 공유하며 문화적, 도덕적 가치를 전달하는 주요 수단으로 사용된다. 인간의 사고와 행동을 모방하려는 인공지능 분야에서는 오랫동안 스토리 생성과 스토리 이해에 관해서 연구해 왔으며, 오늘날 대규모 언어 모델은 발전된 자연어 처리 기술을 바탕으로 괄목할 만한 서사적 능력을 보여주고 있다. 이런 상황은 다양한 변화와 새로운 문제를 제기하지만 이에 대한 포괄적인 논의를 찾아보기는 어렵다. 본 논문은 인간과 AI의 서사 지능의 교차점과 상호작용을 살펴봄으로써 현재의 상태와 미래의 변화에 대한 전체적인 조망을 제공하는 것을 목표로 한다. 먼저 호모 나랜스라는 용어로 대변되는 인간과 내러티브의 본질적 관계에 관한 다학제적 연구를 살펴보고, 인공지능 분야에서 내러티브에 관한 연구가 어떻게 이루어져 왔는지를 역사적으로 살펴본다. 그리고 오늘날 대규모 언어 모델이 보여주는 서사 지능의 가능성과 한계를 살펴보고, 서사 지능을 갖춘 AI가 갖는 함의를 파악하기 위한 세 가지 철학적 과제를 제시한다.

인공지능 통제 가능성 고찰과 글로벌 규제 현황 연구 (Study on Controllability of Artificial Intelligence and Status of Global Regulations)

  • 장미경
    • 문화기술의 융합
    • /
    • 제10권2호
    • /
    • pp.447-452
    • /
    • 2024
  • 생성형 인공지능 기술의 놀라운 성과가 점차 가시화됨에 따라, 기계의 인간 지배 가능성 등 잠재적인 실존 위협이 제기되는 현시점에서 인공지능에 대한 '통제 가능성'이 첨예한 글로벌 키워드로 주목받고 있다. 이에 따라 이 연구는 인공지능 기술을 중심으로 펼쳐질 미래 사회의 혁신적 변화에 대응하기 위하여 인공지능에 대한 통제 개념과 현주소, 글로벌 현황을 면밀하게 탐색함으로써 사회적 공론장 형성의 토대를 마련하고자 하는 데 목적이 있다. 이를 통해 인공지능 기술 진화에 따라 야기될 사회문제와 예측 불가능한 변수에 대해 대응책을 마련하기 위한 시사점을 모색하고, 정부 규제 수립에 대한 가이드라인과 전략적 통찰력을 제시하는 한편, 사회적 공개 담론 형성을 위한 함의를 찾아 보고자 한다.

오픈 도메인 대화를 위한 노이징된 가이드 기반 생성 모델 (Noised Guide-based Generative Model for Open-domain Conversation)

  • 금빛나;김홍진;박상민;김재은;황금하;권오욱;김학수
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2022년도 제34회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.82-87
    • /
    • 2022
  • 대화 모델은 대표적으로 검색 모델 또는 생성 모델을 기반으로 구현된다. 최근에는 두 모델의 장점은 융합하고 단점은 보완하기 위해 검색 기법과 생성 기법을 결합하는 연구가 활발히 이루어지고 있다. 그러나 생성 모델이 검색된 응답을 전혀 반영하지 않고 응답을 생성하여 검색 모델을 간과하는 문제 또는 검색된 응답을 그대로 복사해 생성하여 검색 모델에 과의존하는 문제가 발생한다. 본 논문에서는 이러한 문제들을 완화하며 검색 모델과 생성 모델을 모두 조화롭게 활용할 수 있는 대화 모델을 제안한다. 생성 모델이 검색 모델을 간과하는 문제를 완화하기 위해 학습 시 골드 응답을 검색된 응답과 함께 사용한다. 또한, 검색 모델에 과의존하는 문제를 완화하기 위해 검색된 응답들의 내용어 일부를 마스킹하고 순서를 무작위로 섞어 노이징한다. 검색된 응답은 대화 컨텍스트와의 관련성이 높은 것만을 선별하여 생성에 활용한다. 정량 평가 및 정성 평가를 통해 제안한 방법의 성능 향상 효과를 확인하였다.

  • PDF