• 제목/요약/키워드: AI 모델

검색결과 1,117건 처리시간 0.024초

IoT 온디바이스 AI 실현을 위한 AI 모델 레포지토리 (AI Model Repository for Realizing IoT On-device AI)

  • 이석준;최충재;성낙명
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.597-599
    • /
    • 2022
  • IoT 디바이스에서 on-device AI를 수행할 때, 타겟 서비스나 디바이스의 환경에 따라 필요한 AI 모델이 달라질 수 있다. 또한, 기존 AI 모델도 federated learning과 같이 추가적인 데이터를 이용해 트레이닝을 하거나 보다 향상된 새로운 기법을 사용하는 등 업데이트가 일어날 수 있다. 이에 따라 IoT 디바이스에서 양질의 AI 서비스를 수행하기 위해서는 상황에 따라 필요한 AI 모델을 선택적으로 사용하거나 최적화된 최신 버전의 AI 모델로 업데이트 할 수 있어야 한다. 본 논문에서는 이를 지원하기 위한 AI 모델 레포지토리를 제안한다. 레포지토리는 AI 모델의 등록, 검색, 관리 및 배포를 지원하며 실사용을 위한 웹 포털을 포함한다. 제안하는 시스템의 실효성 확인을 위해 Node.js와 Vue.js로 구현하여 동작을 확인하였다.

  • PDF

검색모델과 LLM의 상호작용을 활용한 사고사슬 기반의 한국어 질의응답 (Interactions of Retriever and LLM on Chain-of-Thought Reasoning for Korean Question Answering)

  • 박민준;심묘섭;민경구;최주영;정해민;최정규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.618-621
    • /
    • 2023
  • 최근 거대언어모델(LLM)이 기계 번역 및 기계 독해를 포함한 다양한 문제들에서 높은 성능을 보이고 있다. 특히 프롬프트 기반의 대규모 언어 모델은 사고사슬 방식으로 적절한 프롬프팅을 통해 원하는 형식의 답변을 생성할 수 있으며 자연어 추론 단계에서도 높은 정확도를 보여주고 있다. 그러나 근본적으로 LLM의 매개변수에 질문에 관련된 지식이 없거나 최신 정보로 업데이트 되지 않은 경우 추론이 어렵다. 이를 해결하기 위해, 본 연구는 검색문서와 생성모델의 상호작용을 통해 답변하는 한국어 질의응답 모델을 제안한다. 검색이 어려운 경우 생성형 모델을 통해 질문과 관련된 문장을 생성하며, 이는 다시 검색모델과 추론 과정에서 활용된다. 추가로 "판단불가"라는 프롬프팅을 통해 모델이 답변할 수 없는 경우를 스스로 판단하게 한다. 본 연구결과에서 GPT3를 활용한 사고사슬 모델이 63.4의 F1 점수를 보여주며 생성형 모델과 검색모델의 융합이 적절한 프롬프팅을 통해 오픈-도메인 질의응답에서 성능의 향상을 보여준다.

  • PDF

생성형 언어모델을 이용한 테이블 질의응답 평가 (Evaluating Table QA with Generative Language Models)

  • 민경구;최주영;심묘섭;정해민;박민준;최정규
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.75-79
    • /
    • 2023
  • 문서에서 테이블은 중요한 정보들을 축약하여 모아 놓은 정보 집합체라고 할 수 있다. 이러한 테이블을 대상으로 질의응답하는 테이블 질의응답 기술이 연구되고 있으며, 이 중 언어모델을 이용한 연구가 좋은 결과를 보이고 있다. 본 연구에서는 최근 주목받고 있는 생성형 언어모델 기술을 테이블 질의응답에 적용하여 언어모델과 프롬프트의 변경에 따른 결과를 살펴보고, 단답형 정답과 생성형 결과의 특성에 적합한 평가방법으로 측정해 보았다. 자체 개발한 EXAONE 1.7B 모델의 경우 KorWiki 데이터셋에 대해 적용하여 EM 92.49, F1 94.81의 결과를 얻었으며, 이를 통해 작은 크기의 모델을 파인튜닝하여 GPT-4와 같은 초거대 모델보다 좋은 성능을 보일 수 있음을 확인하였다.

  • PDF

개인화된 의료 예측을 위한 AI 기반 불확실성 표현 및 데이터 한계 극복 연구 (A study on Overcoming Data Limitations and Representing Uncertainty in AI for Personalized Medical Predictions)

  • 김주찬;변규린;추현승
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.608-610
    • /
    • 2023
  • 의료 분야에서 AI 모델의 활용이 증가하고 있지만, 모델의 예측 불확실성을 정확하게 평가하고 표현하는 것이 중요하다. 본 연구는 이러한 문제를 해결하기 위해 AI-driven 방식을 제안하며, 특히 의료 영상 변환 모델에 대한 불확실성 표현과 데이터 한계 극복 방법론을 제안한다. 제안된 AI-driven 안저영상 변환 모델은 기존 GAN과는 다르게 구조가 이루어져 있으며, 신뢰도가 낮은 영역을 구분하고 시각화하여 표현할 수 있다. 실험 결과, 제안된 방법은 기존 모델과 비교하여 영상 변환 성능이 크게 향상되었으며, 불확실성에 대한 정확도 평가에서도 AI-driven 방식이 높은 성능을 보인다. 결론적으로, 본 연구는 AI-driven 방식을 통해 의료 AI에서의 불확실성 표현의 가능성을 확인하였으며, 이 방식이 데이터의 한계와 불확실성을 극복할 수 있을 것으로 기대된다.

Rule 기반 AI 모델의 지속운용을 위한 프레임워크 (A Framework for Continuous operational techniques of AI Model based on Rule)

  • 박영지;이태진
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.432-433
    • /
    • 2023
  • 오늘날 AI 기술은 다양한 분야에서 활용되며 발전해나가고 있다. 하지만 AI 모델의 복잡도가 증가하며 AI의 산출 결과의 해석이 불가능한 Black-box 성격을 지니게 되었고, 이는 실 환경에서 AI 도입의 커다란 걸림돌로 작용하고 있다. 이에 따라 AI 판단 결과에 대한 Interpretation을 제공하는AI Decision Support의 중요성이 커지는 추세이다. 본 논문에서는 Reference 기반 Rule을 통해 AI 모델의 판단 결과에 대한 해석을 제공하고 입력된 데이터에 관한 Rule 적합도를 산출하여 AI Decision Support를 제공하고자 한다. 또한, Rule 적합도 정보를 기반으로 기존의 모델보다 정확한산출 결과를 통해 수집된 데이터의 Label을 확정시킨다. 이를 토대로 AI 모델의 업데이트를 실행하여 지속적으로 AI의 성능을 개선하면서도 지속 운용이 가능한 AI 운용 프레임워크를 제안한다.

대학생의 AI 리터러시 역량 신장을 위한 교양 교육 모델 (The Education Model of Liberal Arts to Improve the Artificial Intelligence Literacy Competency of Undergraduate Students)

  • 박윤수;이유미
    • 정보교육학회논문지
    • /
    • 제25권2호
    • /
    • pp.423-436
    • /
    • 2021
  • 다가오는 미래사회에서는 인공지능 기술이 범용기술이 될 것이며, 인공지능 역량이 필수 역량이 될 것으로 예측되고 있다. 이에 전 세계 주요 국가들은 AI 경쟁력을 갖추기 위해 AI 전문가를 육성하고, 누구나 AI를 이해하고, 설명하며, 응용할 수 있는 인프라와 교육 환경을 갖추기 위해 노력하고 있다. 본 연구에서는 국내·외 인공지능 교육의 선행 연구 사례와 함께 서울 소재 31개 종합대학의 SW 교양 교육 현황을 조사했으며, 이를 바탕으로 SW 교양 교육과 전문적인 AI 교육을 연계할 수 있는 AI 리터러시 교육 모델이 필요하다는 결론을 도출하였다. 이에 KOCW에 공개된 20개의 AI 관련 강좌를 AI 리터러시 역량을 중심으로 분류하였으며, 분류된 결과를 바탕으로 대학생을 위한 AI 리터러시 교양 교육 모델을 제안하고자 한다. 제안하는 AI 리터러시 교육 모델은 기존의 이론적 교육 모델이나 컴퓨터과학적 교육 모델과는 달리 인문학적 소양과 함께 인공지능을 체험할 수 있는 AI·SW 융합 교육 모델이다. 제안하는 AI 리터러시 교육 모델이 AI의 확산에 기여할 수 있기를 기대한다.

AI 학습모델 및 AI모델 서빙 서버 개발을 통한 생활안전 예방 서비스 신고 이미지 자동분류 시스템 개발에 대한 연구 (A Study on the Development of an Automatic Classification System for Life Safety Prevention Service Reporting Images through the Development of AI Learning Model and AI Model Serving Server)

  • 정영식;김용운;임정일
    • 한국재난정보학회 논문집
    • /
    • 제19권2호
    • /
    • pp.432-438
    • /
    • 2023
  • 연구목적: 생활안전 예방서비스 앱에서 신고되는 이미지를 AI를 사용하여 실시간으로 위험 카테고리를 자동으로 분류하여 사용자에게 편리한 위험신고를 가능하게 하는 것을 목적으로 한다. 연구방법: 인터넷으로 상호연결되는 생활안전 예방서비스 플랫폼, 생활안전 예방서비스 앱, AI 모델 서빙 서버와 sftp 서버로 구성되는 시스템을 통하여 신고된 생활안전 이미지를 실시간으로 자동분류하며, 이때 사용되는 AI모델 생성을 위한 AI 학습 알고리즘도 개발하였다. 연구결과: 이미지를 실시간으로 AI 처리하여 자동으로 분류할 수 있게 되어, 신고자가 생활안전 관련 사항을 보다 편리하게 신고할 수 있게 되었다. 결론: 본 논문에서 제시하는 AI 이미지 자동분류 시스템은 90% 이상의 분류 정확도로 신고 이미지를 실시간으로 자동분류하여 신고자가 간편하게 생활안전 관련 이미지를 신고할 수 있게 되었으며 향후 생활안전 예방서비스 앱의 사용자의 증가에 따라 더욱 빠르고 정확한 AI 모델 개발 및 시스템 처리용량 향상이 필요하다.

금융 특화 딥러닝 광학문자인식 기반 문서 처리 플랫폼 구축 및 금융권 내 활용 (Deep Learning OCR based document processing platform and its application in financial domain)

  • 김동영;김두형;곽명성;손현수;손동원;임민기;신예지;이현정;박찬동;김미향;최동원
    • 지능정보연구
    • /
    • 제29권1호
    • /
    • pp.143-174
    • /
    • 2023
  • 인공지능의 발전과 함께 딥러닝을 활용한 인공지능 광학문자인식 기법 (Artificial Intelligence powered Optical Character Recognition, AI-OCR) 의 등장은 기존의 이미지 처리 기반 OCR 기술의 한계를 넘어 다양한 형태의 이미지로부터 여러 언어를 높은 정확도로 읽어낼 수 있는 모델로 발전하였다. 특히, AI-OCR은 인력을 통해 대량의 다양한 서류 처리 업무를 수행하는 금융업에 있어 그 활용 잠재력이 크다. 본 연구에서는 금융권내 활용을 위한 AI-OCR 모델의 구성과 설계를 제시하고, 이를 효율적으로 적용하기 위한 플랫폼 구축 및 활용 사례에 대해 논한다. 금융권 특화 딥러닝 모델을 만듦에 있어 금융 도메인 데이터 사용은 필수적이나, 개인정보보호법 이하 실 데이터의 사용이 불가하다. 이에 본 연구에서는 딥러닝 기반 데이터 생성 모델을 개발하였고, 이를 활용하여 AI-OCR 모델 학습을 진행하였다. 다양한 서류 처리에 있어 유연한 데이터 처리를 위해 단계적 구성의 AI-OCR 모델들을 제안하며, 이는 이미지 전처리 모델, 문자 탐지 모델, 문자 인식 모델, 문자 정렬 모델 및 언어 처리 모델의 선택적, 단계적 사용을 포함한다. AI-OCR 모델의 배포를 위해 온프레미스(On-Premise) 및 프라이빗 클라우드(Private Cloud) 내 GPU 컴퓨팅 클러스터를 구성하고, Hybrid GPU Cluster 내 컨테이너 오케스트레이션을 통한 고효율, 고가용 AI-OCR 플랫폼 구축하여 다양한 업무 및 채널에 적용하였다. 본 연구를 통해 금융 특화 AI-OCR 모델 및 플랫폼을 구축하여 금융권 서류 처리 업무인 문서 분류, 문서 검증 및 입력 보조 시스템으로의 활용을 통해 업무 효율 및 편의성 증대를 확인하였다.

스마트팩토리 예지보전 AI 모델 개발을 위한 데이터 관리 및 모델 신뢰성 요구사항 분석 (The Requirements Analysis of Data Management and Model Reliability for Smart Factory Predictive Maintenance AI Model Development)

  • 김진세;이정원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.644-646
    • /
    • 2023
  • 스마트팩토리는 협동 로봇과 같은 프로그래머블한 설비의 유기적인 협업을 통해 최적화된 공정을 수행한다. 따라서 수집되는 센서 데이터의 특징과 환경 조건의 복잡도가 높아, 예지보전을 위한 AI 소프트웨어의 개발 시 요구사항 기반의 체계적인 개발 및 검증이 필수적이다. 본 논문에서는 AI 소프트웨어의 요구사항을 사용자와 시스템 관점에서 정의하고, AI 모델 개발 프로세스와 스마트팩토리 예지보전 측면에서 분석한다. 도출된 요구사항을 CNN 기반의 협동 로봇 기어 마모 예측 모델의 개발에 적용하여 데이터 관리와 모델 신뢰성 관점의 요구사항을 분석 및 검증하였다.

코드 스위칭 코퍼스 기반 다국어 LLM의 지식 전이 연구 (Knowledge Transfer in Multilingual LLMs Based on Code-Switching Corpora)

  • 김성현;이강희;정민수;이정우
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2023년도 제35회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.301-305
    • /
    • 2023
  • 최근 등장한 Large Language Models (LLM)은 자연어 처리 분야에서 눈에 띄는 성과를 보여주었지만, 주로 영어 중심의 연구로 진행되어 그 한계를 가지고 있다. 본 연구는 사전 학습된 LLM의 언어별 지식 전이 가능성을 한국어를 중심으로 탐구하였다. 이를 위해 한국어와 영어로 구성된 코드 스위칭 코퍼스를 구축하였으며, 기본 모델인 LLAMA-2와 코드 스위칭 코퍼스를 추가 학습한 모델 간의 성능 비교를 수행하였다. 결과적으로, 제안하는 방법론으로 학습한 모델은 두 언어 간의 희미론적 정보가 효과적으로 전이됐으며, 두 언어 간의 지식 정보 연계가 가능했다. 이 연구는 다양한 언어와 문화를 반영하는 다국어 LLM 연구와, 소수 언어를 포함한 AI 기술의 확산 및 민주화에 기여할 수 있을 것으로 기대된다.

  • PDF