• 제목/요약/키워드: 온디바이스 AI

검색결과 10건 처리시간 0.023초

IoT 온디바이스 AI 실현을 위한 AI 모델 레포지토리 (AI Model Repository for Realizing IoT On-device AI)

  • 이석준;최충재;성낙명
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 추계학술대회
    • /
    • pp.597-599
    • /
    • 2022
  • IoT 디바이스에서 on-device AI를 수행할 때, 타겟 서비스나 디바이스의 환경에 따라 필요한 AI 모델이 달라질 수 있다. 또한, 기존 AI 모델도 federated learning과 같이 추가적인 데이터를 이용해 트레이닝을 하거나 보다 향상된 새로운 기법을 사용하는 등 업데이트가 일어날 수 있다. 이에 따라 IoT 디바이스에서 양질의 AI 서비스를 수행하기 위해서는 상황에 따라 필요한 AI 모델을 선택적으로 사용하거나 최적화된 최신 버전의 AI 모델로 업데이트 할 수 있어야 한다. 본 논문에서는 이를 지원하기 위한 AI 모델 레포지토리를 제안한다. 레포지토리는 AI 모델의 등록, 검색, 관리 및 배포를 지원하며 실사용을 위한 웹 포털을 포함한다. 제안하는 시스템의 실효성 확인을 위해 Node.js와 Vue.js로 구현하여 동작을 확인하였다.

  • PDF

지능형 엣지 컴퓨팅 기기를 위한 온디바이스 AI 비전 모델의 경량화 방식 분석 (Analysis on Lightweight Methods of On-Device AI Vision Model for Intelligent Edge Computing Devices)

  • 주혜현;강남희
    • 한국인터넷방송통신학회논문지
    • /
    • 제24권1호
    • /
    • pp.1-8
    • /
    • 2024
  • 실시간 처리 및 프라이버시 강화를 위해 인공지능 모델을 엣지에서 동작시킬 수 있는 온디바이스 AI 기술이 각광받고 있다. 지능형 사물인터넷 기술이 다양한 산업에 적용되면서 온디바이스 AI 기술을 활용한 서비스가 크게 증가하고 있다. 그러나 일반적인 딥러닝 모델은 추론 및 학습을 위해 많은 연산 자원을 요구하고 있다. 따라서 엣지에 적용되는 경량 기기에서 딥러닝 모델을 동작시키기 위해 양자화나 가지치기와 같은 다양한 경량화 기법들이 적용되어야 한다. 본 논문에서는 다양한 경량화 기법 중 가지치기 기술을 중심으로 엣지 컴퓨팅 기기에서 딥러닝 모델을 경량화하여 적용할 수 있는 방안을 분석한다. 특히, 동적 및 정적 가지치기 기법을 적용하여 경량화된 비전 모델의 추론 속도, 정확도 그리고 메모리 사용량을 시험한다. 논문에서 분석된 내용은 실시간 특성이 중요한 지능형 영상 관제 시스템이나 자율 이동체의 영상 보안 시스템에 적용될 수 있다. 또한 사물인터넷 기술이 적용되는 다양한 서비스와 산업에 더욱 효과적으로 활용될 수 있을 것으로 기대된다.

온디바이스 소형언어모델 기술개발 동향 (Technical Trends in On-device Small Language Model Technology Development)

  • 김근용;윤기하;김량수;류지형;김성창
    • 전자통신동향분석
    • /
    • 제39권4호
    • /
    • pp.82-92
    • /
    • 2024
  • This paper introduces the technological development trends in on-device SLMs (Small Language Models). Large Language Models (LLMs) based on the transformer model have gained global attention with the emergence of ChatGPT, providing detailed and sophisticated responses across various knowledge domains, thereby increasing their impact across society. While major global tech companies are continuously announcing new LLMs or enhancing their capabilities, the development of SLMs, which are lightweight versions of LLMs, is intensely progressing. SLMs have the advantage of being able to run as on-device AI on smartphones or edge devices with limited memory and computing resources, enabling their application in various fields from a commercialization perspective. This paper examines the technical features for developing SLMs, lightweight technologies, semiconductor technology development trends for on-device AI, and potential applications across various industries.

온디바이스 AI 비전 모델이 탑재된 지능형 엣지 컴퓨팅 기기 개발 (Development of an intelligent edge computing device equipped with on-device AI vision model)

  • 강남희
    • 한국인터넷방송통신학회논문지
    • /
    • 제22권5호
    • /
    • pp.17-22
    • /
    • 2022
  • 본 논문에서는 지능형 엣지 컴퓨팅을 지원할 수 있는 경량 임베디드 기기를 설계하고, 영상 기기로부터 입력되는 이미지에서 객체를 실시간으로 빠르게 검출할 수 있음을 보인다. 제안하는 시스템은 산업 현장이나 군 지역과 같이 사전에 설치된 인프라가 없는 환경에 적용되는 지능형 영상 관제 시스템이나 드론과 같은 자율이동체에 탑재된 영상 보안 시스템에 적용될 수 있다. 지능형 비전 인지 시스템이 확산 적용되기 위해 온디바이스 AI(On-Device Artificial intelligence) 기술 적용 필요성이 증대되고 있다. 영상 데이터 취득 장치에서 가까운 엣지 기기로의 컴퓨팅 오프 로딩은 클라우드를 중심으로 수행되는 인공지능 서비스 대비 적은 네트워크 및 시스템 자원으로도 빠른 서비스 제공이 가능하다. 또한, 다양한 해킹 공격에 취약한 공격 표면의 감소와 민감한 데이터의 유출을 최소화 할 수 있어 다양한 산업에 안전하게 적용될 수 있을것으로 기대된다.

온 디바이스 국방 AI를 위한 PEFT 효용성 연구 (Research on PEFT Feasibility for On-Device Military AI)

  • 배기민;이학진;김세옥;이장형
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.51-54
    • /
    • 2024
  • 본 논문에서는 온 디바이스 국방 AI를 위한 효율적인 학습 방법을 제안한다. 제안하는 방법은 모델 전체를 재학습하는 대신 필요한 부분만 세밀하게 조정하여 계산 비용과 시간을 대폭 줄이는 PEFT 기법의 LoRa를 적용하였다. LoRa는 기존의 신경망 가중치를 직접 수정하지 않고 추가적인 낮은 랭크의 매트릭스를 학습하는 방식으로 기존 모델의 구조를 크게 변경하지 않으면서도, 효율적으로 새로운 작업에 적응할 수 있다. 또한 학습 파라미터 및 연산 입출력에 데이터에 대하여 32비트의 부동소수점(FP32) 대신 부동소수점(FP16, FP8) 또는 정수형(INT8)을 활용하는 경량화 기법인 양자화도 적용하였다. 적용 결과 학습시 요구되는 GPU의 사용량이 32GB에서 5.7GB로 82.19% 감소함을 확인하였다. 동일한 조건에서 동일한 데이터로 모델의 성능을 평가한 결과 동일 학습 횟수에선 LoRa와 양자화가 적용된 모델의 오류가 기본 모델보다 53.34% 증가함을 확인하였다. 모델 성능의 감소를 줄이기 위해서는 학습 횟수를 더 증가시킨 결과 오류 증가율이 29.29%로 동일 학습 횟수보다 더 줄어듬을 확인하였다.

  • PDF

극소전자 디바이스를 위한 AI-1%Si 박막배선에서의 Electromigration 특성 (Electromigration Characteristics in AI-1%Si Thin Film Interconnections for Microelectronic Devices)

  • 박영식;김진영
    • 한국진공학회지
    • /
    • 제4권3호
    • /
    • pp.327-333
    • /
    • 1995
  • 전자소자의 축소화에 따라 박막배선에서의 electromigration은 점차 극소전자 디바이스의 주요 결함원인으로 부각되고 있다. 본 실험에서는 현재 박막 배선 재료로 가장 널리 사용되고 있는 AI-1%Si 금속박막배선의 electromigration에 대한 온도 및 배선길이의 의존성에 관하여 연구하였다. PSG($8000AA$)/SiO2(1000$\AA$)/AI-1%Si(7000$\AA$)/SiO2(5000$\AA$)/p-Si(100)의 보호막처리되지 않은 시편 등을 standard photolithography 공정을 이용하여 각각 제작하였다. 선폭 3$\mu$m, 길이 100, 400, 800, $\1600mu$m등의 AI-1%Si 배막배선구조를 사용하였다. 가속화실험을 위해 인가된 d.c.전류밀도는 4.5X106A/$ extrm{cm}^2$이었고 실온에서 $100^{\circ}C$까지의 분위기 온도에서 electromigration test를 진행하였다. 박막배선의 길에에 따른 MTF(Mean-Time-to-Failure)는 임계길이 이상에서 포화되는 경향을 보이며 이는 보호막층의 유무에 관계없이 나타난다. 선폭 $3\mu$m인 AI-1%Si 박막배선에서 임계길이는, 보호막처리된 시편은 $800\mu$m, 보호막처리되지 않은 시편은 $400\mu$m 배선길이에서 나타난다. 이러한 포화의 경향은 낮은 온도에서 더욱 명확해지는 특성을 보인다. 각 시편에서 electromigration에 대한 활성화에너지도 MTF의 특성과 유사하게 임계길이 이상에서 포화되는 특성을 보인다.

  • PDF

임베디드 시스템(Raspberry PI 5) 환경에서의 DistilBERT 구현 및 성능 검증에 관한 연구 (A Study on the Implementation and Performance Verification of DistilBERT in an Embedded System(Raspberry PI 5) Environment)

  • 임채우;김은호;서장원
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2024년도 춘계학술발표대회
    • /
    • pp.617-618
    • /
    • 2024
  • 본 논문에서 핵심적으로 연구할 내용은 기존 논문에서 소개된 BERT-base 모델의 경량화 버전인 DistilBERT 모델을 임베디드 시스템(Raspberry PI 5) 환경에 탑재 및 구현하는 것이다. 또한, 본 논문에서는 임베디드 시스템(Raspberry PI 5) 환경에 탑재한 DistilBERT 모델과 BERT-base 모델 간의 성능 비교를 수행하였다. 성능 평가에 사용한 데이터셋은 SQuAD(Standford Question Answering Dataset)로 질의응답 태스크에 대한 데이터셋이며, 성능 검증 지표로는 EM(Exact Match) Score와 F1 Score 그리고 추론시간을 사용하였다. 실험 결과를 통해 DistilBERT와 같은 경량화 모델이 임베디드 시스템(Raspberry PI 5)과 같은 환경에서 온 디바이스 AI(On-Device AI)로 잘 작동함을 증명하였다.

AR과 IoT 기술을 기반으로 한 건물 화재 모니터링 및 탈출 내비게이션 시스템 (Building Fire Monitoring and Escape Navigation System Based on AR and IoT Technologies)

  • 왕문도;이승용;박상훈;윤승현
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제30권3호
    • /
    • pp.159-169
    • /
    • 2024
  • 본 논문에서는 증강 현실 (AR) 기술과 사물 인터넷 (IoT) 기술을 융합하여 새로운 실시간 화재 모니터링 및 대피 내비게이션 시스템을 제안한다. 제안된 시스템은 건물 내에 설치된 IoT 온도 측정 디바이스를 통해 온도 데이터를 수집하고, 이를 IoT 플랫폼을 통해 MySQL 클라우드 데이터베이스에 자동으로 전송함으로써 실시간으로 정확한 데이터를 모니터링한다. 이후, 건축 정보 모델링 (BIM)을 통해 생성된 3D 건물 모델에 실시간 IoT 데이터를 가시화하고, AR 기술을 통해 현실 세계에 모델을 표현함으로써 직관적으로 화재 발생 위치를 파악할 수 있다. 또한, Vuforia 엔진의 Device Tracking 및 Area Targets 기능을 활용하여 사용자의 실시간 위치를 파악하고, 개선된 A* 알고리즘을 통해 여러 비상구 중 최적의 대피 경로를 찾는다. 본 논문에서는 다양한 가상 화재 시나리오를 기반으로 사용자 실험 평가를 진행하여 제안된 시스템의 실용성과 빠르고 안전한 대피 효과를 입증한다.

연속학습을 활용한 경량 온-디바이스 AI 기반 실시간 기계 결함 진단 시스템 설계 및 구현 (Design and Implementation of a Lightweight On-Device AI-Based Real-time Fault Diagnosis System using Continual Learning)

  • 김영준;김태완;김수현;이성재;김태현
    • 대한임베디드공학회논문지
    • /
    • 제19권3호
    • /
    • pp.151-158
    • /
    • 2024
  • Although on-device artificial intelligence (AI) has gained attention to diagnosing machine faults in real time, most previous studies did not consider the model retraining and redeployment processes that must be performed in real-world industrial environments. Our study addresses this challenge by proposing an on-device AI-based real-time machine fault diagnosis system that utilizes continual learning. Our proposed system includes a lightweight convolutional neural network (CNN) model, a continual learning algorithm, and a real-time monitoring service. First, we developed a lightweight 1D CNN model to reduce the cost of model deployment and enable real-time inference on the target edge device with limited computing resources. We then compared the performance of five continual learning algorithms with three public bearing fault datasets and selected the most effective algorithm for our system. Finally, we implemented a real-time monitoring service using an open-source data visualization framework. In the performance comparison results between continual learning algorithms, we found that the replay-based algorithms outperformed the regularization-based algorithms, and the experience replay (ER) algorithm had the best diagnostic accuracy. We further tuned the number and length of data samples used for a memory buffer of the ER algorithm to maximize its performance. We confirmed that the performance of the ER algorithm becomes higher when a longer data length is used. Consequently, the proposed system showed an accuracy of 98.7%, while only 16.5% of the previous data was stored in memory buffer. Our lightweight CNN model was also able to diagnose a fault type of one data sample within 3.76 ms on the Raspberry Pi 4B device.

A Study on the Build of Equipment Predictive Maintenance Solutions Based on On-device Edge Computer

  • Lee, Yong-Hwan;Suh, Jin-Hyung
    • 한국컴퓨터정보학회논문지
    • /
    • 제25권4호
    • /
    • pp.165-172
    • /
    • 2020
  • 본 연구에서는 현재 일반적인 스마트 팩토리에서 데이터 전송에 사용하는 중앙 집중형 시스템에서 발생하는 데이터를 중앙의 센터까지 전송, 처리할 때 발셍하는 전송 지연 등의 문제 해결을 위하여 필요한 곳에 연산과 저장 장치를 도입하는 분산 컴퓨팅 패러다임 (Distributed Computing Paradigm)인 온-디바이스 (On-Device) 기반 에지 컴퓨팅 (Edge Computing) 기술과 빅데이터 분석 기술 및 활용 방법의 연구를 통하여 설비 고장 등을 예지하여 가동율을 높일 수 있는 산업현장의 설비관리에 활용되는 솔루션을 제안한다. 그러나 에지 컴퓨팅 기반의 기술이 실제 적용되더라도 네트워크 에지에서 장치의 증가는 많은 양의 데이터가 데이터 센터로 전달되어 네트워크 대역이 한계치에 이르게 되어 네트워크 기술의 향상에도 데이터 센터는 수많은 응용에서 중요한 요건이 되는 수용 가능한 전송 속도와 응답 시간을 보장하지 못하게 된다. 이와 같은 요구조건을 수용할 수 있는 일체형 하드웨어 기술과 공장관리 및 제어 기술을 적용한 설비보존 및 스마트 팩토리 산업 분야에 적용할 수 있는 연구를 통하여 생산성 증대를 지원할 수 있는 지능적 설비관리를 지원하도록 하여 추후 빅데이터에 적합한 딥러닝을 적용할 수 있는 인공지능 기반 설비 예지 보전 분석 도구로 발전할 수 있는 기반을 제공한다.