• 제목/요약/키워드: AI generated images

검색결과 48건 처리시간 0.022초

생성형AI 서비스의 성공요인에 대한 탐색적 연구: 텍스트 마이닝과 ChatGPT를 활용하여 (An Exploratory Study of Success Factors for Generative AI Services: Utilizing Text Mining and ChatGPT)

  • 양지훈;양성병;윤상혁
    • 경영정보학연구
    • /
    • 제25권2호
    • /
    • pp.125-144
    • /
    • 2023
  • 기존에는 사람이 생성하던 문장, 이미지, 음성 등을 인공지능 기술을 활용하여 자동으로 생성할 수 있게 되면서, 생성형AI 기술이 전 세계적인 관심을 받고 있다. 특히, 대표적 생성형AI 서비스인 ChatGPT는 기존 챗봇 서비스와 차별화되는 능동성과 정확도를 보여주며, 단기간에 이용자 수가 급증하고 있다. 이렇듯 생성형AI 서비스에 대한 관심이 높아지고 있음에도 불구하고, 대부분의 선행연구는 아직 초기 수준에 머무르고 있다. 이에, 본 연구는 생성형AI 서비스의 성공요인을 도출하고 이를 바탕으로 성공적인 비즈니스 전략을 제안하기 위해 LDA 토픽모델링과 키워드 네트워크 다이어그램을 활용하였다. 또한, ChatGPT를 사용하여 기존 텍스트마이닝 방법론을 보완하는 새로운 연구방법론을 제시하였다. 본 연구는 선행연구들의 한계를 극복하고, 생성형AI의 미래 발전에 대한 학술적 및 실무적 시사점을 제공했다는 점에서 의의가 있다.

금속 마이크로입자 및 압밀 시편의 펄스레이저 어블레이션에 의한 나노입자 합성 (Nanoparticle Synthesis by Pulsed Laser Ablation of Metal Microparticle and Consolidated Sample)

  • 김동식;장덕석
    • 대한기계학회논문집B
    • /
    • 제27권9호
    • /
    • pp.1335-1341
    • /
    • 2003
  • This paper describes the process of nanoparticle synthesis by laser ablation of microparticles and consolidated sample. We have generated nanoparticles by high-power pulsed laser ablation of AI, Cu and Ag microparticles using a Q-switched Nd:YAG laser (wavelength 355nm, FWHM 6ns, fluence $0.8{\sim}2.0J/cm^2$). Microparticles of mean diameter $18{\sim}80{\mu}m$ are ablated in the ambient air. The generated nanoparticles are collected on a glass substrate and the size distribution and morphology are examined using a scanning electron microscope and a transmission electron microscope. The effect of laser fluence, collector position and compacting pressure on the distribution of particle size is investigated. To better understand the process of laser ablation of microparticle(LAM), we investigated the Nd: YAG laser-induced breakdown of Cu microparticle using time-resolved optical shadow images. Nanosecond time-resolved images of the ablation process are also obtained by laser flash shadowgraphy. Based on the experimental results, discussions are made on the dynamics of ablation plume.

Enhancing Occlusion Robustness for Vision-based Construction Worker Detection Using Data Augmentation

  • Kim, Yoojun;Kim, Hyunjun;Sim, Sunghan;Ham, Youngjib
    • 국제학술발표논문집
    • /
    • The 9th International Conference on Construction Engineering and Project Management
    • /
    • pp.904-911
    • /
    • 2022
  • Occlusion is one of the most challenging problems for computer vision-based construction monitoring. Due to the intrinsic dynamics of construction scenes, vision-based technologies inevitably suffer from occlusions. Previous researchers have proposed the occlusion handling methods by leveraging the prior information from the sequential images. However, these methods cannot be employed for construction object detection in non-sequential images. As an alternative occlusion handling method, this study proposes a data augmentation-based framework that can enhance the detection performance under occlusions. The proposed approach is specially designed for rebar occlusions, the distinctive type of occlusions frequently happen during construction worker detection. In the proposed method, the artificial rebars are synthetically generated to emulate possible rebar occlusions in construction sites. In this regard, the proposed method enables the model to train a variety of occluded images, thereby improving the detection performance without requiring sequential information. The effectiveness of the proposed method is validated by showing that the proposed method outperforms the baseline model without augmentation. The outcomes demonstrate the great potential of the data augmentation techniques for occlusion handling that can be readily applied to typical object detectors without changing their model architecture.

  • PDF

VGGNet을 활용한 석재분류 인공지능 알고리즘 구현 (Implementation of the Stone Classification with AI Algorithm Based on VGGNet Neural Networks)

  • 최경남
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.32-38
    • /
    • 2021
  • 사진 이미지에서의 딥러닝 학습을 통한 이미지 분류는 지난 수년간 매우 활발한 연구 분야로 자리하고 있다. 본 논문에서는 국내산 석재 이미지로부터 딥러닝 학습을 통해 자동으로 석재를 판별하는 방법을 제안한다. 제안된 방법은 300×300픽셀의 황등석, 고흥석, 포천석의 사진 이미지들을 파이썬의 해시 라이브러리를 이용하여 석재별 중복된 이미지를 검사하고, 검사 결과로 해시값이 같은 중복된 이미지를 제거하여 석재별 딥러닝 학습이미지를 만드는 데이터 전처리 과정을 수행한다. 또한 미리 학습된 모델인 VGGNet을 활용하기 위해 학습된 이미지 사이즈인 224×224픽셀로 석재별 이미지들의 사이즈를 재조정하고, 학습데이터와 학습을 위한 검증데이터의 비율을 80% 대 20%로 나누어 딥러닝 학습을 수행한다. 딥러닝 학습을 수행한 후 손실 함수 그래프와 정확도 그래프를 출력하고 세 종류의 석재 이미지에 대해 딥러닝 학습 모델의 예측 결과를 출력하였다.

적대적 생성 신경망 기반 비공기압 타이어 디자인 시스템 (Non-pneumatic Tire Design System based on Generative Adversarial Networks)

  • 성주용;이현준;이성철
    • Journal of Platform Technology
    • /
    • 제11권6호
    • /
    • pp.34-46
    • /
    • 2023
  • 자동차 타이어의 휠과 트레드 사이에 탄성중합체 또는 다각형의 스포크를 채우는 방식으로 제작하는 비공기압 타이어는 자동차 관련 학계 및 항공우주 업계의 중요한 연구 주제가 되고 있다. 본 연구에서는 생성형 적대 신경망을 기반으로 비공기압 타이어 디자인을 생성하는 시스템 개발했다. 특히 비공기압 타이어의 종류와 사용 환경, 제작 방식, 공기압 타이어와의 차이점 그리고 스포크 디자인에 따른 하중 전달의 변화 등 디자인에 영향을 미칠만한 변수들에 대한 조사를 실시했다. 이 연구는 OpenCV를 통해 다양한 스포크 형태의 이미지를 만들고, projected GANs에 학습시켜 비공기압 타이어 디자인에 사용될 스포크를 생성했다. 디자인된 비공기압 타이어는 사용 가능 및 불가능으로 레이블링하고, 이를 Vision Transformer 이미지 분류 AI 모델에 학습시켜 분류하도록 하였다. 최종적으로 분류 모델의 평가를 통해 0에 가까운 loss의 수렴, 99%의 정확도를 확인했다. 차후 도형 및 스포크 이미지와 알고리즘을 이용한 디자인이 아닌, 완전 자동화 시스템의 개발과 더 나아가 3D의 물리적 해석 없이 사용 가능한 디자인을 생성하는 것을 목표로 한다.

  • PDF

YOLOv5에서 가상 번호판 생성을 통한 차량 번호판 인식 시스템에 관한 연구 (A Study on Vehicle License Plate Recognition System through Fake License Plate Generator in YOLOv5)

  • 하상현;정석찬;전영준;장문석
    • 한국산업융합학회 논문집
    • /
    • 제24권6_2호
    • /
    • pp.699-706
    • /
    • 2021
  • Existing license plate recognition system is used as an optical character recognition method, but a method of using deep learning has been proposed in recent studies because it has problems with image quality and Korean misrecognition. This requires a lot of data collection, but the collection of license plates is not easy to collect due to the problem of the Personal Information Protection Act, and labeling work to designate the location of individual license plates is required, but it also requires a lot of time. Therefore, in this paper, to solve this problem, five types of license plates were created using a virtual Korean license plate generation program according to the notice of the Ministry of Land, Infrastructure and Transport. And the generated license plate is synthesized in the license plate part of collectable vehicle images to construct 10,147 learning data to be used in deep learning. The learning data classifies license plates, Korean, and numbers into individual classes and learn using YOLOv5. Since the proposed method recognizes letters and numbers individually, if the font does not change, it can be recognized even if the license plate standard changes or the number of characters increases. As a result of the experiment, an accuracy of 96.82% was obtained, and it can be applied not only to the learned license plate but also to new types of license plates such as new license plates and eco-friendly license plates.

Mask R-CNN을 이용한 항공 영상에서의 도로 균열 검출 (Crack Detection on the Road in Aerial Image using Mask R-CNN)

  • 이민혜;남광우;이창우
    • 한국산업정보학회논문지
    • /
    • 제24권3호
    • /
    • pp.23-29
    • /
    • 2019
  • 기존의 균열 검출 방법은 많은 인력과 시간, 비용이 소모되는 문제점이 있다. 이러한 문제를 해결하고자 차량이나 드론을 이용하여 취득한 영상에서 균열 정보를 파악하고 정보화하는 자동검출시스템이 요구되고 있다. 본 논문에서는 드론으로 촬영한 도로 영상에서의 균열 검출 연구를 진행한다. 획득한 항공영상은 전처리와 라벨링(Labeling) 작업을 통해 균열의 형태정보 데이터셋(data set)을 생성한다. 생성한 데이터셋을 Mask R-CNN(regions with convolution neural network) 딥러닝(deep learning) 모델에 적용하여 다양한 균열 정보가 학습된 새로운 모델을 획득하였다. 획득 모델을 이용한 실험 결과, 제시된 항공 영상에서 균열을 평균 73.5%의 정확도로 검출하였으며 특정 형태의 균열 영역도 예측하는 것을 확인할 수 있었다.

확산모델의 미세조정을 통한 웹툰 생성연구 (A Study on the Generation of Webtoons through Fine-Tuning of Diffusion Models)

  • 유경호;김형주;김정인;전찬준;김판구
    • 스마트미디어저널
    • /
    • 제12권7호
    • /
    • pp.76-83
    • /
    • 2023
  • 본 연구에서는 웹툰 작가의 웹툰 제작 과정을 보조하기 위해 사전학습된 Text-to-Image 모델을 미세조정하여 텍스트에서 웹툰을 생성하는 방법을 제안한다. 제안하는 방법은 웹툰 화풍으로 변환된 웹툰 데이터셋을 사용하여 사전학습된 Stable Diffusion 모델에 LoRA 기법을 활용하여 미세조정한다. 실험 결과 3만 스텝의 학습으로 약 4시간 반이 소요되어 빠르게 학습하는 것을 확인하였으며, 생성된 이미지에서는 입력한 텍스트에 표현된 형상이나 배경이 반영되어 웹툰 이미지가 생성되는 것을 확인하였다. 또한, Inception score를 통해 정량적인 평가를 수행하였을 때, DCGAN 기반의 Text-to-Image 모델보다 더 높은 성능을 나타냈다. 본 연구에서 제안된 웹툰 생성을 위한 Text-to-Image 모델을 웹툰 작가가 사용한다면, 웹툰 저작에 시간을 단축시킬 수 있을 것으로 기대된다.

항공영상으로부터 YOLOv5를 이용한 도심수목 탐지 (Detection of Urban Trees Using YOLOv5 from Aerial Images)

  • 박채원;정형섭
    • 대한원격탐사학회지
    • /
    • 제38권6_2호
    • /
    • pp.1633-1641
    • /
    • 2022
  • 도시의 인구 집중과 무분별한 개발은 대기오염, 열섬현상과 같은 다양한 환경 문제들을 유발하며, 자연재해로 인한 피해 상황을 악화시키는 등 인재의 원인이 되고 있다. 도심 수목은 이러한 도시 문제들의 해결방안으로 제시되어왔으며, 실제로 환경 개선 기능을 제공하는 등 중요한 역할들을 수행한다. 이에 따라 수목이 도시 환경에 미치는 영향을 파악하기 위해 도심 수목에서 개별목에 대한 정량적인 측정 및 분석이 요구된다. 그러나 도심 수목의 복잡성 및 다양성은 단일 수목 탐지 정확도를 낮추는 문제점이 존재한다. 따라서 본 연구는 수목 개체에 대해 효과적인 탐지가 가능한 고해상도 항공영상 및 object detection에서 뛰어난 성능을 발휘한 You Only Look Once Version 5 (YOLOv5) 모델을 사용하여 도심 수목을 효과적으로 탐지하는 연구를 진행하였다. 수목 AI 학습 데이터셋의 구축을 위한 라벨링 가이드라인을 생성하고 이를 기준으로 동작구 수목에 대해 box annotation을 수행하였다. 구축된 데이터셋으로부터 다양한 scale의 YOLOv5 모델들을 테스트하고 최적의 모델을 채택하여 효율적인 도심 수목 탐지를 수행한 결과, mean Average Precision (mAP) 0.663의 유의미한 결과를 도출하였다.

객체 서브 클래스 분류 융합과 정규식생지수를 이용한 도심지역 객체 분류 (Urban Object Classification Using Object Subclass Classification Fusion and Normalized Difference Vegetation Index)

  • 예철수
    • 대한원격탐사학회지
    • /
    • 제39권2호
    • /
    • pp.223-232
    • /
    • 2023
  • 고해상도의 위성 영상을 이용하여 지표를 모니터링하기 위한 방법으로 분석 대상 객체의 색상을 이용하여 영상을 분류하는 방법이 널리 사용된다. 고해상도 위성영상에서는 도심 지역의 경우 건물, 도로 등과 같은 주요 객체들 이외에도 수목 등과 같은 식생 객체들도 빈번하게 나타난다. 도심 지역에 나타나는 식생 객체들의 색상은 건물, 도로, 그림자 등의 객체와 유사한 경우가 많으며, 이는 색상 정보에 기초하여 객체를 분류할 경우에 분류 성능이 저하되는 요인이 된다. 본 연구에서는 건물 등과 같은 다양한 색상을 가지는 객체뿐만 아니라 식생 객체도 정확하게 분류할 수 있는 기법을 제안한다. 제안하는 방법은 식생 객체 검출에 유용한 정규식생지수 영상을 RGB 영상과 함께 사용하고 객체 클래스를 서브 클래스로 세분화하여 분류한다. 서브 클래스 분류 결과를 융합한 후에 영상 분할 결과와 결합하여 최종 분류 결과를 생성한다. 차세대중형위성1호 영상을 이용한 실험에서 정규식생지수를 사용하지 않은 서브채널 분류 기법과 서브클래스 분류 기법의 overall accuracy가 각각 73.18%, 81.79%의 결과를 보인 반면, 정규식생지수와 서브클래스 분류를 함께 적용하여 제안한 방법은 overall accuracy가 87.42%의 우수한 성능을 보였다.