• 제목/요약/키워드: Deep Learning AI

검색결과 643건 처리시간 0.026초

A Study on GAN Algorithm for Restoration of Cultural Property (pagoda)

  • Yoon, Jin-Hyun;Lee, Byong-Kwon;Kim, Byung-Wan
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권1호
    • /
    • pp.77-84
    • /
    • 2021
  • 오늘날 문화재 복원은, 기존 자료와 전문가에 의존하는 것과 더불어 최신 IT 기술을 적용하여 복원하고 있다. 하지만 새로운 자료가 나와서 기존 복원이 틀리게 되는 경우, 복원하는데 너무 오랜 시간이 걸릴 때도 있다. 그리고 예상과 다른 결과가 나올 가능성도 있다. 이에 우리는 중요 문화재의 복원을 인공지능을 이용하여 빠르게 복원을 해 보고자 한다. 최근에 Generative Adversarial Networks(GANs) 알고리즘에서 DcGAN[2] 알고리즘이 나오면서 이미지 생성, 복원 분야가 지속해서 발전하고 있다. 이에 본 연구에서는 다양한 GAN 알고리즘을 문화재 복원에 GAN 알고리즘을 적용해 보았다. DcGAN과 StyleGAN을 적용하였으며, 유의미한 결과를 얻었다. GAN 알고리즘 중 DCGAN과 Style GAN 알고리즘을 실험한 결과 DCGAN 알고리즘은 학습이 진행되었으며, 낮은 해상도로 탑 이미지가 생성되는 것을 확인했다. 그리고 Style GAN 알고리즘에서도 역시 학습이 진행 되었으며, 탑 이미지가 생성되었다. 결론적으로 GAN 알고리즘을 사용하여 높은 해상도의 탑 이미지를 구할 수 있게 되었다.

인공지능 기반 개인 맞춤형 의류 추천 서비스 개발 (Development of personalized clothing recommendation service based on artificial intelligence)

  • 김형숙;이종혁;이현동
    • 스마트미디어저널
    • /
    • 제10권1호
    • /
    • pp.116-123
    • /
    • 2021
  • 온라인 패션 시장의 빠른 성장과 이로 인한 온라인 선택의 확대로 인해 소비자들은 더욱 개인화된 추천 서비스에 대해 요구가 커지고 있음에도 불구하고 판매자는 수많은 소비자를 개별적으로 직접 대응할 수 없다는 문제점이 있다. 소비자의 이러한 개인화 니즈를 충족시키는 방안으로 이미지에 대한 태깅이 이루어지고 있으나 사람이 태깅하는 경우 사람마다 태깅이 매우 주관적으로 이뤄지고 있고 인공지능 태깅은 단어가 매우 제한적으로 사용자의 니즈를 충족시켜주지 못하고 있다. 이러한 문제를 해결하기 위해 인공지능으로 이미지에 포함된 제품의 형태, 속성, 감성 정보를 인식하고 이러한 정보를 코드화하고 코드의 조합으로 그 이미지가 가지고 있는 모든 정보를 나타낼 수 있는 알고리즘을 설계하였다. 이 알고리즘을 통해서 지금까지 획득이 불가능했던 패션 이미지의 감성, 패션 이미지가 표현하는 TPO 정보 등 이미지가 가지고 있는 다양한 정보를 실시간으로 획득하는 것이 가능하게 되었다. 이러한 정보를 기반으로 소비자의 취향을 분석하는 단계에서 넘어가 소비자의 취향에 당시의 유행, TPO 정보까지 결합하는 초개인화된 의류 추천이 가능해진다.

시분할 특징 융합 합성곱 신경망을 이용한 스마트폰 사용자의 행동 검출 (Detection The Behavior of Smartphone Users using Time-division Feature Fusion Convolutional Neural Network)

  • 신현준;곽내정;송특섭
    • 한국정보통신학회논문지
    • /
    • 제24권9호
    • /
    • pp.1224-1230
    • /
    • 2020
  • 스마트폰의 보급 이후 웨어러블 디바이스에 대한 관심이 높아지고 다양화되면서 사용자들의 생활에 밀접하게 연관되고 있으며, 개인화된 서비스를 제공하기 위한 방법으로 사용되고 있다. 본 논문에서는 스마트폰에 내장된 3축 가속도 센서와 3축 자이로 센서의 정보를 합성곱 신경망에 적용하여 사용자의 행동을 검출하는 방법을 제안한다. 인간의 행동은 동작의 크기와 범위에 따라서 동작을 구성하는 신호 데이터의 지속시간을 포함한 시작 시점과 끝나는 시점이 다르다. 이로 인해 합성곱 신경망에 그대로 적용하면 행동 인식 정확도에 대한 성능상의 문제가 있다. 따라서 센서 데이터를 시간의 구간에 따라 분할된 특징을 학습하는 시분할 특징 융합 합성곱 신경망(TDFFCNN: Time-Division Feature Fusion Convolutional Neural Network)을 제안하였다.

객체 감지 데이터 셋 기반 인체 자세 인식시스템 연구 (Research on Human Posture Recognition System Based on The Object Detection Dataset)

  • 유암;리라이춘;루징쉬엔;쉬멍;정양권
    • 한국전자통신학회논문지
    • /
    • 제17권1호
    • /
    • pp.111-118
    • /
    • 2022
  • 컴퓨터 비전 연구에서 2차원 인체 자세는 매우 광범위한 연구 방향으로 특히 자세 추적과 행동 인식에서 유의미한 분야다. 인체 자세 표적 획득은 이미지에서 인체 목표를 정확히 찾는 방법을 연구하는 것이 핵심이며 인체 자세 인식은 인공지능(AI)에 적용하는 한편 일상생활에 활용되고 있어서 매우 중요한 연구의의가 있다. 인체 자세 인식 효과의 우수성의 기준은 인식 과정의 성공률과 정확도에 의해 결정된다. 본 연구의 인체 자세 인식에서는 딥러닝 전용 데이터셋인 MS COCO를 기반하여 인체를 17개의 키 포인트로 구분하였다. 다음으로 주요 특징에 대한 세분화 마스크(segmentation mask) 방법을 사용하여 인식률을 개선하였다. 최종적으로 신경망 모델을 설계하고 간단한 단계별 학습부터 효율적인 학습에 이르기까지 많은 수의 표본을 학습시키는 알고리즘을 제안하여 정확도를 향상할 수 있었다.

컬러 이미지 분석을 통한 블랙 아이스 검출 방법 연구 (Study of Black Ice Detection Method through Color Image Analysis)

  • 박필원;한성수
    • Journal of Platform Technology
    • /
    • 제9권4호
    • /
    • pp.90-96
    • /
    • 2021
  • 현재 개발중인 그리고 운행중인 대부분의 자동차에는 다양한 IoT 센서들이 탑재되어 있지만, 자동차 사고를 일으키는 요인 중 몇몇 요인들은 상대적으로 탐지하기 힘들다. 이러한 요소 중 대표적인 위험 요인 중 하나가 블랙 아이스이다. 블랙 아이스는 블랙 아이스가 깔린 부분을 지나가는 모든 차량에 영향을 줄 수 있어 대형 사고를 유발할 가능성이 가장 높은 요인 중 하나이다. 따라서 대형 사고를 막기 위해 블랙 아이스 검출기법은 꼭 필요하다. 이를 위해 몇몇 연구가 과거 진행되었으나 몇몇 부분에서 현실적이지 않는 요소들이 반영된 경우가 있어, 이를 보충하기 위한 연구가 필요하다. 본 논문에서는 CNN 기법으로 컬러 이미지를 분석하여 블랙 아이스를 탐지하고자 하였으며, 일정 수준의 블랙 아이스 탐지에 성공하였다. 다만 기존 연구 와 차이가 있어 그 이유를 분석하였다.

Ensemble-based deep learning for autonomous bridge component and damage segmentation leveraging Nested Reg-UNet

  • Abhishek Subedi;Wen Tang;Tarutal Ghosh Mondal;Rih-Teng Wu;Mohammad R. Jahanshahi
    • Smart Structures and Systems
    • /
    • 제31권4호
    • /
    • pp.335-349
    • /
    • 2023
  • Bridges constantly undergo deterioration and damage, the most common ones being concrete damage and exposed rebar. Periodic inspection of bridges to identify damages can aid in their quick remediation. Likewise, identifying components can provide context for damage assessment and help gauge a bridge's state of interaction with its surroundings. Current inspection techniques rely on manual site visits, which can be time-consuming and costly. More recently, robotic inspection assisted by autonomous data analytics based on Computer Vision (CV) and Artificial Intelligence (AI) has been viewed as a suitable alternative to manual inspection because of its efficiency and accuracy. To aid research in this avenue, this study performs a comparative assessment of different architectures, loss functions, and ensembling strategies for the autonomous segmentation of bridge components and damages. The experiments lead to several interesting discoveries. Nested Reg-UNet architecture is found to outperform five other state-of-the-art architectures in both damage and component segmentation tasks. The architecture is built by combining a Nested UNet style dense configuration with a pretrained RegNet encoder. In terms of the mean Intersection over Union (mIoU) metric, the Nested Reg-UNet architecture provides an improvement of 2.86% on the damage segmentation task and 1.66% on the component segmentation task compared to the state-of-the-art UNet architecture. Furthermore, it is demonstrated that incorporating the Lovasz-Softmax loss function to counter class imbalance can boost performance by 3.44% in the component segmentation task over the most employed alternative, weighted Cross Entropy (wCE). Finally, weighted softmax ensembling is found to be quite effective when used synchronously with the Nested Reg-UNet architecture by providing mIoU improvement of 0.74% in the component segmentation task and 1.14% in the damage segmentation task over a single-architecture baseline. Overall, the best mIoU of 92.50% for the component segmentation task and 84.19% for the damage segmentation task validate the feasibility of these techniques for autonomous bridge component and damage segmentation using RGB images.

확산모델의 미세조정을 통한 웹툰 생성연구 (A Study on the Generation of Webtoons through Fine-Tuning of Diffusion Models)

  • 유경호;김형주;김정인;전찬준;김판구
    • 스마트미디어저널
    • /
    • 제12권7호
    • /
    • pp.76-83
    • /
    • 2023
  • 본 연구에서는 웹툰 작가의 웹툰 제작 과정을 보조하기 위해 사전학습된 Text-to-Image 모델을 미세조정하여 텍스트에서 웹툰을 생성하는 방법을 제안한다. 제안하는 방법은 웹툰 화풍으로 변환된 웹툰 데이터셋을 사용하여 사전학습된 Stable Diffusion 모델에 LoRA 기법을 활용하여 미세조정한다. 실험 결과 3만 스텝의 학습으로 약 4시간 반이 소요되어 빠르게 학습하는 것을 확인하였으며, 생성된 이미지에서는 입력한 텍스트에 표현된 형상이나 배경이 반영되어 웹툰 이미지가 생성되는 것을 확인하였다. 또한, Inception score를 통해 정량적인 평가를 수행하였을 때, DCGAN 기반의 Text-to-Image 모델보다 더 높은 성능을 나타냈다. 본 연구에서 제안된 웹툰 생성을 위한 Text-to-Image 모델을 웹툰 작가가 사용한다면, 웹툰 저작에 시간을 단축시킬 수 있을 것으로 기대된다.

딥러닝 알고리즘을 이용한 유사 판례 매칭 데이터셋 구축 방안 연구 (A Study on the building Dataset of Similar Case Matching in Legal Domain using Deep Learning Algorithm)

  • 강예지;강혜린;박서윤;장연지;김한샘
    • 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
    • /
    • 한국정보과학회언어공학연구회 2021년도 제33회 한글 및 한국어 정보처리 학술대회
    • /
    • pp.72-76
    • /
    • 2021
  • 판례는 일반인 또는 법률 전문가가 사건에 참조하기 위해 가장 먼저 참고할 수 있는 재판의 선례이다. 하지만 이러한 판례의 유용성에도 불구하고 현 대법원 판례 검색 시스템은 판례 검색에 용이하지 않다. 왜냐하면 법률 전문 지식이 없는 일반인은 검색 의도에 부합하는 검색 결과를 정확히 도출하는 데 어려움이 있으며, 법률 전문가는 검색에 많은 시간과 비용이 들게 되기 때문이다. 이미 해외에서는 유사 케이스 매칭 데이터셋을 구축하여 일반인과 전문가로 하여금 유사 판례 검색을 용이하게 할 뿐만 아니라 여러 자연어 처리 태스크에도 활용하고 있다. 하지만 국내에는 법률 AI와 관련하여 오직 법률과 관련한 세부 태스크 수행에 초점을 맞춘 연구가 많으며, 리소스로서의 유사 케이스 매칭 데이터셋은 구축되어 있지 않다. 이에 본 논문에서는 리소스로서의 판례 데이터셋을 위해 딥러닝 알고리즘 중 문서의 의미를 반영할 수 있는 Doc2Vec 임베딩 모델과 SBERT 임베딩 모델을 적용하여 판례 문서 간 유사도를 측정·비교하였다. 그 결과 SBERT 모델을 통해 도출된 유사 판례가 문서 간 내용적 유사성이 높게 나타났으며, 이를 통해 SBERT 모델을 이용하여 유사 판례 매칭 기초 데이터셋을 구축하였다.

  • PDF

YOLOv5를 이용한 임베디드 마스크 인식 시스템 (Embedded Mask Recognition System using YOLOv5)

  • 유가원;최은성;강영진;전영준;정석찬
    • 한국빅데이터학회지
    • /
    • 제7권1호
    • /
    • pp.63-73
    • /
    • 2022
  • 2020년부터 현재까지 COVID-19가 지속되고 있으며, 사회적으로도 많은 변화가 생겼다. 마스크를 착용하는 것은 필수가 되었고, 마스크 미착용 시, 공공시설이나 식당 등을 이용할 수 없게 되었다. 이로 인해 대부분의 공공시설 출입구에서는 마스크 인식 시스템을 구비하여 마스크 착용 여부를 확인하고 있다. 그러나 목도리로 입을 가린 사람이나 마스크를 제대로 착용하지 않은 사람 등에 대한 판별 여부가 불분명하다. 본 연구에서는 YOLOv5를 이용한 임베디드 마스크 인식 시스템을 제안하였다. 기존 마스크 인식 시스템과는 달리 마스크 착용 여부뿐만 아니라 목도리를 입으로 가린 사람, 손으로 입을 가린 사람 등 다양한 예외 상황에서도 마스크 착용 여부를 구별해낼 수 있었으며, Nvida Jetson Nano Board에 탑재하였을 때 우수한 성능을 보였다.

인공지능 학습용 토공 건설장비 영상 데이터셋 구축 및 타당성 검토 (Building-up and Feasibility Study of Image Dataset of Field Construction Equipments for AI Training)

  • 나종호;신휴성;이재강;윤일동
    • 대한토목학회논문집
    • /
    • 제43권1호
    • /
    • pp.99-107
    • /
    • 2023
  • 최근 건설 현장의 안전사고 비율은 전체 산업에서 가장 높은 비중을 차지한다. 인공지능 기술을 건설 현장에 접목하기 위해서는 기초 학습 자료로 활용될 수 있는 데이터셋 확보가 필수적이다. 본 논문에서는 실제 현장 확보를 통해 원천 데이터를 수집하였으며, 토목 현장에서 주로 운용되고 있는 주요 건설장비 객체를 선정하고 약 9만장의 정지영상 데이터셋 가공을 통해 최적의 학습 데이터셋 구축을 완료하였다. 또한, 객체 인식분야의 대표적인 모델인 YOLO를 활용하여 구축된 데이터의 검증 작업을 수행하였고 90 % 근접한 검출 성능을 확인해 데이터 신뢰성을 확보하였다. 본 연구에서 사용되는 학습 데이터셋은 공공데이터포털에서 활용 가능하도록 공개를 완료하였다. 본 데이터셋은 향후 건설안전 분야의 객체 인식 기술의 건설현장 적용을 위한 기반 데이터로 활용 가능하리라 판단된다.