• 제목/요약/키워드: 증강학습

검색결과 356건 처리시간 0.024초

딥러닝 기반 지하공동구 제어반 문열림 인식 (Deep Learning-based Object Detection of Panels Door Open in Underground Utility Tunnel)

  • 김경환;김지은;정우석
    • 한국재난정보학회 논문집
    • /
    • 제19권3호
    • /
    • pp.665-672
    • /
    • 2023
  • 연구목적: 지하공동구는 도시 지하에 전기, 수도, 가스 등의 인프라를 공동 수용하는 시설로 공기 흐름이 부족하여 계절에 상관없이 결로가 자주 발생한다. 결로는 전기 설비의 누전 화재를 일으키는 원인이 되므로 지하공동구 내의 조명 등 각종 시설물 관리를 위해 필요한 제어반은 결로에 노출되지 않도록 문이 닫힌 상태로 관리되어야 한다. 본 논문에서는 딥러닝 객체인식 기술을 활용하여 수km 거리에 반복 배치된 공동구 제어반의 문 열림 여부를 이동 카메라 조건과 조명이 꺼진 조건에서도 인식하고자 한다. 연구방법: 지하공동구를 순찰하는 로봇이 촬영한 영상데이터를 이용하여 딥러닝 객체인식 모델인 YOLO를 모자이크 이미지 증강기법으로 학습시켜 제어반 문 열림과 문 닫힘을 인식한다. 연구결과: 모자이크 이미지 증강기법으로 학습시킨 모델과 사용하지 않은 모델의 성능을 비교한 결과, 모자이크 학습 모델이 더 우수한 성능(모든 클래스에 대한 mAP가 0.994 이상임)을 보이는 것을 확인하였다. 결론: 지하공동구의 조명이 꺼진 상태에서도, 공동구 내부 시설물이 복잡한 환경에서도 제어반의 문열림 여부를 우수한 성능으로 인식하여 지하공동구 재난안전관리에 도움이 될 것으로 기대된다.

완전 합성곱 신경망을 활용한 자동 포트홀 탐지 기술의 개발 및 평가 (Development and Evaluation of Automatic Pothole Detection Using Fully Convolutional Neural Networks)

  • 전찬준;심승보;강성모;류승기
    • 한국ITS학회 논문지
    • /
    • 제17권5호
    • /
    • pp.55-64
    • /
    • 2018
  • 운전자의 안전사고에 직접적인 원인이 되고, 차량 파손을 유발시켜 재산상의 피해를 발생시키고 있는 포트홀을 완전 합성곱 신경망 기반의 자동으로 탐지하는 기법을 본 논문에서는 제안한다. 먼저, 실제 국내 도로를 주행하면서 차량에 설치된 카메라를 통하여 학습 데이터셋을 수집하고, 완전 합성곱 신경망 구조를 활용하여 의미론적 분할 형태로 신경망을 학습하였다. 어두운 환경에서 강건한 성능을 보이기 위하여 학습 데이터셋을 밝기에 따라서 증강하여 총 30,000장의 이미지를 학습하였다. 또한, 제안된 자동 포트홀 탐지 기술의 성능을 검증하기 위하여 총 450장의 평가 DB를 생성하였고, 총 네 명의 전문가가 각각의 이미지를 평가하였다. 평가 결과, 제안된 포트홀 탐지 기술은 높은 민감도 수치를 나타나는 것으로 평가 되었으며, 이는 정탐에서 강건한 성능을 보이는 것으로 해석 가능하다.

Transformer 네트워크를 이용한 음성신호 변환 (Voice-to-voice conversion using transformer network)

  • 김준우;정호영
    • 말소리와 음성과학
    • /
    • 제12권3호
    • /
    • pp.55-63
    • /
    • 2020
  • 음성 변환은 다양한 음성 처리 응용에 적용될 수 있으며, 음성 인식을 위한 학습 데이터 증강에도 중요한 역할을 할 수 있다. 기존의 방법은 음성 합성을 이용하여 음성 변환을 수행하는 구조를 사용하여 멜 필터뱅크가 중요한 파라미터로 활용된다. 멜 필터뱅크는 뉴럴 네트워크 학습의 편리성 및 빠른 연산 속도를 제공하지만, 자연스러운 음성파형을 생성하기 위해서는 보코더를 필요로 한다. 또한, 이 방법은 음성 인식을 위한 다양한 데이터를 얻는데 효과적이지 않다. 이 문제를 해결하기 위해 본 논문은 원형 스펙트럼을 사용하여 음성 신호 자체의 변환을 시도하였고, 어텐션 메커니즘으로 스펙트럼 성분 사이의 관계를 효율적으로 찾아내어 변환을 위한 자질을 학습할 수 있는 transformer 네트워크 기반 딥러닝 구조를 제안하였다. 영어 숫자로 구성된 TIDIGITS 데이터를 사용하여 개별 숫자 변환 모델을 학습하였고, 연속 숫자 음성 변환 디코더를 통한 결과를 평가하였다. 30명의 청취 평가자를 모집하여 변환된 음성의 자연성과 유사성에 대해 평가를 진행하였고, 자연성 3.52±0.22 및 유사성 3.89±0.19 품질의 성능을 얻었다.

MAGICal Synthesis: 반도체 패키지 이미지 생성을 위한 메모리 효율적 접근법 (MAGICal Synthesis: Memory-Efficient Approach for Generative Semiconductor Package Image Construction)

  • 창윤빈;최원용;한기준
    • 마이크로전자및패키징학회지
    • /
    • 제30권4호
    • /
    • pp.69-78
    • /
    • 2023
  • 산업 인공지능의 발달과 함께 반도체의 수요가 크게 증가하고 있다. 시장 수요에 대응하기 위해 패키징 공정에서 자동 결함 검출의 중요성 역시 증가하고 있다. 이에 따라, 패키지의 자동 불량 검사를 위한 딥러닝 기반의 방법론들의 연구가 활발히 이루어 지고 있다. 딥러닝 기반의 모델은 학습을 위해서 대량의 고해상도 데이터를 필요로 하나, 보안이 중요한 반도체 분야의 특성상 관련 데이터의 공유 및 레이블링이 쉽지 않아 모델의 학습이 어려운 한계를 지니고 있다. 또한 고해상도 이미지를 생성하기 위해 상당한 컴퓨팅 자원이 요구되는데, 본 연구에서는 분할정복 접근법을 통해 적은 컴퓨팅 자원으로 딥러닝 모델 학습을 위한 충분한 양의 데이터를 확보하는 방법을 소개한다. 제안된 방법은 높은 해상도의 이미지를 분할하고 각 영역에 조건 레이블을 부여한 후, 독립적인 부분 영역과 경계를 학습시켜, 경계 손실이 일관적인 이미지를 생성하도록 유도한다. 이후, 분할된 이미지를 하나로 통합하여, 최종적으로 모델이 고해상도의 이미지를 생성하도록 구성하였다. 실험 결과, 본 연구를 통해 증강된 이미지들은 높은 효율성, 일관성, 품질 및 범용성을 보였다.

딥러닝을 이용한 한국 주요 매개모기 종 분류 (Classification of Korean Vector Mosquito Species using Deep Neural Networks)

  • 박준영;김동인;노광래;권형욱;강우철
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2018년도 추계학술발표대회
    • /
    • pp.680-682
    • /
    • 2018
  • 기후변화에 따라 매개 질병의 발병 빈도가 증가하고 있으며 모기와 같은 매개체에 의해 전염되는 매개 질병은 인구집단에 대한 중요한 위협 요인이다. 이러한 질병 관리를 위해 지역별 모기 서식 현황을 모니터링 하는 시스템의 필요성이 강조되고 있다. 하지만 현재의 모기 모니터링은 개체 파악을 위한 분류와 동정을 사람이 직접 수행하기에 오랜 시간이 소요된다. 이 연구는 그러한 문제점을 해결하고 미래 매개곤충 서식 현황 파악 시스템의 기반을 마련하기 위해 심층 신경망(Deep Neural Networks)을 활용하여 한국 주요 매개모기 종 분류를 수행하고 결과를 분석하였다. 종 분류를 위한 모델은 잘 알려진 신경망 모델인 DenseNet(Densely Connected Networks)을 사용하였고 이를 직접 촬영한 모기 데이터와 약간의 변형을 가한 모기 데이터를 사용하여 학습시켰다. 학습 데이터를 각각 5배, 20배, 100배로 증강하여 실제 데이터의 부족을 보완하였으며, 이를 통해 최대 99.48%의 정확도를 달성하였다.

Attentional View Pooling을 이용한 조립 부품 이미지 기반 3 차원 물체 검색 (Assembly Part Image-based 3D Shape Retrieval using Attentional View Pooling)

  • 이은지;강이삭;김민우;박선지;조남익
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2020년도 추계학술대회
    • /
    • pp.72-75
    • /
    • 2020
  • 조립 부품 이미지에 해당하는 3D CAD 모델 매칭 기술은 최근 로봇 조립 기술의 발전으로 필요성이 대두되고 있다. 이미지 기반 3 차원 모델 매칭 연구는 진행되어 왔지만 가구 부품 이미지와는 특성이 다른 RGB[5] 이미지나 스케치 이미지를 다루는[1] 접근들이었다. 딥러닝을 사용하는 스케치 이미지 기반 3 차원 물제 검색 연구에서는 대부분 3 차원 이미지를 다각도에서 렌더링한 view 이미지들에서 feature를 추출하고 pooling 하여 하나의 feature를 출력한다. 그러나 기존의 view pooling 방식은 단순한 평균 방식으로, 부품 이미지에 따른 view를 반영하기에는 한계가 있었다. 따라서 본 논문에서는 조립 부품 이미지 기반 3 차원 물체 검색을 위해 query 부품 이미지에 따라 다른 view 이미지에 집중할 수 있는 방식의 attentional view pooling을 제안한다. 또한 조립 부품 데이터의 특성 상 class 당 CAD 모델이 하나인 상황이므로 학습 데이터가 터무니없이 부족하여 이를 해결하기 위한 학습 데이터 증강 방법을 제안한다. 실험은 의자 부품 11가지에 대해 진행하였고 이를 통해 제안하는 방식의 성능을 입증하였다.

  • PDF

선별적인 임계값 선택을 이용한 준지도 학습의 SAR 분류 기술 (Semi-Supervised SAR Image Classification via Adaptive Threshold Selection)

  • 도재준;유민정;이재석;문효이;김선옥
    • 한국군사과학기술학회지
    • /
    • 제27권3호
    • /
    • pp.319-328
    • /
    • 2024
  • Semi-supervised learning is a good way to train a classification model using a small number of labeled and large number of unlabeled data. We applied semi-supervised learning to a synthetic aperture radar(SAR) image classification model with a limited number of datasets that are difficult to create. To address the previous difficulties, semi-supervised learning uses a model trained with a small amount of labeled data to generate and learn pseudo labels. Besides, a lot of number of papers use a single fixed threshold to create pseudo labels. In this paper, we present a semi-supervised synthetic aperture radar(SAR) image classification method that applies different thresholds for each class instead of all classes sharing a fixed threshold to improve SAR classification performance with a small number of labeled datasets.

e-Training 사례 : 가상현실 기반의 디젤엔진훈련 시뮬레이션 개발 (Implementation of Diesel Engine Training Simulation based on Virtual Reality)

  • 송은지;서동희
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2015년도 춘계학술대회
    • /
    • pp.567-568
    • /
    • 2015
  • 인터넷이 활성화 되면서 웹기반 교육으로 e-Training이 발전되었다. e-Training은 업무에 필요한 수행능력을 습득 향상 시키기 위하여 정보통신 기술, 장비, 환경을 활용하여 실시하는 교육훈련이다. e-Training에 포함되는 기술에는 시뮬레이션, 3D 가상현실, 증강현실 등이 있다. 본 연구에서는 가상현실 기반의 디젤엔진훈련 시뮬레이션을 개발하였다. 제안한 시스템은 3차원 디스플레이 시스템을 통해 몰입감과 상호작용 교육훈련방식을 도입하여 3D입체형 화면안의 시야가 실제 현실과 같은 몰입의 효과가 있으며 엔진부품의 이름과 기능 등을 게임화를 통해 교육 훈련하는 시스템으로써 시뮬레이션을 통해 필요한 문제풀이를 재미있게 할 수 있어 학습능률에 효과가 있다.

  • PDF

인공지능 기반 3차원 공간 복원 최신 기술 동향

  • 임성훈
    • 방송과미디어
    • /
    • 제25권2호
    • /
    • pp.17-26
    • /
    • 2020
  • 최근 스마트폰에서의 증강현실, 미적 효과의 증대(예, 라이브 포커싱) 등의 어플리케이션을 제공하기 위해 모바일 기기에서의 3차원 공간 복원 기술에 대한 관심이 증가하고 있다. 소비자들의 요구에 발 맞춰 최근 스마트폰 제조사는 모든 플래그십 모델에 다중 카메라 및 뎁스 센서(거리 측정 센서)를 탑재하는 추세이다. 본 고에서는 모바일 폰에 탑재되고 있는 대표적인 세 축의 뎁스 추정(공간 복원) 방식에 대해 간단히 살펴보고, 최근 심층학습(Deep learning)의 등장으로 기술 발전의 새로운 국면에 접어 든 다중 시점 매칭(Multi-view stereo) 방법에 대해 소개하고자 한다. 심층 신경망이 재조명 받은 2012년 전까지 주류 연구 방향이었던 전통 기하학 기반의 방법에 대한 소개를 시작으로 심층 신경망기반의 방법론으로의 발전된 형태를 살펴본다. 또한, 신경망기반의 방법론은 크게 3 세대로 나누어 각 세대별 특징에 대해 자세히 살펴보고, 다양한 데이터에 대한 실험 결과를 통해 세대별 공간 복원 결과를 비교 분석한다.

마커의 가려짐을 해결하여 증강현실을 이용한 안정적 영어 학습 컨텐츠에 대한 연구 (The Study of Stable Child English Education Content Using Augmented Reality Solving the Hide of Marker)

  • 전수진;김영섭
    • 반도체디스플레이기술학회지
    • /
    • 제9권4호
    • /
    • pp.99-102
    • /
    • 2010
  • In this study, the 3- dimensional (3-D) learning contents are suggested using 'Augmented Reality' instead of existing 2-dimensional (2-D) learning methods. At the present, there are some 2-D learning methods using texts, image, pictures, and videos called e-learning. However, these one-way 2-D methods have some disadvantages such as declining learner's immersion and concentration. Thus, the 3-D learning contents using 'Augmented Reality' are suggested to compensate the disadvantages. According to the development of information technology (IT), the augmented reality has many applications to the era of ubiquitous. However, there are some disadvantages when learners use these contents as following; non-augmenting by partially hiding from makers and declining concentration by patterns of the makers. In this study, the beneficial marker which can solve this non-augmenting phenomenon is suggested.