• 제목/요약/키워드: Object Augmentation

검색결과 91건 처리시간 0.021초

손동작을 이용한 가상 물체 증강 (Markerless Augmentation of Virtual Object Using Bare-Hand)

  • 김일목;정경부;최병욱
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.212-215
    • /
    • 2010
  • 본 논문은 카메라 영상을 통해 사용자의 손동작을 인식하여 가상의 물체를 증강시키는 인터페이스를 제안한다. 사용자는 영상의 일부를 원형으로 그려주는 특정한 손동작을 취하여 영역을 선택하고 시스템은 이를 인식하여 물체를 증강 시킨다. 손동작을 인식하기 위하여 먼저 손 외곽선을 찾아낸 후, 찾아낸 외곽선의 곡률을 계산하여 손가락의 위치를 알아낸다. 알아낸 손가락의 상대적인 위치와 개수를 이용하여 손동작을 구분한다. 또한 적은 연산량으로도 안정적으로 물체를 증강 시킬 수 있도록 이전 프레임에서 자세추정에 사용된 특징점들을 이용하여 현재 프레임에서 필요한 인라이어를 찾아 낼 수 있는 방법을 제시한다.

  • PDF

GAN 기반 데이터 증강을 통한 폐기물 객체 인식 모델 설계 (Bulky waste object recognition model design through GAN-based data augmentation)

  • 김형주;박찬;박정현;김진아;문남미
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.1336-1338
    • /
    • 2022
  • 폐기물 관리는 전 세계적으로 환경, 사회, 경제 문제를 일으키고 있다. 이러한 문제를 예방하고자 폐기물을 효율적으로 관리하기 위해, 인공지능을 통한 연구를 제안하고 있다. 따라서 본 논문에서는 GAN 기반 데이터 증강을 통한 폐기물 객체 인식모델을 제안한다. Open Images Dataset V6와 AI Hub의 공공 데이터 셋을 융합하여 폐기물 품목에 해당하는 이미지들을 정제하고 라벨링한다. 이때, 실제 배출환경에서 발생할 수 있는 장애물로 인한 일부분만 노출된 폐기물, 부분 파손, 눕혀져 배출, 다양한 색상 등의 인식저해요소를 모델 학습에 반영할 수 있도록 일반적인 데이터 증강과 GAN을 통한 데이터 증강을 병합 사용한다. 이후 YOLOv4 기반 폐기물 이미지 인식 모델 학습을 진행하고, 학습된 이미지 인식 모델에 대한 검증 및 평가를 mAP, F1-Score로 진행한다. 이를 통해 향후 스마트폰 애플리케이션과 융합하여 효율적인 폐기물 관리 체계를 구축할 수 있을 것이다.

  • PDF

CutMix 알고리즘 기반의 일반화된 밀 머리 검출 모델 (Generalized wheat head Detection Model Based on CutMix Algorithm)

  • 여주원;박원준
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.73-75
    • /
    • 2024
  • 본 논문에서는 밀 수확량을 증가시키기 위한 일반화된 검출 모델을 제안한다. 일반화 성능을 높이기 위해 CutMix 알고리즘으로 데이터를 증식시켰고, 라벨링 되지 않은 데이터를 최대한 활용하기 위해 Fast R-CNN 기반 Pseudo labeling을 사용하였다. 학습의 정확성과 효율성을 높이기 위해 사전에 훈련된 EfficientDet 모델로 학습하였으며, OOF를 이용하여 검증하였다. 최신 객체 검출 모델과 IoU(Intersection over Union)를 이용한 성능 평가 결과, 제안된 모델이 가장 높은 성능을 보이는 것을 확인하였다.

  • PDF

O2O 상점의 객체 인식을 위한 생성 AI 기반의 진열대 상품 데이터 증강 (Data Augmentation of Shelf Product for Object Recognition in O2O Stores Based on Generative AI)

  • 시종욱;김성영
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2024년도 제69차 동계학술대회논문집 32권1호
    • /
    • pp.77-78
    • /
    • 2024
  • 본 논문에서는 O2O 상점의 자동화에 필수적인 객체 인식 모델의 성능 향상을 목표로, 생성 AI 기술을 이용한 데이터 증강 방법을 제시한다. 제안하는 방법은 텍스트 프롬프트를 활용하여 진열대 상품 이미지를 포함한 다양한 고품질 이미지를 생성할 수 있음을 보인다. 또한, 실제에 더 가까운 상세한 이미지를 생성하기 위한 최적화된 프롬프트를 제안하고, Stable-Diffusion과 DALL-E2의 생성 결과를 통해 비교 분석한다. 이러한 접근 방법은 객체 인식 모델의 성능 향상에 영향을 미칠 것으로 기대된다.

  • PDF

합성곱 신경망을 활용한 군사용 CCTV 객체 인식 (Object Recognition Using Convolutional Neural Network in military CCTV)

  • 안진우;김도형;김재오
    • 한국시뮬레이션학회논문지
    • /
    • 제31권2호
    • /
    • pp.11-20
    • /
    • 2022
  • 병력감축 등 국방 및 안보환경의 변화에 따라 육군의 경계시스템에도 변화가 시급한 상황이다. 또한 경계작전의 특성상 인간의 실수가 번번이 발생하고 있으며 이러한 실수가 전체 경계작전의 실패로 귀결되는 상황은 경계시스템의 인공지능 도입이 필요한 것에 대한 중요한 이유이다. 본 연구의 목적은 합성곱 신경망 방법을 활용하여 군사용 CCTV에 적합한 인공지능 영상인식 시스템을 개발하는 것이다. 본 연구에서 개발한 시스템의 주요 특징은 먼저, 군사용 CCTV의 특징상 상대적으로 작은 객체를 인식해야하는 상황에 적합한 학습데이터를 활용한 것이다. 둘째, 학습용 데이터 셋에 대해 데이터 증강 알고리즘을 활용하여 군사용에 보다 적합하도록 유도한 것이다. 셋째, 군사용 영상의 위장, 악천후 등 상황을 고려하여 영상의 잡음을 개선하는 알고리즘을 적용하였다. 본 연구에서 제안하는 시스템의 성능 평가결과 객체의 인식능력이 기존 방법에 비해 우수함을 확인하였다.

A Study on Traffic Vulnerable Detection Using Object Detection-Based Ensemble and YOLOv5

  • Hyun-Do Lee;Sun-Gu Kim;Seung-Chae Na;Ji-Yul Ham;Chanhee Kwak
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권1호
    • /
    • pp.61-68
    • /
    • 2024
  • 횡단보도에서 발생하는 교통사고를 해결하기 위한 시도가 계속되고 있지만, 교통사고는 끊임 없이 일어나는 상황이다. 특히 노인, 장애인 등의 교통약자들은 교통사고에 노출될 위험이 더 크다. 이에 대한 문제점을 주의 깊게 볼 필요가 있다. 본 논문은 교통 약자 중 휠체어, 목발과 같은 보조 기구를 이용하는 보행자를 위해 YOLO v5 모델을 활용한 객체 탐지 기술을 제안한다. 휠체어, 목발 사용자 그리고 보행자의 이미지 크롤링, Roboflow와 Mobibity Aids 데이터를 수집하였다. 일반화 성능을 높이기 위해 데이터 증강 기법을 활용하였다. 더하여 Type 2 error를 줄이기 위해 앙상블 기법을 이용하여 Recall이 96%인 높은 성능 수치를 얻었다. 이를 통해 교통약자를 목표로 YOLO 내 단일 모델을 앙상블 할 시, 객체를 놓치지 않고 정확한 탐지 성능을 보여준다는 것을 입증하였다.

가상 데이터 생성을 통한 딥러닝 기반 문자인식 시스템 제안 (Proposal for Deep Learning based Character Recognition System by Virtual Data Generation)

  • 이승주;박구만
    • 방송공학회논문지
    • /
    • 제25권2호
    • /
    • pp.275-278
    • /
    • 2020
  • 본 논문에서는 가상 데이터 생성을 통한 딥러닝 기반 문자인식 시스템을 제안한다. 지도학습에서 가장 큰 비중을 차지하는 학습 데이터를 확보하기 위하여 가상 데이터를 생성하였다. 또한 가상 데이터를 생성 후 증강 파라미터를 이용하여, 실제 다양한 데이터에 대응하기 위해서 데이터 일반화를 하였다. 최종적으로 학습 데이터 구성은 증강 파라미터와 폰트 인자에 다양한 값을 대입하여 데이터를 생성하였다. 문자인식 성능을 측정하기 위한 테스트 데이터는 실제 촬영된 이미지 데이터에서 문자영역을 크롭하여 구성하였다. 테스트 데이터는 실제환경에서 발생할 수 있는 이미지 왜곡을 고려하여 데이터 증강하였다. 딥러닝 알고리즘은 실시간 검출에 용이한 YOLO v3를 사용하였으며, 추론결과는 후처리를 통하여 최종 검출결과를 출력한다.

비디오 영상에서의 비보정 3차원 좌표 복원을 통한 가상 객체의 비디오 합성 (Video Augmentation of Virtual Object by Uncalibrated 3D Reconstruction from Video Frames)

  • 박종승;성미영
    • 한국멀티미디어학회논문지
    • /
    • 제9권4호
    • /
    • pp.421-433
    • /
    • 2006
  • 본 논문에서는 비디오에서 비보정 3차원 좌표의 복원과 카메라의 움직임 추정을 통하여 가상 객체를 비디오에 자연스럽게 합성하는 방법을 제안한다. 비디오의 장면에 부합되도록 가상 객체를 삽입하기 위해서는 장면의 상대적인 구조를 얻어야 하고 비디오 프레임의 흐름에 따른 카메라 움직임의 변화도 추정해야 한다. 먼저 특장점을 추적하고 비보정 절차를 수행하여 카메라 파라메터와 3차원 구조를 복원한다. 각 프레임에서 카메라 파라메터들을 고정시켜 촬영하고 이들 카메라 파라메터는 일정 프레임 동안 불변으로 가정하였다. 제안된 방법으로 세 프레임 이상에서 작은 수의 특징점 만으로도 올바른 3차원 구조를 얻을 수 있었다. 가상객체의 삽입 위치는 초기 프레임에서 특정 면의 모서리점의 대응점을 지정하여 결정한다. 가상 객체의 투사 영역을 계산하고 이 영역에 이음새가 없도록 텍스처를 혼합하여 가상객체와 비디오의 부자연스러운 합성 문제를 해결하였다. 제안 방법은 비보정 절차를 선형으로만 구현하여 기존의 방법에 비해서 안정성과 수행속도의 면에서 우수하다. 실제 비디오 스트림에 대한 다양한 실험을 수행한 결과 여러 증강현실 응용 시스템에 유용하게 사용될 수 있음을 입증하였다.

  • PDF

컨볼루션 신경망 기반의 능동소나 표적 식별 (Target Classification of Active Sonar Returns based on Convolutional Neural Network)

  • 김정훈;최대성;이형수;이정우
    • 한국정보통신학회논문지
    • /
    • 제21권10호
    • /
    • pp.1909-1916
    • /
    • 2017
  • 최근 딥 러닝 알고리듬이 다양한 분야에 적용되어 좋은 성능을 내고 있지만, 소나시스템에는 아직 활발히 적용되지 않고 있다. 본 논문에서는 기뢰와 같은 금속 물체와 바위로부터 반사된 능동소나 수신음 데이터를 딥 러닝 알고리듬의 하나인 컨볼루션 신경망으로 식별하는 실험을 수행하였다. 과적합 방지 및 성능 향상을 위해 데이터 확장을 하였고, 확장 및 하이퍼파라미터 값 변화에 따른 성능 변화를 분석하였다. 훈련데이터를 수신각도에 독립적인 경우와 의존적인 경우로 나누어 실험을 수행하였고, 그 결과 각각 88.9%, 94.9%의 성능을 보였다. 이는 이전 연구에서 인공신경망 및 Support Vector Machine 알고리듬을 적용하여 얻은 성능보다 최대 4.5% 포인트 향상되었다.

유적지 투어 지원을 위한 증강 현실기반 프레임워크 (Augmented Reality Framework for Archeological Site Tours)

  • 김은석;우운택
    • 한국HCI학회논문지
    • /
    • 제10권2호
    • /
    • pp.35-43
    • /
    • 2015
  • 사용자 경험 증대를 위해 증강 현실 기술에 대한 활용이 증가하게 됨에 따라, 다양한 증강 현실 어플리케이션들이 문화유산 영역 대상으로 개발되어왔다. 그간 문화유산 영역에서의 증강 현실 기술의 활용이 극적인 진보를 이루었음에도 불구하고, 단순 증강 방법은 증대된 사용자 경험 제공에 걸림돌이 되었으며, 이를 해결하기 위한 효과적인 증강현실의 특성을 반영한 증강 현실 체험 기법에 대한 연구는 부족한 실정이다. 또한 저작 프레임워크의 부재로 인한 일회성에 그치는 콘텐츠 개발은 지속적인 서비스에 핵심이 되는 콘텐츠 생태계 구축에 저해하고 있다. 이러한 문제들을 해결하기 위하여, 우리는 기존의 사물 중심의 증강 방식을 확장한 공간 주도의 증강현실 체험 기법인 스페이스텔링(Spacetelling) 기법과, 이에 필요한 시공간 연계 콘텐츠를 생성하고 지속적인 서비스를 지원하기 위한 스토리스케이프 저작 프레임워크, 그리고 이를 포함한 유적지 투어 지원을 위한 시스템 프레임워크를 제안하였다. 본 제안의 실제적인 구현 가능성을 검증하기 위하여, 현재 진행 중인 K-Culture Time Machine 프로젝트에서의 구현 사례를 제시하였다. 본 연구의 제안을 통하여 지속 가능하면서도, 향상된 사용자 경험을 제공하는 문화유산 증강현실 어플리케이션을 개발할 수 있을 것으로 전망한다.