• 제목/요약/키워드: Object Augmentation

검색결과 91건 처리시간 0.041초

사용자 경험 향상을 위한 딥러닝 기반 차량용 AR 매뉴얼 (Deep Learning based Vehicle AR Manual for Improving User Experience)

  • 이정민;김준학;석정원;박진호
    • 한국컴퓨터그래픽스학회논문지
    • /
    • 제28권3호
    • /
    • pp.125-134
    • /
    • 2022
  • 본 논문은 주로 사용되는 AR 콘텐츠의 증강 방법을 적용하기 어려운 차량 실내공간에서도 사용할 수 있는 차량용 AR매뉴얼을 구현하고, 실공간과 가상 객체의 증강 정합도 향상을 위해 딥러닝 모델을 적용하였다. 차량 핸들의 로고를 딥러닝 학습을 통해 위치와 각도, 기울기 등과 관계없이 인식하고, 이를 중심으로 3차원 실내 공간좌표를 생성하여 실제 차량 부품 위에 정확히 가상버튼을 증강한다. 여기에 동일 학습모델을 기반으로 차량의 주요 경고등 심볼을 인식할 수 있는 기능을 함께 구현하여 차량용 AR매뉴얼로서의 기능성과 활용성을 높인다.

휴먼형 로봇 손의 사물 조작 수행을 이용한 사람 데모 결합 강화학습 정책 성능 평가 (Evaluation of Human Demonstration Augmented Deep Reinforcement Learning Policies via Object Manipulation with an Anthropomorphic Robot Hand)

  • 박나현;오지헌;류가현;;;김태성
    • 정보처리학회논문지:소프트웨어 및 데이터공학
    • /
    • 제10권5호
    • /
    • pp.179-186
    • /
    • 2021
  • 로봇이 사람과 같이 다양하고 복잡한 사물 조작을 하기 위해서는 휴먼형 로봇 손의 사물 파지 작업이 필수적이다. 자유도 (Degree of Freedom, DoF)가 높은 휴먼형(anthropomorphic) 로봇 손을 학습시키기 위하여 사람 데모(human demonstration)가 결합한 강화학습 최적화 방법이 제안되었다. 본 연구에서는 강화학습 최적화 방법에 사람 데모가 결합한 Demonstration Augmented Natural Policy Gradient (DA-NPG)와 NPG의 성능 비교를 통하여 행동 복제의 효율성을 확인하고, DA-NPG, DA-Trust Region Policy Optimization (DA-TRPO), DA-Proximal Policy Optimization (DA-PPO)의 최적화 방법의 성능 평가를 위하여 6 종의 물체에 대한 휴먼형 로봇 손의 사물 조작 작업을 수행한다. 학습 후 DA-NPG와 NPG를 비교한 결과, NPG의 물체 파지 성공률은 평균 60%, DA-NPG는 평균 99.33%로, 휴먼형 로봇 손의 사물 조작 강화학습에 행동 복제가 효율적임을 증명하였다. 또한, DA-NPG는 DA-TRPO와 유사한 성능을 보이면서 모든 물체에 대한 사물 파지에 성공하였고 가장 안정적이었다. 반면, DA-TRPO와 DA-PPO는 사물 조작에 실패한 물체가 존재하여 불안정한 성능을 보였다. 본 연구에서 제안하는 방법은 향후 실제 휴먼형 로봇에 적용하여 휴먼형 로봇 손의 사물 조작 지능 개발에 유용할 것으로 전망된다.

스마트 양식을 위한 딥러닝 기반 어류 검출 및 이동경로 추적 (Deep Learning based Fish Object Detection and Tracking for Smart Aqua Farm)

  • 신영학;최정현;최한석
    • 한국콘텐츠학회논문지
    • /
    • 제21권1호
    • /
    • pp.552-560
    • /
    • 2021
  • 현재 국내 수산 양식업은 스마트화를 추진하고 있지만, 여전히 양식 단계의 많은 과정에서 사람의 주관적인 판단으로 진행되고 있다. 수산 양식업 스마트화를 위해서 선행되어야 할 부분은 양식장 내 물고기들의 상태를 효과적으로 파악하는 것이다. 어류 개체 수, 크기, 이동경로, 이동속도 등을 파악하여 실시간 모니터링 할 수 있게 된다면 사료 자동 급이, 질병유무판단 등 다양한 양식자동화를 진행할 수 있을 것이다. 본 연구에서는 수중 촬영한 어류비디오 데이터를 이용하여 실시간으로 어류의 상태를 파악 할 수 있는 알고리즘을 제안하였다. 어류 객체검출을 위해 딥러닝 기반 최신 객체검출 모델들을 적용하여 검출 성능을 비교 평가 하였고, 검출 결과를 이용하여 비디오내의 연속적인 이미지 프레임에서 어류 객체 ID부여, 이동경로 추적 및 이동속도를 측정할 수 있는 알고리즘을 제안하였다. 제안한 알고리즘은 객체 검출 성능 92%(F1-score 기준)를 보였으며, 실제 테스트비디오 상에서 실시간으로 다수의 어류 객체를 효과적으로 추적하는 것을 확인하였다. 본 논문에서 제안하는 알고리즘을 이용하여 향후 사료 자동 급이, 어류 질병 예측 등 다양한 스마트양식 기술에 효과적으로 활용될 수 있을 것으로 기대한다.

샴 네트워크를 사용하여 추적 레이블을 사용하지 않는 다중 객체 검출 및 추적기 학습에 관한 연구 (Training of a Siamese Network to Build a Tracker without Using Tracking Labels)

  • 강정규;송유승;민경욱;최정단
    • 한국ITS학회 논문지
    • /
    • 제21권5호
    • /
    • pp.274-286
    • /
    • 2022
  • 이동객체 추적은 컴퓨터 비전 분야에서 오랜 시간 동안 연구가 진행되어 온 분야로 자율주행이나 운전 보조 시스템 등의 시스템에서 아주 중요한 역할을 수행하고 있다. 이동객체 추적 기술은 일반적으로 객체를 검출하는 검출기와 검출된 객체를 추적하는 추적기의 결합으로 이루어져 있다. 검출기는 다양한 데이터셋이 공개되어 사용되고 있기 때문에 쉽게 좋은 모델을 학습할 수 있지만, 추적기의 경우 상대적으로 공개된 데이터셋도 적고 직접 데이터셋을 구성하는 것도 검출기 데이터셋에 비해 굉장히 오랜 시간을 소요한다. 이에 검출기를 따로 개발하고, 별도의 추적기를 학습 기반이 아닌 방식을 활용하여 개발하는 경우가 많은데 이런 경우 두 개의 시스템이 차례로 작동하게 되어 전체 시스템의 속도를 느리게 하고 앞단의 검출기의 성능이 변할 때마다 별도로 추적기 또한 조정해줘야 한다는 단점이 있다. 이에 본 연구는 검출용 데이터셋만을 사용하여 검출과 추적을 동시에 수행하는 모델을 구성하는 방법을 제안한다. 데이터 증강 기술과 샴 네트워크를 사용하여 단일 이미지에서 객체를 검출 및 추적하는 방법을 연구하였다. 공개 데이터셋에 실험을 진행하여 학습 결과 높은 속도로 작동하는 이동객체 검출 및 추적기를 학습할 수 있음을 검증하였다.

Design of Mobile Application for Learning Chemistry using Augmented Reality

  • Kim, Jin-Woong;Hur, Jee-Sic;Ha, Min Woo;Kim, Soo Kyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권9호
    • /
    • pp.139-147
    • /
    • 2022
  • 본 연구에서는 증강현실 기술을 이용하여, 화학에 입문하는 사람이 화학 학습에 필요한 지식을 쉽게 습득할 수 있도록 모바일 애플리케이션을 개발하는 것을 목표로 한다. 본 연구에서는 2차원 형태의 그림을 인식해 화학 구조를 3차원의 개체로 증강 시켜 사용자의 화면에 보여주고, 이와 관련된 다분야의 정보를 동시에 제공하는 서비스를 활용해 새로운 화학 학습 경험을 제공하는 점이 특징이다. 이를 위해 별도의 시스템과 콘텐츠를 구성하였고, 안전하고 실시간적인 데이터 관리를 위해 로그인 API와 실시간 데이터베이스 기술을 사용하였으며, 이미지 인식 및 3차원 개체 증강 서비스를 위해 이미지 트래킹 기술을 사용하였다. 본 연구를 통한 결과는 실험을 통해 유의미한 결과를 도출하였다. 향후 연구에서는 화학 구조 데이터 라이브러리를 사용하여 효율적으로 데이터를 불러오고 출력할 수 있도록 한다.

객체 중심 증강 기법을 사용한 목조 문화재 영상에서의 변위 감지 모델 (An Displacement Detection Model in Cultural Asset Images using Object-centric Augmentation)

  • 강재용;김인기;임현석;곽정환
    • 한국컴퓨터정보학회:학술대회논문집
    • /
    • 한국컴퓨터정보학회 2021년도 제64차 하계학술대회논문집 29권2호
    • /
    • pp.137-139
    • /
    • 2021
  • 본 논문에서는 목조 문화재 영상에서의 변위를 효율적으로 감지하기 위한 객체 중심 증강 기법을 사용한 모델을 제안한다. 우선 객체 중심 증강 기법을 적용하여 변위 객체들이 이미지 공간상의 어느 곳이든 위치할 수 있게끔 데이터를 구성한 이후 사전 학습된 합성 곱 신경망을 사용하여 입력 이미지에 대한 심층 특징 벡터를 추출한다. 그 이후 심층 특징 벡터는 완전 연결 계층의 입력 값으로 들어와서 최종적으로 변위가 존재하는지 아닌지에 대한 예측을 수행하게 된다. 데이터 셋으로는 충주시 근처의 문화재에 방문해서 수집한 목조 문화재 이미지를 가지고 정상 및 비정상으로 구분한 데이터 셋을 사용하였다. 실험 결과 우리가 제안한 객체 중심 증강 기법을 사용한 모델이 객체 중심 증강 기법을 사용하지 않은 모델보다 목조 문화재에서 변위 영역을 더 잘 감지함을 확인하였다. 이러한 결과로부터 우리가 제안한 방법이 목재 문화재의 변위 검출에 있어서 매우 적합함을 보여준다.

  • PDF

시각 장애인을 위한 상품 영양 정보 안내 시스템 (Product Nutrition Information System for Visually Impaired People)

  • 정종욱;이제경;김효리;오유수
    • 대한임베디드공학회논문지
    • /
    • 제18권5호
    • /
    • pp.233-240
    • /
    • 2023
  • Nutrition information about food is written on the label paper, which is very inconvenient for visually impaired people to recognize. In order to solve the inconvenience of visually impaired people with nutritional information recognition, this paper proposes a product nutrition information guide system for visually impaired people. In the proposed system, user's image data input through UI, and object recognition is carried out through YOLO v5. The proposed system is a system that provides voice guidance on the names and nutrition information of recognized products. This paper constructs a new dataset that augments the 319 classes of canned/late-night snack product image data using rotate matrix techniques, pepper noise, and salt noise techniques. The proposed system compared and analyzed the performance of YOLO v5n, YOLO v5m, and YOLO v5l models through hyperparameter tuning and learned the dataset built with YOLO v5n models. This paper compares and analyzes the performance of the proposed system with that of previous studies.

데이터 증강을 통한 안전모 착용 여부 확인 객체 탐지 모델 성능 향상 연구 (A study on the improvement of Object Detection Model via Data Augmentation)

  • 조재호;이현준;전광휘;오민택;윤상범
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 추계학술발표대회
    • /
    • pp.1102-1103
    • /
    • 2023
  • 안전모 착용 여부를 확인하는 객체 탐지 모델을 물류 현장에서 활용하기 위해서는 안전모를 착용한 경우와 착용하지 않은 경우를 정확하게 탐지해야 한다. 하지만 학습 데이터가 안전모를 착용한 클래스와 착용하지 않은 클래스 간 불균형이 존재하는 경우 해당 데이터만으로는 태스크에 맞게 학습이됐다고 보긴 힘들다. 본 연구는 데이터 증강 기법 적용 시 임의의 데이터에 증강을 적용하는 대신 상대적으로 적은 안전모를 착용하지 않은 클래스를 포함하는 이미지에 대하여 데이터 증강 기법을 적용하였다. 여러 데이터 증강 기법 중 Rotation, Gaussian Noise, 객체를 기준으로 한 Crop을 직접 구현 및 적용하여 객체 탐지 모델인 YOLOv5의 성능을 효과적으로 높이며 더욱 강건한 모델을 개발하는 방법을 제안한다.

딥러닝 기반 지하공동구 제어반 문열림 인식 (Deep Learning-based Object Detection of Panels Door Open in Underground Utility Tunnel)

  • 김경환;김지은;정우석
    • 한국재난정보학회 논문집
    • /
    • 제19권3호
    • /
    • pp.665-672
    • /
    • 2023
  • 연구목적: 지하공동구는 도시 지하에 전기, 수도, 가스 등의 인프라를 공동 수용하는 시설로 공기 흐름이 부족하여 계절에 상관없이 결로가 자주 발생한다. 결로는 전기 설비의 누전 화재를 일으키는 원인이 되므로 지하공동구 내의 조명 등 각종 시설물 관리를 위해 필요한 제어반은 결로에 노출되지 않도록 문이 닫힌 상태로 관리되어야 한다. 본 논문에서는 딥러닝 객체인식 기술을 활용하여 수km 거리에 반복 배치된 공동구 제어반의 문 열림 여부를 이동 카메라 조건과 조명이 꺼진 조건에서도 인식하고자 한다. 연구방법: 지하공동구를 순찰하는 로봇이 촬영한 영상데이터를 이용하여 딥러닝 객체인식 모델인 YOLO를 모자이크 이미지 증강기법으로 학습시켜 제어반 문 열림과 문 닫힘을 인식한다. 연구결과: 모자이크 이미지 증강기법으로 학습시킨 모델과 사용하지 않은 모델의 성능을 비교한 결과, 모자이크 학습 모델이 더 우수한 성능(모든 클래스에 대한 mAP가 0.994 이상임)을 보이는 것을 확인하였다. 결론: 지하공동구의 조명이 꺼진 상태에서도, 공동구 내부 시설물이 복잡한 환경에서도 제어반의 문열림 여부를 우수한 성능으로 인식하여 지하공동구 재난안전관리에 도움이 될 것으로 기대된다.

집합물의 FRBR 구현 방안에 관한 연구 - RDA, KCR4 목록규칙 기술방안을 중심으로 - (A Study on the Bibliographic Description of RDA & KCR4 Cataloging Rules for FRBRizing the Aggregates)

  • 이미화
    • 한국비블리아학회지
    • /
    • 제29권1호
    • /
    • pp.27-46
    • /
    • 2018
  • 본고는 집합물의 FRBR 구현을 위해 집합물 모델링을 바탕으로 RDA, KCR4 목록규칙 기술방안을 제안하고자 한다. FRBR과 LRM의 집합물 모델링을 분석하고, 이러한 집합물 모델링에 따라 RDA, KCR4의 집합물 관련 목록규칙을 비교하여, 집합물을 위한 RDA와 KCR4 목록규칙 기술방안을 제시하였다. 첫째, 객체지향모형으로 서지레코드를 기술하되, 가능한 집합저작과 수록된 개별저작을 모두 기술할 수 있도록 한다. 둘째, 한 개인이나 가족, 단체에 의한 집합물인 경우, RDA에서는 집합저작으로 전통적인 종합표제를 기술하는 것과 함께 개별저작을 기술하는 규칙을 마련해야 한다. KCR4에서는 집합저작과 개별저작을 기술하되 집합저작은 전통적인 종합표제를 사용하도록 규정해야 한다. 셋째, 여러 개인이나 가족, 단체의 집합물의 경우, RDA와 KCR4 모두 집합물의 표제가 있으면 집합저작과 개별저작을 같이 기술하고, 집합물의 표제가 없는 경우는 집합저작 보다는 개별저작을 기술하도록 한다. 넷째, 보유 집합물은 필요시 주된 저작의 표현형과 함께 집합저작, 보유 표현형으로 모두 접근할 수 있도록 규정해야 한다. 본 연구는 집합물을 위한 RDA, KCR4 목록규칙 기술방안을 제시하여 집합물의 FRBR 구현을 가능하도록 할 것이다.