• 제목/요약/키워드: Object-based model

검색결과 2,230건 처리시간 0.034초

STAR-24K: A Public Dataset for Space Common Target Detection

  • Zhang, Chaoyan;Guo, Baolong;Liao, Nannan;Zhong, Qiuyun;Liu, Hengyan;Li, Cheng;Gong, Jianglei
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권2호
    • /
    • pp.365-380
    • /
    • 2022
  • The target detection algorithm based on supervised learning is the current mainstream algorithm for target detection. A high-quality dataset is the prerequisite for the target detection algorithm to obtain good detection performance. The larger the number and quality of the dataset, the stronger the generalization ability of the model, that is, the dataset determines the upper limit of the model learning. The convolutional neural network optimizes the network parameters in a strong supervision method. The error is calculated by comparing the predicted frame with the manually labeled real frame, and then the error is passed into the network for continuous optimization. Strongly supervised learning mainly relies on a large number of images as models for continuous learning, so the number and quality of images directly affect the results of learning. This paper proposes a dataset STAR-24K (meaning a dataset for Space TArget Recognition with more than 24,000 images) for detecting common targets in space. Since there is currently no publicly available dataset for space target detection, we extracted some pictures from a series of channels such as pictures and videos released by the official websites of NASA (National Aeronautics and Space Administration) and ESA (The European Space Agency) and expanded them to 24,451 pictures. We evaluate popular object detection algorithms to build a benchmark. Our STAR-24K dataset is publicly available at https://github.com/Zzz-zcy/STAR-24K.

Lightweight multiple scale-patch dehazing network for real-world hazy image

  • Wang, Juan;Ding, Chang;Wu, Minghu;Liu, Yuanyuan;Chen, Guanhai
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제15권12호
    • /
    • pp.4420-4438
    • /
    • 2021
  • Image dehazing is an ill-posed problem which is far from being solved. Traditional image dehazing methods often yield mediocre effects and possess substandard processing speed, while modern deep learning methods perform best only in certain datasets. The haze removal effect when processed by said methods is unsatisfactory, meaning the generalization performance fails to meet the requirements. Concurrently, due to the limited processing speed, most dehazing algorithms cannot be employed in the industry. To alleviate said problems, a lightweight fast dehazing network based on a multiple scale-patch framework (MSP) is proposed in the present paper. Firstly, the multi-scale structure is employed as the backbone network and the multi-patch structure as the supplementary network. Dehazing through a single network causes problems, such as loss of object details and color in some image areas, the multi-patch structure was employed for MSP as an information supplement. In the algorithm image processing module, the image is segmented up and down for processed separately. Secondly, MSP generates a clear dehazing effect and significant robustness when targeting real-world homogeneous and nonhomogeneous hazy maps and different datasets. Compared with existing dehazing methods, MSP demonstrated a fast inference speed and the feasibility of real-time processing. The overall size and model parameters of the entire dehazing model are 20.75M and 6.8M, and the processing time for the single image is 0.026s. Experiments on NTIRE 2018 and NTIRE 2020 demonstrate that MSP can achieve superior performance among the state-of-the-art methods, such as PSNR, SSIM, LPIPS, and individual subjective evaluation.

Frontal Face Video Analysis for Detecting Fatigue States

  • Cha, Simyeong;Ha, Jongwoo;Yoon, Soungwoong;Ahn, Chang-Won
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권6호
    • /
    • pp.43-52
    • /
    • 2022
  • 사람이 느끼는 피로는 다양한 생체신호로부터 측정이 가능한 것으로 알려져 있으며, 기존 연구는 질병과 관련된 심각한 피로수준을 산정하는데 주된 목적을 두고 있다. 본 연구에서는 피실험자의 영상을 이용하여 딥러닝 기반의 영상 분석 기술을 적용, 피로 여부를 판단하기 위한 모델을 제안한다. 특히 화상 분석에서 통상적으로 사용되는 객체 인식, 요소 추출과 함께 영상 데이터의 시계열적 특성을 고려하여 방법론을 교차한 3개 분석모델을 제시했다. 다양한 피로상황에서 수집된 정면 얼굴 영상 데이터를 이용하여 제시된 모델을 실험하였으며, CNN 모델의 경우 0.67의 정확도로 피로 상태를 분류할 수 있어 영상 분석 기반의 피로 상태 분류가 유의미하다고 판단된다. 또한 모델별 학습 및 검증 절차 분석을 통해 영상 데이터 특성에 따른 모델 적용방안을 제시했다.

집단 로봇 제어를 위한 수정된 플로킹 알고리즘의 시뮬레이션 검증 (Verification of Modified Flocking Algorithm for Group Robot Control)

  • 이은복;신석훈;유용준;지승도;김재익
    • 한국시뮬레이션학회논문지
    • /
    • 제18권4호
    • /
    • pp.49-58
    • /
    • 2009
  • 로봇의 지능화에서 기존의 하향식 접근 방식은 단일 개체 지능화에 중점을 두어 왔으나 이러한 접근은 첫째, 센싱, 연산, 통신에 소모되는 비용과 시간이 크다는 것 그리고 둘째, 예측 불가능한 환경변화에 민감하게 대응하는데 어려움이 있다. 본 연구는 이러한 단점을 극복하는 상향식 접근 방식의 집단적 지능화를 위한 알고리즘과 이를 적용한 에이전트 모델을 제안하고 시뮬레이션을 통해 검증하였다. 본 연구에서 제안한 수정된 플로킹 알고리즘은 그래픽이나 게임에서 집단이동을 보이는 생명체를 모델링 하는데 주로 사용되어온 플로킹(Flocking, Craig Reynolds)의 개념을 단순화시킴으로써 기존 플로킹의 연산과정을 단순화하여 보다 많은 수의 집단 로봇에 적용하기 용이 하도록 수정한 알고리즘이다. 시뮬레이션을 통해 수정된 플로킹 알고리즘의 집단화 적용 가능성을 검증하였고, 이를 위한 보이드 에이전트를 모델링 하였다. 또한 실질적 검증을 위하여 실제 집단로봇에 대한 사례 연구를 진행하였다.

DEEP-South: Asteroid Light-Curve Survey Using KMTNet

  • Lee, Hee-Jae;Yang, Hongu;Kim, Dong-Heun;Kim, Myung-Jin;Moon, Hong-Kyu;Kim, Chun-Hwey;Choi, Young-Jun
    • 천문학회보
    • /
    • 제45권1호
    • /
    • pp.46.3-47
    • /
    • 2020
  • Variations in the brightness of asteroids are caused by their spins, irregular shapes and companions. Thus, in principle, the spin state and shape model of a single object or, a combined model of spins, shapes and mutual orbit of a multiple components can be constructed from the analysis of light curves obtained from the time-series photometry. Using ground- and space-based facilities, a number of time-series photometric observations of asteroids have been conducted to find the possible causes of their light variations. Nonetheless, only about 2% of the known asteroids have been confirmed for their rotation periods. Therefore, a follow-on systematic photometric survey of asteroids is essential. We started an asteroid light curve survey for this purpose using Korea Microlensing Telescope Network (KMTNet) during 199 nights between the second half of 2019 and the first half of 2020. We monitored within a 2° × 14° region of the sky per each night with 25 min cadences. In order to observe as many asteroids as possible with a single exposure, we mostly focus on the ecliptic plane. In our survey, 25,925 asteroids were observed and about 8,000 of them were confirmed for their rotation periods. In addition, using KMTNet's 24-hour continuous monitoring, we collected many composite light curves of slow rotating asteroids that were rarely obtained with previous observations. In this presentation, we will introduce the typical light curves of asteroids obtained from our survey and present a statistical analysis of spin states and shapes of the asteroids from this study.

  • PDF

센서 데이터의 시계열 특성을 고려한 딥러닝 모델 기반의 공압 실린더 고장 감지 시스템 구현 (Real-time Fault Detection System of a Pneumatic Cylinder Via Deep-learning Model Considering Time-variant Characteristic of Sensor Data)

  • 김병수;송근명;이민정;백수정
    • 산업경영시스템학회지
    • /
    • 제47권2호
    • /
    • pp.10-20
    • /
    • 2024
  • In recent automated manufacturing systems, compressed air-based pneumatic cylinders have been widely used for basic perpetration including picking up and moving a target object. They are relatively categorized as small machines, but many linear or rotary cylinders play an important role in discrete manufacturing systems. Therefore, sudden operation stop or interruption due to a fault occurrence in pneumatic cylinders leads to a decrease in repair costs and production and even threatens the safety of workers. In this regard, this study proposed a fault detection technique by developing a time-variant deep learning model from multivariate sensor data analysis for estimating a current health state as four levels. In addition, it aims to establish a real-time fault detection system that allows workers to immediately identify and manage the cylinder's status in either an actual shop floor or a remote management situation. To validate and verify the performance of the proposed system, we collected multivariate sensor signals from a rotary cylinder and it was successful in detecting the health state of the pneumatic cylinder with four severity levels. Furthermore, the optimal sensor location and signal type were analyzed through statistical inferences.

Research on Ocular Data Analysis and Eye Tracking in Divers

  • Ye Jun Lee;Yong Kuk Kim;Da Young Kim;Jeongtack Min;Min-Kyu Kim
    • 한국컴퓨터정보학회논문지
    • /
    • 제29권8호
    • /
    • pp.43-51
    • /
    • 2024
  • 본 논문은 수중 활동을 주로 하는 다이버를 대상으로 특수 목적용 다이버 마스크를 이용해서 안구 데이터를 획득 및 분석하고, 이를 이용해서 사용자의 시선을 추적하는 방법에 대해 제안한다. 안구 데이터 분석을 위해 자체 제작한 안구 데이터 셋을 구축하였고, YOLOv8-nano 모델을 활용해서 학습 모델을 생성하였다. 학습 모델의 프레임 당 소요 시간은 평균 45.52ms를 달성하였고, 눈을 뜬 상태와 감는 상태를 구별하는 인식 성공률은 99%를 달성하였다. 안구 데이터 분석 결과를 바탕으로 현실 세계 좌표를 매칭할 수 있는 시선 추적 알고리즘을 개발하였다. 이 알고리즘의 검증 결과 x축은 약 1%, y축은 약 6%의 평균 오차율을 나타내는 것을 알 수 있었다.

선형모델을 이용한 방향성 조명하의 얼굴영상 정규화 (Normalization of Face Images Subject to Directional Illumination using Linear Model)

  • 고재필;김은주;변혜란
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제31권1호
    • /
    • pp.54-60
    • /
    • 2004
  • 얼굴인식은 외관기반(appearance-based) 매칭기법으로 풀어야 할 문제 중의 하나이다. 그러나, 얼굴영상의 외관은 조명 변화에 매우 민감하다. 얼굴인식 성능을 향상시키기 위해서는 다양한 조명 아래에서 다양한 학습 데이타를 수집해야 하나, 실제로는 데이타 수집이 용이하지 않다. 따라서, 성능향상을 위해서 다양한 데이타를 학습시키는 것 보다 다양한 조건의 데이타를 정규화 하는 기법에 주목하는 것이 바람직하다. 본 논문에서는 방향성 조명 아래에서 취득한 얼굴영상을 정규화 할 수 있는 간단한 방법을 제안한다. 조명 문제는 얼굴인식 시스템에서 오류를 일으키는 가장 중요한 요인중 하나이다. 제안하는 방법을 ICR(illumination Compensation based on Multiple Linear Regression)이라 명명하였다. 본 방법에서는 다중회귀분석 모델을 사용하여 얼굴영상의 화소 밝기 갈 분포에 가장 잘 맞는 평면을 찾은 후 이 평면을 이용하여 얼굴영상을 정규화 한다. 제안하는 방법의 장점은 간단하고 실용적이며, 얼굴영상의 밝기 값 분포에 대한 평면 근사가 선형모델에 의해 수학적으로 정의된다는 점이다. 얼굴인식에서 제안하는 방법의 성능 향상을 보여주기 위해 공개 및 자체 구축 데이타 베이스에 대한 실험 결과를 제시한다. 실험 결과 두드러진 얼굴인식 성능 향상을 보여주었다.

원격 탐사 영상을 활용한 CNN 기반의 초해상화 기법 연구 (A Study of CNN-based Super-Resolution Method for Remote Sensing Image)

  • 최연주;김민식;김용우;한상혁
    • 대한원격탐사학회지
    • /
    • 제36권3호
    • /
    • pp.449-460
    • /
    • 2020
  • 초해상화 기법은 저해상도 영상을 고해상도 영상으로 변환하는 기법이다. 최근에는 딥러닝 기술을 활용한 초해상화 방법이 주류를 이루고 있으며, 원격 탐사 분야에서도 이를 응용한 연구가 증가하고 있다. 본 연구에서는 위성 영상의 4배 해상도 향상을 위하여 deep back-projection network (DBPN) 네트워크에 기반한 초해상화 기법을 제안하였다. 또한, 복원된 영상의 디테일 및 윤곽선 부분에서의 고품질 영상 획득을 위해 윤곽선 손실 함수를 제안하고, 효과적이고 안정적인 학습을 위하여 Wasserstein distance 손실 함수를 사용한 GAN 기법을 적용하였다. 또한, 자연스러운 저해상도 훈련 영상을 획득하기 위한 detail preserving image downscaling (DPID) 기법을 적용하였다. 마지막으로 전정 영상의 특징을 추출하여 훈련의 마지막 단계에 적용 시킴으로써 출력 영상의 세부적인 특징을 효과적으로 생성하였다. 그 결과 실험에 사용된 WorldView-3 영상 및 KOMPSAT-2 영상에서 해상도 향상 효과를 확인하였고, 다른 초해상화 모델에 대비하여 윤곽선 보존력이나 영상의 선명도가 향상 되었음을 확인하였다

순환신경망을 이용한 자기장 기반 실내측위시스템 (Indoor Positioning System using Geomagnetic Field with Recurrent Neural Network Model)

  • 배한준;최린;박병준
    • 한국차세대컴퓨팅학회논문지
    • /
    • 제14권6호
    • /
    • pp.57-65
    • /
    • 2018
  • BLE 또는 Wi-Fi 기반 지문인식과 같은 기존의 RF 신호 기반 실내 위치인식 기술은 RF 신호의 불안정한 수신 신호 세기로 인해 소규모 실내 환경에서도 작지 않은 오차를 발생시키며 공항, 백화점과 같은 대규모 실내 환경에 적용하기가 어렵다. 이 논문에서는 RF 신호보다 안정적인 신호 강도를 갖는 자기장 신호를 이용한 실내측위 시스템을 제안한다. 유사한 자기장 값이 같은 실내 공간에 여럿 존재하지만, 사용자의 이동이 계속됨에 따라 자기장 신호는 고유 시퀀스를 가지게 된다. 본 논문에서는 시간에 따라 변화하는 센서 데이터 시퀀스를 인식하는 데 효과적인 순환 신경망 (Recurrent neural network, RNN)이라 불리는 심층 신경망 모델을 사용하여 사용자의 현재 위치와 이동 경로를 추적한다. 제안된 신경망 기반의 지자기 실내측위시스템의 평가를 위해 약 $94m{\times}26$ 크기의 교내 테스트베드에서 자기장 맵을 구축하고 자기장맵으로부터 추출한 다양한 이동 경로와 위치 정보를 이용하여 RNN을 학습한 결과, 테스트베드에서 제안된 시스템은 평균 1.20 미터의 테스트 측위 오차를 달성할 수 있었다.