• 제목/요약/키워드: Optical flow algorithm

검색결과 189건 처리시간 0.027초

오인식률 감소를 위한 이동 물체 검출 및 추적 기법 (Moving Object Detection and Tracking Techniques for Error Reduction)

  • 황승준;고하윤;백중환
    • 한국항행학회논문지
    • /
    • 제22권1호
    • /
    • pp.20-26
    • /
    • 2018
  • 본 논문에서는 오인식률 감소를 위한 다중 프레임 특징점 추적 정보 기반 이동 물체 검출 및 추적 알고리즘을 제안한다. 기존의 연구에서는 이동 물체 탐지의 오인식과 추적의 속도 문제가 존재 하였다. 본 연구에서는 이를 보완하기 위해 먼저, 카메라 이동 보상과 물체의 추적을 위해 다중 프레임의 코너 특징점과 옵티컬 플로우를 계산한다. 다음으로 다중 프레임 전-후방향 추적으로 옵티컬 플로우의 추적 오류를 감소시키고, 카메라 이동 보상을 위해 호모그래피와 RANSAC 알고리즘 기반으로 추적된 코너 특징점을 배경영역과 이동 물체 후보 영역으로 구분한다. 변환된 코너 특징점들 중 RANSAC에 의해 제거되는 이상점들을 군집화하고 일정 크기 이상의 이상점 군집 영역을 이동 물체 후보군으로 구분한다. 이동 물체 후보군으로 구분된 물체는 라벨 추적 기반 데이터 상관 분석에 따라 라벨 번호를 할당하고 추적한다. 이동 물체 후보군으로 구분된 물체는 라벨 추적 기반 데이터 상관 분석에 따라 라벨 번호를 할당하고 추적한다. 본 논문에서는 제안한 알고리즘이 기존 알고리즘에 비해 Precision과 Recall 모두 향상됨을 쿼드로터 영상기반 탐지 및 추적 성능 실험으로 확인하였다.

Recovery of 3-D Motion from Time-Varying Image Flows

  • Wohn, Kwang-Yun;Jung, Soon-Ki
    • Journal of Electrical Engineering and information Science
    • /
    • 제1권2호
    • /
    • pp.77-86
    • /
    • 1996
  • In this paper we deal with the problem of recovering 3-D motion and structure from a time-varying 2-D velocity vector field. A great deal has been done on this topic, most of which has concentrated on finding necessary and sufficient conditions for there to be a unique 3-D solution corresponding to a given 2-D motion. While previous work provides useful theoretical insight, in most situations the known algorithms have turned out to be too sensitive to be of much practical use. It appears that any robust algorithm must improve the 3-D solutions over time. As a step toward such algorithm, we present a method for recovering 3-D motion and structure from a given time-varying 2-D velocity vector field. The surface of the object in the scene is assumed to be locally planar. It is also assumed that 3-D velocity vectors are piecewise constant over three consecutive frames (or two snapshots of flow field). Our formulation relates 3-D motion and object geometry with the optical flow vector as well as its spatial and temporal derivatives. The linearization parameters, or equivalently, the first-order flow approximation (in space and time) is sufficient to recover rigid body motion and local surface structure from the local instantaneous flow field. We also demonstrate, through a sensitivity analysis carried out for synthetic and natural motions in space, that 3-D motion can be recovered reliably.

  • PDF

인공면역체계를 이용한 플라즈마 증착 장비의 유량조절기 오류 검출 실험 연구 (An Algorithm Study to Detect Mass Flow Controller Error in Plasma Deposition Equipment Using Artificial Immune System)

  • 유영민;정지윤;조나현;박소은;홍상진
    • 반도체디스플레이기술학회지
    • /
    • 제20권4호
    • /
    • pp.161-166
    • /
    • 2021
  • Errors in the semiconductor process are generated by a change in the state of the equipment, and errors usually arise when the state of the equipment changes or when parts that make up the equipment have flaws. In this investigation, we anticipated that aging of the mass flow controller in the plasma enhanced chemical vapor deposition SiO2 thin film deposition method caused a minute flow rate shift. In seven cases, fourier transformation infrared film quality analysis of the deposited thin film was used to characterize normal and pathological processes. The plasma condition was monitored using optical emission spectrometry data as the flow rate changed during the procedure. Preprocessing was used to apply the collected OES data to the artificial immune system algorithm, which was then used to process diagnosis. Through comparisons between datasets, the learning algorithm compared classification accuracy and improved the method. It has been confirmed that data characterized as a normal process and abnormal processes with differing flow rates may be discriminated by themselves using the artificial immune system data mining method.

Generative optical flow based abnormal object detection method using a spatio-temporal translation network

  • Lim, Hyunseok;Gwak, Jeonghwan
    • 한국컴퓨터정보학회논문지
    • /
    • 제26권4호
    • /
    • pp.11-19
    • /
    • 2021
  • 이상 객체란 일반적이고 평범한 행동을 취하는 객체가 아닌 비정상적이고 흔하지 않은 행동을 하여 관찰이나 감시·감독을 필요로 하는 사람, 물체, 기계 장치 등을 뜻한다. 이를 사람의 지속적인 개입 없이 인공지능 알고리즘을 통해 탐지하기 위해서 광학 흐름 기법을 활용한 시간적 특징의 특이도를 관찰하는 방법이 많이 활용되고 있으며, 이 기법은 정해진 표현 범위가 없는 수많은 이상 행동을 식별하기에 적합하다. 본 연구에서는 생성적 적대 신경망(Generative Adversarial Network, GAN)으로 입력 영상 프레임을 광학 흐름 영상으로 변환하는 알고리즘을 학습시켜 비정상적인 상황을 식별한다. 특히 생성적 적대 신경망 모델이 입력 영상에 대한 중요한 특징 정보를 학습하고, 그 외 불필요한 이상치를 제외시키기 위한 전처리 과정과 학습 후 테스트 데이터셋에서 식별 정확도를 높이기 위한 후처리 과정을 고도화하여 전체적인 모델의 이상 행동 식별 성능을 향상시키는 기법을 제안한다. 이상 행동을 탐지하기 위한 학습 데이터셋으로 UCSD Pedestrian, UMN Unusual Crowd Activity를 활용하였으며, UCSD Ped2 데이터셋에서 프레임 레벨 AUC 0.9450, EER 0.1317의 수치를 보이며 이전 연구에서 도출된 성능 지표 대비 성능 향상이 확인되었다.

Development of a Low-cost Industrial OCR System with an End-to-end Deep Learning Technology

  • Subedi, Bharat;Yunusov, Jahongir;Gaybulayev, Abdulaziz;Kim, Tae-Hyong
    • 대한임베디드공학회논문지
    • /
    • 제15권2호
    • /
    • pp.51-60
    • /
    • 2020
  • Optical character recognition (OCR) has been studied for decades because it is very useful in a variety of places. Nowadays, OCR's performance has improved significantly due to outstanding deep learning technology. Thus, there is an increasing demand for commercial-grade but affordable OCR systems. We have developed a low-cost, high-performance OCR system for the industry with the cheapest embedded developer kit that supports GPU acceleration. To achieve high accuracy for industrial use on limited computing resources, we chose a state-of-the-art text recognition algorithm that uses an end-to-end deep learning network as a baseline model. The model was then improved by replacing the feature extraction network with the best one suited to our conditions. Among the various candidate networks, EfficientNet-B3 has shown the best performance: excellent recognition accuracy with relatively low memory consumption. Besides, we have optimized the model written in TensorFlow's Python API using TensorFlow-TensorRT integration and TensorFlow's C++ API, respectively.

영상 구성 파라미터 추출을 위한 융합 분석 알고리듬 연구 (Convergence Analysis Algorithm Study for Extracting Image Configuration Parameters)

  • 맹채정;하동환
    • 한국과학예술포럼
    • /
    • 제37권3호
    • /
    • pp.125-134
    • /
    • 2019
  • 본 연구는 영상콘텐츠 제작과정에서 배경음악 선정의 자동화를 위하여 영상의 특성을 분류, 분석할 수 있는 프로그램을 구성하였다. 연구 결과 및 내용은 다음과 같다. 영상의 특성은 '주제 범주', '감정', '픽셀 움직임 속도', '색상', '등장인물' 로 선정하며, '주제 범주'와 '감정'은 Microsoft사의 Azure Video Indexer를, '픽셀 움직임 속도'는 Optical flow, '색상'은 Image Histogram, '등장인물'은 CNN (Convolutional Neural Network)을 활용하여 데이터를 추출하였다. 이러한 본 연구의 결과는 최근 주목을 받고있는 '인터넷 1인 방송 크리에이터'들의 콘텐츠 제작과정에서 배경음악 매칭을 위한 영상 특성 분석이 이루어졌다는 점에서 의의가 있다.

유속 센싱을 위한 스피커형 광학적 유체 단층촬영 기술 (Fluidic velocity sensing with a speaker based optical doppler tomography)

  • 이창호;김지현
    • 센서학회지
    • /
    • 제17권4호
    • /
    • pp.317-324
    • /
    • 2008
  • This paper presents an optical doppler tomography(ODT) system using a speaker as a method to achieve depth measurement in a flowing sample. The use of the speaker provides easy implementation with a low cost. The nonlinear characteristics of the speaker has hindered its adaptation because it produces inconsistent fringe frequencies at different depths. This paper reports an adaptive algorithm to compensate the nonlinear characteristics, and could, resultantly, acquire the Doppler frequency shift caused by the sample. The experiment utilizes a flowing scattering particle solution in a capillary tube at a certain flow rate. The Doppler frequency profile over the lumen was calculated by using spectrogram method. and we obtained the velocity image of the sample.

Neural Network-based Time Series Modeling of Optical Emission Spectroscopy Data for Fault Prediction in Reactive Ion Etching

  • Sang Jeen Hong
    • 반도체디스플레이기술학회지
    • /
    • 제22권4호
    • /
    • pp.131-135
    • /
    • 2023
  • Neural network-based time series models called time series neural networks (TSNNs) are trained by the error backpropagation algorithm and used to predict process shifts of parameters such as gas flow, RF power, and chamber pressure in reactive ion etching (RIE). The training data consists of process conditions, as well as principal components (PCs) of optical emission spectroscopy (OES) data collected in-situ. Data are generated during the etching of benzocyclobutene (BCB) in a SF6/O2 plasma. Combinations of baseline and faulty responses for each process parameter are simulated, and a moving average of TSNN predictions successfully identifies process shifts in the recipe parameters for various degrees of faults.

  • PDF

Motion Estimation-based Human Fall Detection for Visual Surveillance

  • Kim, Heegwang;Park, Jinho;Park, Hasil;Paik, Joonki
    • IEIE Transactions on Smart Processing and Computing
    • /
    • 제5권5호
    • /
    • pp.327-330
    • /
    • 2016
  • Currently, the world's elderly population continues to grow at a dramatic rate. As the number of senior citizens increases, detection of someone falling has attracted increasing attention for visual surveillance systems. This paper presents a novel fall-detection algorithm using motion estimation and an integrated spatiotemporal energy map of the object region. The proposed method first extracts a human region using a background subtraction method. Next, we applied an optical flow algorithm to estimate motion vectors, and an energy map is generated by accumulating the detected human region for a certain period of time. We can then detect a fall using k-nearest neighbor (kNN) classification with the previously estimated motion information and energy map. The experimental results show that the proposed algorithm can effectively detect someone falling in any direction, including at an angle parallel to the camera's optical axis.

Coarse to Fine 단계를 통한 TerraSAR-X Staring Mode 다중 관측각 영상 정합기법 비교 분석 (Comparison of Multi-angle TerraSAR-X Staring Mode Image Registration Method through Coarse to Fine Step)

  • 이동준;김상완
    • 대한원격탐사학회지
    • /
    • 제37권3호
    • /
    • pp.475-491
    • /
    • 2021
  • 최근 사용 가능한 고해상도 위성 SAR 영상이 다양해지면서, 변화 탐지를 포함한 다양한 분야에서 SAR 영상에 대한 정밀 정합 요구가 높아지고 있다. 다중 관측각 환경에서의 고해상도 SAR 영상간 정합은 SAR 영상의 특성상 발생하는 스펙클 노이즈, 기하 왜곡 등에 의해 어려움이 있다. 본 연구에서는 독일 TerraSAR-X의 staring spotlight 모드로 촬영된 고해상도 SAR 영상을 활용하여, 개략정합 단계와 정밀정합 단계의 2단계에 걸친 영상정합 알고리즘을 제안하였다. 개략정합 단계에서는 적응형 샘플링 기법과 SAR-SIFT(Scale Invariant Feature Transform)를 결합하여 정합을 수행하였고, 정밀정합 단계에서는 3가지의 강성 정합 기법인 NCC(Normalized Cross Correlation), PC (Phase Congruency)-NCC, MI (Mutual Information) 기법과 비강성 정합 기법인 Gefolki (Geoscience extended Flow Optical Flow Lucas-Kanade Iterative)를 적용하여 정합 성능을 비교 분석하였다. 정합 결과는 RMSE (Root Mean Square Error)와 FSIM (Feature Similarity) 지수를 사용하여 정량적인 비교를 수행하였다. 사용한 모든 영상 조합에서 강성정합 기법은 Gefolki 알고리즘에 비해 저조한 정합 성능을 보였다. 강성정합 모델들은 지형기복이 큰 지역에서 정합오차가 크게 발생함을 확인할 수 있었다. Gefolki 알고리즘 적용 결과, RMSE 1~3화소를 보이며 가장 우수한 결과를 확인하였으며, FSIM 지수 또한 다른 기법에 비해 0.02~0.03 이상 높은 값을 취득했다. 다중 관측각 영상에서의 고해상도 SAR 영상 간 정합 성능을 비교하였으며, 강성정합 기법에 비해 Gefolki 알고리즘을 통해 지형효과를 충분히 줄일 수 있음을 확인했다. 이는 추후 변화탐지를 포함한 다양한 분야의 전 처리 과정에 효과적으로 사용될 수 있을 것으로 기대된다.