• 제목/요약/키워드: Multiple feature detection

검색결과 163건 처리시간 0.03초

객체 추적 성능향상을 위한 Heatmap Detection 및 Transformer 기반의 MOT 모델 설계 (Design of a MOT model based on Heatmap Detection and Transformer to improve object tracking performance)

  • 양현성;심춘보;정세훈
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2023년도 춘계학술발표대회
    • /
    • pp.461-463
    • /
    • 2023
  • 본 연구는 실시간 MOT(Multiple-Object-Tracking)의 성능을 향상시키기 위해 다양한 기법을 적용한 MOT 모델을 설계한다. 연구에서 사용하는 Backbone 모델은 TBD(Tracking-by-Detection) 기반의 Tracking 모델을 사용한다. Heatmap Detection을 통해 객체를 검출하고 Transformer 기반의 Feature를 연결하여 Tracking 한다. 제안하는 방법은 Anchor 기반의 Detection의 장시간 문제와 추적 객체 정보 전달손실을 감소하여 실시간 객체 추적에 도움이 될 것으로 사료된다.

Three-dimensional Face Recognition based on Feature Points Compression and Expansion

  • Yoon, Andy Kyung-yong;Park, Ki-cheul;Park, Sang-min;Oh, Duck-kyo;Cho, Hye-young;Jang, Jung-hyuk;Son, Byounghee
    • Journal of Multimedia Information System
    • /
    • 제6권2호
    • /
    • pp.91-98
    • /
    • 2019
  • Many researchers have attempted to recognize three-dimensional faces using feature points extracted from two-dimensional facial photographs. However, due to the limit of flat photographs, it is very difficult to recognize faces rotated more than 15 degrees from original feature points extracted from the photographs. As such, it is difficult to create an algorithm to recognize faces in multiple angles. In this paper, it is proposed a new algorithm to recognize three-dimensional face recognition based on feature points extracted from a flat photograph. This method divides into six feature point vector zones on the face. Then, the vector value is compressed and expanded according to the rotation angle of the face to recognize the feature points of the face in a three-dimensional form. For this purpose, the average of the compressibility and the expansion rate of the face data of 100 persons by angle and face zone were obtained, and the face angle was estimated by calculating the distance between the middle of the forehead and the tail of the eye. As a result, very improved recognition performance was obtained at 30 degrees of rotated face angle.

스테레오 비전기반의 컬럼 검출과 조감도 맵핑을 이용한 전방 차량 검출 알고리즘 (Forward Vehicle Detection Algorithm Using Column Detection and Bird's-Eye View Mapping Based on Stereo Vision)

  • 이충희;임영철;권순;김종환
    • 정보처리학회논문지B
    • /
    • 제18B권5호
    • /
    • pp.255-264
    • /
    • 2011
  • 본 논문에서는 스테레오 비전기반의 컬럼 검출과 조감도 맵핑을 이용한 전방 차량 검출 알고리즘을 제안한다. 제안된 알고리즘은 실제 복잡한 도로 환경에서 전방 차량을 강건하게 검출할 수 있다. 전체적인 알고리즘은 도로 특징기반의 컬럼 검출, 조감도 기반의 장애물체 세그멘테이션, 차량 특징기반의 영역 재결합, 차량 검증으로 크게 네 단계로 구성되어 있다. 먼저 v-시차맵상에서 최대 빈도값을 이용하여 도로 특징 정보만을 추출한 후, 이를 기반으로 컬럼 검출을 수행한다. 도로 특징 정보는 기존의 중앙값과 달리 도로 환경에 영향을 받지 않아 도로상의 장애물체 유무를 판단하는 기준으로 적절하다. 그러나 다수의 장애물체가 동일한 장애물체로 검출되는 것을 해결하기 위하여 조감도 기반의 세그멘테이션을 수행한다. 조감도는 시차맵과 카메라 정보를 기반으로 계산된 장애물체들의 위치를 평면상에 표시함으로써 장애물체를 쉽게 분리할 수 있다. 그러나 분리된 장애물체 중에는 동일한 장애물체인 경우도 있으므로, 도로상의 차량 특징을 기반으로 장애물체가 동일한지를 판단하여 재결합하는 과정을 수행한다. 마지막으로 시차맵과 그레이 영상기반의 차량 검증 단계를 수행하여 차량만 검출한다. 제안된 알고리즘을 실제 복잡한 도로 영상에 적용함으로써 차량 검증 성능을 검증한다.

제어 가능한 카메라 환경에서 실시간 관심 보행자 검출 및 추적 (Real-Time Interested Pedestrian Detection and Tracking in Controllable Camera Environment)

  • 이병선;이은주
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2007년도 추계종합학술대회
    • /
    • pp.293-297
    • /
    • 2007
  • 본 논문에서는 실시간으로 획득된 칼라 영상에서 CMODE(Correct Multiple Object DEtection)방법을 이용하여 움직이는 다수 물체를 검출하고, 위치 정보와 색상 정보를 이용하여 관심 보행자만을 추적하는 새로운 알고리즘을 제안한다. 다수 물체가 검출되면, 사람의 구조적 특징과 형태 정보를 이용하여 나무의 흔들림이나 차량의 움직임은 제거하고 관심 보행자만을 검출한다. 검출된 관심 보행자 추적을 위한 1차 유사성 판단은 이전 관심 보행자의 무게중심과 현재 관심 보행자의 무게중심간의 거리차를 이용한다. 1차 유사성이 판단된 영역에 대하여 k-평균 알고리즘으로 세 개의 특징점을 구하고, 각 특징점의 $3{\times}3$ 영역에 대한 평균 색상값으로 2차 유사성을 판단하여 추적하도록 한다. 카메라 배율은 원거리의 보행자에 대한 추적을 용이하게 하기 위해서 조정하고, 카메라 시계(FOV: Field of View)는 보행자의 위치가 화면내의 일정 범위에 있지 않을 경우에 조정한다. 실험 결과, 제안한 CMODE 방법이 라벨링 방법보다 평균 접근 횟수가 1/4배정도 덜 접근하였으며, 평균 검출시간도 3배정도 빠르게 검출됨을 확인할 수 있었다. 나무의 흔들림으로 인한 영역이나 차량의 움직임 영역, 그림자 영역과 같이 복잡한 배경에서도 관심 보행자 검출은 평균 96.5%의 높은 검출률을 보였다. 관심 보행자 추적은 위치 정보와 색상 정보를 이용하여 평균 95%의 높은 추적률을 보였으며, 관심 보행자는 카메라 시계와 배율을 조정함으로써 연속적으로 추적할 수 있었다.

  • PDF

Computationally Efficient Lattice Reduction Aided Detection for MIMO-OFDM Systems under Correlated Fading Channels

  • Liu, Wei;Choi, Kwonhue;Liu, Huaping
    • ETRI Journal
    • /
    • 제34권4호
    • /
    • pp.503-510
    • /
    • 2012
  • We analyze the relationship between channel coherence bandwidth and two complexity-reduced lattice reduction aided detection (LRAD) algorithms for multiple-input multiple-output (MIMO) orthogonal frequency division multiplexing (OFDM) systems in correlated fading channels. In both the adaptive LR algorithm and the fixed interval LR algorithm, we exploit the inherent feature of unimodular transformation matrix P that remains the same for the adjacent highly correlated subcarriers. Complexity simulations demonstrate that the adaptive LR algorithm could eliminate up to approximately 90 percent of the multiplications and 95 percent of the divisions of the brute-force LR algorithm with large coherence bandwidth. The results also show that the adaptive algorithm with both optimum and globally suboptimum initial interval settings could significantly reduce the LR complexity, compared with the brute-force LR and fixed interval LR algorithms, while maintaining the system performance.

DB-Based Feature Matching and RANSAC-Based Multiplane Method for Obstacle Detection System in AR

  • Kim, Jong-Hyun
    • 한국컴퓨터정보학회논문지
    • /
    • 제27권7호
    • /
    • pp.49-55
    • /
    • 2022
  • 본 논문에서는 날씨와 같은 외부 환경요인에도 강건하게 동작할 수 있는 장애물 감지 기법을 제안한다. 특히, DB 기반의 특징 매칭과 RANSAC(RANdom SAample Consensus)기반의 다중 평면 방식을 통해 증강현실(Augmented Reality, AR)에서 정확하게 위험 상황을 알려줄 수 있는 장애물 감지 시스템을 제안한다. RGB카메라로부터 얻은 영상을 기반으로 장애물을 검출하는 접근법은 영상에 의존하기 때문에 조명에 따른 특징 검출이 부정확하고, 조명이나 자연광 또는 날씨의 영향을 받기 때문에 장애물 검출이 어려워진다. 또한, 복잡한 지형에서 생성되는 다수의 평면은 장애물을 감지하는데 있어서 오차가 커지는 원인이 된다. 이 문제를 완화하기 위해 본 논문에서는 DB기반의 특징 매칭을 통해 조명에 관계없이 장애물을 효율적이고 정확하게 감지한다. 또한, 다중 평면을 RANSAC을 통해 단일 평면으로 정규화하여 특징점을 분류하기 위한 기준을 새롭게 계산한다. 결과적으로 제안하는 방법은 조명, 자연광, 날씨에 관계없이 효율적으로 장애물을 감지할 수 있고, 높낮이나 다른 지형에서도 안정적으로 표면을 감지할 수 있기 때문에 사용자의 안전성 확보에 활용할 수 있을 거라 기대한다. 제안하는 방법은 모바일 디바이스에서 실험한 결과가 대부분 안정적으로 실내/외의 장애물들을 인지하였다.

주파수 공간상의 특징 데이터를 활용한 손목에 부착된 가속도 센서 기반의 낙상 감지 (Fall detection based on acceleration sensor attached to wrist using feature data in frequency space)

  • 노정현;김진헌
    • 스마트미디어저널
    • /
    • 제10권3호
    • /
    • pp.31-38
    • /
    • 2021
  • 낙상사고는 언제, 어디에서 일어날지 예측하기 어렵다. 또한 신속한 후속 조치가 수행되지 않으면 생명의 위협으로 이어지므로 낙상사고를 자동으로 감지할 수 있는 연구가 필요하게 되었다. 자동적인 낙상사고 감지기법 중 손목에 부착된 IMU 센서를 활용한 기법은 움직임이 많아 낙상사고 검출이 어렵지만, 착용의 간편함과 접근성이 뛰어난 기법으로 인식되고 있다. 낙상 데이터 확보의 어려움을 극복하기 위해 본 연구는 KNN과 SVM과 같은 머신러닝으로 적은 데이터를 효율적으로 학습하는 알고리즘을 제안한다. 또한, 이들 수학적 분류기의 성능을 높이기 위해 본 연구에서는 주파수 공간에서 취득한 특징 데이터를 활용하였다. 제안된 알고리즘은 표준 데이터세트를 활용한 실험을 통해 모델의 파라미터와 주파수 특징 추출기의 파라미터를 다각화하여 그 영향을 분석하였다. 제안된 알고리즘은 학습 데이터를 확보하기 어려운 현실적인 문제에 적절히 대처할 수 있었다. 또한 본 알고리즘이 다른 분류기보다 경량화되어 있기 때문에 SIMD(Single Instruction Multiple Data) 처리장치 탑재가 어려운 소형 임베디드시스템에도 구현이 용이했다.

반도체 공정의 이상 탐지와 분류를 위한 특징 기반 의사결정 트리 (Feature Based Decision Tree Model for Fault Detection and Classification of Semiconductor Process)

  • 손지훈;고종명;김창욱
    • 산업공학
    • /
    • 제22권2호
    • /
    • pp.126-134
    • /
    • 2009
  • As product quality and yield are essential factors in semiconductor manufacturing, monitoring the main manufacturing steps is a critical task. For the purpose, FDC(Fault detection and classification) is used for diagnosing fault states in the processes by monitoring data stream collected by equipment sensors. This paper proposes an FDC model based on decision tree which provides if-then classification rules for causal analysis of the processing results. Unlike previous decision tree approaches, we reflect the structural aspect of the data stream to FDC. For this, we segment the data stream into multiple subregions, define structural features for each subregion, and select the features which have high relevance to results of the process and low redundancy to other features. As the result, we can construct simple, but highly accurate FDC model. Experiments using the data stream collected from etching process show that the proposed method is able to classify normal/abnormal states with high accuracy.

기울기 히스토그램 및 폐색 탐지를 통한 다중 보행자 추적 (Multiple Pedestrians Tracking using Histogram of Oriented Gradient and Occlusion Detection)

  • 정준용;정병만;이규원
    • 한국정보통신학회논문지
    • /
    • 제16권4호
    • /
    • pp.812-820
    • /
    • 2012
  • 본 논문에서는 지능형 감시 시스템에 부합하는 기울기 히스토그램 및 폐색 추적을 통한 다중보행자 추적 시스템을 제안한다. 먼저, 연속 영상에서 보행자의 특징을 이용하여 보행자를 검출한다. 보행자의 특징을 획득하기 위해 HOG(Histogram of Oriented Gradient)를 기반으로 기울기의 방향성을 이용한 블록별 히스토그램을 생성하고, Linear-SVM(Support Vector Machine)의 학습을 통해 보행자만을 분류한다. 다음으로 보행자의 위치정보를 이용하여 추적을 행한다. 마지막으로 추적이 끝날 경우 내용기반 검색이 가능한 움직임 궤적 디스크립터를 생성한다. 실험을 통해 제안한 방법이 기존 방법보다 빠르고 정확한 움직임 추적에 효과적임을 증명하였다.

Crack location in beams by data fusion of fractal dimension features of laser-measured operating deflection shapes

  • Bai, R.B.;Song, X.G.;Radzienski, M.;Cao, M.S.;Ostachowicz, W.;Wang, S.S.
    • Smart Structures and Systems
    • /
    • 제13권6호
    • /
    • pp.975-991
    • /
    • 2014
  • The objective of this study is to develop a reliable method for locating cracks in a beam using data fusion of fractal dimension features of operating deflection shapes. The Katz's fractal dimension curve of an operating deflection shape is used as a basic feature of damage. Like most available damage features, the Katz's fractal dimension curve has a notable limitation in characterizing damage: it is unresponsive to damage near the nodes of structural deformation responses, e.g., operating deflection shapes. To address this limitation, data fusion of Katz's fractal dimension curves of various operating deflection shapes is used to create a sophisticated fractal damage feature, the 'overall Katz's fractal dimension curve'. This overall Katz's fractal dimension curve has the distinctive capability of overcoming the nodal effect of operating deflection shapes so that it maximizes responsiveness to damage and reliability of damage localization. The method is applied to the detection of damage in numerical and experimental cases of cantilever beams with single/multiple cracks, with high-resolution operating deflection shapes acquired by a scanning laser vibrometer. Results show that the overall Katz's fractal dimension curve can locate single/multiple cracks in beams with significantly improved accuracy and reliability in comparison to the existing method. Data fusion of fractal dimension features of operating deflection shapes provides a viable strategy for identifying damage in beam-type structures, with robustness against node effects.