• 제목/요약/키워드: 3D Feature Vector

검색결과 98건 처리시간 0.027초

Support Vector Machines를 이용한 효율적인 차량 인식 알고리즘 (The Efficient Vehicle Recognition Algorithm using Support Vector Machines)

  • 황원준;송명철;고한석
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.327-330
    • /
    • 2000
  • In this paper, we describe an intelligent method to detect types of vehicles using Support Vector Machines focused to the Intelligent Transportation System (ITS) applications such as in the CCD based Electronic Toll Collection System (ETCS). This algorithm can be used the various fields of ITS applications. Support Vector Machines employed in this paper has been recently proposed as a very effective method for 3D image recognition. And our proposed feature extraction method using the singluar values that directly come from pixels at input images. Consequently, The low calculation load and the high recognition rate in spite of image rotation and various noises are one of merits of proposed method.

  • PDF

원거리 무인기 신호 식별을 위한 특징추출 알고리즘 (Feature Extraction Algorithm for Distant Unmmaned Aerial Vehicle Detection)

  • 김주호;이기배;배진호;이종현
    • 전자공학회논문지
    • /
    • 제53권3호
    • /
    • pp.114-123
    • /
    • 2016
  • 본 논문에서는 무인항공기의 엔진 음향 신호를 탐지하기 위한 효과적인 특징 추출 방법을 제안하고 검증한다. 엔진 음향신호는 기본주파수와 배음이 정수배 관계를 갖는 조화 복합음(Harmonic complex tone)으로 구성되며, 각 주파수의 시간에 따른 변화는 연속적이다. 이러한 특성을 이용하여 기본주파수의 정수배와 실제 배음 주파수 차이의 평균과 분산, 주파수 변화량 등으로 구성된 특징벡터를 제안하였다. 모의 실험을 수행한 결과 제안한 특징벡터는 목표신호와 다양한 간섭 신호에 대해 우수한 변별력을 보였으며, 시간에 따라 주파수가 변하는 경우에도 영향을 받지 않고 안정적인 결과를 보였다. 원거리에서 실측된 엔진 음향신호로 부터 특징의 Fisher score를 계산하여 변별력을 비교한 결과, 제안한 특징 중 주파수에 기반한 세 가지 특징들이 신호 대 잡음비가 낮은 상황에서도 높은 변별력을 보였다. ELM 분류기를 이용해 MFCC와의 인식 성능을 비교한 결과, 제안한 방법을 이용할 경우 모의 간섭신호에 대한 오류율이 37.6% 개선되었다. 또한 신호대 잡음비가 시간에 따라 점진적으로 증가하는 경우 MFCC에 비해 4.5 dB 낮은 시점에서 목표신호 탐지가 가능하였다.

Evaluation of Histograms Local Features and Dimensionality Reduction for 3D Face Verification

  • Ammar, Chouchane;Mebarka, Belahcene;Abdelmalik, Ouamane;Salah, Bourennane
    • Journal of Information Processing Systems
    • /
    • 제12권3호
    • /
    • pp.468-488
    • /
    • 2016
  • The paper proposes a novel framework for 3D face verification using dimensionality reduction based on highly distinctive local features in the presence of illumination and expression variations. The histograms of efficient local descriptors are used to represent distinctively the facial images. For this purpose, different local descriptors are evaluated, Local Binary Patterns (LBP), Three-Patch Local Binary Patterns (TPLBP), Four-Patch Local Binary Patterns (FPLBP), Binarized Statistical Image Features (BSIF) and Local Phase Quantization (LPQ). Furthermore, experiments on the combinations of the four local descriptors at feature level using simply histograms concatenation are provided. The performance of the proposed approach is evaluated with different dimensionality reduction algorithms: Principal Component Analysis (PCA), Orthogonal Locality Preserving Projection (OLPP) and the combined PCA+EFM (Enhanced Fisher linear discriminate Model). Finally, multi-class Support Vector Machine (SVM) is used as a classifier to carry out the verification between imposters and customers. The proposed method has been tested on CASIA-3D face database and the experimental results show that our method achieves a high verification performance.

Human Action Recognition via Depth Maps Body Parts of Action

  • Farooq, Adnan;Farooq, Faisal;Le, Anh Vu
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제12권5호
    • /
    • pp.2327-2347
    • /
    • 2018
  • Human actions can be recognized from depth sequences. In the proposed algorithm, we initially construct depth, motion maps (DMM) by projecting each depth frame onto three orthogonal Cartesian planes and add the motion energy for each view. The body part of the action (BPoA) is calculated by using bounding box with an optimal window size based on maximum spatial and temporal changes for each DMM. Furthermore, feature vector is constructed by using BPoA for each human action view. In this paper, we employed an ensemble based learning approach called Rotation Forest to recognize different actions Experimental results show that proposed method has significantly outperforms the state-of-the-art methods on Microsoft Research (MSR) Action 3D and MSR DailyActivity3D dataset.

3차원 객체 인식을 위한 RGB-D 영상 특징점 추출 및 특징 기술자 생성 방법 (RGB-D Image Feature Point Extraction and Description Method for 3D Object Recognition)

  • 박노영;장영균;우운택
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2012년도 한국컴퓨터종합학술대회논문집 Vol.39 No.1(C)
    • /
    • pp.448-450
    • /
    • 2012
  • 본 논문에서는 Kinect 방식의 RGB-D 영상센서를 사용하여, 깊이(Depth) 영상으로부터 3차원 객체의 기하정보를 표현하는 표면 정규 벡터(Surface Normal Vector)를 추출하고, 그 결과를 영상화하는 방법을 제안하며, 제안된 방법으로 생성된 영상으로부터 깊이 영상의 특징점 및 특징 기술자를 추출하여 3차원 객체 인식 성능을 향상시키는 방법을 제안한다. 또한 생성된 RGB-D 특징 기술자들을 객체 단위로 구분 가능한 코드북(CodeBook) 학습을 통한 인식방법을 제안하여 객체의 인식 성능을 높이는 방법을 제안한다. 제안하는 RGB-D 기반의 특징 추출 및 학습 방법은 텍스쳐 유무, 카메라 회전 및 이동 변화 등의 환경변화에 강건함을 실험적으로 증명하였으며, 이 방법은 Kinect 방식의 RGB-D 영상을 사용하는 3차원 객체/공간 인식 및 추적, 혹은 이를 응용하는 증강현실 시스템에 적용하여 사용될 수 있다.

효율적인 feature map 추출 네트워크를 이용한 2D 이미지에서의 3D 포인트 클라우드 재구축 기법 (3D Point Cloud Reconstruction Technique from 2D Image Using Efficient Feature Map Extraction Network)

  • 김정윤;이승호
    • 전기전자학회논문지
    • /
    • 제26권3호
    • /
    • pp.408-415
    • /
    • 2022
  • 본 논문에서는 효율적인 feature map 추출 네트워크를 이용한 2D 이미지에서의 3D 포인트 클라우드 재구축 기법을 제안한다. 본 논문에서 제안한 기법의 독창성은 다음과 같다. 첫 번째로, 메모리 측면에서 기존 기법보다 약 27% 더 효율적인 새로운 feature map 추출 네트워크를 사용한다. 제안하는 네트워크는 딥러닝 네트워크의 중간까지 크기 축소를 수행하지 않아, 3D 포인트 클라우드 재구축에 필요한 중요한 정보가 유실되지 않았다. 축소되지 않은 이미지 크기로 인해 발생하는 메모리 증가 문제는 채널의 개수를 줄이고 딥러닝 네트워크의 깊이를 얕게 효율적으로 구성하여 해결하였다. 두 번째로, 2D 이미지의 고해상도 feature를 보존하여 정확도를 기존 기법보다 향상시킬 수 있도록 하였다. 축소되지 않은 이미지로부터 추출한 feature map은 기존의 방법보다 자세한 정보가 담겨있어 3D 포인트 클라우드의 재구축 정확도를 향상시킬 수 있다. 세 번째로, 촬영 정보를 필요로 하지 않는 divergence loss를 사용한다. 2D 이미지뿐만 아니라 촬영 각도가 학습에 필요하다는 사항은 그만큼 데이터셋이 자세한 정보를 담고 있어야 하며 데이터셋의 구축을 어렵게 만드는 단점이다. 본 논문에서는 추가적인 촬영 정보 없이 무작위성을 통해 정보의 다양성을 늘려 3D 포인트 클라우드의 재구축 정확도가 높아질 수 있도록 하였다. 제안하는 기법의 성능을 객관적으로 평가하기 위해 ShapeNet 데이터셋을 이용하여 비교 논문들과 같은 방법으로 실험한 결과, 본 논문에서 제안하는 기법의 CD 값이 5.87, EMD 값이 5.81 FLOPs 값이 2.9G로 산출되었다. 한편, CD, EMD 수치가 낮을수록, 재구축한 3D 포인트 클라우드가 원본에 근접하는 정확도가 향상된 결과를 나타낸다. 또한, FLOPs 수치가 낮을수록 딥러닝 네트워크에 필요한 메모리가 적게 소요되는 결과를 나타낸다. 따라서, 제안하는 기법의 CD, EMD, FLOPs 성능평가 결과가 다른 논문의 기법들보다 메모리 측면에서 약 27%, 정확도 측면에서 약 6.3% 향상된 결과를 나타내어 객관적인 성능이 입증되었다.

Support Vector Machine Based Phoneme Segmentation for Lip Synch Application

  • Lee, Kun-Young;Ko, Han-Seok
    • 음성과학
    • /
    • 제11권2호
    • /
    • pp.193-210
    • /
    • 2004
  • In this paper, we develop a real time lip-synch system that activates 2-D avatar's lip motion in synch with an incoming speech utterance. To realize the 'real time' operation of the system, we contain the processing time by invoking merge and split procedures performing coarse-to-fine phoneme classification. At each stage of phoneme classification, we apply the support vector machine (SVM) to reduce the computational load while retraining the desired accuracy. The coarse-to-fine phoneme classification is accomplished via two stages of feature extraction: first, each speech frame is acoustically analyzed for 3 classes of lip opening using Mel Frequency Cepstral Coefficients (MFCC) as a feature; secondly, each frame is further refined in classification for detailed lip shape using formant information. We implemented the system with 2-D lip animation that shows the effectiveness of the proposed two-stage procedure in accomplishing a real-time lip-synch task. It was observed that the method of using phoneme merging and SVM achieved about twice faster speed in recognition than the method employing the Hidden Markov Model (HMM). A typical latency time per a single frame observed for our method was in the order of 18.22 milliseconds while an HMM method applied under identical conditions resulted about 30.67 milliseconds.

  • PDF

Three-dimensional human activity recognition by forming a movement polygon using posture skeletal data from depth sensor

  • Vishwakarma, Dinesh Kumar;Jain, Konark
    • ETRI Journal
    • /
    • 제44권2호
    • /
    • pp.286-299
    • /
    • 2022
  • Human activity recognition in real time is a challenging task. Recently, a plethora of studies has been proposed using deep learning architectures. The implementation of these architectures requires the high computing power of the machine and a massive database. However, handcrafted features-based machine learning models need less computing power and very accurate where features are effectively extracted. In this study, we propose a handcrafted model based on three-dimensional sequential skeleton data. The human body skeleton movement over a frame is computed through joint positions in a frame. The joints of these skeletal frames are projected into two-dimensional space, forming a "movement polygon." These polygons are further transformed into a one-dimensional space by computing amplitudes at different angles from the centroid of polygons. The feature vector is formed by the sampling of these amplitudes at different angles. The performance of the algorithm is evaluated using a support vector machine on four public datasets: MSR Action3D, Berkeley MHAD, TST Fall Detection, and NTU-RGB+D, and the highest accuracies achieved on these datasets are 94.13%, 93.34%, 95.7%, and 86.8%, respectively. These accuracies are compared with similar state-of-the-art and show superior performance.

심층신경망 기반 우주파편 영상 추적시스템 인식모델에 대한 연구 (A Study on the Deep Neural Network based Recognition Model for Space Debris Vision Tracking System)

  • 임성민;김진형;최원섭;김해동
    • 한국항공우주학회지
    • /
    • 제45권9호
    • /
    • pp.794-806
    • /
    • 2017
  • 지속적으로 우주파편이 증가하고 있는 상황에서 국가 우주자산을 안전하게 보호하고 우주개발국으로서 우주환경 보호에 관심을 가지는 것은 중요하다. 우주파편의 급격한 증가를 막기 위한 효과적인 방법 중 하나는 충돌위험이 큰 우주파편들, 그리고 임무가 종료된 폐기위성을 직접 제거해 나가는 것이다. 본 논문에서는 영상기반 우주파편 추적시스템의 안정적인 인식모델을 위해 인공신경망을 적용한 연구에 대해 다루었다. 한국항공우주연구원에서 개발한 지상기반 우주쓰레기 청소위성 테스트베드인 KARICAT을 활용하여 우주환경이 모사된 영상을 획득하였고, 깊이불연속성에 기인한 영상분할 후 각 객체에 대한 구조 및 색상 기반 특징을 부호화한 벡터를 추출하였다. 특징벡터는 3차원 표면적, 점군의 주성분 벡터, 2차원 형상정보, 색상기반 정보로 구성되어있으며, 이 범주를 기반으로 분리한 특징벡터를 입력으로 하는 인공신경망 모델을 설계하였다. 또한 인공신경망의 성능 향상을 위해 입력되는 특징벡터의 범주에 따라 모델을 분할하여 각 모델 별 학습 후 앙상블기법을 적용하였다. 적용 결과 앙상블 기법에 따른 인식 모델의 성능 향상을 확인하였다.

DCT와 계층 분할 벡터 양자화를 이용한 3차원 영상 부호화 (3D Image Coding Using DCT and Hierarchical Segmentation Vector Quantization)

  • 조성환;김응성
    • 인터넷정보학회논문지
    • /
    • 제6권2호
    • /
    • pp.59-68
    • /
    • 2005
  • 본 논문에서는 3차원 영상의 압축 전송을 위하여 3차원 영상에 대해 3차원 DCT를 수행하고 원 영상과의 비교에 따라 영상의 3차원 블록들을 계층적으로 분할하여 각 블록에 대해 유한상태 벡터 양자화를 수행하는 알고리듬을 제안한다. 3차원 DCT의 계수 특징을 이용하여 영상을 크기가 큰 배경 블록과 크기가 작은 윤곽선 블록으로 계층적으로 분할하고, 블록 계층분할 정보를 전송한다. 각 계층에 속한 블록들에 대해 따로 부호책을 설계하고 부호 비트 수를 줄이기 위해 유한상태 벡터양자화를 이용하여 부호단어의 인덱스를 계층 분할 정보와 함께 전송한다. Small Lobster와 Head 영상에 대하여 본 알고리듬으로 부호화했을 때 기존의 HFSVQ를 이용한 알고리듬보다는 각각 1.91 dB과 1.47 dB만큼 더 좋은 영상의 화질을 얻을 수 있었다.

  • PDF