• Title/Summary/Keyword: 검출 모델

Search Result 1,728, Processing Time 0.027 seconds

Training of a Siamese Network to Build a Tracker without Using Tracking Labels (샴 네트워크를 사용하여 추적 레이블을 사용하지 않는 다중 객체 검출 및 추적기 학습에 관한 연구)

  • Kang, Jungyu;Song, Yoo-Seung;Min, Kyoung-Wook;Choi, Jeong Dan
    • The Journal of The Korea Institute of Intelligent Transport Systems
    • /
    • v.21 no.5
    • /
    • pp.274-286
    • /
    • 2022
  • Multi-object tracking has been studied for a long time under computer vision and plays a critical role in applications such as autonomous driving and driving assistance. Multi-object tracking techniques generally consist of a detector that detects objects and a tracker that tracks the detected objects. Various publicly available datasets allow us to train a detector model without much effort. However, there are relatively few publicly available datasets for training a tracker model, and configuring own tracker datasets takes a long time compared to configuring detector datasets. Hence, the detector is often developed separately with a tracker module. However, the separated tracker should be adjusted whenever the former detector model is changed. This study proposes a system that can train a model that performs detection and tracking simultaneously using only the detector training datasets. In particular, a Siam network with augmentation is used to compose the detector and tracker. Experiments are conducted on public datasets to verify that the proposed algorithm can formulate a real-time multi-object tracker comparable to the state-of-the-art tracker models.

Implementation of person tracking system using learning model method (모델 학습 방법을 이용한 사람 탐지 시스템의 구현)

  • 서경민;이칠우
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2001.10b
    • /
    • pp.346-348
    • /
    • 2001
  • 본 논문은 입력 영상들로부터 추적이나 탐지의 대상이 되는 모델을 학습에 의해 생성하는 방법에 대해 기술한다. 일반적으로 탐지나 검출 시스템을 구성할 경우, 사용되는 대상 모델은 초기에 인위적으로 주어지게 된다. 이 경우 시스템이 동작하는 주위의 환경이 변하게 되면, 그에 맞게 새로운 대상 모델이 다시 주어져야 하는 단점이 있다. 또한 탐지 시스템 개발에 있어서 일반적인 문제점은 탐지 대상이 가려지거나 겹칠 경우 인식 성공률이 크게 떨어진다는 것이다. 본 논문에서는 사람 탐지 시스템의 일반적인 문제점들에 대응하고 탐지의 성능을 높이기 위하여 최소한의 제약 조건만이 미리 주어지고 실제 탐지 대상의 모델은 입력 영상으로부터 학습을 통해 구성 요소별로 생성하는 방법에 대해 기술한다.

  • PDF

Analysis of the Internal Reliability in Relative Orientation and Independent Model Method (상호표정 및 독립모델법에서의 내적신뢰성 분석)

  • 양인태
    • Journal of the Korean Society of Surveying, Geodesy, Photogrammetry and Cartography
    • /
    • v.5 no.1
    • /
    • pp.59-65
    • /
    • 1987
  • This paper presented the procedures for detecting gross errors, and described the influence of the number and distribution of points on the internal reliability in photogrammetric adjustment, such as relative orientation and independent model method. The use of the standard six points for relative orientation and the regular four points for independent model method result in low internal reliability. With such a distribution, gross erors in measured points might not be detected But using cluster of double or triple points instead of individual point, internal reliability improves remarkably.

  • PDF

Improving the Performance of Statistical Context-Sensitive Spelling Error Correction Techniques Using Default Operation Algorithm (Default 연산 알고리즘을 적용한 통계적 문맥의존 철자오류 교정 기법의 성능 향상)

  • Lee, Jung-Hun;Kim, Minho;Kwon, Hyuk-Chul
    • 한국어정보학회:학술대회논문집
    • /
    • 2016.10a
    • /
    • pp.165-170
    • /
    • 2016
  • 본 논문에서 제안하는 문맥의존 철자오류 교정은 통계 정보를 이용한 방법으로 통계적 언어처리에서 가장 널리 쓰이는 샤논(Shannon)이 발표한 노이지 채널 모형(noisy channel model)을 기반으로 한다. 선행연구에서 부족하였던 부분의 성능 향상을 위해 교정대상단어의 오류생성 및 통계 데이터의 저장 방식을 개선하여 Default 연산을 적용한 모델을 제안한다. 선행 연구의 모델은 교정대상단어의 오류생성 시 편집거리의 제약을 1로 하여 교정 실험을 하지만 제안한 모델은 같은 환경에서 더욱 높은 검출과 정확도를 보였으며, 오류단어의 편집거리(edit distance) 제약을 넓게 적용하더라도 신뢰도가 있는 검출과 교정을 보였다.

  • PDF

The Background Modeling Method under Camera Shaking (카메라 흔들림을 고려한 배경 모델 생성 방법)

  • Lee, Jaehoon;Kim, Hyungmin;Park, Jong-Il;Kim, Yookyung;Kim, Kwang-Yong
    • Proceedings of the Korean Society of Broadcast Engineers Conference
    • /
    • 2016.11a
    • /
    • pp.72-75
    • /
    • 2016
  • 본 논문에서는 고정된 카메라 환경에서 카메라의 흔들림에 강인한 배경 영상을 생성할 수 있는 배경 모델링 방법을 제안한다. 흔들리지 않은 영상을 기준 영상으로 설정하고 기준 영상에서 해리스 코너 검출기를 이용하여 특징점들을 검출한다. 이후 입력 영상에 대해 동일한 방식으로 특징점을 추출한 뒤 탬플릿 매칭과 거리 비교를 이용하여 공통적으로 나타나는 배경 영역들에 대한 특징점만을 선별한다. 기준 영상에서의 특징점과 목표 영상에서의 대응되는 특징점 쌍을 이용하여 보정을 위한 호모그래피 행렬을 계산한다. 이렇게 계산된 보정 행렬을 이용하여 흔들린 목표 영상을 보정하게 된다. 흔들린 영상들을 보정한 후 보정된 영상들로 배경 모델을 생성하게 되면 정확한 배경 모델을 생성할 수 있다.

  • PDF

Improving the Performance of Statistical Context-Sensitive Spelling Error Correction Techniques Using Default Operation Algorithm (Default 연산 알고리즘을 적용한 통계적 문맥의존 철자오류 교정 기법의 성능 향상)

  • Lee, Jung-Hun;Kim, Minho;Kwon, Hyuk-Chul
    • Annual Conference on Human and Language Technology
    • /
    • 2016.10a
    • /
    • pp.165-170
    • /
    • 2016
  • 본 논문에서 제안하는 문맥의존 철자오류 교정은 통계 정보를 이용한 방법으로 통계적 언어처리에서 가장 널리 쓰이는 샤논(Shannon)이 발표한 노이지 채널 모형(noisy channel model)을 기반으로 한다. 선행연구에서 부족하였던 부분의 성능 향상을 위해 교정대상단어의 오류생성 및 통계 데이터의 저장 방식을 개선하여 Default 연산을 적용한 모델을 제안한다. 선행 연구의 모델은 교정대상단어의 오류생성 시 편집거리의 제약을 1로 하여 교정 실험을 하지만 제안한 모델은 같은 환경에서 더욱 높은 검출과 정확도를 보였으며, 오류단어의 편집거리(edit distance) 제약을 넓게 적용하더라도 신뢰도가 있는 검출과 교정을 보였다.

  • PDF

Implementation of Vocabulary-Independent Keyword Spotting System (가변어휘 핵심어 검출 시스템의 구현)

  • Shin Young Wook;Song Myung Gyu;Kim Hyung Soon
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • autumn
    • /
    • pp.167-170
    • /
    • 2000
  • 본 논문에서는 triphone을 기본단위로 하는 HMM에 의해 핵심어 모델을 구성하고, 사용자가 임의로 핵심어를 추가 및 변경할 수 있도록 가변어휘 핵심어 검출기를 구현하였다. 비핵심어 모델링 방법으로 monophone clustering을 사용한 방법 및 GMM을 사용한 방법의 성능을 비교하였다. 또한 후처리 과정에서 가변어휘 인식구조에 적합한 anti-subword 모델을 사용하였으며 몇 가지 구현방식에 따른 후처리 성능을 검토하였다. 실험결과 비핵심어 모델로 monophone을 clustering하여 사용한 방법보다 GMM을 사용한 경우 약간의 인식성능 개선을 얻을 수 있었으며, 후처리 과정에서 Kullback distance를 이용한 anti-subword 모델링 방식이 다른 방식에 비해 우수한 결과를 나타냈다.

  • PDF

Voice Segment Reduction using Perceiver Model (Perceiver 모델을 이용한 사용자 음성 구간 축약)

  • Choi, Yeon-Ung;Lee, Jae-Jun;Han, Hyeon-Taek;Lee, Hae-Yeoun
    • Annual Conference of KIPS
    • /
    • 2022.05a
    • /
    • pp.491-493
    • /
    • 2022
  • 최근 스마트 기기에서 오디오 데이터를 이용하는 응용 기술들이 증가하면서, 오디오 데이터에서 관심 있는 구간을 찾아내는 기술의 필요성이 증가하고 있다. 본 논문에서는 Perceiver 모델을 활용하여 오디오 데이터에서 사람의 음성 구간을 검출하고 축약하는 방법을 제안한다. Perceiver 모델은 복잡한 입력 데이터에 대하여 Self-attention을 기반으로 특징을 추출하면서 이전의 특징을 다음 입력으로 다시 학습하는 특징을 갖고 있어서 연속적인 데이터인 오디오에 효율적으로 적용할 수 있다. 외부 및 자체에서 수집한 음성과 비음성 데이터셋에 대하여 실험을 진행하였고, 10초 단위 세그먼트에서 대해서 92.4%의 검출 정확도를 달성하였다.

An Improved Object Detection Method using Hausdorff Distance based on Elastic Deformation Energy (탄성변형 에너지 기반 Hausdorff 거리를 이용한 개선된 객체검출)

  • Won, Bo-Whan;Koo, Ja-Young
    • Journal of the Korea Society of Computer and Information
    • /
    • v.12 no.2 s.46
    • /
    • pp.71-76
    • /
    • 2007
  • Object detection process which makes decision on the existence of meaningful objects in a given image is a crucial part of image recognition in computer vision system. Hausdorff distance metric has been used in object detection and shows good results in applications such as face recognition. It defines the dissimilarity between two sets of points and is used to find the object that is most similar to the given model. This paper proposes a Hausdorff distance based detection method that uses directional information of points to improve detection accuracy when the sets of points are derived from edge extraction as is in usual cases. In this method, elastic energy needed to make two directional points coincident is used as a measure of similarity.

  • PDF

A System for Recognizing Sunglasses and a Mask of an ATM User (현금 인출기 사용자의 선글라스 및 마스크 인식 시스템)

  • Lim, Dong-Ak;Ko, Jae-Pil
    • Journal of Korea Multimedia Society
    • /
    • v.11 no.1
    • /
    • pp.34-43
    • /
    • 2008
  • This paper presents a system for recognizing sunglasses and a mask of an ATM (Automatic Teller Machine) user. The proposed system extracts firstly facial contour, then from this extraction results it estimates the regions of eyes and mouth. Finally, it recognizes sunglasses and a mouth using Histogram Indexing based on those regions. We adopt a face shape model to be able to extract facial contour and to estimate the regions of eyes and mouth when those regions are occluded by sunglasses and a mask. To improve the fitting accuracy of the shame model, we adopt 2-step face detection method and conduct fitting several times by varying the initial position of the model instance. To achieve a good performance of the face detection method based on a background model, we enable the system to automatically update the background model. In experiment, we present some experiments on setting parameters of the system with images taken from in our laboratory, and demonstrate the results of recognizing sunglasses and a mask.

  • PDF