• 제목/요약/키워드: Feature detector

검색결과 191건 처리시간 0.024초

시각적 특징을 기반한 샷 클러스터링을 통한 비디오 씬 탐지 기법 (Video Scene Detection using Shot Clustering based on Visual Features)

  • 신동욱;김태환;최중민
    • 지능정보연구
    • /
    • 제18권2호
    • /
    • pp.47-60
    • /
    • 2012
  • 비디오 데이터는 구조화되지 않은 복합 데이터의 형태를 지닌다. 이러한 비디오 데이터의 효율적인 관리 및 검색을 위한 비디오 데이터 구조화의 중요성이 대두되면서 콘텐츠 내 시각적 특징을 기반으로 비디오 씬(scene)을 탐지하고자 하는 연구가 활발히 진행되었다. 기존의 연구들은 주로 색상 정보만을 이용하여 샷(shot) 간의 유사도 평가를 기반한 클러스터링(clustering)을 통해 비디오 씬을 탐지하고자 하였다. 하지만 비디오 데이터의 색상 정보는 노이즈(noise)를 포함하고, 특정 사물의 개입 등으로 인해 급격하게 변화하기 때문에 색상만을 특징으로 고려할 경우, 비디오 샷 혹은 씬에 대한 올바른 식별과 디졸브(dissolve), 페이드(fade), 와이프(wipe)와 같은 화면의 점진적인 전환(gradual transitions) 탐지는 어렵다. 이러한 문제점을 해결하기 위해, 본 논문에서는 프레임(frame)의 컬러 히스토그램과 코너 에지, 그리고 객체 컬러 히스토그램에 해당하는 시각적 특징을 기반으로 동일한 이벤트를 구성하는 의미적으로 유사한 샷의 클러스터링을 통해 비디오 씬을 탐지하는 방법(Scene Detector by using Color histogram, corner Edge and Object color histogram, SDCEO)을 제안한다. SDCEO는 샷 바운더리 식별을 위해 컬러 히스토그램 분석 단계에서 각 프레임의 컬러 히스토그램 정보를 이용하여 1차적으로 연관성 있는 연속된 프레임을 샷 바운더리로 병합한 후, 코너 에지 분석 단계에서 병합된 샷 내 처음과 마지막 프레임의 코너 에지 특징 비교를 통하여 샷 바운더리를 정제하여 최종 샷을 식별한다. 키프레임 추출 단계에서는 샷 내 프레임간 유사도 비교를 통해 모든 프레임과 가장 유사한 프레임을 각 샷을 대표하는 키프레임으로 추출한다. 그 후, 비디오 씬 탐지를 위해, 컬러 히스토그램과 객체 컬러 히스토 그램에 해당하는 프레임의 시각적 특징을 기반으로 상향식 계층 클러스터링 방법을 이용하여 의미적인 연관성을 지니는 샷의 군집화를 통해 비디오 씬을 탐지하는 방법이다. 본 논문에서는 SDCEO의 프로토 타입을 구축하고 3개의 비디오 데이터를 이용한 실험을 통하여 SDCEO의 효율성을 평가하였고 샷 바운더리 식별의 성능의 정확도는 평균 93.3%, 비디오 씬 탐지 성능의 정확도는 평균 83.3%로 만족할만한 성능을 보였다.

열펌프의 고장감지 및 진단시스템 구축을 위한 실시간 정상상태 진단기법 개발 (Technology for Real-Time Identification of Steady State of Heat-Pump System to Develop Fault Detection and Diagnosis System)

  • 김민성;윤석호;김민수
    • 대한기계학회논문집B
    • /
    • 제34권4호
    • /
    • pp.333-339
    • /
    • 2010
  • 고장감지 및 진단(FDD) 시스템의 구축의 기초 연구로 정상상태 진단기에 대한 연구를 수행하였다. 정상상태에 대한 진단은 시스템 전체를 관찰하거나 몇몇 필요한 시스템 파라미터를 모니터링 함으로써 가능하다. 최적화된 정상상태 진단기를 이용하면 FDD 시스템에서 필수적인 정상운전 시의 기준모델(no fault reference model)을 자가학습을 통하여 적용할 수 있다. 본 연구에서는 가정용 열펌프가 냉방조건으로 작동할 경우에 대해 이동창을 기반으로 7개의 측정값들에 대한 표준편차를 분석함으로써 정상상태 판정을 내리도록 하였다. 정상상태 진단기의 작동의 여부는 실내부하를 조절함으로써 확인하였다. 본 연구를 통하여 열펌프 등의 증기압축 사이클 시스템에 대하여 이동창을 기반으로 한 정상상태 진단기 개발 방법을 제시하였다.

저전력 장치를 위한 자원 효율적 객체 검출기 (Resource-Efficient Object Detector for Low-Power Devices)

  • 악세이 쿠마 샤마;김경기
    • 반도체공학회 논문지
    • /
    • 제2권1호
    • /
    • pp.17-20
    • /
    • 2024
  • 본 논문은 전통적인 자원 집약적인 컴퓨터 비전 모델의 한계를 해결하기 위해 저전력 엣지 장치에 최적화된 새로운 경량 객체 검출 모델을 제안합니다. 제안된 검출기는 Single Shot Detector (SSD)에 기반하여 소형이면서도 견고한 네트워크를 설계하였고, 작은 객체를 효율적으로 감지하는 데 있어 효율성을 크게 향상시키도록 모델을 구성하였다. 이 모델은 주로 두 가지 구성요소로 구성되어 있습니다: Depthwise 와 Pointwise Convolution 레이어를 사용하여 효율적인 특징 추출을 위한 Light_Block, 그리고 작은 객체의 향상된 감지를 위한 Enhancer_Block 으로 나누었다. 우리의 모델은 300x480 의 이미지 크기를 가진 Udacity 주석이 달린 데이터셋에서 처음부터 훈련되었으며, 사전 훈련된 분류 가중치의 필요성을 제거하였다. 약 0.43M 의 파라미터로 5.5MB 만의 무게를 가진 우리의 검출기는 평균 정밀도 (mAP) 27.7%와 140 FPS 의 처리 속도를 달성하여, 정밀도와 효율성 모두에서 기존 모델을 능가하였다. 따라서, 본 논문은 추론의 정확성을 손상시키지 않으면서 엣지 장치를 위한 객체 검출에서의 효과적인 경량화를 보여주고 있다.

Feature Based Multi-Resolution Registration of Blurred Images for Image Mosaic

  • Fang, Xianyong;Luo, Bin;He, Biao;Wu, Hao
    • International Journal of CAD/CAM
    • /
    • 제9권1호
    • /
    • pp.37-46
    • /
    • 2010
  • Existing methods for the registration of blurred images are efficient for the artificially blurred images or a planar registration, but not suitable for the naturally blurred images existing in the real image mosaic process. In this paper, we attempt to resolve this problem and propose a method for a distortion-free stitching of naturally blurred images for image mosaic. It adopts a multi-resolution and robust feature based inter-layer mosaic together. In each layer, Harris corner detector is chosen to effectively detect features and RANSAC is used to find reliable matches for further calibration as well as an initial homography as the initial motion of next layer. Simplex and subspace trust region methods are used consequently to estimate the stable focal length and rotation matrix through the transformation property of feature matches. In order to stitch multiple images together, an iterative registration strategy is also adopted to estimate the focal length of each image. Experimental results demonstrate the performance of the proposed method.

특이값분해 기반 동적의료영상 재구성기법의 특징 파악을 위한 시뮬레이션 연구 (Simulation Study for Feature Identification of Dynamic Medical Image Reconstruction Technique Based on Singular Value Decomposition)

  • 김도휘;정영진
    • 대한방사선기술학회지:방사선기술과학
    • /
    • 제42권2호
    • /
    • pp.119-130
    • /
    • 2019
  • Positron emission tomography (PET) is widely used imaging modality for effective and accurate functional testing and medical diagnosis using radioactive isotopes. However, PET has difficulties in acquiring images with high image quality due to constraints such as the amount of radioactive isotopes injected into the patient, the detection time, the characteristics of the detector, and the patient's motion. In order to overcome this problem, we have succeeded to improve the image quality by using the dynamic image reconstruction method based on singular value decomposition. However, there is still some question about the characteristics of the proposed technique. In this study, the characteristics of reconstruction method based on singular value decomposition was estimated over computational simulation. As a result, we confirmed that the singular value decomposition based reconstruction technique distinguishes the images well when the signal - to - noise ratio of the input image is more than 20 decibels and the feature vector angle is more than 60 degrees. In addition, the proposed methode to estimate the characteristics of reconstruction technique can be applied to other spatio-temporal feature based dynamic image reconstruction techniques. The deduced conclusion of this study can be useful guideline to apply medical image into SVD based dynamic image reconstruction technique to improve the accuracy of medical diagnosis.

Evaluation of the 256ch Flat Panel PS-PMT on Positioning Image Histogram for PET

  • Orita, Narimichi;Murayama, Hideo;Kawai, Hideyuki;Inadama, Naoko;Umehara, Takaya;Kasahara, Takehiro;Tsuda, Tomoaki
    • 한국의학물리학회:학술대회논문집
    • /
    • 한국의학물리학회 2002년도 Proceedings
    • /
    • pp.324-327
    • /
    • 2002
  • For a next generation PET that realizes high sensitivity and high resolution, we proposed a design of a depth of interaction detector. A unit of the detector is constructed of four stages rectangular blocks of 2 by 2 Gd$_2$SiO$\sub$5/: Ce (GSO) crystal array optically coupled to position sensitive photomultiplier tube (PS-PMT). The 256ch flat panel PS-PMT is under development by Hamamatsu Photonics K.K., JAPAN. It has large cathode area, 51.7 by 51.7 mm$^2$, and the ratio of the effective area to external size is about 90%. The feature will contribute high packing fraction, accordingly high sensitivity. The 256 anodes are arranged in 16 by 16 at intervals of 3.0 mm. So as to evaluate the detector capability for identifying crystal of interaction, we got positioning image histograms with coupling a 16 by 5 array of GSO crystals, 2.9 by 2.9 by 7.5 mm$^3$, to the PS-PMT by irradiating a gamma ray uniformly from a point source. Flat panel PS-PMT is a new promising device for PET. We need to evaluate it if its performance is sufficiency. The performance was compared to the one with a 16ch PS-PMT.

  • PDF

Multi-Task FaceBoxes: A Lightweight Face Detector Based on Channel Attention and Context Information

  • Qi, Shuaihui;Yang, Jungang;Song, Xiaofeng;Jiang, Chen
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제14권10호
    • /
    • pp.4080-4097
    • /
    • 2020
  • In recent years, convolutional neural network (CNN) has become the primary method for face detection. But its shortcomings are obvious, such as expensive calculation, heavy model, etc. This makes CNN difficult to use on the mobile devices which have limited computing and storage capabilities. Therefore, the design of lightweight CNN for face detection is becoming more and more important with the popularity of smartphones and mobile Internet. Based on the CPU real-time face detector FaceBoxes, we propose a multi-task lightweight face detector, which has low computing cost and higher detection precision. First, to improve the detection capability, the squeeze and excitation modules are used to extract attention between channels. Then, the textual and semantic information are extracted by shallow networks and deep networks respectively to get rich features. Finally, the landmark detection module is used to improve the detection performance for small faces and provide landmark data for face alignment. Experiments on AFW, FDDB, PASCAL, and WIDER FACE datasets show that our algorithm has achieved significant improvement in the mean average precision. Especially, on the WIDER FACE hard validation set, our algorithm outperforms the mean average precision of FaceBoxes by 7.2%. For VGA-resolution images, the running speed of our algorithm can reach 23FPS on a CPU device.

램프의 완전 선명화를 이용한 에지 검출기 (An Edge Detector by Using Perfect Sharpening of Ramps)

  • 이종구;유철중;장옥배
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제34권11호
    • /
    • pp.961-970
    • /
    • 2007
  • 국소적 미분 연산자를 이용한 대개의 에지 검출 방법을 사용하면 검출된 에지의 폭이 불균일하게 되거나, 확대된 영상에서 에지의 일부를 검출하지 못한다. 캠프 에지의 엄격하게 단조적인 자기 분포구간을 단순 계단 함수에 대응시키는 램프 에지의 완전 선명화 사상을 이용하면 자기분포의 비국소적 속성이 반영되는 변형된 미분이 도입되고, 이를 이용하면 다양한 에지 폭의 변화에 효율적으로 대응할 수 있는 에지 검출기를 구현할 수 있다. 본 논문에서는 MADD를 사용하여 형상의 확대나 다양한 에지 폭의 변화에 안정적으로 동작하는 검출기를 개발하였다. 기존의 알고리즘과 비교하여 본 결과 제안한 알고리즘의 우수성을 확인할 수 있었다.

Anomaly detection of isolating switch based on single shot multibox detector and improved frame differencing

  • Duan, Yuanfeng;Zhu, Qi;Zhang, Hongmei;Wei, Wei;Yun, Chung Bang
    • Smart Structures and Systems
    • /
    • 제28권6호
    • /
    • pp.811-825
    • /
    • 2021
  • High-voltage isolating switches play a paramount role in ensuring the safety of power supply systems. However, their exposure to outdoor environmental conditions may cause serious physical defects, which may result in great risk to power supply systems and society. Image processing-based methods have been used for anomaly detection. However, their accuracy is affected by numerous uncertainties due to manually extracted features, which makes the anomaly detection of isolating switches still challenging. In this paper, a vision-based anomaly detection method for isolating switches, which uses the rotational angle of the switch system for more accurate and direct anomaly detection with the help of deep learning (DL) and image processing methods (Single Shot Multibox Detector (SSD), improved frame differencing method, and Hough transform), is proposed. The SSD is a deep learning method for object classification and localization. In addition, an improved frame differencing method is introduced for better feature extraction and a hough transform method is adopted for rotational angle calculation. A number of experiments are conducted for anomaly detection of single and multiple switches using video frames. The results of the experiments demonstrate that the SSD outperforms the You-Only-Look-Once network. The effectiveness and robustness of the proposed method have been proven under various conditions, such as different illumination and camera locations using 96 videos from the experiments.

Back Propagation 알고리즘을 이용한 산업용 로봇의 견실 제어 (Robust Control of Industrial Robot Based on Back Propagation Algorithm)

  • 윤주식;이희섭;윤대식;한성현
    • 한국공작기계학회:학술대회논문집
    • /
    • 한국공작기계학회 2004년도 춘계학술대회 논문집
    • /
    • pp.253-257
    • /
    • 2004
  • Neural networks are works are used in the framework of sensor based tracking control of robot manipulators. They learn by practice movements the relationship between PSD(an analog Position Sensitive Detector) sensor readings for target positions and the joint commands to reach them. Using this configuration, the system can track or follow a moving or stationary object in real time. Furthermore, an efficient neural network architecture has been developed for real time learning. This network uses multiple sets of simple back propagation networks one of which is selected according to which division(corresponding to a cluster of the self-organizing feature map) in data space the current input data belongs to. This lends itself to a very training and processing implementation required for real time control.

  • PDF