• 제목/요약/키워드: block based extraction

검색결과 132건 처리시간 0.021초

중심이동과 신경망 기반 주요성분분석을 이용한 얼굴인식 (Face Recognitions Using Centroid Shift and Neural Network-based Principal Component Analysis)

  • 조용현
    • 정보처리학회논문지B
    • /
    • 제12B권6호
    • /
    • pp.715-720
    • /
    • 2005
  • 본 논문에서는 영상의 1차 모멘트와 단층신경망에 기반을 둔 주요성분분석을 이용한 얼굴인식 기법을 제안하였다. 여기서 1차 모멘트는 입력되는 얼굴영상의 중심이동을 위한 것으로 차원을 감소시켜 얼굴인식에 불필요한 배경을 배제시키기 위함이다. 또한 단층신경망을 이용한 주요성분분석은 수치적 기법의 대안으로 Foldiak 학습알고리즘을 이용하며, 차원을 감소시켜 얼굴영상의 특징추출을 위한 정규직교기저를 얻기 위함이다. 제안된 기법을 64$\ast$64 픽셀의 48개(12명$\ast$4장) 학습자 얼굴영상을 대상으로 city-block, Euclidean, 그리고 negative angle의 각 거리 척도를 분류척도로 이용하여 실험하였다. 실험결과, 제안된 기법은 우수한 인식성능이 있음을 확인하였다. 특히 negative angle를 이용하는 것이 city-block이나 Euclidean을 이용하는 것보다 상대적으로 정확하게 유사성을 측정할 수 있었다.

칼라의 공간적 상관관계 및 국부 질감 특성을 이용한 영상검색 (Image Retrieval Using Spacial Color Correlation and Local Texture Characteristics)

  • 성중기;천영덕;김남철
    • 대한전자공학회논문지SP
    • /
    • 제42권5호
    • /
    • pp.103-114
    • /
    • 2005
  • 본 논문에서는 칼라 특징으로 칼라 오토코렐로그램(autocorrelogram)을 선택하고 질감 특징으로 BDIP(block difference inverse probabilities)와 BVLC(block variance of local correlation coefficient)를 선택하여 이들을 효율적으로 추출하고 결합한 다중 특징기반 영상검색 기법을 제안한다. 칼라 오토코렐로그램은 영상의 H(hue), S(saturation) 칼라 성분으로부터 추출 하였고, BDIP와 BVLC는 V(value) 성분으로부터 추출하였다. 이때 각 특징추출 시 계산량을 고려하여 간소화된 오토코렐로그램과 BVLC를 제안하여 사용하였으며, 추출한 특징들을 효율적으로 저장하기 위해 특징벡터성분들의 값을 그 분포에 따라 균등 또는 비균등 양자화 하여 사용하였다. Corel DB및 VisTex DB에 대한 실험 결과, 칼라 오토코렐로그램과 BDIP, BVLC 질감 특징을 결합함으로써 동일한 차원에서 오토코렐로그램만을 사용할 때보다 최대 9.5%, BDIP, BVLC만을 사용할 때보다 최대 4% 검색성능이 향상되었다. 또한 제안한 다중 특징은 웨이브렛 모멘트, CSD, 칼라 히스토그램에 비해 특징벡터의 저장공간을 약 3분의 1 정도 적게 차지하면서 검색성능이 각각 최대 12.6%, 14.6%, 27.9% 우수하게 나타남을 확인할 수 있었다.

ACTA 형식론에 기반한 워크플로우 패턴추출 (Workflow Pattern Extraction based on ACTA Formalism)

  • 이우기;배준수;정재윤
    • 한국정보과학회논문지:데이타베이스
    • /
    • 제32권6호
    • /
    • pp.603-615
    • /
    • 2005
  • 워크플로우 관리 시스템은 다양성과 복잡성이 커지고 있는 비즈니스 프로세스 관리의 해결대안으로서 부각되고있다. 본 연구에서는 주어진 프로세스 흐름을 세 가지의 패턴 즉, 반복블록, 직렬블록 및 병렬블록 등으로 단순화하고 노드의 위상적 순서(topological ordering)를 생성하는 알고리즘을 이용하여 사이클을 찾아 반복블록을 제거하고, 다음으로 직렬 및 병렬블록을 반복적으로 검색하는 수로분기 알고리즘을 포함하는 새로운 모델을 제시한다. 그리고 ACTA 형식론에 기반하여 각 블록을 ECA규칙으로 변환하여 사건(event)을 감지하는 워크플로우 시스템으로의 구현 방안을 제시한다. 그 모델의 결과를 컴퓨터가 수행할 수 있도록 만들어주는 과정 즉, 비즈니스 프로세스를 모델에 입각하여 통제하는 데에 사건-조건-처리(ECA)규칙을 사용한다. 유형별로 ECA 규칙에 입각한 통제 논리를 설계하였으며, 이것은 규칙기반 워크플로우 관리시스템의 기초가 될 수 있다. 또한 본 연구의 결과가 현행 DBMS들의 능동형 규칙(active rule)에 적용될 수 있도록 구체적 대안을 제시하였다.

신경회로망을 이용한 동적 손 제스처 인식에 관한 연구 (A Study on Dynamic Hand Gesture Recognition Using Neural Networks)

  • 조인석;박진현;최영규
    • 대한전기학회논문지:시스템및제어부문D
    • /
    • 제53권1호
    • /
    • pp.22-31
    • /
    • 2004
  • This paper deals with the dynamic hand gesture recognition based on computer vision using neural networks. This paper proposes a global search method and a local search method to recognize the hand gesture. The global search recognizes a hand among the hand candidates through the entire image search, and the local search recognizes and tracks only the hand through the block search. Dynamic hand gesture recognition method is based on the skin-color and shape analysis with the invariant moment and direction information. Starting point and ending point of the dynamic hand gesture are obtained from hand shape. Experiments have been conducted for hand extraction, hand recognition and dynamic hand gesture recognition. Experimental results show the validity of the proposed method.

딥러닝을 활용한 무선 전송 및 접속 기술 동향 (Research Trends on Wireless Transmission and Access Technologies Using Deep Learning)

  • 김근영;명정호;서지훈
    • 전자통신동향분석
    • /
    • 제33권5호
    • /
    • pp.13-23
    • /
    • 2018
  • Deep learning is a promising solution to a number of complex problems based on its inherent capability to approximate almost all types of functions without the demand for handcrafted feature extraction. New wireless transmission and access schemes based on deep learning are being increasingly proposed as substitutes for existing approaches, providing a lower complexity and better performance gain. Among such schemes, a communications system is viewed as an end-to-end autoencoder. The learning process applied in autoencoders can automatically deal with some nonlinear or unknown properties in communications systems. Deep learning can also be used to optimize each processing block for required tasks such as channel decoding, signal detection, and multiple access. On top of recent related research trends, we suggest appropriate research approaches for communications systems to adopt deep learning.

Smoke detection in video sequences based on dynamic texture using volume local binary patterns

  • Lin, Gaohua;Zhang, Yongming;Zhang, Qixing;Jia, Yang;Xu, Gao;Wang, Jinjun
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제11권11호
    • /
    • pp.5522-5536
    • /
    • 2017
  • In this paper, a video based smoke detection method using dynamic texture feature extraction with volume local binary patterns is studied. Block based method was used to distinguish smoke frames in high definition videos obtained by experiments firstly. Then we propose a method that directly extracts dynamic texture features based on irregular motion regions to reduce adverse impacts of block size and motion area ratio threshold. Several general volume local binary patterns were used to extract dynamic texture, including LBPTOP, VLBP, CLBPTOP and CVLBP, to study the effect of the number of sample points, frame interval and modes of the operator on smoke detection. Support vector machine was used as the classifier for dynamic texture features. The results show that dynamic texture is a reliable clue for video based smoke detection. It is generally conducive to reducing the false alarm rate by increasing the dimension of the feature vector. However, it does not always contribute to the improvement of the detection rate. Additionally, it is found that the feature computing time is not directly related to the vector dimension in our experiments, which is important for the realization of real-time detection.

한글 문장의 자동 띄어쓰기를 위한 어절 블록 양방향 알고리즘 (Eojeol-Block Bidirectional Algorithm for Automatic Word Spacing of Hangul Sentences)

  • 강승식
    • 한국정보과학회논문지:소프트웨어및응용
    • /
    • 제27권4호
    • /
    • pp.441-447
    • /
    • 2000
  • 자동 띄어쓰기는 띄어쓰기가 무시된 한글 문서의 자동색인이나 문자인식 시스템에서 줄바꿈 문자에 대한 공백 삽입 문제 등을 해결하는데 필요하다. 이러한 문서에서 공백이 삽입될 위치를 자동으로 찾아주는 자동 띄어쓰기 알고리즘으로 문장 분할 기법과 양방향 최장일치법을 이용한 어절 인식 방법을 제안한다. 문장 분할은 한글의 음절 특성을 이용하여 어절 경계가 비교적 명확한 어절 블록을 추출하는 것이며, 형태소 분석기를 이용한 양방향 최장일치법에 의해 어절 블록에 나타난 각 어절들을 인식한다. 4,500여 어절로 구성된 두 가지 유형의 문장 집합에 대하여 제안한 방법의 띄어쓰기 정확도를 평가한 결과 '공백 재현율'이 97.3%, '어절 재현율'이 93.2%로 나타났다.

  • PDF

웹 이미지로부터 이미지기반 문자추출 (Locating Text in Web Images Using Image Based Approaches)

  • Chin, Seongah;Choo, Moonwon
    • 지능정보연구
    • /
    • 제8권1호
    • /
    • pp.27-39
    • /
    • 2002
  • 본 논문은 다양한 웹 이미지로부터 문자영역(text block)의 위치를 알아내고 문자영역을 추출하는 방법을 제안한다. 인터넷 사용자관점에서 볼 때, 웹 이미지에 포함되어 있는 문자정보는 중요한 정보이지만 최근까지 이 분야의 연구는 그리 활발하지 못했다. 본 연구에서 제안된 알고리즘은 문자의 경사방향(skew)과 문자의 크기나 폰트에 관한 사전 정보 없이 수행되어 질 수 있도록 제안되었다 폰트 스타일과 크기에 제약되지 않고 문자영역을 적합하게 추출하기 위해 유용한 에지 검출, 문자 클러스터링 영역으로 정의되는 문자의 고유한 특성을 위한 히스토그램을 사용하였다. 다수의 실험을 통하여 제안된 방법을 테스트하고 수용할 만한 결과를 도출했다.

  • PDF

독립성분분석을 이용한 국부기저영상 기반 동작인식 (Motion Recognitions Based on Local Basis Images Using Independent Component Analysis)

  • 조용현
    • 한국지능시스템학회논문지
    • /
    • 제18권5호
    • /
    • pp.617-623
    • /
    • 2008
  • 본 논문에서는 중심이동과 국부기저영상을 이용한 동작인식 기법을 제안하였다. 여기서 중심이동은 1차 모멘트 평형에 기반을 둔 것으로 위치나 크기 변화에 강건한 동작영상을 얻기 위함이고, 국부기저영상의 추출은 독립성분분석 기법에 기반을 둔 것으로 각 동작들마다에 포함된 통계적으로 독립인 동작특징들의 집합을 얻기 위함이다. 특히 국부기저영상을 빠르게 추출하기 위해 뉴우턴(Newton)법의 고정점 알고리즘에 기반을 둔 독립성분분석을 이용하였다. 제안된 기법을 240*215 픽셀의 160(1명*10종류*16동작)개 동물표현의 수화 동작영상을 대상으로 city-block, Euclidean, 그리고 negative angle의 척도들을 분류척도로 이용하여 실험하였다. 실험결과, 제안된 기법은 국부고유영상을 이용한 방법과 중심이동을 거치지 않는 국부기저영상을 이용하는 기법보다 각각 우수한 인식성능이 있음을 확인하였다.

Space-Time Quantization and Motion-Aligned Reconstruction for Block-Based Compressive Video Sensing

  • Li, Ran;Liu, Hongbing;He, Wei;Ma, Xingpo
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제10권1호
    • /
    • pp.321-340
    • /
    • 2016
  • The Compressive Video Sensing (CVS) is a useful technology for wireless systems requiring simple encoders but handling more complex decoders, and its rate-distortion performance is highly affected by the quantization of measurements and reconstruction of video frame, which motivates us to presents the Space-Time Quantization (ST-Q) and Motion-Aligned Reconstruction (MA-R) in this paper to both improve the performance of CVS system. The ST-Q removes the space-time redundancy in the measurement vector to reduce the amount of bits required to encode the video frame, and it also guarantees a low quantization error due to the fact that the high frequency of small values close to zero in the predictive residuals limits the intensity of quantizing noise. The MA-R constructs the Multi-Hypothesis (MH) matrix by selecting the temporal neighbors along the motion trajectory of current to-be-reconstructed block to improve the accuracy of prediction, and besides it reduces the computational complexity of motion estimation by the extraction of static area and 3-D Recursive Search (3DRS). Extensive experiments validate that the significant improvements is achieved by ST-Q in the rate-distortion as compared with the existing quantization methods, and the MA-R improves both the objective and the subjective quality of the reconstructed video frame. Combined with ST-Q and MA-R, the CVS system obtains a significant rate-distortion performance gain when compared with the existing CS-based video codecs.