• Title/Summary/Keyword: 인식구조

Search Result 4,071, Processing Time 0.039 seconds

Dynamic Hand Gesture Recognition Using a CNN Model with 3D Receptive Fields (3 차원 수용영역 구조의 CNN 모델을 이용한 동적 수신호 인식 기법)

  • Park, Jin-Hee;Lee, Joseph S.;Kim, Ho-Joon
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2007.05a
    • /
    • pp.459-462
    • /
    • 2007
  • 본 연구에서는 동적 수신호 인식문제를 위하여 CNN 모델을 사용한 특징추출 기법과, FMM 신경망을 사용한 특징 분석 기법을 상호 결합한 형태의 패턴 인식 모델을 제안한다. 수신호 인식을 위하여 영상패턴에서 대상물의 움직임 정보에 기초한 3 차원 형식의 데이터 표현 기법과, 이로부터 인식을 위한 특징추출 기법을 제시한다. 특징추출 모듈에서는 3 차원으로 확장된 구조의 수용영역을 고려한 CNN 모델을 제안하며, 이로부터 학습패턴에서 특징점의 공간적 변이에 대한 영향을 최소화할 수 있음을 고찰한다. 또한 인식효율의 개선을 위하여 방대한 양의 특징집합으로부터 효과적인 특징을 선별하기 위한 방법론으로서 WFMM 모델 기반의 특징분석 기법을 정의하고 이로부터 선별된 특징을 사용하는 인식 기법을 소개한다.

  • PDF

On-line Handwritten Character Recognition with Hidden Markov Models (통계적 방법에 의한 온라인 한글 필기 인식)

  • Sin, Bong-Kee;Kim, Jin-Hyung
    • Annual Conference on Human and Language Technology
    • /
    • 1992.10a
    • /
    • pp.533-542
    • /
    • 1992
  • 손으로 쓴 글씨는 인쇄체와 달리 많은 변형이 있다는 점이 한글 필기 인식에서 가장 큰 장애물로 통한다. 본 논문에서는 이점을 해결하면서 필기에 대한 제한을 대폭 줄인 온라인 한글 인식 방법을 제시하고자 한다. 봉넷(BongNet)은 온라인 한글 필기를 인식하기 위한 네트워크 모델이다. 글씨 인식에 들어가는 여러가지 정보를 네트워크라는 틀 안에 표현한 것 인데, 기본적으로 네트워크 구조 자체가 표현하는 정적 글자 구조 정보와, 글꼴에 따라 달라지는 것으로써 노드간 확률적 이동을 나타내는 동적 정보를 포함한다. 본 모델에 따르면 한글 인식은 네트워크 안에서 최적 경로를 따라 초, 중, 종성 자소열을 찾는 문제로 변환된다. 동적 프로그래밍 기법을 이용하여 그 경로를 찾는 인식 알고리즘은 입력 데이타의 양에 정비례하는 효율성을 갖는다.

  • PDF

Efficient Deep Neural Network Architecture based on Semantic Segmentation for Paved Road Detection (효율적인 비정형 도로영역 인식을 위한 Semantic segmentation 기반 심층 신경망 구조)

  • Park, Sejin;Han, Jeong Hoon;Moon, Young Shik
    • Journal of the Korea Institute of Information and Communication Engineering
    • /
    • v.24 no.11
    • /
    • pp.1437-1444
    • /
    • 2020
  • With the development of computer vision systems, many advances have been made in the fields of surveillance, biometrics, medical imaging, and autonomous driving. In the field of autonomous driving, in particular, the object detection technique using deep learning are widely used, and the paved road detection is a particularly crucial problem. Unlike the ROI detection algorithm used in general object detection, the structure of paved road in the image is heterogeneous, so the ROI-based object recognition architecture is not available. In this paper, we propose a deep neural network architecture for atypical paved road detection using Semantic segmentation network. In addition, we introduce the multi-scale semantic segmentation network, which is a network architecture specialized to the paved road detection. We demonstrate that the performance is significantly improved by the proposed method.

Classification of a People and Scenery Picture Using Structure Simplicity of the Picture (구조 단순도를 이용한 인물 사진과 풍경 사진의 분류)

  • Chung, Myoung-Bum;Jung, Min-Kyu;Ko, Il-Ju
    • 한국HCI학회:학술대회논문집
    • /
    • 2007.02a
    • /
    • pp.507-511
    • /
    • 2007
  • 기존의 얼굴 인식 기술은 얼굴 검출과 얼굴 인식이라는 두 분야로 나뉘며, 얼굴 검출 기술은 주로 얼굴 인식을 위한 전처리 단계로 이용되었다. 이러한 얼굴 검출 기술은 방대한 양의 사진 콘텐츠를 분류하는 것에도 이용될 수 있다. 얼굴 검출 기술을 통해 사람이 있는 경우 인물 사진, 없는 경우 풍경 사진으로 분류한다. 그러나 기존의 얼굴 검출 기술만으로는 정확성이 떨어진다. 이를 보완하기 위해 본 논문에서는 사진의 구조 단순도 알고리즘을 제안 한다. 구조 단순도는 사진의 색상 구도의 단순비율을 의미하며, 일반적으로 인물 사진일 때 작은 값을 풍경 사진일 때 큰 값을 갖는다. 제안 방법의 유용성을 검증하기 위해 인물 사진 250장, 풍경 사진 250장을 이용하여 분류 실험을 하였다. 얼굴 검출 기술만을 이용한 실험은 66%의 정확성을 나타낸 반면 얼굴 검출 기술과 구조 단순도를 이용한 실험은 74.6%를 나타내었다. 따라서 얼굴 검출 기술과 구조 단순도를 이용하면 효과적인 사진 분류를 할 수 있다.

  • PDF

Development of a Pseudomorpheme-Based Large Vocabulary Continuous Speech Recognizer (의사형태소 단위 대어휘 연속 음성 인식기 개발)

  • 권오욱
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.08a
    • /
    • pp.320-327
    • /
    • 1998
  • 대어휘 연속음성인식을 목표로 개발한 의사형태소 단위의 인식기를 기술하였다. 먼저 의상형태소를 정의하고, 의사형태소 태거를 간단히 기술하며, 의사형태소의 병합에 의한 인식단위 결정방법, 의사형태소 단위 인식기에서 특히 고려되어야 할 음향모델링, 품사 정보를 이용한 언어모델 및 어절규칙의 적용 방안, 의사형태소 단위 인식을 위한 새로운 탐색기 구조를 기술한다. 약 5,500 어절의 인식어휘를 갖는 여행계획 영역의 대화체 연속음성 데이터베이스를 이용하여 초벌 인식실험을 한 결과, 의사형태소 단위의 인식기의 단어인식률은 66.4%, 어절인식률은 60.0%를 나타내었다.

  • PDF

Syntax Analysis of Enumeration type and Parallel Type Using Maximum Entropy Model (Maximum Entropy 모델을 이용한 나열 및 병렬형 인식)

  • Lim, Soo-Jong;Lee, Chang-Ki;Hur, Jeong;Jang, Myoung-Gil
    • 한국HCI학회:학술대회논문집
    • /
    • 2006.02a
    • /
    • pp.1240-1245
    • /
    • 2006
  • 한국어 문장을 구조 분석할 때에 모호성을 발생시키는 유형 중의 하나가 나열 및 병렬형이다. 문장 구조 복잡도를 증가시키는 나열 및 병렬형을 구조 분석 전에 미리 하나의 단위로 묶어서 처리하는 것이 문장 구조 분석의 정확도를 높이는데 중요하다. 본 연구에서는 형태소 태그를 이용한 기본 규칙으로 문장을 청크 단위로 분할하고 분할된 청크 중에서 나열형을 인식하여 해당되는 청크들을 하나의 나열 청크로 통합하여 청크의 개수를 줄인다. 병렬형에 대해서는 반복되는 병렬 청크의 범위와 생략된 용언을 복원한다. 이러한 인식은 첫 단계로 기호(symbol)를 중심으로 구축된 간단한 규칙으로 인식을 하고 이러한 규칙에 해당되지 않는 형태의 나열 및 병렬형은 Maximum Entropy 모델을 이용하여 적용한다. ME모델은 어휘자질, 형태소 품사 자질, 거리 자질, 의미자질, 구 단위 태그 자질(NP:명사구, VP:동사구, AP:형용사구), BIO 태그(Begin, Inside, Outside) 자질에 대한 ME(Maximum Entropy) 모델을 이용하여 구축되었다.

  • PDF

Performance Evaluation of an On-Chip Multiprocessor for Object Recognition (객체 인식을 위한 다중처리 마이크로프로세서의 성능 평가)

  • Chung, Yong-Wha;Park, Kyoung;Choi, Sung-Hoon;Hahn, Woo-Jong
    • Journal of KIISE:Computer Systems and Theory
    • /
    • v.27 no.6
    • /
    • pp.558-566
    • /
    • 2000
  • Object recognition is a challenging application for high-performance computing. Currently, the superscalar architecture dominates todays microprocessor marketplace. As more transistors are integrated onto larger die, however, an on-chip multiprocessor is regarded as a promising alternative to the superscalar microprocessor. This paper examines the behavior of the object recognition on the on-chip multiprocessor, which will be employed in general-purpose parallel machines. To obtain the performance characteristics of the microprocessor, a program-driven simulator and its programming environment were developed. The simulation results showed that the on-chip multiprocessor can exploit thread level parallelisms effectively and offer a promising architecture for the object recognition application.

  • PDF

Handwritten Korean Amounts Recognition in Bank Slips using Rule Information (규칙 정보를 이용한 은행 전표 상의 필기 한글 금액 인식)

  • Jee, Tae-Chang;Lee, Hyun-Jin;Kim, Eun-Jin;Lee, Yill-Byung
    • The Transactions of the Korea Information Processing Society
    • /
    • v.7 no.8
    • /
    • pp.2400-2410
    • /
    • 2000
  • Many researches on recognition of Korean characters have been undertaken. But while the majority are done on Korean character recognition, tasks for developing document recognition system have seldom been challenged. In this paper, I designed a recognizer of Korean courtesy amounts to improve error correction in recognized character string. From the very first step of Korean character recognition, we face the enormous scale of data. We have 2350 characters in Korean. Almost the previous researches tried to recognize about 1000 frequently-used characters, but the recognition rates show under 80%. Therefore using these kinds of recognizers is not efficient, so we designed a statistical multiple recognizer which recognize 16 Korean characters used in courtesy amounts. By using multiple recognizer, we can prevent an increase of errors. For the Postprocessor of Korean courtesy amounts, we use the properties of Korean character strings. There are syntactic rules in character strings of Korean courtesy amounts. By using this property, we can correct errors in Korean courtesy amounts. This kind of error correction is restricted only to the Korean characters representing the unit of the amounts. The first candidate of Korean character recognizer show !!i.49% of recognition rate and up to the fourth candidate show 99.72%. For Korean character string which is postprocessed, recognizer of Korean courtesy amounts show 96.42% of reliability. In this paper, we suggest a method to improve the reliability of Korean courtesy amounts recognition by using the Korean character recognizer which recognize limited numbers of characters and the postprocessor which correct the errors in Korean character strings.

  • PDF

An Improved Grammatical Structure of the FSN for the Recognition of Korean Price Sentences (한국어 가격 문장인식을 위한 FSN의 개선된 문법적 구조)

  • 김동주;홍광석
    • Journal of the Institute of Convergence Signal Processing
    • /
    • v.3 no.3
    • /
    • pp.1-5
    • /
    • 2002
  • In this paper, we present an improved grammatical structure of the finite state network(FSN) for constructing useful recognizer of practical Korean price sentences. The grammar constraints of Korean price sentences in the existing method are necessary to modify grammar constraint and grammatical structure for the recognition of practical Korean price sentences. The grammar constraints are improved in the third and the fourth grammar constraint of Korean price sentences for the practical point. In this paper, we improve the grammar constraints and make up for the weak point in the grammatical structure of the FSN[1]. Three kinds of experiments were performed to evaluate the improved grammatical structures; FSN0, FSN-1, FSN-2. As the recognition results for price sentences, the word recognition rates were 81.37%, 83.92%, and 85.49%, for FSN0, FSN-1, and FSN-2. Also, the sentence recognition rates were 35%, 45%, and 52%, respectively.

  • PDF

A Study of UHF RFID Metallic Tag Design for Long Reading Range Using a Cavity Structure (캐비티 구조를 사용한 장거리 인식용 UHF RFID 금속용 태그 설계에 관한 연구)

  • Lee, Jin-Seong;Lee, Kyoung-Hwan;Yeo, Jun-Ho;Chung, You-Chung
    • The Journal of Korean Institute of Communications and Information Sciences
    • /
    • v.34 no.12B
    • /
    • pp.1468-1474
    • /
    • 2009
  • This paper shows an UHF RFID metallic tags using a Cavity structure for a long reading range. The reading range of a general passive tag is limited because the EIRP of a reader system is limited as 36㏈m by ISO 18000-6. To extend the reading range, the tag antenna should have a high gain antenna structure. The designed tag antenna is recognized over 10m range with a Cavity structure. The directivity pattern and the performance of the tag with the Cavity structure is stable when it is attached to a metallic object. The designed tag antenna has two kinds as cavity thickness. The sizes of designed tag antennas are $176\;{\times}\;52\;{\times}\;10\;mm$ and $176\;{\times}\;61\;{\times}\;30mm$ They can be attached to a large metallic materials and heavy equipments. The measured reading ranges of the tags are about 11m and 15m when they are attached to a metallic object.