• 제목/요약/키워드: Recognition Improvement

검색결과 1,496건 처리시간 0.03초

가상훈련 콘텐츠 운영기관 인식을 통한 활용도 제고방안 연구 (A Study on the Improvement of Utilization through Recognition of Virtual Training Content Operating Institutions)

  • 양미석;오창헌
    • 실천공학교육논문지
    • /
    • 제14권3호
    • /
    • pp.479-489
    • /
    • 2022
  • 본 연구는 K대학교 온라인평생교육원의 가상훈련 콘텐츠 활용을 높이는 방안을 파악하기 위해 운영기관 사례를 중심으로 활용경험, 콘텐츠 인식, 현장실습 대체, 요구사항 등을 살펴보았다. 이를 위해 2020년 K대학교 온라인평생교육원이 보급한 가상훈련 콘텐츠를 운영한 12개 기관을 선정하여 심층인터뷰를 실시하고, 최종 인터뷰한 11개 기관의 인터뷰 내용을 질적 분석하였다. 분석 결과, 첫째, 가상훈련 운영기관의 콘텐츠 활용경험은 교육환경의 변화, 이론학습의 보완, 실무감각의 향상이 목적이었다. 둘째, 가상훈련 콘텐츠 인식을 조사한 결과, 콘텐츠의 중요도와 활용도가 높다고 인식한 경우에는 구비가 어려운 시설과 장비의 경험, 흥미유발 및 주의집중에 도움, 안전교육에 유용, 비대면 수업시 현장실습에 대체 가능한다고 응답했다. 셋째, 현장실습에 대체에 대한 인식은 다수의 경우, 현장실습의 사전 교육자료로 활용하기에는 무리가 없지만 현장실습을 대체하기에는 어렵다고 응답했다. 넷째, 콘텐츠 질 개선사항으로 콘텐츠 질 제고, 콘텐츠 접근 및 조작 개선, 전용 기기 개발, 교수자 대상 연수실시, 교육과정 체계화로 요약할 수 있다. 다섯째, 기관의 요구사항으로 가상훈련 콘텐츠 자체의 질 제고, 장비지원, 교육과정 체계화 및 특성화, 체계적인 교육과정 및 세부 콘텐츠 목적 공유 등이며, 홍보방안으로 교수자 대상으로 연수 진행하며 가상 훈련 콘텐츠 활용에 대한 자세한 안내, 가상훈련 콘텐츠 활용과 타 사업 연계, 콘텐츠 활용방법 소개 및 활용 강사모집 등이었다. 본 연구는 가상훈련 콘텐츠 운영기관의 인식을 바탕으로 가상훈련 콘텐츠 활용도 제고를 위한 방안을 모색했다는데 의의가 있다.

자기 센서 방식 자율 주행 차량의 경로 인식 성능 개선 (Roadway recognition performance improvement for an autonomous vehicle using magnetic sensor)

  • 김명준;김의선;류영재;임영철
    • 센서학회지
    • /
    • 제12권5호
    • /
    • pp.211-217
    • /
    • 2003
  • 도로의 중앙에 일정한 간격으로 마그네틱 마커를 설치하고 차량에 자기 센서를 장착하여 차량의 이동에 따른 자기장의 변화를 측정하여 차량의 주행 경로를 인식하는 시스템의 성능을 개선하는 방법을 제안한다. 도로에 설치하는 마그네틱 마커들의 설치비를 절감하기 위하여 마커들 간의 설치간격을 기존의 경우보다 넓혔다. 이를 위하여 마커들의 간격에 따른 자계의 분석을 행하여 적절한 마커들의 간격을 알아내고, 6개 센서들의 배치방법과 신경회로망을 이용한 제어방법을 제안하였다. 자기장 분석, 지자기 소거. 학습패턴 획득, 신경망 학습에 의해 조향 제어기를 구성하고 컴퓨터 주행 시뮬레이션을 통해 제안된 방법에 의한 자율주행 차량의 성능이 개선될 수 있음을 확인하였다.

멀티미디어 응용을 위한 얼굴 인식시스템 (Face Recognition System for Multimedia Application)

  • 박상규;성현경;한영환
    • 전기전자학회논문지
    • /
    • 제6권2호
    • /
    • pp.152-160
    • /
    • 2002
  • 본 논문에서는 멀티미디어 환경을 위한 얼굴 인식 시스템을 구현하였다. 본 얼굴 인식 시스템에서는 얼굴 영역을 선정하고 출력하는 처리시간의 단축과 인식률 향상을 위한 설계에 중점을 두었다. 전형적인 RGB 색상체계를 변형 없이 사용함으로써 색상체계 변환에 필요한 시간을 감소시켰으며, 얼굴 특성을 이용한 알고리즘과 신경망 기법을 활용하여 인식률을 향상시켰다. 본 시스템은 입력된 영상을 모자이크화 시킨 후 모자이크 블록의 색상 분석을 통하여 얼굴 색상 후보 블록을 선정하고, 얼굴이 가지는 특성을 활용하여 잘못 검색된 얼굴 색상 후보 블록을 제거한다 잘못 검색된 얼굴 색상 후보 블록이 제거된 모자이크 블록 영역에서 신경망의 입력으로 사용될 4가지 특성 값을 산출하여 오류 역전파 학습과정을 거친 신경망에서 처리한 후 그 출력 값을 가지고 얼굴 영역의 진위 여부를 판단하게 된다. 본 논문에서 구현된 시스템은 복수의 인원이 포함된 10장의 입력영상을 사용하여 실험한 결과 0.1초미만의 처리시간 내에 90%의 얼굴 인식률을 보여주었다. 이 결과는 멀티미디어 동영상의 응용을 위한 얼굴인식 시스템으로 충분히 이용될 수 있을 것이다.

  • PDF

얼굴 인식의 정확도 향상을 위한 SURF 특징점에서의 Gabor 기술어 추출 (Gabor Descriptors Extraction in the SURF Feature Point for Improvement Accuracy in Face Recognition)

  • 이재용;김지은;오승준
    • 방송공학회논문지
    • /
    • 제17권5호
    • /
    • pp.808-816
    • /
    • 2012
  • 얼굴 인식은 여러 분야에서의 활발한 연구를 통해 많은 발전이 있었고, 현재도 활발한 연구가 진행되고 있다. 최근 들어 물체 인식에 주로 사용되어온 특징점 추출 알고리즘이 얼굴 인식에도 적용되고 있다. 본 논문은 대표적인 특징점 추출 알고리즘인 SURF를 이용한다. 사람은 얼굴의 형태 및 구조가 유사하므로 물체를 인식하는 경우보다 분별력이 떨어지기 때문에 SURF를 이용한 얼굴인식의 정확도는 낮은 편이다. 이를 개선하고자 본 논문에서는 SURF를 통해 추출한 특징점에서 Gabor 웨이블릿 변환을 사용해 기술어를 추출하는 얼굴 인식 방법을 제안한다. 실험 결과에서 제안하는 방법이 기존 SURF 기반의 얼굴 인식에 비해 정확도가 약 23% 향상된 것을 확인하였다.

반음절쌍과 변형된 연쇄 상태 분할을 이용한 연속 숫자 음 인식의 성능 향상 (Performance Improvement of Continuous Digits Speech Recognition Using the Transformed Successive State Splitting and Demi-syllable Pair)

  • 서은경;최갑근;김순협;이수정
    • 한국멀티미디어학회논문지
    • /
    • 제9권1호
    • /
    • pp.23-32
    • /
    • 2006
  • 본 논문에서는 언어모델과 음향모델을 개선함으로써 단위 숫자음의 인식성능 최적화에 대해 설명한다. 언어모델은 한국어 단위 숫자음 문장의 문법적 특징을 분석하고, Finile State Network(FSN) 노드를 두 음절로 구성하여 오 인식률을 감소시켰다. 음향모델은 단 음절로 구성되어 발성기간이 짧고 조음이 많이 생기는 불명확한 음소, 음절의 분할로 인한 오 인식을 줄이기 위해 인식단위를 반음절 쌍으로 하였다. 인식단위의 특징을 효과적으로 모델링하기 위해 특징부분에서 K-means 알고리즘으로 군집화 하여, 상태를 분할하는 변형된 연쇄 상태 분할방법을 이용하였다. 실험 결과 제안된 언어모델의 적용 후 동일 문맥종속 음소모델에서 10.5%, 음향모델에서 인식단위를 반음절 쌍으로 하였을 경우 문맥종속 음소모델에 비해 12.5%, 변형된 연쇄 상태분할을 하였을 경우 1.5%의 인식률을 향상시킬 수 있었다.

  • PDF

가변위치 고음성인식 기술을 이용한 무선 홈 네트워크 시스템 구현에 관한 연구 (A Study on the Realization of Wireless Home Network System Using High-performance Speech Recognition in Variable Position)

  • 윤준철;최상방;박찬섭;김세영;김기만;강석엽
    • 한국정보통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.991-998
    • /
    • 2010
  • 실내 환경에서 음성인식 기술을 이용한 무선 홈 네트워크 시스템 구현에 있어, 잡음과 실내 잔향음은 시스템 성능 저하의 주요 원인이다. 본 연구에서는 실내 인식환경에서 스펙트럼 엔트로피(Spectral entropy) 기반의 음성 구간검출법을 이용하여 잔향음(reverberation) 및 실내잡음에 강인한 음성인식 홈 네트워크 시스템을 구현하고자 한다. 스펙트럼 차감법(Spectral Subtraction)은 잔향으로 인해 왜곡된 신호를 스펙트럼 상에서 제거하여 잔향의 효과를 줄일 수 있고 음성신호와 독립적인 잡음을 제거 할 수 있다. 효과적인 스펙트럼 차감을 위해서는 음성과 비음성 구간의 정확한 구분이 수반되어야 하며 이를 위해서 엔트로피 기반의 음성 구간 검출법을 적용하여 성능을 향상시킨다. 모의 및 실내환경 실험 결과 Spectral entropy 기반의 음성 구간 검출법을 이용할 경우 실내 잔향 및 잡음환경에서 명령어 인식률의 향상이 증명되었다.

반음절쌍과 변형된 연쇄 상태 분할을 이용한 연속 숫자음 인식의 성능 향상 (Performance Improvement of Continuous Digits Speech Recognition using the Transformed Successive State Splitting and Demi-syllable pair)

  • 김동옥;박노진
    • 한국정보통신학회논문지
    • /
    • 제9권8호
    • /
    • pp.1625-1631
    • /
    • 2005
  • 본 논문에서는 언어모델과 음향모델을 개선함으로써 단위 숫자음의 인식성능 최적화에 대해 설명한다. 언어모델은 한국어 단위 숫자음 문장의 문법적 특징을 분석하고, FSN 노드를 두음절로 구성하여 오 인식률을 감소시켰다. 음향모델은 단음절로 구성되어 발성기간이 짧고 조음이 많이 생기는 불명확한 음소, 음절의 분할로 연한 오 인식을 줄이기 위해 인식단위를 반음절쌍으로 하였다. 인식단위의 특징을 효과적으로 모델링하기 위해 특징레벨에서 K-means 알고리즘(4)으로 클러스터링 하여 상태를 분할하는 변형된 연쇄 상태 분할방법을 이용하였다. 실험 결과 제안된 언어모델의 적용 후 동일 문백종속 음소모델에서 $10.5\%$, 음향모델에서 인식단위를 반음절쌍으로 하였을 경우 문백종속 음소모델에 비해 $12.5\%$, 변형된 연쇄 상태분할을 하였을 경우 $1.5\%$의 인식률을 향상시킬 수 있었다.

Representative Batch Normalization for Scene Text Recognition

  • Sun, Yajie;Cao, Xiaoling;Sun, Yingying
    • KSII Transactions on Internet and Information Systems (TIIS)
    • /
    • 제16권7호
    • /
    • pp.2390-2406
    • /
    • 2022
  • Scene text recognition has important application value and attracted the interest of plenty of researchers. At present, many methods have achieved good results, but most of the existing approaches attempt to improve the performance of scene text recognition from the image level. They have a good effect on reading regular scene texts. However, there are still many obstacles to recognizing text on low-quality images such as curved, occlusion, and blur. This exacerbates the difficulty of feature extraction because the image quality is uneven. In addition, the results of model testing are highly dependent on training data, so there is still room for improvement in scene text recognition methods. In this work, we present a natural scene text recognizer to improve the recognition performance from the feature level, which contains feature representation and feature enhancement. In terms of feature representation, we propose an efficient feature extractor combined with Representative Batch Normalization and ResNet. It reduces the dependence of the model on training data and improves the feature representation ability of different instances. In terms of feature enhancement, we use a feature enhancement network to expand the receptive field of feature maps, so that feature maps contain rich feature information. Enhanced feature representation capability helps to improve the recognition performance of the model. We conducted experiments on 7 benchmarks, which shows that this method is highly competitive in recognizing both regular and irregular texts. The method achieved top1 recognition accuracy on four benchmarks of IC03, IC13, IC15, and SVTP.

심층신경망 구조에 따른 구개인두부전증 환자 음성 인식 향상 연구 (A study on recognition improvement of velopharyngeal insufficiency patient's speech using various types of deep neural network)

  • 김민석;정재희;정보경;윤기무;배아라;김우일
    • 한국음향학회지
    • /
    • 제38권6호
    • /
    • pp.703-709
    • /
    • 2019
  • 본 논문에서는 구개인두부전증(VeloPharyngeal Insufficiency, VPI) 환자의 음성을 효과적으로 인식하기 위해 컨볼루션 신경망 (Convolutional Neural Network, CNN), 장단기 모델(Long Short Term Memory, LSTM) 구조 신경망을 은닉 마르코프 모델(Hidden Markov Model, HMM)과 결합한 하이브리드 구조의 음성 인식 시스템을 구축하고 모델 적응 기법을 적용하여, 기존 Gaussian Mixture Model(GMM-HMM), 완전 연결형 Deep Neural Network(DNN-HMM) 기반의 음성 인식 시스템과 성능을 비교한다. 정상인 화자가 PBW452단어를 발화한 데이터를 이용하여 초기 모델을 학습하고 정상인 화자의 VPI 모의 음성을 이용하여 화자 적응의 사전 모델을 생성한 후에 VPI 환자들의 음성으로 추가 적응 학습을 진행한다. VPI환자의 화자 적응 시에 CNN-HMM 기반 모델에서는 일부층만 적응 학습하고, LSTM-HMM 기반 모델의 경우에는 드롭 아웃 규제기법을 적용하여 성능을 관찰한 결과 기존 완전 연결형 DNN-HMM 인식기보다 3.68 % 향상된 음성 인식 성능을 나타낸다. 이러한 결과는 본 논문에서 제안하는 LSTM-HMM 기반의 하이브리드 음성 인식 기법이 많은 데이터를 확보하기 어려운 VPI 환자 음성에 대해 보다 향상된 인식률의 음성 인식 시스템을 구축하는데 효과적임을 입증한다.

피치 정보를 이용한 GMM 기반의 화자 식별 (GMM based Speaker Identification using Pitch Information)

  • 박태선;한민수
    • 대한음성학회지:말소리
    • /
    • 제47호
    • /
    • pp.121-129
    • /
    • 2003
  • This paper describes the use of pitch information for speaker identification. The recognition system is a GMM based one with 4 connected Korean digits speech database. The mean of the pitch period in voiced sections of speech are shown to be ,useful at discriminating between speakers. Utilizing this feature with Gaussian mixture model in the speaker identification system gave a marked improvement, maximum 6% improvement comparing to the baseline Gaussian mixture model.

  • PDF