• 제목/요약/키워드: 인식 개선

검색결과 5,273건 처리시간 0.034초

변형된 이득함수를 이용한 잡음 환경에서의 음성인식 (Speech Recognition in Noisy Environments Using Modified Gain Function)

  • 진호성;이상호;홍재근
    • 한국산학기술학회:학술대회논문집
    • /
    • 한국산학기술학회 2010년도 춘계학술발표논문집 1부
    • /
    • pp.119-123
    • /
    • 2010
  • 본 논문에서는 2단계 잡음제거 방법의 이득함수를 이용한 고조파 복원 잡음제거 방법의 이득함수를 조정하여 기존의 방법보다 음성개선을 향상시켰고, 제안한 방법으로 개선된 음성을 음성인식 기술에 적용하였다. 본 논문에서는 기존 방법으로 음성개선 결과 묵음구간에서 음성구간으로 변화는 구간에서 이전 프레임의 추정된 음성신호로 스펙트럼의 이득함수가 구해져서 음성이 발생하는 구간에서 왜곡이 발생한다. 따라서 본 논문에서는 이러한 현상을 개선시키기 위해 2단계 잡음제거 방법의 이득함수를 추정된 a priori SNR과 비교하여 이득함수를 조정하고, 2단계 잡음제거 방법의 이득함수를 고조파 복원 방법의 이득함수와 비교하여 이득함수를 조정하여 음성을 개선하는 방법을 제안하였다. 그리고 음성인식을 위한 특징벡터 추출을 위해 제안한 방법으로 개선된 음성의 대수 에너지를 정규화 하는 대수 에너지 정규화 방법(Log Energy Normalization)을 음성인식 방법에 적용하였다.

  • PDF

라인센서에서 획득한 지문영상의 개선에 관한 연구 (A Study on improvement of the fingerprint image obtained to Line-Sensor)

  • 장동혁;장태복;이상범
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 1999년도 가을 학술발표논문집 Vol.26 No.2 (2)
    • /
    • pp.536-538
    • /
    • 1999
  • 사용자 인증에 관한 연구 중 지문인식에 대한 연구는 매우 진보적인 발전을 거듭해왔다. 지문인식 장치의 보급으로 지문영상을 입력받기 위한 센서의 소형화와 저가화가 요구되어짐에 따라 Area-Sensor를 대신하여 Line-Sensor에 대한 관심이 높아지고 있다. 하지만 잡음에 민감한 Line-Sensor의 특성과 비효율적인 스캔방법으로 인하여 양질의 지문영상을획득하기에 어려움이 있다. 기존의 지문인식 알고리즘의 지문영상개선 방법으로는 인식과정 중 오류를 일으키는 확률이 높아 Line-Sensor에서 획득한 지문영상의 개선에 관한 알고리즘을 제안한다.

  • PDF

변형 VGG 모델의 전처리를 이용한 부품도면 문자 인식 성능 개선 (Performance Improvement of Optical Character Recognition for Parts Book Using Pre-processing of Modified VGG Model)

  • 신희란;이상협;박장식;송종관
    • 한국전자통신학회논문지
    • /
    • 제14권2호
    • /
    • pp.433-438
    • /
    • 2019
  • 본 논문에서는 기계 서비스 부품 도면에서 숫자를 인식하기 위하여 입력 영상에 대한 전처리와 딥러닝 모델을 제안한다. 서비스 부품 도면의 숫자를 인식하는데 있는 지시선과 도형에 의한 오검출 또는 오인식을 개선하기 위하여 수학적 형태학 필터링 전처리를 한다. 숫자 인식을 위하여 VGG-16 모델을 축소 변형한 7 개의 계층을 가지는 VGG 모델을 적용함으로써 인식 성능을 개선한다. 서비스 부품 도면의 숫자 인식 실험 결과, 제안하는 방법이 인식률 95.57%, 정확도는 92.82%로 종래의 방법에 현저히 개선된 결과를 얻었다.

사용자와 제공자간의 웹사이트 서비스 평가차이 분석 (The Analysis of Website Service Evaluations by Users and Providers)

  • 김진화;변현수;임옥선
    • 한국데이타베이스학회:학술대회논문집
    • /
    • 한국데이타베이스학회 2008년도 연합학회학술대회
    • /
    • pp.193-210
    • /
    • 2008
  • 본 연구는 웹사이트에 대한 사용자와 제공자의 인식의 차이를 확인하고 분석한 후 이를 데이터마이닝을 이용해 웹사이트의 개선을 위한 전략의 도출을 제시하고자 한다. 이 연구에서는 웹사이트 사용자와 제공자간의 인식차이 분석을 위하여 기존 문헌 연구를 통해서 웹사이트 개선을 위한 웹사이트의 평가 요인과 항목을 중심으로 인터넷 서점 사이트를 연구대상으로 한 설문지를 재구성하였다. 그 다음 동일한 문항으로 사용자와 제공자에게 각각 설문 조사를 실시하여 데이터를 수집하였다. 수집된 사용자와 제공자 각각의 응답을 통계분석을 통해 비교하고 그 차이를 확인한 후 조하리 창(Johari Window)을 바탕으로 인식차이에 대한 분석을 하였다. 웹사이트의 개선을 위한 전략을 도출하기 위해서 사용자와 제공자간 인식차이가 상이하게 나타난 설문 항목에 대해 데이터마이닝을 이용하여 응답 데이터에서 규칙을 도출해내고 이를 기반으로 웹사이트 사용자와 제공자간 인식차이 분석을 통한 웹사이트 개선전략을 제시하였다.

  • PDF

실험실 환경 음성을 이용한 전화음성 인식에 관한 연구 (Telephone Speech Recognition Using Laboratory Environment Speech Data)

  • 윤상호
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
    • /
    • pp.391-394
    • /
    • 1994
  • 본 연구에서는 전화선을 통한 음성인식을 위해 저잡음의 실험실 환경에서 수집된 음성 자료를 이용하는 접근을 하였다. 전화 음성과 실험실 음성 간의 특성 차이를 보정하기 위해 선형 회귀 분석법을 이용한 SDCN을 제안하였다. 두 자료간의 보정은 동시 녹음된 실험실 환경의 음성과 전화음성의 SNRDP 따른 두 자료간의 차이를 최소화하는 변환행렬을 구해, 이를 학습자료의 변환에 이용한다. 제안된 방법의 타당성을 확인하기 위해 두가지 인식 알고리즘인 DTW와 이산 HMM 에 대해 실험하였다. DTW를 통한 인식에서개선된 SDCN 에 의한 특징벡터의 변환은 기존의 SDCNDP 따른 특징변환보다 8~17%의 인식률이 향상되었다. 이산 HMM으로 인식할 때는 개선된 SDCNDP 의한 전화음성과 실험실 음성과의 유사도를 보다 잘 나타내기 위해 개선된 SDCN을 적용하고, VQ 코드열 상에서이 코드 사상법을 사용하여 인식률의 향상시켰다.

  • PDF

스미어링 기법과 퍼지 ART 알고리즘을 이용한 여권 인식 (The Passport Recognition by Using Smearing Method and Fuzzy ART Algorithm)

  • 류재욱;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2002년도 춘계학술대회 및 임시총회
    • /
    • pp.37-42
    • /
    • 2002
  • 현행 출입국 관리는 사용자가 여권을 제시하면, 여권을 육안으로 검색하고 수작업으로 정보를 입력하여 여권의 데이터 베이스와 대조하였다. 이러한 종래의 출입국 관리 시스템은 출입국 심사 시간이 길어 출입국자에 불편을 제공하고 출입국 부적격자에 대한 정확한 검색이 이루어지지 않아 체계적으로 관리하기가 어려웠다. 이리한 종래의 문제점을 개선하기 위해 영상 처리와 문자 인식을 이용한 여권 인증 시스템을 제안한다. 된 논문에서는 여권 영상에 대해 소벨 연산자와 스미어링 기법 그리고 윤곽선 추적 알고리즘을 이용하여 사진영역, 코드 영역 및 개별 코드 문자를 추출하고 개별 코드 문자 인식은 기존의 퍼지 ART를 개선하여 적용한다. 다양한 국내 여권 영상에 대해 제안된 여권 인식 방법을 실험한 결과, 제안된 방법이 여권 인식에 우수한 성능을 보였고 개선된 퍼지 ART 알고리즘이 기존의 퍼지 ART 알고리즘보다 클러스터 수가 적게 생성되고 인식률도 향상된 것을 확인하였다

  • PDF

개선된 퍼지 신경망을 이용한 여권 인식 시스템 (Recognition System of Passports by Using Enhanced Fuzzy Neural Networks)

  • 류재욱;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 추계 학술대회 학술발표 논문집
    • /
    • pp.155-161
    • /
    • 2003
  • 출입국 관리 절차를 간소화하는 방안의 하나로 퍼지 신경망을 이용한 여권 인식 시스템을 제안한다. 제안된 여권 인식 방법은 소벨 연산자와 수평 스미어링, 윤곽선 추적 알고리즘을 적용하여 코드의 문자열 영역을 추출한다 여권의 문자열 영역은 OCR 문자 서체로 구성되어 있고, 명도 차이가 다양하게 나타난다. 따라서 추출된 문자열 영역을 블록 이진화와 평균 이진화를 각각 수행하고 그 결과들을 AND 비트 연산을 취하여 적응적으로 이진화한다. 이진화된 문자열 영역에 대해서 개별 코드의 문자들을 복원하기 위하여 CDM(Conditional Dilation Morphology) 마스크를 적용한 후, 역 CDM마스크와 HEM(Hit Erosion Morphology)마스크를 적용하여 잡음을 제거한다 잡음이 제거된 문자열 영역에 대해 수직 스미어링을 적용하여 개별 코드의 문자를 추출한다. 추출된 개별 코드의 인식은 퍼지 ART 알고리즘을 개선하여 RBF 네트워크의 중간층으로 적용하는 퍼지 RBF 네트워크와 개선된 퍼지 ART 알고리즘과 지도 학습을 결합한 퍼지 자가 생성 지도 학습 알고리 즘을 각각 제안하여 여권의 개별 코드 인식에 적용한다. 제안된 방법의 성능을 확인하기 위해서 실제 여권 영상을 대상으로 실험한 결과, 제안된 추출 및 인식 방법이 여권 인식에서 우수한 성능이 있음을 확인하였다.

  • PDF

C++ 언어와 Standard Library 를 이용한 음성인식기 개발 (Development of a Speech Recognition System uSing e++ Language and Standard library)

  • 황규웅
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1998년도 제15회 음성통신 및 신호처리 워크샵(KSCSP 98 15권1호)
    • /
    • pp.74-77
    • /
    • 1998
  • 우리는 C++를 이용하여 음성인식기를 구현하여 기존의 C를 이용한 경우에 비하여 30% 수준의 소스로 표현하였고 인식기의 공동개발, 확장 및 개선, 기술 전수 등이 용이하게 되었으며 이를 음성인식 엔진 및 음성인식 연구를 위한 툴로 사용할 수 있게 되었다. 이 인식기의 특징으로는 연속 음성 및 대화체 음성을 인식할 수 있으며 trigram 언어 모델을 사용하였고 문맥 종속 음소 모델링에서는 기존의 triphone 보다 넓은 문맥을 고려한 n-phone context modeling을 사용하였으며 모델의 선정에는 음성학적 지식을 기반으로 한 질문을 사용한 decision tree를 사용하여 훈련에 나타나지 않은 단어나 문맥인 경우라도 가장 가까운 모델을 선정할 수 있게 하였다. 또, tree lexicon을 사용하여 속도를 개선하였으며 state 단위의 모델 공유를 통해 제한된 데이터를 이용하여 더 많은 모델을 훈련할 수 있어 성능을 개선하였다. 상용화를 염두에 두고 pc에서 구현하였다.

  • PDF

계층적인 접근과 개선된 RBF 네트워크를 이용한 영문 명함 인식 (Recognition of English Calling Card by Using Hierarchical Approach and Enhanced RBF Networks)

  • 임은경;김광백
    • 한국지능시스템학회:학술대회논문집
    • /
    • 한국퍼지및지능시스템학회 2003년도 춘계 학술대회 학술발표 논문집
    • /
    • pp.141-146
    • /
    • 2003
  • 본 논문에서는 문자열 영역 추출을 위한 3배 축소 명함 영상, 개별 문자 추출을 위한 2배 축소 명함 영상, 정확한 인식을 위한 원본 영상으로 명함 영상을 분리하고, 분리된 영상들을 대상으로 각 영상 크기에 적합한 처리를 수행하고 각각의 결과들을 이용하여 정확한 문자를 추출할 수 있는 방법을 제안한다 그리고 추출된 개별 문자들의 인식을 위해서 ART1을 적용한 개선된 RBF 네트워크를 제안하여 적용한다 제안된 명함 추출 방법은 원 영상을 각각의 처리 방법에 적합하도록 하기 위해서 다해상도로 분리한다. 문자열의 추출은 문자들의 간격을 축소 시켜서 블록을 추출하기 쉬운 적절한 최소 크기의 영상에서 수행하고, 개별 문자의 추출은 문자들의 간격을 분리할 수 있는 적절한 영상의 크기에서 수행한다 개별 문자 인식은 문자의 형태학적 특성을 잘 나타내기 위해서 원본 영상에 적용한다 본 논문에서 제안한 추출 방법은 문자를 정확히 추출할 수 있으며 병렬 처리가 가능하여 처리시간을 단축할 수 있는 장점을 가진다. 그리고 정확히 추출된 개별 문자들을 개선된 R8F 네트워크를 이용하여 인식률을 향상시킨다. 제안된 명함 추출 및 인식 방법의 성능을 확인하기 위해서 실제 영문 명함 영상을 대상으로 실험한 결과, 기존의 방법보다 명함 추출 및 인식에서 우수한 성능이 있음을 확인하였다.

  • PDF

이동통신 단말기를 위한 고속의 홍채인식 시스템 (A Fast Iris Identification System for Mobile Device)

  • 홍성민;이윤석;문성림;위영철;김동윤
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2006년도 가을 학술발표논문집 Vol.33 No.2 (B)
    • /
    • pp.505-508
    • /
    • 2006
  • 홍채인식 시스템은 홍채영역 검출, 홍채특징 코드 생성, 그리고 홍채코드 비교 판단의 과정으로 이루어져 있다. 기존의 논문이나 연구들의 대부분은 앞에서 나열한 홍채인식 시스템의 과정의 일부만을 수정하여 성능개선, 즉 인식속도 향상과 인식률 향상 등을 꾀하였다. 이에 반해, 본 논문에서는 홍채인식 과정 전체의 개선을 통하여, 획기적으로 홍채인식 시간을 단축시키는 홍채인식 방법을 제안 하였다. Hough Transform과 Vertical & Horizontal Histogram을 사용한 홍채영역 검출, gradient를 사용한 홍채코드 생성, 그리고 variance를 이용하는 홍채코드의 비교와 판단 과정을 빠르고 단순한 알고리즘으로 구성하여, 홍채인식 속도를 개선하였다. 본 논문에서 제안한 홍채인식 시스템의 성능을 실험한 결과, mobile 환경에서 실시간으로 사용 할 수 있는 속도와 기존 홍채인식 시스템과 비슷한 홍채인식률을 나타내었다.

  • PDF