• Title/Summary/Keyword: 음성 신호 처리

Search Result 474, Processing Time 0.025 seconds

Signal Processing of Disordered Speech (장애음성 신호처리)

  • 조철우
    • Proceedings of the IEEK Conference
    • /
    • 1999.11a
    • /
    • pp.647-650
    • /
    • 1999
  • 본 논문에서는 음성신호처리 기법을 이용하여 장애음성을 진단, 개선하는 데 필요한 다양한 신호처리방법에 대하여 다루고자 한다. 음성장애중 성대장애를 중심으로 신호에 나타나는 현상과 이를 이용한 신호처리 방법들을 소개하며 응용사례로 음성을 이용한 성대질환의 진단에 관한 내용을 소개한다.

  • PDF

Sound Spectrographic Analysis (음성의 음향적 검사)

  • 홍수기
    • Proceedings of the KSLP Conference
    • /
    • 1994.06a
    • /
    • pp.128-137
    • /
    • 1994
  • 신호처리의 목적은 신호를 변형하여 우리가 원하는 형태로 만드는 것으로 신호를 변환시키는 장치 즉 시스템이 신호에 응답하여 다른 형태의 신호를 만들어 내는 것을 신호처리라 한다. 현재는 음성신호 처리시에 대부분 입력시호인 아날로그 신호(Analog Signal)를 표본화(Sampling)하고 양자화(Quantizing)하여 디지털 신호(Digital Signal)로 변환한 후 필요한 신호처리를 수행한다. 디지털 신호를 처리하므로써 정확성, 신뢰성, 처리속도를 증가시키게 되고 전자시스템(Electronic System)의 크기를 줄일 수가 있다. (중략)

  • PDF

Spectral Analysis and Modeling of Speech Signal - Analysis by FFT and LP Analysis - (음성신호의 스텍트럼해석 및 모델링 - FFT와 선형예측분석법에 의한 음성신호분석 -)

  • 조철우
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1998.06c
    • /
    • pp.393-398
    • /
    • 1998
  • 본 논문에서는 음성신호처리의 기초적인 해석법인 FFT와 LP분석법에 대하여 기본적인 이론과 함께 분석과정에서 알아두어야 할 사항들을 정리한다. 아울러 이러한 분석을 실제 음성신호를 대상으로 행함에 있어서 주의해야 할 점들을 실제음성을 처리한 그림과 함께 설명한다.

  • PDF

Current Status and the Prospect of Speech Signal Processing Technology in Korea (한국에서의 음성 신호 처리 기술의 현황과 전망)

  • 안수길
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.17-23
    • /
    • 1995
  • 최근 우리나라에서는 음성신호처리 기술을 바탕으로한 여러 가지 시스템이 상용화되고, 또 그에 따라 관련분야의 연구도 더욱 활발해지고 있다. 본 고에서는 최근 몇 년간 발표되었던 연구결과들을 바탕으로 현재 국내에서 dam성신호처리 관련분야에서의 연구현황을 소개하고 향후의 연구방향 및 미래의 연구 경향을 예측해보고자 g나다. 이를 위해서, 음성신호처리 분야를 음성분석, 음성 합성, 음성 인식, 음성 부호화의 네 세부 분야로 나누고 각 분야별로 국내 현황 그리고 앞으로의 전망을 제시한다.

  • PDF

A Study on Realization of Speech Recognition System based on VoiceXML for Railroad Reservation Service (철도예약서비스를 위한 VoiceXML 기반의 음성인식 구현에 관한 연구)

  • Kim, Beom-Seung;Kim, Soon-Hyob
    • Journal of the Korean Society for Railway
    • /
    • v.14 no.2
    • /
    • pp.130-136
    • /
    • 2011
  • This paper suggests realization method for real-time speech recognition using VoiceXML in telephony environment based on SIP for Railroad Reservation Service. In this method, voice signal incoming through PSTN or Internet is treated as dialog using VoiceXML and the transferred voice signal is processed by Speech Recognition System, and the output is returned to dialog of VoiceXML which is transferred to users. VASR system is constituted of dialog server which processes dialog, APP server for processing voice signal, and Speech Recognition System to process speech recognition. This realizes transfer method to Speech Recognition System in which voice signal is recorded using Record Tag function of VoiceXML to process voice signal in telephony environment and it is played in real time.

NOVA 4/X Minicomputer를 이용한 음성신호의 Digital저장

  • Kim, Nak-Hyeon;Lee, Seon-Taek
    • ETRI Journal
    • /
    • v.6 no.2
    • /
    • pp.39-44
    • /
    • 1984
  • 애널로그 신호인 음성신호를 디지틀값으로 변환하여 컴퓨터의 mass storage device에 저장하거나 또는 저장된 디지틀 음성 데이터를 애널로그 신호로 재생하는 기술은 디지틀 음성신호처리의 가장 중요한 토대를 마련해 준다. 본고에서는 음성변경시스팀과 같은 저장형 통신시스팀의 구현에 있어서 반드시 구비되어야 할 기술인 음성신호의 실시간 디스크 저장문제를 NOVA 4/X 미니컴퓨터에서 해결한 것을 간단히 기술하였다.

  • PDF

Speech enhancement based on reinforcement learning (강화학습 기반의 음성향상기법)

  • Park, Tae-Jun;Chang, Joon-Hyuk
    • Proceedings of the Korea Information Processing Society Conference
    • /
    • 2018.05a
    • /
    • pp.335-337
    • /
    • 2018
  • 음성향상기법은 음성에 포함된 잡음이나 잔향을 제거하는 기술로써 마이크로폰으로 입력된 음성신호는 잡음이나 잔향에 의해 왜곡되어지므로 음성인식, 음성통신 등의 음성신호처리 기술의 핵심 기술이다. 이전에는 음성신호와 잡음신호 사이의 통계적 정보를 이용하는 통계모델 기반의 음성향상기법이 주로 사용되었으나 통계 모델 기반의 음성향상기술은 정상 잡음 환경과는 달리 비정상 잡음 환경에서 성능이 크게 저하되는 문제점을 가지고 있었다. 최근 머신러닝 기법인 심화신경망 (DNN, deep neural network)이 도입되어 음성 향상 기법에서 우수한 성능을 내고 있다. 심화신경망을 이용한 음성 향상 기법은 다수의 은닉 층과 은닉 노드들을 통하여 잡음이 존재하는 음성 신호와 잡음이 존재하지 않는 깨끗한 음성 신호 사이의 비선형적인 관계를 잘 모델링하였다. 이러한 심화신경망 기반의 음성향상기법을 향상 시킬 수 있는 방법 중 하나인 강화학습을 적용하여 기존 심화신경망 대비 성능을 향상시켰다. 강화학습이란 대표적으로 구글의 알파고에 적용된 기술로써 특정 state에서 최고의 reward를 받기 위해 어떠한 policy를 통한 action을 취해서 다음 state로 나아갈지를 매우 많은 경우에 대해 학습을 통해 최적의 action을 선택할 수 있도록 학습하는 방법을 말한다. 본 논문에서는 composite measure를 기반으로 reward를 설계하여 기존 PESQ (Perceptual Evaluation of Speech Quality) 기반의 reward를 설계한 기술 대비 음성인식 성능을 높였다.

Implementation of a General Purpose DSP board using the ADSP-2105 Digital Signal Processor and its application to a real-time FFT analyzer (ADSP-2105를 이용한 범용 DSP 보드의 제작 및 이를 이용한 실시간 FFT 분석기의 구현)

  • 조철희
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1994.06c
    • /
    • pp.61-64
    • /
    • 1994
  • 디지털 신호를 처리하기 위해 특별히 제작된 ADSP-2105는 빠른 Fied-point 연산과 Harvard-architecture로 구조화됐기 때문에 빠른 수행연산을 할 수 가 있다. 본 논문은 이 DSP 프로세서를 이용해 음성신호의 실시간 FFT 분석에 관한 방법을 소개한다. 실시간 FFT 분석기로서의 DSP 보드는 크게 음성신호를 받는 입력부분과 FFT를 계산하는 FFT 부분으로 나뉘어지는데, 입력부분은 AD1849로 8KHz로 데이터를 샘플링해 받게 되었고, FFT 부분은 실제로 DSP가 FFT를 수행하는 부분으로 되어있다. 실시간 처리를 구현하기 위해 입력 부분은 두 개의 뱅크로 만들어 한 뱅크에서 음성신호를 받아들이는 동안에 다른 뱅크에서는 FFT를 계산하도록 되어있어서 DSP 보드는 항시 음성신호를 샘플링 할 수 있는 상태를 유지할 수 있다. 그리고 FFT 처리부는 빠른 처리로 음성신호를 샘츨링할 뱅크가 채워지기 전에 실행되게 프로그램되어 있어 실제적으로 모든 음성데이타를 FFT 하게 되어있다.

  • PDF

Fundamental Signal Processing in NonUniformly Sampled Speech Signal (비균일 표본화된 음성 신호에서의 기본적인 신호처리)

  • 임재열
    • Proceedings of the Acoustical Society of Korea Conference
    • /
    • 1995.06a
    • /
    • pp.235-238
    • /
    • 1995
  • 극점에서 비균일 표본화된 음성 신호는 크기열과 간격열의 이중구조로 표현되어, 균일 표본화된 신호에 근거한 기존의 신호처리 방법을 그대로 적용할 수 없다. 본 논문에서는 비균일 표본화된 음성 신호에서 에너지, 크기, 영교차율, 함수의 관계를 직접 유도하고, 특징을 살펴보아 비규닝ㄹ 펴본화된 음성신호에서도 균일 표본화된 신호에 해당하는 에너지, 크기, 영교차율과 같은 전처리과정 파라미터의추정이 가능함을 확인한다.

  • PDF

A Crowd Noise Reduction Model for Speech Signal processing (음성 신호처리를 위한 군중잡음 제거 모델)

  • 안용운;김중환;김상철
    • Proceedings of the Korean Information Science Society Conference
    • /
    • 2002.10d
    • /
    • pp.502-504
    • /
    • 2002
  • 군중잡음(crowd noise)이 발생하는 환경에서 음성 통화 및 화자 인식을 할 때에는 음성에 파열음이나 마찰음과 같은 유색잡음(colored noise)이 부가되어 원래 음성이 왜곡된다. 이와 같이 왜곡된 음성 신호를 처리할 때에는 군중잡음을 제거하는 과정이 반드시 필요하다. 본 논문에서는 군중잡음의 특성을 분석하고, 그 결과를 이용하여 음성 신호처리 시에 효과적으로 군중잡음만을 제거할 수 있는 모델을 제안한다. 제안된 모델은 시간 영역에서는 침묵 구간을 검출하여 마찰음과 파열음을 제거하는 과정과 주파수 영역에서는 잡음 평균을 생성하고 이를 이용한 스펙트럼 차감법(spectral subtraction)으로 군중 잡음을 제거하는 과정으로 이루어진다.

  • PDF