• 제목/요약/키워드: speech speed

검색결과 239건 처리시간 0.023초

VoIP 통화품질 개선을 위한 적응 재생 버퍼 제어 기법 (Adaptive Playout Buffer Control Method for Improvement of VoIP Speech Quality)

  • 강진아;고성택;임재윤
    • 한국콘텐츠학회:학술대회논문집
    • /
    • 한국콘텐츠학회 2006년도 추계 종합학술대회 논문집
    • /
    • pp.75-79
    • /
    • 2006
  • 실시간 음성 서비스를 지원하는 VoIP(Voice over IP) 시스템에서 음성 품질은 지연, 지터, 손실, 그리고 역전된 패킷 순서에 의해 손상된다. 본 논문에서는 적응 재생 알고리즘에 의해 지터를 보상하고 패킷 손실 보상을 수행하며 패킷 순서를 정렬하는 수신단의 적응 재생 버퍼 제어 기법(Adaptive Playout Buffer Control: APBC)을 제안하였다. 또한 임베디드 VoIP 시스템을 구현하여 구현 시스템에서의 APBC 성능을 측정한 결과, 처리속도는 257$\mu$sec로 실시간으로 처리하기에 적합하고 MOS(Mean Opinion Score)에 의한 음성 품질은 고정 재생 지연 알고리즘에 비해 18% 개선되었다.

  • PDF

Speech Interactive Agent on Car Navigation System Using Embedded ASR/DSR/TTS

  • Lee, Heung-Kyu;Kwon, Oh-Il;Ko, Han-Seok
    • 음성과학
    • /
    • 제11권2호
    • /
    • pp.181-192
    • /
    • 2004
  • This paper presents an efficient speech interactive agent rendering smooth car navigation and Telematics services, by employing embedded automatic speech recognition (ASR), distributed speech recognition (DSR) and text-to-speech (ITS) modules, all while enabling safe driving. A speech interactive agent is essentially a conversational tool providing command and control functions to drivers such' as enabling navigation task, audio/video manipulation, and E-commerce services through natural voice/response interactions between user and interface. While the benefits of automatic speech recognition and speech synthesizer have become well known, involved hardware resources are often limited and internal communication protocols are complex to achieve real time responses. As a result, performance degradation always exists in the embedded H/W system. To implement the speech interactive agent to accommodate the demands of user commands in real time, we propose to optimize the hardware dependent architectural codes for speed-up. In particular, we propose to provide a composite solution through memory reconfiguration and efficient arithmetic operation conversion, as well as invoking an effective out-of-vocabulary rejection algorithm, all made suitable for system operation under limited resources.

  • PDF

음성인식용 인터페이스의 사용편의성 평가 방법론 (A Usability Evaluation Method for Speech Recognition Interfaces)

  • 한성호;김범수
    • 대한인간공학회지
    • /
    • 제18권3호
    • /
    • pp.105-125
    • /
    • 1999
  • As speech is the human being's most natural communication medium, using it gives many advantages. Currently, most user interfaces of a computer are using a mouse/keyboard type but the interface using speech recognition is expected to replace them or at least be used as a tool for supporting it. Despite the advantages, the speech recognition interface is not that popular because of technical difficulties such as recognition accuracy and slow response time to name a few. Nevertheless, it is important to optimize the human-computer system performance by improving the usability. This paper presents a set of guidelines for designing speech recognition interfaces and provides a method for evaluating the usability. A total of 113 guidelines are suggested to improve the usability of speech-recognition interfaces. The evaluation method consists of four major procedures: user interface evaluation; function evaluation; vocabulary estimation; and recognition speed/accuracy evaluation. Each procedure is described along with proper techniques for efficient evaluation.

  • PDF

발화속도가 경계앞 음절 길이에 미치는 영향 (The Effects of the Speaking Rate on the Duration of Syllable before Boundary)

  • 이순향;구희산
    • 음성과학
    • /
    • 제1권
    • /
    • pp.103-111
    • /
    • 1997
  • The purpose of this study was to investigate the effect of the speaking rate on the duration of syllable before boundary. The materials used were four types of syllable-boundary sequences(Go-'Ga' Boundary-Gu) in a paragraph. The duration of 'Ga' syllables before 4 level of boundary was measured, and all of the measurements were taken from signals and spectrograms made by the $Signalyze^{TM}$ 3.04 for Power Mac 7200. Subjects were six female speakers who read the materials at fast, normal, and slow speed five times. The results show that (1) the slower the speaking rate becomes, the longer the duration of syllable before boundary, (2) the duration rank of syllable before each boundary does not correspond to the level of boundary, eg. at fast speed, = < #, + < $ ; at normal speed, +, #, = < $ ; at slow speed, + < =, #, $, and (3) the syllable before sentence boundary is less influenced than syllable before another boundary.

  • PDF

적응잡음제거기의 성능향상을 위한 웨이브렛 기반 적응알고리즘에 관한 연구 (A Study on Adaptive Algorithm Based on Wavelet Transform for Adaptive Noise Canceler Improvement)

  • 이채욱;김도형;오신범
    • 한국산업정보학회논문지
    • /
    • 제7권2호
    • /
    • pp.68-73
    • /
    • 2002
  • 빠른 수렴속도를 얻기 위해서 LS(Least Square)에 기초한 적응 알고리즘에 대한 연구가 많이 이루어지고 있다. 본 논문에서는 수렴속도의 향상 그리고 계산량의 감소를 위하여 웨이브렛 기반 적응알고리즘을 제안하고, 음성신호의 특성에 따라서 두 가지 구조의 형태로 적응잡음 제거기에 적용시켰다. 컴퓨터 시뮬레이션을 통하여 기존의 시간영역 적응알고리즘, 주파수영역 적응알고리즘 그리고 제안한 알고리즘을 적응잡음제거기에 적용하여 비교하였다. 그 결과 제안한 알고리즘은 음성을 사용하는 적응신호처리 분야에 적합하다는 것을 확인하였다.

  • PDF

실시간 음성분석도구의 MatLab 구현 (Matlab Implementation of Real-time Speech Analysis Tool)

  • 박일서;김대현;조철우
    • 대한음성학회지:말소리
    • /
    • 제44호
    • /
    • pp.93-104
    • /
    • 2002
  • There are many speech analysis tools available. Among them real-time analysis tool is very useful for interactive experiments. A real-time speech analysis tool was implemented using Matlab. Matlab is a very widely used general purpose signal processing tool. In general, its computational speed is relatively lower than that of the codes from conventional programming languages. Especially, real-time analysis including input of signal and output of the result was not possible in the past. However, due to the improvement of computing power of PCs and inclusion of real-time I/O toolboxes in Matlab, real-time analysis is now possible in some extent by Matlab only. In this experiment, we tried to implement a real-time speech analysis tool using Matlab. Pitch and spectral information is computed in real-time. From the result it is shown that such real-time applications can be implemented easily using Matlab.

  • PDF

G.729 음성 복호화기와 듀얼 SOLA 알고리즘을 통합한 최적의 음성 속도 변환 시스템 (Optimized Time Scale Modification (TSM) System Integrating G,729 Speech Decoder and Dual SOLA Algorithm)

  • 박규식;오승록;김선영
    • 한국음향학회지
    • /
    • 제21권3호
    • /
    • pp.293-303
    • /
    • 2002
  • 본 논문에서는 ITU G.729 음성 복호화기와 듀얼 SOLA (Synchronized Overlap-Add)알고리듬을 통합한 최적의 음성 속도 변환시스템 (TSM)을 구현한다. 제안된 시스템은 ITU G.729 음성 복호화기를 통한 8 Khz 80 샘플/프레임 단위의 음성 신호를 입력으로 가정하여 듀얼 SOLA를 통해 사용자가 원하는 음성 속도에 맞추어 출력, 음성을 천천히 혹은 빠르게 최적화된 음성 품질로의 재생을 가능하게 한다. 특히 본 논문에서 제안된 듀얼 SOLA는 다양한 SOLA 파라미터에 대한 모의실험과 이론적 분석에 의거하여 ITU G.729 복호화기 음성 신호에 대한 최적화된 음성 재생 변환 기능을 제공하며, 입력 음성신호의 부가적인 인터폴레이션 (interpolation) 과정을 첨가하여 최대 2배 빠르기 혹은 2배 느리기의 극한 속도율에서도 우수한 성능의 통합 음성 속도 변환 시스템을 구현할 수 있다. 제안된 시스템은 다양한 입력 음성신호와 재생 속도에 대한 모의실험을 걸쳐 그 성능을 검증한다.

정상 청력 아동의 음절 간 쉼 간격에 따른 어음이해도 변화 (Changes of Speech Discrimination Score Depending on Inter-syllable Pause Duration in Normal Hearing Children)

  • 박정인;이지연;허승덕
    • 재활복지공학회논문지
    • /
    • 제8권2호
    • /
    • pp.139-144
    • /
    • 2014
  • 어음 이해는 발화속도에 영향을 받는다. 발화속도는 쉼 간격으로 조절할 수 있는데, 쉼 간격은 정보 처리과정에서 여유 시간을 가질 수 있어서 정보의 과부하를 피할 수 있다. 이 연구는 쉼 간격이 노화에 따른 청력손실과 청각재활, 청각처리 과정에 미치는 영향을 알아보기 위한 기초 연구로서 그 정상치를 알아보고자 한다. 연구 대상은 청각학 및 언어병리학적 문제가 없는 일반 초등학생 남자 7명, 여자 8명으로 하였다. 검사 도구는 3음절 20개를 1 set으로, 모두 4 set를 제작하였다. 이들 모든 낱말은 각각 보통(250 ms), 느린(500 ms), 아주 느린(1000 ms) 속도로 쉼 간격을 조절하였다. 선택용 보기는 올바르게 표기한 3음절 낱말 하나와 음소 하나씩을 오류 표기한 세 개의 낱말을 포함한 4개의 낱말로 하였다. 대상자에게는 3음절 낱말을 들려 준 후, 하나를 선택하게 하였다. 연구 결과 쉼 간격에 따른 평균 어음이해도는 250, 500, 1,000 ms의 순서로 $73{\pm}19.4%$, $84{\pm}12.2%$, $88{\pm}8.8%$로 각각 나타났다.

  • PDF