통합 검색 | Korea Science

가변 스텝 크기 알고리즘을 이용한 CATV 수신기용 블라인드 등화기의 성능 향상에 관한 연구 (A Study on the Performance Enhancement of Blind Equalizer for CATV Receiver Using the Variable Step Size Algorithm)

이현철;조일준;진현수;김성환
- 한국음향학회지
- /
- 제15권6호
- /
- pp.33-40
- /
- 1996
이 논문에서는 CATV 수신기에서 QAM 복조에 널리 이용되는 stop-and-go 알고리즘을 기본으로 한 블라인드 등화기의 상호 절충(trade-off)문제를 해결하였다. Stop-and-go 알고리즘은 탭 가중치의 적응 과정에서 최소 제곱 평균(least mean square) 알고리즘을 이용하였기 때문에 등화기의 구조가 간단하기는 하지만 전형적인 최소 제곱 평균 알고리즘과 같이 수렴 속도와 정상 상태 오차 사이에 상호 절충 문제가 존재한다. 정상 상태 오차를 일정한 수준으로 유지하면서 수렴 속도를 높이기 위해 가변 스텝 크기 알고리즘을 이용하였다. 동일 수준의 정상 상태 오차를 기준으로 하였을 때, 가변 스텝 크기 알고리즘을 이용한 stop-and-go 알고리즘이 상수 스텝 크기를 이용한 알고리즘에 비해 수렴 속도가 $36%{\sim}56%$ 향상되었다.
PDF

가변어휘 단어 인식기를 사용한 음성 명령 웹 브라우저 (Voice Command Web Browser Using Variable Vocabulary Word Recognizer)

이항섭
- 한국음향학회지
- /
- 제18권2호
- /
- pp.48-52
- /
- 1999
본 논문에서는 웹 브라우저 상에서 한국어 음성인식을 이용하여 정보검색을 할 수 있는 가변어휘 단어 인식기를 사용한 음성 명령 웹 브라우저에 대하여 기술한다. 이 시스템의 특징은 웹 브라우저 상에서 보여지는 링크를 가지는 HyperText Word들과 웹 브라우저 메뉴를 음성으로 인식할 수 있는 것으로, 마우스 click 뿐만이 아니라 음성인식을 이용하여서도 웹 브라우저를 사용할 수 있다는 것이다. 웹 브라우저를 통해서 보여지는 문서에서 추출되는 인식 후보들은 각 문서에 따라 고정되지 않고 계속하여 변화하므로, 이러한 가변적인 인식 후보들을 인식하기 위해 가변어휘 단어 인식기를 사용하였다. 가변어휘 단어 인식기는 훈련용 음성 데이터와 무관한 임의의 새로운 어휘를 훈련 없이 인식해 낼 수 있는 인식기로 POW (Phonetically Optimized Words) 3,848 단어를 사용하여 훈련한 결과 32단어에 대해 93.8%의 단어 인식률을 보인다. 음성 명령 웹 브라우저는 Windows 95/NT 환경에서 Netscape Navigator를 사용하여 개발되었으며, 사용자가 음성을 사용하는 새로운 인터페이스를 배울 필요 없이 바로 사용할 수 있도록 사용자 편의성 부분도 고려하여 개발되었다. 개발된 음성 명령 웹 브라우저는 환경 독립, 화자 독립에 대해 On-line으로 실험한 결과 평균 90%의 인식성능을 보인다.
PDF

가변 스텝 사이즈를 이용한 개선된 의사 인접 투사 알고리즘 (Enhanced Pseudo Affine Projection Algorithm with Variable Step-size)

정익주
- 한국음향학회지
- /
- 제31권2호
- /
- pp.79-86
- /
- 2012
NLMS 알고리즘의 수렴 특성을 개선하기 위해 제안된 인접 투사 알고리즘의 성능을 향상시킨 알고리즘을 제안하였다. 기존의 인접 투사 또는 의사 인접 투사 알고리즘은 지연된 입력 신호 벡터 및 오차 신호 벡터를 기반으로 하기 때문에 복잡할 뿐만 아니라, 기존의 스칼라 오차를 기반으로 하는 LMS 형 알고리즘에서 개발된 기법을 적용하는데 어려움이 있다. 본 논문에서는 의사 인접 투사 알고리즘의 경우, 스칼라 오차 신호를 이용한다는 사실과 수렴 후 입력 신호가 오차 신호에 직교한다는 직교 원리에 근거하여 적은 연산량으로도 우수한 수렴 성능을 보이는 가변 스텝 사이즈 알고리즘을 제안하였다. 시스템 확인 모델 하에서 컴퓨터 모의 실험을 통하여 제안된 알고리즘이 기존의 알고리즘들에 비하여 적은 연산량에도 불구하고 정상 및 비정상 환경에서 수렴 특성이 우수함을 보였다.
https://doi.org/10.7776/ASK.2012.31.2.079 인용 PDF KSCI

1차원 SPIHT를 이용한 가변 비트율 음성 부호기의 설계 (Design of a Variable Bit Rate Speech Coder Based on One-dimensional SPIHT)

나훈;정대권
- 한국음향학회지
- /
- 제22권6호
- /
- pp.443-451
- /
- 2003
코드북 기반의 CELP 부호기는 코드북에 미리 할당된 부호화 비트율에 따라서 여기 신호를 모델링한 후 코드북을 이용하여 음성신호를 합성한다. 따라서 임의의 다양한 비트율을 하나의 부호기에서 지원하지 못하는 단점이 있다. 본 논문에서 제안하는 가변 비트율 부호기는 웨이블렛 변환 (wavelet transform과 1차원 SPIHr (one dimensional SPIHT)를 이용하여 현재 프레임에 할당되는 비트수에 따라서 여기신호를 부호화한다. 또한 CELP 부호기의 경우처럼 특정한 몇 가지 형태로 여기신호(또는 코드북)를 모델링할 필요가 없고, 정확한 피치정보가 없어도 여기신호를 사용자의 요구에 따라 다양한 비트율로 부호화할 수 있다. 그 결과 코드북이 존재하지 않기 때문에 부호기의 복잡도가 낮으며, CELP 기반의 G.729와 G.723.1 부호기와의 음질 비교 결과 동등하거나 나은 결과를 보여준다.
PDF KSCI

고정된 공간 축 샘플링 간격을 적용한 뜯는 현악기의 현에 관한 물리적 모델링 (Physical Modeling of Plucked String Based on Fixed Spatial Sampling Interval)

강명수;김규년
- 한국음향학회지
- /
- 제20권1호
- /
- pp.3-12
- /
- 2001
뜯는 현악기의 물리적 모델에서는 선형 시스템에 의해 현을 따라 이동하는 파동이 모델링 된다. 현재 양질의 악기 음 합성을 위해 사용되는 물리적 모델링 방법은 J.O. Smith가 제안한 디지털 도파관[1] 이론을 기초로 한다. J.O. Smith는 디지털 도파관 모델을 유도하기 위해 파동 방정식의 해를 이용했으며, 시간 변수를 기준으로 한 모델을 유도했다. 본 논문에서는 기존의 이론에 파동 방정식의 공간 변수도 고려해 악기를 모델링 함으로써 기존의 디지털 도파관 모델을 변형한 새로운 모델을 제시하였다. 새로운 악기 모델에서는 파동의 속도에 관계없이 공간 변수의 샘플링 간격을 일정하게 유지한 상태에서 시간 변수의 변화에 따른 파동의 이동을 묘사할 수 있도록 하였다. 이렇게 함으로써 새로운 악기 모델은 악기의 물리적인 움직임을 더 정확히 묘사할 수 있으며, 결과적으로 더 좋은 음질의 뜯는 현악기 음을 합성할 수 있다.
PDF

음성학적 지식 기반 변이음 모델을 이용한 가변 어휘 단어 인식기 (Variable Vocabulary Word Recognizer using Phonetic Knowledge-based Allophone Model)

김회린;이항섭
- 한국음향학회지
- /
- 제16권2호
- /
- pp.31-35
- /
- 1997
본 논문에서는 훈련용 음성 데이터와 무관한 임의의 새로운 어휘를 인식해 낼 수 있는 가변 어휘 단어 인식기 개발에 대하여 기술한다. 가변 어휘 단어 인식기를 구현하기 위해서는, 인식 대상이 될 새로운 어휘를 즉시 발음 사전으로 변환시키는 on-line 발음 사전 생성기가 필요하고, 발음 사전 출력을 가지고 각 단어를 모델링할 수 있는 신뢰성 있는 음소 및 변이음 모델이 필요하다. 이와 같은 신뢰성 있는 음소 및 변이음 모델은 생성시키기 위하여 본 연구에서는, 각 음소의 전후 음소들의 음성학적 자질을 고려하여 3 음소열을 집단화(clustering)하여 변이음을 정의하고 이를 당 연구실이 보유하고 있는 POW(Phonetically Optimized Words) 3,848개 단어에 적용하여 1,548개의 변이음 모델을 생성시켰다. 이를 토대로 가변 어휘 단어 인식기를 구현하고 이를 POW 3,848 DB, PBW 445 DB 및 호텔 예약용 244 단어 DB 등에 적용하여 그 성능을 평가하였다. 평가 결과, POW DB에 대해서는 79.6%, PBW DB에 대해서는 445 단어 사전의 경우 79.4%, 100 단어 사전의 경우 88.9%의 성능을 보여 주었고, 호텔 예약 DB에 대해서는 71.4%의 성능을 보여 주었다.
PDF

트랜섬 파이프 간격이 동력대차-견인전동기간 강체 모드 공진응답에 미치는 영향에 관한 연구 (The influence of transom pipe gap on the resonance response in motorized bogie and traction motor system)

김재환;송시엽;임효석
- 한국음향학회지
- /
- 제38권3호
- /
- pp.340-343
- /
- 2019
본 논문은 동력차에서 견인전동기 기진 주파수와 견인전동기 강체 모드 공진 문제로 인해 발생할 수 있는 현상에 대해 소개하고, 이를 제어하는데 효과적인 설계인자를 해석적으로 검토해보았다. 회전 속도가 변하는 회전기기의 경우, 공진 문제를 해결하기 위해서는 공진주파수 대역을 상용 운전 범위 바깥으로 이동시키거나 동강성을 크게 하는 등의 방법을 통하여 공진 응답이 낮아지도록 하는 방안이 있다. 견인전동기의 운전 범위는 일반적으로 0 r/min ~ 4800 r/min으로 대차모드가 이 운전 영역대를 벗어나게 설계하는 것은 현실적으로 불가능 하다. 따라서 공진 응답에 영향을 주는 설계 인자를 찾아 이를 적절하게 조정하여야 한다. 유한요소 해석 검토 결과, 견인전동기 강체모드 공진 응답에 영향을 주는 설계인자는 트랜섬파이프 간격으로 간격이 지나치게 넓게 설계될 경우 견인전동기 기진력과 강체 모드 간 공진 시 과도한 진동이 발생될 수 있음을 파악하였다.
https://doi.org/10.7776/ASK.2019.38.3.340 인용 PDF KSCI HTML

가변어휘 음성인식기의 성능개선 (Performance Improvement of Variable Vocabulary Speech Recognizer)

김승희;김회린
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
- /
- pp.21-24
- /
- 1999
본 논문에서는 가변어휘 음성인식기의 성능개선 작업에 관한 내용을 기술하고 있다. 묵음을 포함한 총 40개의 문맥독립 음소모델을 사용한다. LDA 기법을 이용하여 동일차수의 특징벡터내에 보다 유용한 정보를 포함시키고, likelihood 계산시 가우시안 분포와 mixture weight에 대한 가중치를 달리 함으로써 성능향상을 볼 수 있었다. ETRI POW 3848 DB만을 사용하여 실험한 경우, $21.7\%$의 오류율 감소를 확인할 수 있었다. 잡음환경 및 어휘독립환경을 고려하여 POW 3848 DB와 PC 168 DB 및 PBW445 DB를 사용한 실험도 행하였으며, PBW 445 DB를 사용한 어휘독립 인식실험의 경우 $56.8\%$의 오류율 감소를 얻을 수 있었다.
PDF

한국어 연속음성중 키워드 인식을 위한 반연속 은닉 마코브 모델과 One-Pass 알고리즘의 개선방안 (Improvement of Semicontinuous Hiden Markov Models and One-Pass Algorithm for Recognition of Keywords in Korean Continuous Speech)

최관선
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1994년도 제11회 음성통신 및 신호처리 워크샵 논문집 (SCAS 11권 1호)
- /
- pp.358-363
- /
- 1994
This paper presents the improvement of the SCHMM using discrete VQ and One-Pass algorithm for keywords recognition in Korean continuous speech. The SCHMM using discrete VQ is a simple model that is composed of a variable mixture gaussian probability density function with dynamic mixture number. One-Pass algorithm is improved such that recognition rates are enhanced by fathoming any undesirable semisyllable with the low likelihood and the high duration penalty, and computation time is reduced by testing only the frame which is dissimilar to the previously testd frame. In recognition experiments for speaker-dependent case, the improved One-Pass algorithm has shown recognition rates as high as 99.7% and has reduced compution time by about 30% compared with the currently abailable one-pass algorithm.
PDF

파형 부호와 방식에 의한 정보압축과 퍼포먼스에 관한 연구 (The study on the information compression by coding method and its performance)

안동순
- 한국음향학회:학술대회논문집
- /
- 한국음향학회 1985년도 학술발표회 논문집
- /
- pp.68-71
- /
- 1985
In this paper, Sentence-Sip E Il Ka Gi Seo U1 E Gan Da was spoken by 4 men and 3 see sound is used for the experiment. A/D conversion time is 30 sec. Data are obtained using the microcomputer and compressed by ADPCM Rate of compression is 1/8. Data compressed by ADPCM are synthesized and compared to the original sound. Rate of speech identification is analysed using the sound pressure, white noise. Coding of ADPCM is done for 5bit. As the result of fixing starting voltage by 2.6V. It is acertained that variable value increases in initial speech signal and then process is made by minimum value "3". From the result of processing, synthesized sound is almost eaual to original sound. Minimum values cause distorition, Dummy Head System is used in this experiment.xperiment.
PDF

검색결과 143건 처리시간 0.032초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)