Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)
The Acoustical Society of Korea
- Semi Annual
Domain
- Physics > Interdisciplinary Physics
1993.06a
-
실내 음향특성의 컴퓨터 씨뮬레이션 기법은 모형실험 기법과 더불어 건축물의 음향설계 분야에서 널리 사용되는 도구이다. 본 연구에서는 건축물의 음향특성을 설계단계에 예측하기 위해 영상법에 기초한 실내음향 해석 소프트웨어를 개발하였다. 개발된 소프트웨어는 건축물의 3차원 형상모델, 벽면등 반사체의 흡음특성, 음원과 수음점의 위치 등의 데이터를 입력하면, 음선의 전파경로, 수음위치에서의 반사음 패턴, 실내 음향 특성의 평가척 (음의 명료도, 잔향시간 등)을 산출하여 출력하는 기능을 지니고 있다. 기존의 씨뮬레이션 기법이 소요 장비나 비용, 시간적 제약으로 널리 실용화되기 어려웠던 점을 고려하여 PC급에서 간편하게 활용할 수 있도록 개발하였고 음선 전차경로의 그래픽 표현, 반사음 패턴의 분석등, 건축물의 음향 설계를 위한 기능을 부여하는데 중점을 두었다.
-
본 연구에서는 엘리베이터 용량, 속도, 제어방식, 아파트 건설공법(현장타설공법 및 조립식공법), 승강로의 벽 및 천장구조 등 여러 요인별로 현장에서 엘리베이터 운행시 소음.진동량을 실측하고 문제점을 파악한 후, 현형 설계여건을 고려하여 PC구조아파트에 적용할 수 있는 효과적인 저감공법을 제시하였다.
-
본 연구에서는 공동주택의 바닥충격음 차음성능 향상을 위한 설계자료의 제시를 위해 천장구조가 서로 다른 공동주택을 대상으로 경량 및 중량 바닥충격음의 현장측정을 통하여 공동주택의 천장구조에 의한 바닥충격음 변화특성을 분석하고 차음성능을 평가하였다. 측정대상 건물에서 천장을 설치한 경우가 비교적 높은 충격음 차음성능 분포를 보이는 것으로 나타났으며, 바닥슬래브 하부 천장에 공기층과 완충재를 함께 설치하는 것은 기존 공동주택 등에서 경량 및 중량 바닥충격음 차음성능을 향상시키기 위한 효과적인 방안임을 확인하였다.
-
The acoustic mode of a perforated tube muffler was investigated both theoretically and experimentally to explain the cavity-tones induced by through-flow. The cutoff frequencies for the axisymmetric modes were obtained and confirmed experimentally. It was found that the cutoff frequencies are decreased significantly by the perforated tube. The onset frequencies of the cavity-tones were compared with the cutoff frequencies of the acoustic mode and it was found that the cavity-tones are induced by the radial acoustic modes and their frequency stages are coincident with the discrete cutoff frequencies.
-
실린더 형태의 관에서, 소음발생과 소음의 제어를 위해서는 실린더 운동 방정식이 필요하다. 지금까지 많은 음향 학자 등에 의해 실린더 운동 방정식이 유도되었다. 본 논문에서는, z 방향으로 에너지 흐름의 계산을 위해 실린더 벽 두께(h)사이의 임의의 점에서 z와
$\phi$ 방향의 strain과 stress을 고려하여 새로운 실린더 운동 방정식을 유도하였다. -
펄스레이저를 고체표면에 조사하면 광-음향효과에 의해 입사지점에서 음향파원이 형성되고 음향파원의 형태와 재료의 특성에 따라 여러 유형의 종파, 횡파 및 표면파의 음향에너지가 발생된다. 본 연구에서는 열탄성영역과 플라스마영역에서 종파와 횡파의 변위파형을 해석하여 모의실험을 수행하였다. 실험에서는 KrF엑시머레이저를 탄소강, 알루미늄, 황동에 조사하여 플라스마영역에서의 광-음향신호를 검출하였으며 이론과 비교하여 분석하였다.
-
End-to-end 디지틀화를 실현하는 종합정보통신망 (ISDN)의 도입으로 음성통신 서비스의 통화품질에 대한 열화요인 및 영향이 기존의 망이나 단말기와는 다른 특성을 갖게 된다. 이러한 변화는 종합정보통신망이나 ISDN 전화기의 전송품질 기준을 새롭게 규정하여야 할 필요성을 도출시킨다. 본 논문에서는 ISDN 전화기의 전송품질 기준을 규정하기 위한 품질평가의 특성들을 기술하고, 이 특성들을 평가하기 위한 음량정격 기준의 설계에 대해서 기술하였다.
-
ISDN에 기초한 음성 서비스가 가능해지고 망이 점차 광대역 ISDN으로 진화함에 따라, ISDN 전화기의 송화자 에코의 적절한 규정이 필요하며, 이는 ISDN 전화기의 송화 및 수화음량정격 및 단말결합손실에 의해 좌우된다. 따라서, 전화기의 송화 및 수화음량정격이 규정되어질 경우, 에코가 없는 전화통화를 할 수 있는 단말결합손실의 규정이 필요하며, 실질적으로 이에 대한 규정은 가중 단말결합손실(weighted terminal coupling loss ; TCLw)과 에코 안정손실(stability loss)로 분류되어 규정될 수 있다. 본고에서는 이와 관련된 국제기준을 고찰하고, 국내기준의 제안과 단말결합손실 및 안정손실의 측정결과에 대해서 기술한다.
-
본 논문은 스피커 시스템의 이상적이지 못한 특성으로 인해 발생하는 비선형 왜곡을 분석하고 스피커에 입력하는 신호를 처리함으로써 비선형 왜곡을 감소시키도록 하는 것을 목적으로 한다. 비선형 왜곡의 가장 큰 요인인 강성과 force factor의 비선형성을 변위에 관한 2차함수로 모델링하여 이것을 바탕으로 전처리의 여러 계수를 결정하며 변위를 측정하여 귀환시키는 대신 선형 운동방정식을 적용하여 변위를 예측하도록 함으로써 시스템의 구현을 간단히 할 수 있도록 하였다. 이 왜곡보상시스템을 하드웨어로 설계하였다.
-
진동판 변위에 따라 변화하는 스피커의 비선형 강성과 비선형 force factor를 간단히 함수로 모델링하고 각각의 계수를 구하는 방법을 살펴보았다. 강서의 계수를 구하는데 있어서 질량을 부가하는 기계적인 방법을 사용하여 강성과 force factor 간의 커플링을 배제하도록 하였으며, 공진시 스피커로 입력되는 전압, 전류 파형으로부터 force factor의 함수를 얻어 curve fitting 함으로써 force factor의 계수를 얻을 수 있게 하였다. 실험시 변위의 측정은 밀폐형 스피커의 내부 음압을 측정하여 변위를 간접측정하는 방법을 사용하였다.
-
A method to measure the distortions of the loudspeaker at low frequencies without an anechoic chamber is proposed. This method utilizes the fact that the n-th harmonic distortion outside the enclosure is boosted by 40log n dB compared to that inside the enclosure. By compensating for the effect of standing waves occuring inside the enclosure, it is possible to predict the distortions for wide frequency ranges below the first break-up frequency of the diaphragm. The method is applicable to the intermodulation distortion as well.
-
본 논문에서는 변화가 심한 음원파형을 추정하는 새로운 순차처리 알고리듬을 제안한다. 먼저, 1) 기존의 순차처리 분석법중 대표적인 분석법인 RLS(recursive least square)의 문제점들을 검토하고, 2) 이를 개선하기 위해서 관측행렬(observation matrix)을 최적차수의 SVD(reduced-rank singular value decomposition)로 재구성하고, 3) 이에 견실개념(robustness concept)을 적용해서 최적의 성도변수(vocal tract parameter)를 찾아내고 역필터를 적용해서 음원(voice source)을 효과적으로 구분해낸다. 본 논문에서 제안된 방법으로 음원을 추정할 경우, 변화가 심한 음원파형을 잘 추정할 수 있으며, 음원의 특성을 구분해낸 성도 파라미터도 효과적으로 추정할 수 있다. 본 연구내용은 음성합성에서 자연성 개선 및 개인성 구현을 위해서 필수적이며, 다양한 형태의 음성을 표현하기 위해 사용되어질 수 있다. 또한, 음성코딩, 화자인식, 음성인식에서도 사용되어질 수 있다.
-
본 논문에서는 양질의 규칙합성을 얻기 위하여, 유성음에 대한 여기신호로 임펄스 스펙트럼과 노이즈 스펙트럼을 다중대역으로 혼합하여 생성한 여기신호를 규칙합성에 적용하는 방법을 제안한다. 이 방법에서는, 분석합성에서 각 프레임별로 요구되었던 혼합여기신호에 대한 정보량 문제를 해결하기 위해 유성음의 정상부분의 한 프레임에 대해 혼합여기신호를 구하여 규칙합성에 적용하였고, 정보량을 더욱 줄이는 방안으로, 켑스트럼 유클리디안 거리를 이용하여 유성음을 분류하여, 각 그룹에 대한 대표 여기신호를 규칙합성의 여기신호로 사용하였다. 제안된 방법으로 음성을 합성한 결과 양질의 합성음을 얻을 수 있음을 확인하였다.
-
본 연구에서는 50음절로 구성된 5세트의 명료도 평가용 단음절 목록을 개발하고, 그 목록에 대한 타당성을 검증하기 위하여 S/N비에 따른 단어와 양이조건, 그리고 주파수 대역 변화에 따른 명료도 실험을 실시하였다. 각 실험조건에서의 사후비교 결과, 목록간에 어떠한 유의미한 차이도 없었으며, 전체 실험자료를 종합하여 목록간 상관계수를 도출한 결과, 실험에 사용한 5개 목록간에는 거의 완전한 상관을 보였다.
-
In speech signal processing, it is necessary to detect exactly the pitch. The algorithms of pitch extraction which have been proposed until now are difficult to detect pitches over wide range speech signals. Thus we propose a new algorithm which uses the G-peak extraction to do it. It is the method that finds the most MZI(maximum zero-crossing interval) at each frame and convolve it with speech signal ; this is the same with passing speech signals to variable LPF. Finally we obtained the pitch, improve the accuracy of pitch detection and extract it with the high speed.
-
본 논문은 한국어 문어변환(TTS:Text-to-Speech) 시스템내에서의 음성합성시 음질 및 자연성 개선을 위한 연구 결과이다. 합성음 평가방법으로는 한국어 발음대사전에 수록된 빈도수 순위대로 추출한 음절(V형: 19개, CV형:80개, VC형:30개, CVC형: 100개, 총 229개)을 대상으로 규칙합성시킨 1음절어(합성음절수:229개)중 음절유형별로 15개씩 총 60개 음절을 20초간 3회 반복음의 녹음 테이프를 작성한 합성음에 대하여 사전지식이 없는 임의의 그룹을 선정하여 이해도, 명료도, 잡음감, 자연성 등 4 가지 항목에 대하여 오피니온 평가를 수행한 결과를 제시하였다.
-
본 논문은 한국전자통신연구소 음성응용연구실에서 개발한 문자-음성변환 시스팀(Text-to-Speech Conversion System)의 음질개선 연구의 일환으로 Phoneme-Balanced Words 110개에 대해서 개선전 시스팀(V.1)과 개선 후 시스팀(v.2)을 대상으로 각각 실시한 명료도 실험결과에 대하여 기술하고 있다. 본 실험의 목적은 연구개발자 입장에서 합성음 개선에 대한 정량적 성과 및 문제점 파악을 위한 진단형 평가이며 남자 5명, 여자 5명을 대상으로 1회 실시한 청취 실험결과 V.1에 대해서는 최저 37.3%(41개) ~ 최고 55.5%(61개)이고, V.2에 대해서는 최고 39.1%(43개) ~ 최고 60.9%(67개) 결과를 얻었다.
-
In this paper, we examine the method of articulation test which is effective in evaluating the speech quality in mobile communication. The korean monosyllable lists for articulation test are developed based upon the frequency of occurrence of korean monosyllables used under natural environment. The monosyllable articulation lists are recorded through the public switch telecommunication network(PSTN) and mobile telecommunication system. The recorded lists are presented to the listeners through the headphone in order to deep the listening conditions equal. It is showen that the articulation lists perform well under different signal-to-noise ratios and the restriction of some frequency ranges. Some articulation scores obtained within the PSTN and between the mobile communication system and PSTN are presented.
-
In this paper, we propose the modified VQ, applied correlation between codewords in order to reduce the error rate due to personal and speakers' temporal variation. Such a modified VQ is used in the stage of preprocessing of HMM and the temporal variation is absorbed by nonlinear Decimation and Interpolation of vowel part that we obtain higher recognition rate than not so case. The objects of experiment are Korea 142 DDD regional names and we show that the proposed method increase the recognition rate.
-
본 논문에서는 변형된 wavelet 변환을 통해 추출한 특징벡터를 이용하여 한국어 숫자음을 대상으로 한 음성인식기를 구현하였다. wavelet 변환은 시간 및 주파수 영역에 대해 다중해상도(multiresolution)를 가지는 신호분석법이다. 본 연구에서는 계산량의 감소와 넓은 주파수 대역을 분석하기 위해, mother wavelet의 형태를 분석 주파수 대역에 따라 변화시키는 방법을 제안하였다. 기존의 wavelet 변환으로 실험한 결과 86.5%의 인식율을 얻었고, 변형된 wavelet 변환의 경우 96%의 인식율을 얻었으며 계산량이 감소하였다. 이와 함께 음성인식에서 널리 사용되는 특징 파라미터인 멜켑스트럼과 FFT 멜스케일 필터 대역(mel scale filter bank)과 비교 실험한 결과 인식율의 향상을 보였다. 이는 제안한 방법이 고주파 대역의 세밀한 시간 해상도와 저주파 대역의 세밀한 주파수 해상도를 지니는데 기인하는 것으로 판단된다.
-
In this paper, we explore the possibility of URAN(Universally Reconstructable Artificial Neural-network) VLSI chip for speech recognition. URAN, a newly developed analog-digital hybrid neural chip, is discussed in respects to its input, output, and weight accuracy and their relations to its performance on speaker independent digit recognition. Multi-layer perceptron(MLP) nets including a large frame input layer are used to recognize a digit syllable at a forward retrieval. The simulation results using the full and limited floating precision computations for the input, output, and weight variables of the network give the comparable classification performance. An MLP with piecewise linear hidden and output units is also trained successfully using low accuracy computation.
-
This paper is a study on the word recognition using neural network. A limited vocabulary, speaker independent, isolated word recognition system has been built. This system recognizes isolated word without performing segmentation, phoneme identification, or dynamic time wrapping. It needs a static pattern approach to recognize a spatio-temporal pattern. The preprocessing only includes preceding and tailing silence removal, and word length determination. A LPC analysis is performed on each of 24 equally spaced frames. The PARCOR coefficients plus 3 other features from each frame is extracted. In order to simplify a structure of neural network, we composed binary code form to decrease output nodes.
-
오디오 혹은 비디오화의, 방송 고품질전화 등의 음성신호의 전송을 위해 마련된 CCITT Recommendation G.722에 의거 Codec을 구성하고 이를 통과한 연속음성을 CMU의 불특정 화자 연속음성인식 시스템인 SPHINX에 입력하여 인식률을 조사 한 후 CODING전의 인식결과와 비교하였다. 이때 CODEC은 크게 네 부분(Trans Quarature Mirror Filter, Encoder, Decoder, Receive QMF)으로 구성하고 입력음성 데이터는 150화자에 의한 1018문장을 훈련용으로, 140문장을 테스트용으로 하였을 때의 단어 인식률을 인식률로 하였다. 또 이때 특징벡터로는 12차 Melcepstrum 계수를 사용하였다. 인식결과 코딩전(close talk Mic를 이용하여 직접입력)의 단어 인식률이 86.7%인데 비해 코딩후의 인식률은 85.6%로 나타나 약 1%의 인식률 저하를 가져와 코딩으로 인한 Error에 비해 비교적 양호한 결과를 얻을 수 있었다. 인식률 저하의 원인으로서는 코딩시의 BER(Bit Error Rate)에 의한 것으로 생각된다.
-
정적지도 화자적응기법에서 스펙트럼 거리에 의존하는 비선형적인 스펙트럼사상법을 이용하여 잡음환경에서의 음성인식방법에 관하여 연구한 결과, Top2에서 인식율의 향상을 얻어 그 유효성을 확인하였다. 본 연구에서는 스펙트럼 거리에 의존하지 않는 선형 스펙트럼 사상법을 제시하고 그에 의한 잡음환경의 음성인식결과를 비선형적인 스펙트럼 사상법에 의한 결과와 비교하였다. 그 결과, 인식율이 개선되었을 뿐만 아니라, Top1에서도 인식율이 향상되어 선형 스펙트럼사상법이 잡음환경음성인식방법으로 효과적인 방법임을 확인하였다.
-
초음파 흡수에 의한 단백질에서의 온도 변화 특성을 관측하기 위하여, 간단한 조직의 형태인 계란 흰자와 계란 흰자의 주성분인 물과 알부민 수용액을 시료로 선택하여, 초음파 흡수에 의한 온도 변화 특성을 물리 음향학적으로 관측하였다. 수 MHz의 초음파를 집속형 변환기에서 연속파의 형태로 시료에 투사하였을 때, 한정된 시료에서의 온도 변화를 측정하였다. 측정결과, 물과 알부민 성분에 의한 온도 증가 효과는 미미함을 알 수 있었다. 초음파 흡수에 의한 계란 흰자에서의 온도 변화는 단백질의 주성분인 알부민에 의한 효과보다는, 단백질을 구성하고 있는 각 성분들의 결합에 의한 효과가 큼을 알 수 있다. 이들 결과에 대한 이론적 검토로부터 초음파 흡수에 의한 인체내 온도 변화 및 부작용에 대한 초음파 강도의 안전기준의 토대 마련이 가능함을 제시하였다.
-
In this paper, the features extraction of reflected signals from various type of defects existing in the solid has been studied by Wiener filtering technique. In this experiment, three types of the defect have been considered; a flat cut, a angular cut and a circular hole. All of the defects have the same size, 20mm in diameter and have been located at 45mm in depth from the aluminum surface. In the result of the experiment, it has been found that the wiener filtering technique used for features extraction from the reflected signal corresponding to each defect have been very effective for defect classification.
-
초음파 변환기의 방사 컨덕턴스를 결정하기 위해서는 변환기로부터 방사된 음향파워와 입력전압의 정밀측정을 요구하게 된다. 음\ulcorner파워는 초음파를 거의 완전 반사시킬 수 있는 표적을 사용하여 변환기로부터 방사된 음압에 의해 표적에 가해진 힘을 수동맞저울과 레이저 간섭계로 측정하여 구하였으며, 입력전압을 열 변환기와 전압계를 한 시스템으로 하여 정밀 측정하였다. 방사 컨덕턴스의 최대 측정오차는
$\pm$ 4% 이내로 평가되었다. -
물 속에 만들어진 공기방울들은 각자 자신의 반지름에 반비례하는 공진주파수로 음파를 방출하며, 많은 공기방울들이 모인 공기방울 집단은 집단의 전체 크기에 반비례하는 집단 공진주파수를 가진다는 현상이 그동안 연구되어 왔다. 그러나, 수십, 수백 개의 유한한 개수를 가진 공기방울들의 음파방출 주파수 특성 연구는 부족한 실정이다. 본 연구에서는 수중에 일차원 배열의 공기방울들을 발생시켜 공기방울들에서 나오는 음파방출 주파수를 측정하였다. 수중에 형성된 공기방울들은 그들 간에 거리 간격이 존재하므로 본 연구에서는 공기방울들 간의 상호작용이 변화한다고 간주한 유효 결합 조화진동자 모형을 새로이 만들어 해석하였으며, 실험값과 좋은 이치를 보여주었다.
-
능동 소나 체계에서 표적의 탐지거리 예측을 위하여 소나방정식이 이용되는데, 이는 음원 준위, 전달 손실, 표적 강도, 복반사 준위, 소음 준위, 방향성 이득, Detection threshold, Signal excess, 탐지 확률과 탐지거리의 요소로 구성된다. 본 연구에서는 능동 소나 체계에서 소나 깊이와 표적 깊이의 함수인 탐지거리를 계산하기 위한 알고리즘에 대해 살펴보았다. 소나의 각 요소와 환경이 주어졌을 때 SAFARI 모델을 이용하여 각 수신기의 깊이와 거리에서의 전달손실을 계산하였으며, 구하여진 전달 손실과 배경 소음 준위를 이용하여 Signal excess를 계산하였다. ROC(Receiver-operating-characteristic) 곡선을 이용하여 Signal excess를 탐지 확률로 계산한 후 두 항을 곱하여 각 깊이별 거리로 적분함으로서 탐지거리를 구하였다. 주파수 30Hz의 전방향 음원을 사용하여 여름의 일반적 음속 분포에서 계산한 결과 100m 음원 보다 300m 음원에서 상대적으로 큰 탐지거리를 얻었으며 각 음원 깊이별 평균 탐지거리는 100m 이하의 표면을 제외한 500m 까지는 거의 일정함을 알 수 있었다.
-
In the ocean bubble layers play a significant role in the sound propagation as well as sound generation. Most of early works dealt with acoustic properties of the bubble layers with sharp flat boundaries. Bubble layers with sharp flat boundaries. Bubble layers with transition sublayers are more likely in the coean. In this paper a theory of sound propagation through plane bubble layers with transition sublayers at both borders was developed. It shows that the reflection and transmission coefficients depend on the thickness of transition sublayers. The theory with thicker transition sublayers shows weaker resonance properties of bubble layer. It gives better presentation for the peculiar behavior of the experimental data than that with sharp flat boundaries.
-
해수의 물리적 성질 변화에 의한 수중음속 변화는 수중음파 전파에 커다란 영향을 미친다. 매질변동에 의한 음파 전파경로 변동특성, 즉 음파 도달시간 변동에 의한 매질변위량 추정으로 해양을 탐사하는“해양음향 토모그라피”를 운용하기 위하여 비균질 매질에서의 음파 전파경로 파악이 우선이다. 수심이 일정한 비균질한 매질에서의 음파 전파경로를 파악하기 위해 파동방정식의 해를 Ray theory에 의거 ray path를 구하고 송,수신기 사이를 연결하는 eigenray 정보를 얻었다. 음원의 주파수가 400Hz(
$\pm$ 25Hz), pulse length가 20ms인 LFM pulse를 사용하였다. 이 음원을 동해의 최소음속층에서 송,수신하였을 경우 음원에서 150Km 떨어진 수신기에 도달한 신호는 평균음속분포 일 때 보다 약 66ms 정도 빨리 도착한다. 또한 Eigenray 정보에 의거 모의된 수신신호는 토모그라피 운용을 위한 필수 조건인 ray path의 식별, 안정성, 그리고 분해능을 만족한다. 또한 모의 수신신호 음파 도달시간 변동 분석으로 송,수신기 사이의 매질 변동을 파악 할 수 있다. -
A decision-theoretic concept is introduced to investigate whether targets of interest in array sensor systems are present at some steering direction or not. The solutions to this problem are described as a set of simple numbers 0 or 1 corresponding to the direction under consideration. This coded number representation is transplanted in the optimisation technique based on the Hopfield neural network, which may provide a new aspect of determining the direction of arrival (DOA) of sources. To cast the perspectives of the proposed approach and illustrate its effectiveness in source direction finding in array sensor systems, simulation results and related discussions are presented in this paper.
-
The main purpose of this paper is to verify the effectiveness of a high resolution direction finding method, so called the‘averaged MUSIC’. This method uses a new sample array covariance matrix that consists of diagonal components obtained by taking averages of the diagonal component values of the sample covariance matrix for the MUSIC. The paper shows that the proposed method performs higher resolved direction-of-arrival estimation and better resolution probability than the MUSIC in such cases as low signal-to-noise ratio, when the number of sensors used is finite, based on the statistical analysis.
-
There are two general techniques to observe particle movements in fluid. One is the acoustic time domain correlation technique and another is the frequency domain Doppler-shift techniques. Both techniques were reviewed and mentioned their some merits and demerits in ocean wave and current observation. Some possible application of acoustic time domain correlation technique in ocean wind wave measurement was discussed.
-
일반적임 빔 형성기는 표적의 방위탐지가 가능하지만, 구조적인 특성상 대칭적인 빔을 형성하므로 표적의 좌/우 방위 구분이 불가능하기 때문에 표적의 정확한 방위를 탐지하고자 할 때 좌/우 구분이 가능한 빔 형성기가 필수적이다. 좌/우 분리 빔 형성 기법으로는 카디오이드(Cardioid) 빔 형성기법을 일반적인 빔 형성기에 적용시키는 방법이 최적으로 알려져 왔다. 그러나 좌/우 분리 빔을 형성하기 위해서는 많은 연산량과 하드웨어 설계에 대한 고려가 있어야한다. 본 논문에서는 좌/우 분리 빔 형성을 위하여 주파수 빔 형성기법과 카디오이드 빔 형성기법을 합성하여 적용하였다. 주파수 빔 형성 기법은 짧은 수행시간 동안에 표적의 정보추출을 위하여 고려되었으며, 카디오이드 빔 형성기법은 3개의 센서를 이용하여 센서의 기울기를 보상하여 수행하는 기법을 적용하였다. 또한 방향성 있는 시뮬레이션 신호를 생성하여 좌/우 분리 빔 형성 시뮬레이션을 수행하였다.
-
이 논문은 최근에 개발된 실시간 음성부 검출 알고리즘[1]을 TMS320C30 System board와 IBM PC486을 이용한 implementation에 관한 논문이다. 음성부 검출 알고리즘은 Energy와 LCR(Level Crossing Rate)를 이용하여 각 frame을 음성/묵음으로 분류하는 방법을 사용하였고 DSP 보드를 사용하여 한 frame이 입력되면 다음 frame이 입력되기 전에 그 frame에 대한 음성/묵음 분류를 하여 음성입력이 끝남과 동시에 음성이라고 판단되는 부분만을 DPS moemory상에 저장하므로 불필요한 memory의 낭비를 중이고 다음 단계의 음성처리를 위한 시간을 절약하였다. 이 알고리즘의 성능 평가를 위하여 Rabiner와 Sambur의 알고리즘과 한민수의 알고리즘과를 전문가가 수작업으로 찾아낸 결과와 비교 평가하였다. 알고리즘의 오차는 평균 남성 4.925ms, 여성 5.85ms로 1 frame 이내의 오차를 보였다.
-
본 논문에서는 패턴 매칭 방법에 근거하여 인식 단위가 음소인 음소 기반 인식 시스템을 구성하였다. 선택한 신경망 구조는 생물학적 신경망인 코호넨(T. Kohonen)의 SOFM(Self-Organizing Feature Map)으로 패턴 매칭 과정 중 cluster로 사용하였다. SOFM 신경망은 신호 공간에 대해서 최적의 국소(局所) 해부적 사사에 의한 자기 조직화 과정을 수행하며, 그 결과 인식 문제에 있어서 상당히 높은 정확도를 나타낸다. 따라서 SOFM 신경망은 음소 인식에도 효과적으로 응용될 수 있다. 또한 음소 인식 시스템의 성능 향상을 위해 K-means 클러스터링 알고리즘이 결합된 학습 알고리즘을 제안하였다. 제안된 음소 인식 시스템의 성능을 평가하기 위해, 먼저, 우리말 음소들을 모음, 파열음, 마찰음, 파찰음, 유음 및 비음, 종성의 6개 음소군으로 분류하고 각 음소군에 대한 특징 지도를 구성하여 labeler의 기능을 수행하게 하였다. 화자 종속 인식실험 결과 87.2%의 인식률을 보였으며 제안한 학습법의 빠른 수렴성과 인식률 향상을 확인하였다.
-
We present a new method to normalize spectral variations of different speakers based on physiological studies of hearing. The proposed method uses the cochlear frequency map to warp the input speech spectra by interpolation or decimation. Using this normalization method, we can obtain much improved recognition results for speaker independent speech recognition.
-
예측신경회로망 모델은 다층 퍼셉트론을 연속되는 음성특징 벡터간의 비선형예측기로 사용하는 동적인 음성인식 모델이다. 이 모델은 음성의 동적인 특성을 인식에 이용하고 연속음성인식으로의 확장이 용이한 우수한 인식 모델이다. 그러나, 예측신경회로망 모델은 음운학적으로 유사한 음성구간에서의 변별력이 낮다는 문제점이 있다. 그것은 기존의 학습 알고리즘이 다른 어휘와의 거리는 고려하지 않고 대상어휘의 예측오차만 최소화시키기 때문이다. 따라서, 본 논문에서는 직접 인식오차를 최소화시키는 GPD알고리즘에 의해 유사어휘간의 거리를 고려하는 변별력있는 학습 알고리즘을 제안한다.
-
In speech signal processing, The accurate detection of the voiced/unvoiced is important for robust word recognition and analysis. This algorithm is based on the MD in the frame of speech signals that does not require statistical information about either signal or background-noise to decide a voiced/unvoiced. This paper presents a method of estimation the Characteristic of Magnitude Distribution from noisy speech and also of estimation the optimal threshold based on the MD of the voiced/unvoiced decision. The performances of this detectors is evaluated and compared to that obtained from classifying other paper.
-
In this paper, we propose a new method to extract the line spectrum pair (LSP) frequencies. When speech signal is analyzed by the autocorrelation method, the spectral difference in the logarithmic spectra of the model at steps p and p-1 oscillates. There are p-1 frequency points where the values of the spectral dfference take on either maximum or minimum between 0 and half sampling frequency. We show that these frequencies are excatly the LSP frequencies of order p-1, which can be found by searching the frequencies where the spectral difference reaches either maxima or minima. also, the LSP frequencies of order p can be obtained from this spectral difference. In this case, we derive the expression governing the pth order LSP frequencies. The efficient search for finding the LSP frequencies of order p can be done by proving the property that the LSP frequencies of order p and p-1 are interlaced with each other.
-
In this paper, a new pitch beginning point detection method by extracting the G-peak, is proposed. By the speech production model, the area of the first peak on a pitch interval of speech signals is emphasized. By using the above characteristics, this method have more advantages than the others for pitch beginning point detection. The defective decision caused by an impulsive noise is minimized and the pre-filtering is not necessary for this method, because the integration of signals takes place in the process.
-
디지틀 피아노에서 PCM 방식의 음원 합성을 위한 압축 알고리듬을 제안하였다. 디지틀 피아노는 매우 높은 음질을 필요로 한다. 따라서 FM 방식보다는 PCM 방식의 음원 합성 알고리듬이 주로 사용되어져 왔다. 그러나 PCM 방식은 많은 메모리가 필요한 단점이 있다. 본 논문에서는 피아노 음원을 청각적으로 왜곡이 없도록 압축, 저장하여 음원 데이터를 줄였다. 또한 피아노 음의 시간 영역 특성에 따라 비트 할당을 달리하여 음질을 향상시킬 수 있었다. 이와 같이 부호화할 경우 약 15 : 1 ~ 20 :1로 원음을 압축하여도 지각적으로 원음과 동일한 복원음을 얻을 수 있었다.
-
The throughput of conventional ARQ protocols can be improved by dynamically adapting the packet length. This protocol transmits packets with the length to maximize the transmission efficiency, based on the dynamic estimation of time-varying channel condition. A very simple adaptive scheme is presented. The results of a simulation show that the scheme performs well.
-
이 논문에서는 페이딩이 있는 채널에서 충격성 잡음이 있을 때 부호 상관 수신기를 쓰는 DS/SSMA 시스템의 성능을 분석하였다. 좀 더 자세히 말하면, 확산 수열이 짧을 때에는 직접 계산으로, 확산 수열이 길 때에는 근사식으로 부호 상관 수신기를 쓰는 DS/SSMA 시스템의 비트 오류 발생 확률을 얻었다. 이를 통해 사용자가 한 사람일때에는 이 시스템의 성능이 신호대 잡음비의 변화에 크게 영향을 받지 않는다는 것을 보였다.
-
Code Excited Linear Prediction(CELP) speech coders exhibit good performance at data rates as low as 4800bps. The major drawback to CELP type paper, a comparative performance study of three pitch searching algorithms for the CELP vocoder was conducted. For each of the algorithms, a standard pitch searching algorithm was used by the sequential pitch searching algorithm that was implimented in the QCELP vocoder. The algorithms used in this study were 1) using the skip table(TABLE), 2) using the symmetrical property of the autocorrelation(SYMMT), and 3) using the preprocessing autocorrelation(PREPC). Performance scores are presented for each of the three pitch searching algorithms based on computation speed and on pitch prediction error.