Search | Korea Science

Covariance Model Based on Multi-Band for Speaker Verification in Noise (잡음 환경에서 화자 확인을 위한 다중대역에 기반한 공분산 방법)

Choi Min Jung;Lee Ki Yong
- Proceedings of the Acoustical Society of Korea Conference
- /
- autumn
- /
- pp.127-130
- /
- 2004
기존의 전대역(Full-Band)에서 특징 파라미터를 추출하는 화자 확인(Speaker Verification) 시스템은 저대역이나 고대역에서 화자 정보의 특징이 제거되기 쉽다. 또한, 주파수 스펙트럼에 부분적으로 오염이 되는 경우, 특징 파라미터를 왜곡시켜 화자 확인 시스템의 성능을 저하시킨다. 본 논문에서는 이러한 문제점을 해결하기 위해 다중대역 공분산 모델(Covariance Model)을 제안한다. 제안한 방법은 주파수 영역에서 전대역을 여러 개의 부대역(Sub-Band)으로 분할하고, 부대역별로 독립적으로 특징 파라미터를 추출하여 공분산 모델을 구한다. 제안된 방법의 성능 확인을 위하여 공분산 모델 간의 거리를 측정하는 화자 확인 실험을 하였다. 잡음 환경에서 기존의 방법인 전대역에 기반한 공분산 모델과 제안한 방법을 비교 분석한 결과, 제안한 방법이 기존 방법보다 $2\%$정도 성능이 향상되었다. 또한, 제안된 방법은 전대역에 기반한 파라미터 차원 수를 다중대역의 개수로 분할하여 사용하므로 계산량의 감소와 저장 공간면에서 효율적이다.
PDF

On a Study Sound Characteristic Analysis the Divine Bell of King Songdok and Other Bells (성덕대왕 신종과 다른 종들의 소리특징 분석에 관한 연구)

Ham Myungkyu;Kim Youngil;Bae Myungjin
- Proceedings of the Acoustical Society of Korea Conference
- /
- autumn
- /
- pp.123-126
- /
- 2000
에밀레종은 771년도에 성덕대왕의 공적을 기리기 위해 34년간 주조(높이 $3.663{\cal}m$, 최대지름 $2.227{\cal}m$, 무게 $18,900{\cal}kg$)하여 만든 세계적인 문화유산이다. 외형도 미려하지만 종소리는 천, 지, 인을 뒤흔드는 신비감을 갖추고 있다. 에밀레 종소리는 끊어질 듯 이어지는 소리, 애끓는 소리, 심금을 울리는 소리 등의 특징을 갖는데 끊어질듯 이어지는 소리는 맥놀이 현상으로 나타난다. 지금까지 맥놀이 현상의 규명에 대한 많은 연구가 있었다. 하지만, 에밀레종이 갖는 세 가지의 소리 특징에 대해서는 연구되어지고 있지 않다. 따라서, 본 논문에서는 국내의 사찰에 있는 다른 종들의 비교 분석을 통해 다른 종에서는 세 가지소리 특징 중 어떤 소리가 발생되고 있는지를 밝히고자 한다. 결론적으로 우리는 1228년 전에 완성한 우리민족의 지혜와 숨결이 스며있는 에밀레 종소리의 세 가지를 규명하고 재현함으로서 문화민족의 자부심으로 새로운 세대를 개척해 나아갈 수 있는 원동력을 얻고자 한다.
PDF

Bird sounds classification by combining PNCC and robust Mel-log filter bank features (PNCC와 robust Mel-log filter bank 특징을 결합한 조류 울음소리 분류)

Badi, Alzahra;Ko, Kyungdeuk;Ko, Hanseok
- The Journal of the Acoustical Society of Korea
- /
- v.38 no.1
- /
- pp.39-46
- /
- 2019
In this paper, combining features is proposed as a way to enhance the classification accuracy of sounds under noisy environments using the CNN (Convolutional Neural Network) structure. A robust log Mel-filter bank using Wiener filter and PNCCs (Power Normalized Cepstral Coefficients) are extracted to form a 2-dimensional feature that is used as input to the CNN structure. An ebird database is used to classify 43 types of bird species in their natural environment. To evaluate the performance of the combined features under noisy environments, the database is augmented with 3 types of noise under 4 different SNRs (Signal to Noise Ratios) (20 dB, 10 dB, 5 dB, 0 dB). The combined feature is compared to the log Mel-filter bank with and without incorporating the Wiener filter and the PNCCs. The combined feature is shown to outperform the other mentioned features under clean environments with a 1.34 % increase in overall average accuracy. Additionally, the accuracy under noisy environments at the 4 SNR levels is increased by 1.06 % and 0.65 % for shop and schoolyard noise backgrounds, respectively.
https://doi.org/10.7776/ASK.2019.38.1.039 인용 PDF KSCI HTML

Definition and Evaluation of Korean Phone-Like Units using Hidden Markov Network (HM-Net을 이용한 한국어 유사음소 단위의 재 정의와 평가)

Lim Young-Chun;Oh Se-Jin;Jung Ho-Youl;Chung Hyun-Yeol
- Proceedings of the Acoustical Society of Korea Conference
- /
- spring
- /
- pp.183-186
- /
- 2002
최근 음성인식의 인식 단위로서 문맥의존 음향 모델이 널리 사용되고 있다. 이는 음소의 음향학적 특징, 즉 선행 및 후행음소에 의한 중심 음소의 변이음 모델이 문맥독립 모델보다 좀 더 정확하게 모델링 될 수 있기 때문이다. 하지만 강건한 문맥의존 음향 모델을 작성하기 위해서는 모델 파라미터의 병합(tying)과 미지의 문맥(unseen context)의 처리를 위한 좀더 정교한 해결 방법이 필요하다. 따라서 본 논문에서는 이점을 고려하여 음향학적 특징과 언어학적 특징을 결합하여 상태 분할을 수행할 수 있도록 SSS(Successive State Splitting) 알고리즘의 문맥 방향 상태 분할에 음소결정트리를 접목한 HM-Net(Hidden Markov Network) 구조 결정법을 도입하였다. 또한 HM-Net은 연속적인 상태 분할에 의해 한국어에서 많이 발생하는 변이음들을 효과적으로 모델링 할 수 있다는 점을 고려하여 본 연구실에서 기존에 사용하던 48 유사음소 단위에서 문맥의존 음향 모델 작성에 불필요한 변이음을 제거하여 39 유사음소 단위를 재 정의하였다. 도입한 방법과 새로 정의한 유사음소 단위의 유효성을 확인하기 위해 고립 단어, 4연속 숫자음, 연속 음성인식에 대해 인식 실험을 수행한 결과, 모든 실험에서 재 정의한 39 유사음소 단위가 문맥종속형 HM-Net 음향모델을 이용한 한국어 음성인식에 효과적임을 확인할 수 있었다. 특히 연속 음성인식 실험의 경우, 기존의 48 유사음소 단위보다 평균 $15.08\%$의 인식률 향상이 있었다.
PDF

Target Speech Segregation Using Non-parametric Correlation Feature Extraction in CASA System (CASA 시스템의 비모수적 상관 특징 추출을 이용한 목적 음성 분리)

Choi, Tae-Woong;Kim, Soon-Hyub
- The Journal of the Acoustical Society of Korea
- /
- v.32 no.1
- /
- pp.79-85
- /
- 2013
Feature extraction of CASA system uses time continuity and channel similarity and makes correlogram of auditory elements for the use. In case of using feature extraction with cross correlation coefficient for channel similarity, it has much computational complexity in order to display correlation quantitatively. Therefore, this paper suggests feature extraction method using non-parametric correlation coefficient in order to reduce computational complexity when extracting the feature and tests to segregate target speech by CASA system. As a result of measuring SNR (Signal to Noise Ratio) for the performance evaluation of target speech segregation, the proposed method shows a slight improvement of 0.14 dB on average over the conventional method.
https://doi.org/10.7776/ASK.2013.32.1.079 인용 PDF KSCI

An Acoustic-based Method of Detecting Electric Sparks in Underground Facilities (음향기반 지하시설물의 전기스파크 감지 방법)

Lee, Byung-Jin;Jung, Woo-Sug
- Proceedings of the Korean Society of Disaster Information Conference
- /
- 2023.11a
- /
- pp.73-74
- /
- 2023
본 논문에서는 음향센서를 기반으로 한 지하시설물 화재 위험감지 방법을 제안하였다. 음향센서는 진동이나 광센서처럼 접촉식이 아니기 때문에 결로가 발생하고 있는 취약구간에 설치하여 보다 효율적으로 활용이 가능하고 지하시설물 내부에 설치된 기기나 장비들과 상호작용하거나 간섭하지 않기 때문에 안전하게 관리가 가능하다. 이러한 특징으로 지하 시설물에서 내 통행이 불편하여 관리하기 힘든 구간이나 결로가 많아 화재안전에 주의가 필요한 곳에 설치하여 전기스파크 발생 감지를통해 재난이 발생하기 이전 화재위험을 감지하는 방법론 중 하나가 될 수 있다. 제안하는 방법은 음향 센서를 통해 지하공동구 안에서 발생하는 소리들을 수집하고 일정한 길이의 시간 단위 프레임들로 분할한 후 분석하여 전기스파크의 특징 벡터를 도출한다. 전기스파크 감지 모델로는 전기스파크 신호의 지역적 특성을 포착할 수 있도록 2D-CNN 구조를 사용하며 모델에서 출력된 전기 스파크 발생 예측확률을 분할된 단위 프레임 따라 계산하여 융합한다. 이로 인해 높은 정확도의 전기스파크 감지 정밀도를 얻을 수 있으며, 이는 전기 스파크에 의한 화재 이벤트 감지 있어서 효과적인 센싱 기술임을 알 수 있다.
PDF

Speaker Identification Using Dynamic Time Warping Algorithm (동적 시간 신축 알고리즘을 이용한 화자 식별)

Jeong, Seung-Do
- Journal of the Korea Academia-Industrial cooperation Society
- /
- v.12 no.5
- /
- pp.2402-2409
- /
- 2011
The voice has distinguishable acoustic properties of speaker as well as transmitting information. The speaker recognition is the method to figures out who speaks the words through acoustic differences between speakers. The speaker recognition is roughly divided two kinds of categories: speaker verification and identification. The speaker verification is the method which verifies speaker himself based on only one's voice. Otherwise, the speaker identification is the method to find speaker by searching most similar model in the database previously consisted of multiple subordinate sentences. This paper composes feature vector from extracting MFCC coefficients and uses the dynamic time warping algorithm to compare the similarity between features. In order to describe common characteristic based on phonological features of spoken words, two subordinate sentences for each speaker are used as the training data. Thus, it is possible to identify the speaker who didn't say the same word which is previously stored in the database.
https://doi.org/10.5762/KAIS.2011.12.5.2402 인용 PDF KSCI

선박방사소음의 측정및 평가방법

윤종락
- Journal of KSNVE
- /
- v.8 no.2
- /
- pp.232-238
- /
- 1998
선박 방사소음은 군사적 목적의 수동소나가 탐지대상으로 하는 수중음향 표적이라 할 수 있다. 따라서 수동소나 운용자는 대잠전 수행이전에 다양한 선박들에 대한 방사소음을 측정, 분석하여 개별 선박 고유의 음향 특징을 수집함으로써 실전 상황에서 미지 선박이 탐지되는 경우 이들 자료를 식별의 기초자료로 활용하고자 한다. 또한 새로운 수동소나의 개발자나 스텔스 능력의 선박 설계자 역시 선박방사소음 특징자료를 필요로한다. 본 글은 선박방사소음의 발생기구, 측정시스템 및 측정자료의 분석 평가 기술을 연구분석한 내용이다.
PDF

Spectrum Filter Algorithm based on Acoustic Model (음향학적 모델에 의한 스펙트럼 필터 알고리즘)

Choi, Jae-seung
- Proceedings of the Korean Institute of Information and Commucation Sciences Conference
- /
- 2016.10a
- /
- pp.770-772
- /
- 2016
본 논문에서는 음성신호처리 시스템에 유용하게 사용되는 음성신호의 특징 파라미터를 출력하는 스펙트럼 필터모델을 사용하여, 배경잡음 환경 하에서 음성신호 중의 잡음을 제거하는 알고리즘을 제안한다. 따라서 본 논문에서는 배경잡음을 제거할 때 고려해야 할 인간의 청각특성이 포함된 음성의 진폭 스펙트럼에 의한 청각필터의 특성을 도입한다. 본 논문의 실험에서 사용한 성능평가의 방법으로는 음절 명료도의 테스트에 적합한 주관적인 평가인 주파수 영역에서의 스펙트럼 왜곡률(Spectral Distortion, SD)을 사용하여 실험결과를 비교하고 고찰한다.
PDF

Performance Improvement of korean Connected Digit Recognition Based on Acoustic Parameters (음향학적 파라메터를 이용한 한국어 연결숫자인식의 성능개선)

Kim Seunghi;Kim Hyung Soon
- Proceedings of the Acoustical Society of Korea Conference
- /
- spring
- /
- pp.44-47
- /
- 1999
본 논문에서는 한국어 연결숫자인식에 있어서 모델간의 변별력 향상을 통해 인식률을 높이기 위하여 음향학적 파라메터(Acousticparameter)를 사용하는 짓을 제안한다. 제안된 방법은 음성학적 지식에 근거하여 적절한 주파수 대역별 에너지의 비의 로그값을 추가적인 특징파라메터로 사용한다. 실험결과, 제안된 방법을 사용함으로써 기본 인식시스템에 비해 오류율이 최고 $46\%$ 정도 감소됨을 확인할 수 있었다. 그리고 채널보상 기술을 함께 적용함으로써 $69\%$ 정도의 오류율 감소를 얻었다.
PDF

Search Result 435, Processing Time 0.03 seconds

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

Detail Search

Image Search (β)