통합 검색 | Korea Science

음성부호 처리에 적합한 RISC 프로세서의 설계 및 구현 (Design and Implementation of RISC Processor for Speech Coding)

김진;이준용
- 한국정보과학회:학술대회논문집
- /
- 한국정보과학회 2000년도 가을 학술발표논문집 Vol.27 No.2 (3)
- /
- pp.18-20
- /
- 2000
디지털 음성통신을 위한 빠르고 쉬운 내장 프로세서(Embedded processor)가 요구되어짐에 따라 음성신호 압축 복원 알고리즘인 ADPCM과 LD-CELP의 구현에 가장 빈번히 사용되는 연산의 특성을 조사하였다. ARM6 processor core의 기본 구성요소들과 명령어집합을 기반으로 하여 음성부호화 알고리즘의 연산의 특성을 효율적으로 처리하기 위한 명령어와 구조를 추가한 범용 프로세서의 구조를 제안하고 VHDL로 기술하여 동작을 검증하였다. ARM6의 ALU logic에 leading zero count를 위한 회로를 추가하였고 opcode를 변경하였으며, LPC 계수 연산을 위해 제안된 MAC을 도입하여 효율적인 구현이 가능하도록 설계하였다.
PDF

지속적으로 발성한 모음에 의한 화자인식 (Automatic Speaker Identification by Sustained Vowel Phonation)

배건성
- 한국음향학회지
- /
- 제11권1호
- /
- pp.35-41
- /
- 1992
지속적으로 발성한 모음에 대해 각 화자의 특징을 나타내는 벡터양자화 코드북을 만들고 이를 이용해 화자를 인식하는 방법을 제안하고 실험하였다. 특히 벡터로는 모음 /이/로 부터 각각의 피치 주기에 대해 얻어진 선형예측계수를 사용하였으며, 코드북의 크기는 4가 적절함을 실험적으로 보였다. 인식실험에서, 학습에 사용된 데이타를 이용했을 경우에는 99.4%의 인식율을 보였으며, 학습에 사용되지 않은 50개의 피치 주기를 포함하는 음성신호로 부터는 89.4%의 인식율을 보였다.
PDF

선형예측계수에 근거한 ART 네트워크를 이용한 심전도 신호 분류 (Classification of the ECG Beat Using ART Network Based on Linear Prediction Coefficient)

박광리;이경중
- 대한의용생체공학회:학술대회논문집
- /
- 대한의용생체공학회 1997년도 추계학술대회
- /
- pp.228-231
- /
- 1997
In this paper, we designed an ART(Adaptive Resonance Theory) network based on LPC(Linear Prediction Coefficient) for classification of PVB (Premature Ventricular Beat: PVC, LBBB, RBBB). The procedure of proposed system consists of the error calculation, feature generation and processing of the ART network. The error is calculated after processing by linear prediction algorithm and the features of ART network or classification are obtained from the binary ata determined by threshold method. In conclusion, ART network has good performance in classification of PVB.
PDF

검색구간 조절에 의한 LSP 변환시간 감소에 관한 연구 (A Study on the Reduction of LSP Transformation Time by Adjustment of Search Band)

민소연;배명진
- 한국산학기술학회:학술대회논문집
- /
- 한국산학기술학회 2006년도 추계학술발표논문집
- /
- pp.208-211
- /
- 2006
일정한 스펙트럼 민감도와 낮은 스펙트럼 왜곡을 보이고 선형 보간이 용이하다는 장점을 갖는 LSP 파라미터는 음성코덱(codec)이나 인식기에서 음성신호를 분석하여 전송형이나 저장형 파라미터로 변환되어, 주로 저전송률 음성부호화기에 사용된다. 그러나 LPC 계수를 LSP로 변환하는 방법이 복잡하여 계산시간이 많이 소요된다는 단점이 있다. 기존의 LSP 변환 방법 중 음성 부호화기에서 주로 사용하는 real root 방법은 근을 구하기 위해 주파수 영역을 순차적으로 검색하기 때문에 계산시간이 많이 소요되는 단점을 갖는다. 본 논문에서 제안하는 알고리즘은 LSP 분포 특성에 따라 검색구간의 순서와 검색간격을 달리하며, 제1 포만트와 제2 포만트의 연관성을 고려하여 검색구간을 조절한다. 기존의 real root 방법과 제안한 방법을 비교한 결과 검색시간이 평균 48.13% 단축되었다.
PDF

다중펄스 방법을 이용한 디컨벌루션 (The Seismic Multipulse Deconvolution)

손호웅
- 자원환경지질
- /
- 제28권5호
- /
- pp.487-491
- /
- 1995
음성신호를 임펄스 반응으로 압축시키는데 사용되는 선형예측코드의 다중펄스 방법을 다중반사파를 제거시킬수 있도록 개선시켰다. 다중반사파는 층사이에서 연속 반사에 의해 발생하는 것으로서 탄성파 해석을 어렵게 한다. 본 논문에서는 개선된 다중펄스방법을 이용하여 음원 파형요소를 스파이크로 압축시키고 다중반사파를 제거하도록 하였으며, 지하 정보를 갖고 있는 반사계수 함수의 크기와 위치를 연속 계산방식에 의해 이끌어 냈었다. 개선된 다중펄스 방법의 탄성파 자료에의 적용은 좋은 결과를 보여주고 있다.
PDF

검색구간의 순서와 해상도 조절을 통한 LSP 계산량 감소에 관한 연구 (A Study on the Reduction of LSPComputation Using Adjustment of Search Band Sequence and Interval)

임지선
- 한국산학기술학회:학술대회논문집
- /
- 한국산학기술학회 2010년도 춘계학술발표논문집 1부
- /
- pp.245-248
- /
- 2010
일정한 스펙트럼 민감도와 낮은 스펙트럼 왜곡을 보이고 선형보간이 용이하다는 장점을 갖는 LSP 파라미터는 음성코덱(codec)이나 인식기에서 음성신호를 분석하여 전송형이나 저장형 파라미터로 변환되어, 주로 저전송률 음성부호화기에 사용된다. 그러나 LPC 계수를 LSP로 변환하는 방법이 복잡하여 계산시간이 많이 소요된다는 단점이 있다. 기존의 LSP 변환 방법 중 음성 부호화기에서 주로 사용하는 real root 방법은 근을 구하기 위해 주파수 영역을 순차적으로 검색하기 때문에 계산시간이 많이 소요되는 단점을 갖는다. 본 논문에서 제안하는 알고리즘은 LSP 분포 특성에 따라 검색구간의 순서와 검색간격을 달리하며, 제1 포만트와 제2 포만트의 연관성을 고려하여 검색구간을 조절한다. 기존의 real root 방법과 제안한 방법을 비교한 결과 검색시간이 평균 48.13% 단축되었다.
PDF

Cepstrum 계수와 Frequency Sensitive Competitive Learning 신경회로망을 이용한 한국어 인식. (Korean Digit Recognition Using Cepstrum coefficients and Frequency Sensitive Competitive Learning)

이수혁;조성원;최경삼
- 대한전기학회:학술대회논문집
- /
- 대한전기학회 1994년도 추계학술대회 논문집 학회본부
- /
- pp.329-331
- /
- 1994
In this paper, we present a speaker-dependent Korean Isolated digit recognition system. At the preprocessing step, LPC cepstral coefficients are extracted from speech signal, and are used as the input of a Frequency Sensitive Competitive Learning(FSCL) neural network. We carried out the postprocessing based on the winning-neuron histogram. Experimetal results Indicate the possibility of commercial auto-dial telephones.
PDF

한국 전통음악 (국악)에 대한 자동 장르 분류 시스템 구현 (An Implementation of Automatic Genre Classification System for Korean Traditional Music)

이강규;윤원중;박규식
- 한국음향학회지
- /
- 제24권1호
- /
- pp.29-37
- /
- 2005
본 논문은 한국의 전통 음악, 즉 국악 장르를 자동으로 분류하는 시스템을 제안한다. 제안된 시스템은 입력 음악의 내용기반 분석을 통하여 궁중음악, 풍류방음악, 민속성악, 민속기악, 불교음악, 무속음악 등 6가지 장르중 하나로 자동분류하여 해당 음악의 장르 결과를 보여준다. 국악 장르 분류에 사용된 내용기반 알고리즘은 크게 음악의 특징 벡터 추출 그리고 장르 분류를 위한 패턴인식 과정 2가지로 구성된다. 음악의 특징 벡터 추출은 디지탈 신호 처리기술을 이용하여 해당 음악의 spectral centroid, rolloff, flux 등 STFT (Short Time Fourier Transform) 기반의 특징 계수들과 MFCC (Mel frequency cepstral coefficient), LPC (Linear predictive coding) 등의 계수들을 구한 후 SFS (Sequential Forward Selection) 최적 특징 벡터 열을 선별하여 사용하였으며 패틴 분류 알고리즘으로는 k-NN (k -Nearest Neighbor), Gaussian, GMM (Gaussian Mixture Model), SVM (Support Vector Machine) 분류기를 사용하였다. 특히 본 연구에서는 입력 질의의 패턴 (혹은 구간) 변화에 따른 시스템의 불확실성을 개선하기 위하여 MFC (Multi Feature Clustring) 방법을 이용하여 DB를 구축하였다. 모의실험 결과 k-NN 과 SVM 분류기 모두 $97{\%}$ 이상의 장르 분류 성공률을 보였으나, SVM 이 k-NN에 비해 약 3배 이상의 빠른 분류 성능을 가지고 있음을 확인하였다.
PDF KSCI

지각적 표현에 기초한 비음 인식에 관한 연구 (Nasal Consonants Recognition Based on the Perceptual Representation)

김기철;조정완
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 1989년도 한글날기념 학술대회 발표논문집
- /
- pp.120-125
- /
- 1989
음성 신호에는 언어정보이외에 여러 요인에 의한 정보가 포함되어 있어서, 문자와 일대일로 대응되는 분절을 정확하게 검출하기가 어렵다. 본 연구에서는 선형 예측계수 (LPC) 스펙트럼의 첨두 부분을 강조한 이진 (binary) 스펙트럼을 제안하고, 이를 바탕으로 음의 안정영역과 천이영역을 통합하여 음향특징을 추출하고자 한다. 각 영역의 특징은 이진 스펙트럼을 누적하여 구하며, 통합적인 특징은 각 영역의 특징을 결합한 관계적 특징으로 나타낸다. 제 2 차 포르만트 주파수의 궤적을 관계적 특징으로 하여, 양순 비음과 치조 비음을 구별한 결과, 모음의 문맥과 화자에 비교적 독립적인 인식결과를 얻을 수 있었다. 또한 이진 스펙트럼이 원래의 스펙트럼에 포함된 정보를 유지하는지 검토하기 위해, 같은 거리척도 (distance measure) 에 의해 인식 실험한 결과 이진 스펙트럼의 성능이 오히려 우수하게 나타났으며, 관계적 이진 스펙트럼의 경우 화자에 따른 변화가 더욱 적었다. 음성에 백색 잡음 (Gaussian white noise)을 더하여 잡음음성 (noisy speech) 을 만든 뒤, 같은 방법으로 실험한 결과도 유사한 인식결과를 얻을 수 있어 제안된 이진 스펙트럼의 유효성을 확인하였다.
PDF

지연누적에 기반한 화자결정회로망이 도입된 구문독립 화자인식시스템 (Text-Independent Speaker Identification System Using Speaker Decision Network Based on Delayed Summing)

이종은;최진영
- 한국지능시스템학회논문지
- /
- 제8권2호
- /
- pp.82-95
- /
- 1998
본 논문에서는 구문독립 화지인식 시스템에서 가장 중요한 역할을 하는 분류기를 두 단계로 나누어, 먼저 짧은 구간들에 대해서 각각의 화자에 속하는 정도를 계산하고, 다음에 계산된 결과들을 가지고 주어진 음성구간전체에 대해 가장 가능성이 높은 화자를 선택하는 구조를 제안한다. 첫번째 부분은 학습에 의해 스스로 조기하는 RBFN을 이용하여 구현하고 두번째 부분에서는 MAXNET과 지연합의 조합으로 화자를 결정한다. 이렇게 함으로써 지연합의 개수가 증가함에 따라 인식률이 100%가 되는 것을 모의 실험을 통하여 확인한다. 또한 본 논문에서는 음성의 프랙탈적인 특징이 화자인식에 사용될 수 있는지를 검토한다. 화자인식은 동질의 집단에서 13명의 성인만자의 목소리를 이용하여 닫힌집합(closed-set)의 경우로 모의실험을 하였고, 기존의 특징으로는 선형예측계수(LPC) 와 PC-cepstrum을 사용하였다.
PDF

검색결과 90건 처리시간 0.026초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)