Proceedings of the Acoustical Society of Korea Conference (한국음향학회:학술대회논문집)
The Acoustical Society of Korea
- Semi Annual
Domain
- Physics > Interdisciplinary Physics
1998.06c
-
본고에서는 음성인식기술의 최근동향을 알아보고 국외의 실용화사례를 통신사업자와 비통신사업자 주축으로 이루어지고 있는 응용사례를 소개한다. 현재의 음성인식 기술중 최근 주목을 받고 있는 발화 확인기술과 탐색기술을 소개하고 외국의 실용화 사례를 통신분야와 비통신 분야로 나누어서 기술한다. 그리고 실용화 전망에 대해 고찰한 후 결론을 맺는다.
-
본 논문에서는 음성을 이용한 가전제품 제어 시스템을 구현하였다. 시스템은 인식부, 가정 자동화부로 구성되어 있으며 주 이용자는 몸이 불편한 장애인과 환자들을 대상으로 하였다. 본 시스템은 15가지 음성 명령어를 이용하여 실시간으로 가전 제품을 제어 할 수 있도록 하였다.
-
본 논문은 컴퓨터 사용에 미숙한 초보자나 키보드나 마우스를 사용할 수 없는 신체적인 조건을 가진 장애인 또는 PC사용에 미숙한 사용자들을 위해 기존의 인터페이스에 추가적으로 음성을 사용하여 더 효율적인 작업 환경을 만들기 위한 음성을 이용한 Window95 환경에서의 음성 인식 시스템 구현에 관한 것이다. 인터페이스 구현을 위해 사용되는 인식 알고리즘으로는 연결어 인식에 사용되는 OSDP[1] 알고리즘을 단독어 인식에 적용하여 사용하였다. 특징 벡터는 화자 독립적인 특성을 지닌 Perceptual Linear Predictive(PLP)[2] 13차 계수를 사용하였다. 인식 대상 어휘는 윈도우 사용자에게 자주 사용되는 60개의 명령어로 설정하였다. 인식된 후 그 결과는 구현된 시스템의 명령 실행 모듈로 전달되어 윈도우 상에서 실제 수행된다. 구현된 시스템에서는 노트북 내장 마이크를 사용하여 음성을 검출하였고 이를 위한 음성 구간 검출 알고리즘을 사용하였다. 기준 패턴은 20대 남성화자 9인이 2회 발성한 데이터를 이용하였고, 화자 독립으로 온라인 인식률은 91.71%이고, 오프라인 인식률은 96.4%의 인식률을 얻었다.
-
본 논문은 자동차의 편의성 및 안전성의 동시 확보를 위하여, 보조적 스위치의 조작없이 상시 음성의 입,출력이 가능하도록 하며, band pass filter를 이용하여 잡음환경에서 자동으로 정확하게 음성구간 검출(End Point Detection)을 하게 하였다. Reference Pattern은 Dynamic Multi-Section(DMS)[1] 모델을 사용하였고 차량의 속도에 따라 자동으로 잡음환경에 강인한 모델을 선택하도록 하였으며, 음성의 특징 파라미터와 인식 알고리즘은 Perceptual Linear Predictive(PLP) 13차와 One Stage Dynamic Programming(OSDP)를 사용하였다. 주행중인 자동차 환경(30~70km/h)에서 자주 사용되는 차량제어 명령 33개에 대하여 화자독립 92.98%, 화자종속 94.44% 인식율을 구하였다. 또한 주행중인 차량에서 카폰, 핸드폰 사용으로 인한 사고를 줄이기 위하여 음성으로 전화를 걸 수 있도록 하는 Voice Dialing 기능도 구현하였다.
-
본 논문에서는 자동차 잡음 환경에서 녹음된 데이터 베이스를 이용하여 인식 시스템의 성능을 향상시키기 위한 효율적인 잡음 제거 방법을 연구하였다. 먼저, 잡음 및 주변 환경 변화에 강인한 것으로 알려져 있는 특징 벡터들의 인식 성능을 비교하교, 가중 켑스트랄 거리 측정 방법을 이용한 인식 실험을 통하여 시스템의 성능 향상을 확인하였다. 실험 결과, 본 논문에서 기준 시스템으로 사용한 LPC 켑스트럼의 경우에 비하여 MFCC나 root-cepstrum을 사용한 경우 인식률이 향상되었다. 켑스트럼간의 거리 측정에 있어서는 RPS와 BPL과 같은 가중 켑스트랄 거리 측정 함수들이 인식 성능 향상에 도움을 주었다. 또한 켑스트럼 평균 차감법이라는 간단한 잡음 제거기술을 적용하여 자동차 잡음 환경에서 인식 성능 향상을 보였다. 마지막으로, 차량 항법용 음성 인식 시스템의 실시간구현을 위하여 여러 경우의 인식 성능을 비교하고, 메모리 량과 실행 시간 등을 고려하여 최적 시스템을 제시하였다.
-
본 논문에서는 음성인식기능을 이용하여 지리정보 검색시스템을 구현하고 그 성능 평가 결과에 관하여 보고한다. 성능평가실험을 위하여 사용한 수치지도 자료는 1:5,000의 대구광역시 수성구의 국가 기본도를 사용하였으며, 이 수치지도에서 속성단어와 제어단어를 포함한 68단어를 음성인식과 지도정보 검색의 대상으로 한다. 또한, 음성인식 결과와 지도자료와의 인터페이스는 OLE Automation 프로그래밍 기법을 이용하였으며, Pentium 150MHz, 64MB 메모리를 가진 개인용 컴퓨터 환경하에서 개발하였다. 성능평가 실험결과 남성 3인이 지도검색용 68단어를 실제 사무실 환경하에서 마이크를 통하여 on-line 테스트하여 평균 98.02%의 인식률을 얻었다. 이사의 결과로부터 음성인식기능을 이용한 수치지도 정보검색 시스템의 실용화 가능성을 확인할 수 있었다.
-
본 논문에서는 한국전자통신연구원의 Handy Combi 응용 도메인을 대상으로 한 화자독립 연속음성인식 시스템 개발에 관하여 기술한다. 불특정화자가 자연스럽게 발음한 연속음성을 인식하는 기술은 펜인식 등과 더불어 멀티모달 인터페이스의 핵심 요소로서, 이동 환경에서 사용자의 다양한 요구사항을 처리하는 지능형 에이전트에 구현을 위해 필수적으로 개발되어야 하는 기술이다. 본 논문에서는 연속확률분포를 가지는 Hidden Markov Model(HMM) 기반의 연속음성인식 시스템을 구현하였다. 개발된 시스템은 음성특징벡터로 MFCC를 사용하였으며, 음소 모델의 강인한 훈련을 위해 음성학적 지식에 기반을 둔 tree-based clustering 방식을 도입하였다. 인식단계에서는 인식속도를 개선시키기 위해 beam-search 기법을 적용하였다. 인식 실험 결과, 99.7%의 어절 인식률과 98.8%의 문장 인식률을 얻었으며, 최종적인 문장의 이해도는 99% 이상이었다.
-
한국통신에서는 PC로 된 프로토타입 시스템을 이용하여 음성인식 증권정보 서비스를 1995년 11월부터 1998년 초까지 5채널에 대해 시험운용을 해왔으며, 상용서비스를 위해 120명이 동시에 서비스 받을 수 있는 시스템을 개발하였다. 개발된 시스템의 전반적인 문제점을 파악하기 위하여 개발된 시스템을 사용하여 1998년 3월 16일부터 30 채널규모로 일반인들에게 시험서비스를 제공하고 있다. 음성인식 전화정보 서비스를 현재보다 훨씬 더 활성화시키기 위해서, 서비스의 이용 형태에 대한 분석을 통해, 어느 부분이 어떻게 개선되어야 할지를 연구하여, 초보 사용자라도 이용하기 쉬운 형태로 서비스를 시나리오를 개선해 나가고 있다. 본 논문에서는 사용자 특히, 처음 사용자의 여러 가지 이용 실태 요인을 분석하였다. 또한, 음성인식 증권 정보 서비스가 정식으로 서비스되기 이전과 그 이후의 일시별 인식률을 통해 조사하고, 이용자가 동일 대상 단어를 연속으로 발음하는 경우, 동일 대상 단어에 대한 인식률을 조사하였다. 조사결과 문제점은 4가지로 분류될 수 있었으며, 드러난 문제점을 해결하기 위하여 노력하고 있다.
-
본 논문에서는 단어독립 음성인식 시스템을 위한 음성인식 거절(rejection)기능에 대해 기술한다. 음성인식 거절 기능은 음성인식기를 제작할 때 정해놓은 인식대상 단어 이외의 단어가 입력되었을 때 그 단어가 인식할 수 없는 단어임을 알려주는 기능이다. 본 연구에서는 단어독립 음성인식 시스템에 적용될 수 있는 발화 검증 방식에 의해 음성인식 거절 기능을 구현하였다. 특히 유사도를 결정함에 있어서 산술평균, 기하평균, 조화평균을 사용하고 각각을 비교하여, 기하 평균을 사용하는 방식이 우수한 성능을 보임을 알 수 있었다. 음성의 신뢰도(confidence score)를 정규화하기 위해서 Sigmoid 함수를 사용하는데 이 함수의 가중치(weight) 상수의 변화에 대해 인식률을 비교함으로써 가장 적절한 가중치 상수값을 결정하였다. 음성인식 테스트 결과에서는 신뢰도 임계치 값을 구하고 이 값을 사용하여 인식률을 계산하였으며, 거절의 오류까지 포함된 음성인식률은 약 76%였다. 이 연구결과는 현재 한국통신에서 시험 서비스 중인 음성인식 증권정보 안내 시스템에 적용될 예정이다.
-
HMM (hidden Markov model)을 이용한 음성인식은 현재 가장 널리 쓰여지고 있는 방법으로, 이 중 CDHMM (continuous observation density HMM)은 상태에서 관측심볼확률을 연속확률밀도를 사용하여 표현한다. 본 논문에서는 가우스 혼합밀도함수를 사용하는 CDHMM의 상태천이확률과, 관측심볼확률을 표현하기 위한 인자인 평균벡터, 공분산 행렬, 가지하중값을 유전자 알고리듬을 사용하여 최적화하는 방법을 제안하였다. 유전자 알고리듬은 매개변수 최적화문제에 대하여 자연의 진화원리를 모방한 알고리듬으로, 염색체 형태로 표현된 개체군 (population) 중에서 환경에 대한 적합도 (fitness)가 높은 개체가 높은 확률로 살아남아 재생 (reproduction)하게 되며, 교배 (crossover)와 돌연변이 (mutation) 연산 후에 다음 세대 개체군을 형성하게 되고, 이러한 과정을 반복하면서 최적의 개체를 구하게 된다. 본 논문에서는 상태천이확률, 평균벡터, 공분산행렬, 가지하중값을 부동소수점수 (floating point number)의 유전자형으로 표현하여 유전자 알고리듬을 수행하였다. 유전자 알고리듬은 복잡한 탐색공간에서 최적의 해를 찾는데 효과적으로 적용되었다.
-
이 논문에서는 대용량 연속음성 인식에서 인식 속도를 향상시키기 위한 방법들에 대해서 연구하였다. 음성인식에 있어서 많은 양의 계산을 요하는 부분은 관측 확률의 계산과 탐색에 필요한 계산이다. 탐색에 필요한 계산을 줄이기 위하여 빔 탐색법과 phoneme look-ahead기법을 통해 탐색 공간을 줄였으며, 관측 확률을 계산하는데 소요되는 시간을 줄이기 위하여 입력 특징 벡터와 이웃 관계에 있는 가우시안 성분들만 정확한 계산을 하는 VQ에 의한 계산량 감축 방법과 tree-structured pdf 방법을 구현하였다. 3천개의 어휘와 2천여개의 트라이폰 모델로 구성된 연속 음성인식 시스템에서 보통의 Viterbi 빔 탐색법을 적용한 경우에 실시간의 2.73배의 인식 속도로 93.39%의 단어 인식률을 얻을 수 있는데 phoneme look-ahead 기법과 tree-structured pdf 방법을 추가 적용함으로써 비슷한 인식 성능에서 1.55배의 인식 속도를 얻을 수 있었다.
-
본 연구에서는 연결단어 음성인식 상에서 올바른 참조 패턴을 생성하기 위해 Levelbuilding 알고리즘을 이용하여 인식대상 단어의 표본 집합(훈련패턴 집합)으로부터 참조 패턴을 자동적으로 생성하는 알고리즘을 개발하였다. 본 연구는 분한 K-Mans 훈련방법에 기초하고 있으며, Levelbuilding 알고리즘을 이용하여 훈련패턴으로부터 참조 패턴을 생성하는 것이다. 먼저 초기화 과정에서 훈련 패턴을 그에 포함된 단어 수만큼 등간격 분리하여 분리된 단어들을 소속 Cluster로 분류하고 각 Cluster의 Center들로 초기 참조패턴을 구성한다. 그리고 참조패턴, 제어정보 및 Levelbuilding 알고리즘을 이용하여 각 훈련패턴을 분리하고, 분리된 단어들을 소속 Cluster로 분류하여 단어 Cluster집합을 구성한 후 DTW 및 minimax알고리즘을 이용해 각 Cluster의 Center를 구하여 참조 패턴을 생성한다. 참조패턴 구성에 변화가 없을 때까지 전 단계의 참조패턴과 본 알고리즘을 반복 수행하여 최적의 참조패턴을 생성한다. 본 알고리즘을 이용하여 3개 숫자의 연결단어 집합으로부터 영('0')에서 구('9')까지 숫자음에 대한 참조패턴을 자동 생성하였다. 참조패턴 생성과정에서 가정 중요한 처리인 훈련패턴 분리과정을 분석하기 위하여 각 반복과정에서 분리된 정보를 그래프로 도시화하여 확인하였다.
-
This paper describes an overview of the system designed for 500-word speech recognition. The system is based on the triphone models and uses Dynamic Multisection(DMS) technique for pattern matching. The system is very flexible in the sense of the word-dictionary which is changable spontaneously without any training. The vocabulary selected for the experiments is 561 words of province names, district names of Seoul and Pusan. The experimental results which will be shown here are preliminary because only one speaker was involved in the experiments. But the result is satisfactory when we see the performance is 95.1%. The system is designed on the Windows-95 and works in realtime on the Pentium-133 computer.
-
이 논문에서 우리는 대규모 어휘를 갖는 연속 음성 인식을 위한 방법을 제시한다. 우리말은 영어와 구조적으로 달라서 대용량 어휘를 갖는 연속 음성을 인식하기 위한 언어모델을 만들기가 매우 어렵다. 언어 모델을 우리말 문장에 적용하기 위해 신문의 사설을 3-gram을 이용하여 처리하였다. 우리의 인식 시스템을 평가하기 위하여 시스템 공학 연구소에서 제공한 낭독 음성을 대상으로 인식률을 계산하였다. 589개의 문장을 대상으로 총 20명이 발음한 3,156개의 문장에 대하여 남자 92.2%, 여자 87.9%의 인식률을 얻었다. 발음사전은 낭독음성과 신문 사설에서 추출한 10K 크기이며 uniphone의 음성모델을 사용하였다.
-
우리만은 영어와는 달리 단어를 공백으로만 구분할 수 없다. 그러므로 대용량 어휘를 갖는 연속 음성을 인식하기 위한 언어모델을 만들기가 매우 어렵다. N-gram의 언어 모델을 우리말 문장에 적용하기 위해 하나의 문장을 한 단어로 구성하여 처리하였다. 우리의 인식시스템을 평가하기 위하여 시스템 공학 연구소에서 제공한 음성을 대상으로 인식률을 계산하였다. 단어의 종류는 452개이며 한명이 이 단어들을 2번씩 발음하고 총70명이 발음한 총 63,280개의 단어에 대하여 92.8%의 인식률을 얻었다. 일간지 사설로부터 추출한 단어를 대상으로 발음 사전을 10K 크기로 만들었다. 음성 모델은 uniphone을 사용하였다.
-
본 논문에서는 이산적인 HMM(Hidden Markov Model)을 이용한 고립단어 인식 시스템에서 입력특징 벡터의 변별력을 향상시키기 위해 수정된 집단화 알고리듬을 제안하므로써 K-means나 LBG 알고리듬을 이용한 기존의 HMM에 비해 2.16%의 인식율을 향상시켰다. 또한 HMM학습과정에서 불충분한 학습데이타로 인해 발생되는 인식율저하의 문제를 해소하기 위해 개선된 smoothing 기법을 제안하므로써 화자독립 실험에서 3.07%의 인식율을 향상시켰다. 본 논문에서 제안한 두가지 알고리듬을 모두 적용하여 최종적으로 실험한 VQ/HMM에서는 기존의 방식에 비해 화자독립 인식실험 결과 평균 인식율이 4.66% 개선되었다.
-
본 연구에서는 연속음 인식과 합성을 위한 경계강도 예측 모델을 제안한다. 운율 경계 강도는 음성 합성에서는 운율구 사이의 휴지기의 길이 조절로 합성음의 자연도에 기여를 하고 연속음 인식에서는 인식과정에서 나타나는 후보문장의 선별 과정에 특징변수가 되어 인식률 향상에 큰 역할을 한다. 음성학적으로 발화된 문장은 큰 경계 단위로 볼 때 운율구 형태로 이루어졌다고 볼 수 있으며 구의 경계는 문장의 문법적인 특징과 관련을 지을 수 있게 된다. 본 논문에서는 운율 경계 강도 수준을 4로 하고 문법적인 특징으로는 트리구조 방법으로 결정된 오른쪽 가지의 수식의 깊이(rd)와 link grammar방법으로 결정된 음절수(syl), 연결거리(torig)를 bigram 모형과 결합하여 운율적 경계 강도를 예측한다. 예측 모형으로는 다중 회귀 모형과 Marcov 모형을 제안한다. 이들 모형으로 낭독체 200 문장에 대해 실험한 결과 76%로 경계 강도를 예측할 수 있었다.
-
본 논문에서는 음성인식 시스템의 인식 정도의 향상을 위해서 동적 특징으로서 K-L(Karhanen-Loeve)계수를 이용하여 음소모델을 구성하는 방법을 제안하고, 음소, 단어, 숫자음 인식 실험을 통하여 그 유효성을 검토하였다. 인식 실험을 위한 음성자료는 한국 전자통신 연구소에서 채록한 445단어와 국어정보공학연구소에서 채록한 4연속 숫자음을 사용하였으며, K-L계수 동적 특징의 유효성을 확인하기 위해 정적 특징으로서 멜-켑스트럼과 동적 특징으로서 K-L계수 및 회귀계수를 추출한 후 음소, 단어, 숫자음 인식 실험을 수행하였다. 인식의 기본 단위로는 48개의 유사음소단위(Phoneme Likely Unite ; PLUs)를 음소모델로 사용하였으며, 단어와 숫자음 인식을 위해서는 유한상태 오토마타(Finite State Automata; FSA)에 의한 구문제어를 통한 OPDP(One Pass Dynamic Programming)법을 이용하였다. 인식 실험 결과, 음소인식에 있어서는 정적특징인 멜-켑스트럼을 사용한 경우 39.8%, K-L 동적 계수를 사용한 경우가 52.4%로 12.6%의 향상된 인식률을 얻었다. 또한, 멜-켑스트럼과 회수계수를 사용한 경우 60.1%, K-L계수와 회귀계수를 결합한 경우에 있어서도 60.4%로 높은 인식률은 얻었다. 이 결과를 단어인식에 확장하여 인식 실험을 수행한 결과, 기존의 멜-켑스트럼 계수를 사용한 경우 65.5%, K-L계수를 사용한 경우 75.8%로 10.3% 향상된 인식률을 얻었으며, 멜-켑스트럼과 회귀계수를 결합한 경우 91.2%, K-L계수와 회귀계수를 결합한 경우 91.4%의 높은 인식률을 보였다. 도한, 4연속 숫자음에 적용한 경우에 있어서도 멜-켑스트럼을 사용한 경우 67.5%, K-L계수를 사용한 경우 75.3%로 7.8%의 향상된 인식률을 보였으며 K-L계수와 회귀계수를 결합한 경우에서도 비교적 높은 인식률을 보여 숫자음에 대해서도 K-L계수의 유효성을 확인할 수 있었다.
-
본 논문은 DTW(Dynamic Time Warping)을 이용한 음성인식에서 표준패턴(reference patterns)으로 사용되는 벡터열을 GA(Genetic Algorithm)을 이용하여 보다 적응된 패턴의 벡터열로 생성하는 방법을 제시한다. 본 논문의 필요성은 다음과 같다. 음성인식의 주요한 엔진들 중에 하나로 DTW가 사용된다[1]. DTW는 표준패턴과 시험패턴(test patterns)간의 최적 경로(optimal path)를 찾아내어 가장 유사한 패턴을 찾아내는 방법을 말한다. 그러나 음성은 같은 발음에 대해서도 사람의 발성 길이와 목의 상태 등에 따라 다양한 패턴으로 나타나며 동일 화자의 같은 어휘도 시간과 환경에 따라 변한다. 따라서 이러한 음성의 동적 특성에 적응하는 방법이 필요하다. 본 논문은 이러한 문제에 대한 해결 방법으로 GA를 이용하여 보다 적합하고 적응적인 표준 패턴을 생성시켜 적응하는 방법을 개발하였다.
-
기존의 음성인식시스템의 잡음환경에서 인식률의 한계를 극복하기 위해 음성신호뿐만이 아니라 입술정보를 결합하여 음성인식에 이용하여 바이모달(Bi-modal) 음성인식이 근래에 제안되어지고 있다. 그래서 바이모달 음성인식 시스템을 실제로 구현해보고 인식 실험을 수행해 보았다. 입술영상은 이미지에 근거한 입술모양을 파라메터화하여 인식실험에 사용하였으며 음성과 입술영상을 각각 인식한 후 인식스코어(Score)에 가중치를 적용하여 통합하는 방법을 사용하였다. 마지막으로 바이모달 음성인식의 잡음환경에서의 성능을 알아보기 위해 음성신호에 여러 레벨의 잡음을 섞어서 실험을 하고 잡음환경에서 인식률의 한계를 입술정보를 이용하여 극복할 수 있다는 것을 보이고자 한다.
-
본 연구에서는 입력 음성 특징 파라메터를 선형 및 비선형 변환함으로써 음성 특징의 1 차, 2 차 및 고차 통계치를 정규화하였다. 이러한 정규화 기법을 통해서 부가잡음 환경에서의 음성인식 성능향상을 얻을 수 있었다.
-
본 논문은 MLP, HMM, DTW가 결합된 하이브리드 시스템을 기반으로한 화자인식시스템에 대한 연구이다. 이미 시스템에 등록되어 있는 화자의 인식과 비등록 화자의 등록된 화자 키워드 도용에 대한 시스템 거부, 그리고 등록된 화자의 다른 등록 화자에 대한 키워드 도용에 따른 시스템 거부에 관하여 검토하였다. 키워드는 화자의 이름을 사용하였고, 시스템에 사용된 특징 파라메터는 15차 켑스트럼, 10차 LSF, 10개 대역으로 나뉘어진 주파수 대역별 에너지값(10차 FB)을 사용하였다. 이 세 가지의 특징 파라메터들과 세 개의 인식기를 조합, 모두 아홉 개의 인식 결과값을 누적하여 인식 여부를 결정하도록 하였다. 개별적 시스템에서 발생되는 오인식을 Hybrid model을 이용하여 처리한 본 시스템에서는 실험대상 화자에 대하여 100%의 시스템 신뢰도를 얻었다.
-
기존의 DTW를 이용한 화자 인식 시스템은 DTW의 단점이라 할 수 있는 과다한 계산량을 갖는다는 문제점을 갖고 있다. 따라서 본 논문은 텍스트 종속 화자 인식 시스템에서 피치 분포도를 갖는 개별 화자의 lDTW를 수행하기 전에 시간축 스케일링을 이용한 전처리로 인식시의 계산량을 감소시키는 과정을 미리 수행할 후 감소된 기준패턴들의 입력신호에 대해서만 DTW를 수행하는 방법을 제안하고자 한다. 제안한 방법을 실험하였을 경우 87.5%의 평균 처리 시간이 감소하였고, 더불어 인식률 감소는 거의 없었다.
-
본 연구에서는 문맥 종속 또는 문맥 독립형 화자 인식에서의 단점을 개선하는 방법으로 문맥 제시형 화자 인식을 수행하였다. 문맥 종속형 화자 인식은 제한된 문장이나 단어를 발성하여 출입 판별을 하는 방식으로 구현하기는 쉬우나 사칭자가 사용자의 목소리를 흉내낼 수 있으며[1], 문맥 독립형 화자 인식은 임의의 대화 문장이나 대화를 사용에게 유도하여 일정 시간 동안 녹음한 후에 이를 이용하여 사칭자가 접근을 허가 받을 수 있다는 단번이 있다. 또한 문맥 독립형 화자 인식에서는 접근 허가를 받기까지 많은 학습 시간이 필요하며 학습 시간이 적을 경우에 상당한 인식률의 저하가 발생된다. 문맥 제시형 화자 인식은 랜덤하게 제시된 단어만을 화자가 발성함으로써 특정한 문장이나 단어의 배열을 미리 녹음했다가 재생하는 방법을 배제할 수 있을 뿐만 아니라 동시에 학습을 위한 많은 시간을 소모하지 않는다는 장점이 있다. 본 논문에서는 화자로 하여금 랜덤하게 제시된 여러 개의 단어들을 순서적으로 발성하도록 하여, 발성 단어를 인식한 후에 인식된 단어를 통하여 화자를 판별하는 방법을 사용하였다.
-
본 논문에서는 전자 개인 비서 시스템(PEAS)의 일부인 일정관리 시스템을 화자인식 기술을 적용하여 구현하였다. 본 시스템은 음성을 패스워드로 개인을 확인하여 각 개인의 일정을 관리해 주는 것으로 보안성과 함께 사용자에게 편의성을 제공한다. 사용자 등록을 자유롭게 하였으며 인식에서는 계산 시간 등을 고려하여 DTW 알고리즘에서 얻을 수 있는 경로정보를 이용해 하나의 참조패턴을 구성하도록 하였다. 또한 시간 흐름에 따라 인식율 저하를 방지하기 위해 실험결과에 따라 일정기간 뒤에 자동으로 참조패턴이 갱신되도록 하였다.
-
이상호 135
본 논문에서는 트리 기반 모델링 기법 중 하나인 CART(Classification And Regression Trees) 방법을 이용하여, 운율구 추출, 운율구 사이의 휴지 기간, 음소 지속 시간을 모델링 하고자 한다. 총 400문장(약 33분)의 코퍼스를 수집한 후, 그 중 240문장(약 20분)을 이용하여 결정 트리와 회귀 트리를 학습시키고 160문장(약 13분)에 대해 실험하였다. 운율구 경계를 결정하는 결정 트리의 오류율은 14.6%이었고, 운율구 사이의 휴지 기간과 음소 지속 시간을 예측하는 회귀 트리들의 평균 제곱 오류근(RMSE)이 각각 132.61msec, 21.97msec이었다. -
그 동안 TTS 음성합성의 평가 척도로 명료도(Clarity)와 자연성(Naturalness)을 기준으로 삼았다. 이제는 합성음의 평가 기준이 사람 목소리와 이해도가 되는 것이 좋겠다고 생각한다. 본 논문은 사람 목소리와 이해도라는 척도 중에서 사람 목소리에 관한 주제를 다루고자 한다. 이를 위하여 음성 DB의 합성 단위로 CVC type을 기본으로 하고, CV, VC type으로 보강한 단위를 선정하여 음성 DB를 구축하였다. 그리고 합성 알고리즘은 음색을 살리며 피치 변경이 용이한 PS-RELP 알고리즘을 제안하였다.
-
자연스러운 한국어의 음성합성을 위해서는 음운의 지속시간의 제어가 매우 중요하다. 본 연구에서는 POW3848 어절에 대한 음성 데이터에 대해 음운 세그먼트, 음운 라벨링, 품사 태깅을 행한 음성 데이터베이스를 구축하여 한국어 음운의 지속시간을 변화시키는 시간 특징을 통계적으로 분석하였다. 이 시간 특징들 중 변화 폭이 큰 요인들을 제어요소로 각 음운의 고유길이를 최대한 배제하고 단지 음운 발성 환경의 영향에 의한 지속시간 변화만을 고려하는 정규화 지속시간에 대한 회귀트리로 한국어 음운 지속시간을 모델화 하였다. 제안된 음운 지속시간 모델을 실시간 제어 알고리즘으로 구현하여 평가한 결과, 음운 지속시간 예측오차의 88% 정도가 25ms이내 이었고 예측치와 관측치 간의 다중 상관관계수는 0.92 정도로 평가되어, 제안된 모델의 타당성이 입증되었다.
-
In the case of speech synthesis, the waveform coding method with high quality is mainly used to the synthesis by analysis. Because the parameters of this coding method are not classified as both excitation and vocal tract parameters, it is difficult to apply the waveform coding method to the synthesis by rule. Thus, in order to apply the waveform coding method to the synthesis by rule, a pitch alteration is required for the prosody control. In the speech synthesis method by the conventional PSOLA technique, applying symmetric window function to asymmetric speech waveform, it occurs the unbalance phenomenon of energy according to the overlapped degree of pitch interval adjustment. In this paper to overcome the unbalance phenomenon of energy, we proposed a new method that can convert asymmetric waveform to symmetric one by time-frequency conversion. As a result, we can obtain an average spectrum distortion ratio with 6.38% according to the pitch alteration ratio.
-
이중 전송율(5.3 과 6.3kbit/s)을 제공하는 G.723.1 음성 코더는 공중망을 통한 H.324 POTS 영상 회의 규격의 음성 코더로 채택된 것으로, MPMLQ, ACELP 알고리즘에 근거한다. 본 논문에서는 Annex A를 포함한 G.723.1 음성 코더 알고리즘을 C&S Technology에서 개발한 음성 신호 처리를 위한 범용 DSP인 CSD17C00 칩을 이용하여 실시간 응용이 가능하도록 구현하였다. G.723.1 에 대한 양방향 평가가 Codec loopback을 통해 수행되었으며, ITU에서 제공한 테스트 절차에 따라 평가되었다. 또한, 본 논문에서 구현된 G.723.1 음성 코더는 27MIPS의 계산 속도를 갖으며, 프로그램 ROM의 크기는 8.85K Words이고, 10K 데이터 ROM과 4K 데이터 RAM을 필요로 하고 있다. 경쟁 제품과의 MOS 측정 음질 평가를 실시한 결과, CSD17C00에서의 음질 성능이 더 우수함을 입증 함으로써, 본 논문에서 보여준 CSD17C00을 기반으로 구현된 G.723.1 알고리즘의 실시간 구현기술의 타당성을 검증하게 되었다.
-
IMBE(Improved Multi-Band Excitation) vocoders exhibit good performance at low data rates. The major drawback to IMBE coders is their large computational requirements. In this paper, thus, we propose a new pitch search method that preserves the quality of the IMBE vocoder with reduced complexity. The basic idea is to reduce computation complexity of the pitch searching by using the SAMDF. Applying the proposed method to the IMBE vocoder, we can get approximately 52.02% searching time reduction in the pitch search. There is no difference in voice quality between conventional IMBE and proposed IMBE.
-
Speech synthesis coding is classified into three categories: waveform coding, source coding and hybrid coding. To obtain the synthetic speech with high quality, the synthesis by waveform coding is desired. However, it is difficult to apply waveform coding to synthesis by syllable or phoneme unit, because it does not divide the speech into excitation and formant component. Thus it is required to alter the excitation in waveform coding for applying waveform coding to synthesis by rule. In this paper we propose a new pitch alteration method that minimizes the spectrum distortion by using the behavior of cepstrum. This method splits the spectrum of speech signal into excitation spectrum and formant spectrum and transforms the excitation spectrum into cepstrum domain. The pitch of excitation cepstrum is altered by zero insertion or zero deletion and the pitch altered spectrum is reconstructed in spectrum domain. As a result of performance test, the average spectrum distortion was below 2.29%.
-
본 논문에서는 장애음성들의 분석을 위하여 기존의 파라미터들인 jitter, shimmer 및 NHR과 함께 음원의 추정에 의한 파라미터를 이용하여 장애음성의 음향적 특성분석을 위한 실험을 행하고 정상음성과 장애음성을 이들 파라미터에 의해 식별하고자 한다.
-
음성신호의 특징적인 성분인 피치를 검출하는 알고리즘 중 실시산 구현이 손쉬운 3단계를 클리핑 알고리즘을 PC상에서의 처리를 위하여 구현하였다. 이 알고리즘을 통하여 검출되는 피치의 안정성 및 정확성을 높이기 위해서 적용된 창함수, LPF, 클리핑 자기상관값계산, 비선형 감쇄, 등의 전처리 필터링과, 배수피치 검출 및 정정, 메디언 필터링을 사용하여 피치를 검출하였다. 또한 이 알고리즘을 이용하여 DSP의 도움을 얻지 않고 PC상에서 음성을 분석하여 스펙트로그램, 파형, 에너지, 피치 등을 출력하는 프로그램인 Visual Analysis Tool for sounds(VAT)의 출력화면을 통하여 피치검출을 나타내었다.
-
본 논문에서는 음성합성(speech synthesis) 및 부호화(coding) 시스템에 있어서 음원(voice source) 모델링에 관한 문제를 살펴보고자 한다. 기존의 음원 모델링 시스템이 가지고 있는 여러 문제들을 극복하고자 기저함수(basis function) 의 가중 합(weighted-sum)으로 음원을 모델링 하는 새로운 기법을 제안하고자 한다. 제안한 방법에서는 음원 파형(voice source waveform)을 적절히 표현하기 위해서 필터뱅크(filter bank)에 기초한 기저함수의 가중 합으로 나타낸다. 다양한 음원 특성을 효과적으로 나타내는 음원 파라미터를 구하기 위하여 EM(estimate maximize)에 기초한 구조에 관해 조사한다. 제안한 방법을 이용하여 다양한 유성음에 대해 실험을 수행하였다. 실험결과 제안한 추정(estimation) 방법 및 모델링 방법을 이용하면 기존의 방법에 비해 더 정확한 음원 파형을 추정할 수 있고, 다양한 음원 특성을 나타낼 수 있다. 또한 음성합성 및 부호화에서도 음성품질(voice quality)를 개선시킬 수 있으리라 기대된다.
-
음질개선에 이줄 여진(Double Excitation) 음성모델을 적용하는 방법이 있다. 유성음과 무성음 성분들로 분리하는 이 방법은 각 성분들의 고유한 성질을 이용하여 음질을 저하시키는 wideband 잡음을 제거할 수 있다. 이중 여진 음성모델을 이용한 음질개선 시스팀과 기존의 스펙트랄 제거(spectal subtraction) 알고리즘을 비공식적으로 비교한 결과 이중 여진 모델을 이용한 방법이 더 나은 성능을 보였다.
-
본 논문에서는 보청기의 다채널 구조를 이용하여 음향 궤환 제거의 대역폭과 대역의 위치를 조절할 수 있는 새로운 알고리듬을 제안하였다. 제안한 알고리듬에서는 음향 궤환 제거기가 보청 알고리듬의 각 주사수 대역별로 따로 연결되어 있기 때문에 주파수 대역과의 연결에 따라 특정 주파수 대역에서만 음향 궤환이 이루어지게 할 수도 있고, 기존의 음향 궤환 제거 방식과 같이 전 주파수 대역에서도 음향 궤환 제거를 할 수 있으므로 보다 효과적이고 유연한 알고리듬이라 할 수 있다. 따라서 성능면에서도 기존의 알고리듬과 같거나 특별한 조건하에서는 더 나은 성능을 보인다. 제안한 알고리듬에 대해 3개의 채널을 가지는 보청기 구조와 8개의 채널을 가지는 보청기 구조에서 실험을 행하였다. 음향 궤환 경로는 문헌의 자료를 참고하여 2가지를 만들어 이들 음향 궤환 경로의 특성이 집중되어 있는 대역으로 제한하여 음향궤환 제거를 한 결과 전주파수 대역에서 음향 궤환 제거를 한 경우보다 이들 제한된 대역내에서는 더 음향 궤환이 잘 이루어졌다.
-
실제의 음성 인식 및 음성 통신 등의 음성 처리 시스템에서는 음성 신호를 손상시키는 배경 잡음 신호의 존재로 그 성능이 많이 저하된다. 특히 차량 내와 같은 잡음이 극심한 상황에서는 전처리 부분에서 이러한 잡음을 제거시켜 주어야한다. 본 연구는 자동차 내의 배경 잡음에 의해 손상된 음성에서 배경 잡음을 주파수 차감에 의하여 제거시킨다. 특히 음성 정보의 손실이 적은 잡음 추정 방법으로 가중치를 이용하여 잡음을 추정하는 가중치 주파수 차감법을 이용하였다. 이러한 가중치 주파수 차감법 사용의 전제 조건은 잡음의 변화가 완만한 경우에 적당하다. 그러나 실제적인 상황에서 배경잡음신호의 변화가 큰 경우가 존재한다. 이러한 이유에서 본 연구는 잡은 추정시 잡음 추정값을 이용하여 추정 잡음 경계값을 적응적으로 변화하는 차감법을 제안한다. 이러한 방법은 추정된 잡음 신호의 변화율을 이용하여 경계값을 상황에 따라 적응적으로 변화시키는 방법이다. 모의 실험에 의하여 고정적인 경계값을 갖는 가중치 주파수 차감법에 비해 제안한 적응적 경계값을 갖는 가중치 주파수 차감법의 출력 SNR이 증가함을 확인하였고, 음성 인식 시스템에 정용한 인식 실험에서도 성능이 향상됨을 확인하였다.
-
전화망을 이용한 음성인식 시스팀에서 출력신호의 반향에 의한 입력신호의 음질 열화현상을 막기위해서 적응디지털 필터를 이용한 반향제거기가 필수적이다. 대표적인 적응 필터 알고리즘인 LMS와 NLMS 들을 각각 이용한 적응 반향제거기들과 입/출력신호의 상관계수를 이용한 개선된 적응 필터 알고리즘의 성능을 비교하였다. 개선된 알고리즘의 경우 NLMS 알고리즘의 빠른 수렴특성을 가지면서도 더블톡(double talk)구간에서의 음질왜곡 현상을 LMS보다 개선시켰다.
-
지금까지 바이노럴 필터 설계 방법들의 대부분은 linear frequency scale을 이용한 것이지만, 사람의 귀는 non-linear frequency scale을 가지며 critical band에 의한 청각정보를 인지한다. 따라서, 이와 같은 특징을 이용하여 좀 더 효율적으로 바이노럴 필터를 설계할 수 있다. 본 논문에서는 frequency warping을 이용해 non-linear frequency resolution을 갖는 바이노럴 필터를 계산한다. 또한, 종래의 설계방법에 의한 필터와 warped FIR 구조를 갖는 바이노럴 필터와의 비교청취를 통해 성능의 비교 평가를 수행 한다.
-
본 논문에서는 유전자 알고리즘(genetic Algorithm)을 사용하여 벡터 양자화(vector quantization : VQ)를 수행하는 방법을 제안하고자 한다. 벡터 양자화를 수행하여 코드북(codebook)을 생성할 때 생성된 코드북과 학습벡터(training vector)사이에는 반드시 양자화 오차(quantization error)가 발생하는데 기존의 K-means 알고리듬을 사용하여 코드북을 생성했을 경우 양자화 오차를 줄이는데 한계가 있었다. 본 논문에서 제안하는 유전자 알고리즘을 이용한 벡터 양자화는 이 양자화 오차를 감소시키기 위해서 연구되었다. 제안한 방법의 성능을 평가하기 위해 음성데이터를 기존의 K-means 알고리즘에서 클러스터의 중심을 선택하는 방법중의 하나인 Minimax방법으로 코드북을 생성하여 제안한 방법과 양자화 오차를 비교한 결과 양자화 오차가 감소됨을 알 수 있었다.
-
강당, 회의실, 강의실 등과 같은 닫혀진 공간에서 포착된 소리의 질은 반향음과 간섭 잡음 등에 의해 영향을 받는다. 마이크로폰에 수신되는 신호는 직접전달파와 벽면에 의한 반사파들이 더해지므로 해서 실제 발생음을 명확히 얻기가 어렵다. 수신측 마이크로폰에서 반사음의 영향을 제거하면 실제 발생음에 가까운 양질의 소리를 얻을 수 있을 것이다. 잡음과 반향음의 영향이 큰 음향 공간에서 고음질의 소리를 얻기 위한 방법으로 마이크로폰 배열의 병렬 신호 처리 기법이 있다. 본 연구에서 제시된 마이크로폰 배열의 병렬 신호처리 기법은 공간적 음량 선택성을 제공하기 위해 각 마이크로폰 센서들의 matched filter 처리와 병렬 처리 기법을 결합한다. 이 기법은 다중경로 왜곡(반향)과 간섭 잡음을 제거하는 수단을 제공한다.
-
본 논문에서는 VLSI 기술에 바탕을 둔 top-down 접근 방식에 의하여 MPEG-2 오디오 부호화 알고리듬을 구현하였다. MPEG-2 오디오 부호화기의 알고리듬은 많은 연산량을 갖고 이질적인 특성을 갖고 이질적인 특성을 갖는 알고리듬들이 복합적으로 존재한다. 그러므로, 부호화기를 효과적으로 구현하기 위해서는 알고리듬 수준에서 구조적 수준에 이르기까지 많은 고찰이 이루어져야 한다. 본 논문에서는 우선 전체 부호화 알고리듬을 분석하여 이들을 다시 작업이라고 정의된 작은 부-알고리듬으로 나누었다. 다음으로, 분할된 작업들은 시간과 공간을 초대한 활용할 수 있도록 적절한 작업 순서를 부여하고, 좀 더 큰 모듈들로 모으는 클러스터링을 수행하였다. 마지막으로 이러한 분석 결과를 바탕으로, 실시간으로 동작하는 5.1 채널 MPEG-2 오디오 부호화기를 설계하였다. 설계된 시스템은 두 개의 하드웨어 블록과 한 개의 ASIP형 DSP 프로세서를 갖는 이질적인 다중 프로세서의 형태를 갖는다. 설계된 오디오 부호화기는 0.6
$\mu\textrm{m}$ 표준 셀 기술을 이용하여 단일 칩으로 제작되었으며, PC에 탑재 가능한 시험 기판을 제작하여 동작을 검증하였다. -
소나나 레이다분야에서 목표물로부터 오는 신호의 산란점을 추정하는 것은 추정한 산란점 특성을 분석하여 목표물을 식별하기 위해서 연구되어 오고 있다. 지금까지 연구되어온 모델링에 의한 산란점 추정을 보면 많은 경우 Prony 모델에 근거하여 추정하고 있다. Prony 모델을 레이다나 소나에 적용할 때에 몇 가지 단점을 갖고 있다. 그 첫째는 Prony모델이 잡음에 약하다는 점이고 둘째는 Prony모델이 모델차수에 대한 사전정보를 요구한다는 점이다. 본 논문에서는 위에 든 단점중에서 잡음에 취약한 점을 보완하기 위해서 입력 신호 성분만을 자동 추적하는 창함수(Automatic Tracking Window)를 전처리기로 사용한 Prony 산란점 추정 방법을 제안한다. 또 그 성능을 기존 Prony방법만을 사용한 산란점 추정방법과 비교하여 잡음에 대한 성능 향상을 보였다.
-
This paper proposes improved algorithm for multi-user detection in DS-CDMA. Each of algorithm is based on CMA algorithm. Improved LMS-CMS and LMAD-CMA are combined to macthed filter. Simulations results shown that Improved LMAD-CMA algorithm has a higher capacity than MOE in steady-state convergence properties.
-
간섭신호가 원하는 신호에 coherent한 경우에는 원하는 신호와 간섭신호간의 cross correlation에 의해 공분산 행렬의 rank가 줄어들게 되어 coherent한 간섭신호의 도래각을 추정할 수 없게 된다. 이러한 문제를 해결하기 위해 발표된 기존의 방법중 대칭 어레이(Symmetric array)방법은 계산량이 많아지고 공간 스무딩(Spatial Smoothing)방법은 array aperture size에서 손해를 보게 되어 분해능이 떨어지는 단점이 있다[1,2,3].
-
파이프의 양 끝단에 심한 온도구배가 형성될 때 음향이 발생한다는 사실은 이미 알려진 사실이다. 본 연구는 열구동식 열음향냉동기를 구현하기 위해서 1단계로 열원에 의한 음향발생을 달성하고자 했다. 이를 위해 1/4 파장의 열음향 발생장치를 설계 및 제작하여 실험에 사용하였다. 열음향 발생기는 직경 3cm, 길이 16cm의 공명관에 가열부, 박판집적체, 고온부 및 저온부의 열교환기로 구성되며 발생음의 기본주파수는 520Hz로 설계하였다. 고온부를 38
$0^{\circ}C$ 로 가열한 결과 열음향발생기의 개구부로부터 1m 떨어진 곳에서 최초 음압측정값이 약 112dB, 음향출력으로 약 1와트에 해당하는 값을 얻었다. 박판집적체에 급격한 온도구배가 형성되면서 주변의 기체가 자발적인 진동을 하여 형성된 음향동력중 일부는 공명관 벽에 흡수되고 일부는 열교환기에서 점성에 의해 소산된다. 따라서 실제로 음향으로 변하는 부분은 이들을 감한 부분인데 실험결과 약 53%의 음향 생성효율을 달성했으며 이는 스위프트 등이 얻었던 결과보다 우수하다. -
A new real time sound field visualization technique is introduced in this study using PIV(Particle Imaging Velocimetry) technique. Small particles of which density is small enough to follow up the air flow are used for sound visualization. When the driving frequency is in the vicinity of the resonance frequency of the simplified 2-dimensional muffler system, an acoustic streaming is shown and of which velocity distribution is obtained through PIV technique. It is experimentally proved that the present technique is able to visualize and quantify the sound field's energy flow.
-
In this paper, a new variable wavelet packet decomposition audio coder, based on the time varying characteristic of the audio signals, is proposed and presents a technique to incorporate psychoacoustic models into an adaptive wave let packet scheme. The proposed filterbank improves the defect of the polyphase filterbank that could not properly represent the critical band and the defect of QMF-tree filter that need high complexity to implement. The filterbank consists of varying number of subband from 4 to 26 bands and use Daubechies 6-order wave let. The codec yields excellent quality at total bit rates of about 128kbps for monophonic CD-quality signals with an sampling frequency of 44.1kHz and reduces complexity by 19% for various bit-rates and sources with encoding and decoding process.
-
MPEG 오디오 그룹에서는 오디오 부호화 기술의 국제 표준으로 MPEG-1 오디오, MPEG-2 오디오 BC, MPEG-2 AAC의 규격 제정을 완료하였고, 현재 MPEG-4 오디오 및 MPEG-7 오디오의 국제 표준을 제정하고 있다. 본 논문에서는 이들 표준에 대한 요구 기능 및 기술 특징을 분석하고, 각각의 표준에 대한 응용분야와 향후의 계획에 대하여 기술한다.
-
Sine파를 이용한 오디오 분석과 합성은 고음질 저비트율 오디오 부호화에 매우 효율적인 방법의 하나로 알려져 있다. 본 논문은 sine파를 이용한 오디오 분석과 합성에 중요한 sine파 검출에 심리음향모델을 활용하는 방안을 제안하였다. 모의실험 결과, 심리음향모델을 사용한 경우 사용하지 않은 경우에 비해 합성에 사용되는 sine파의 개수를 약 50% 정도 줄일 수 있었음을 알 수 있었다. 한편 오디로 신호의 attack이나 nonstationarity를 처리할 수 있는 방법이 sine파를 이용한 오디오 부호화에 필수적이라는 사실을 확인하였고 그에 대한 대처 방안을 제시하였다.
-
본 논문에서는 MIT 머리전달함수(Head-Related Transfer Function; HRTF)와 Neumann의 머리전달함수를 이용하여 머리전달함수가 음성정위에 미치는 영향을 비교분석하였다. 이를 위하여 머리전달함수의 측정조건과 시간 및 주파수특성을 비교 분석하였고 청취실에 헤드폰 재생을 통하여
$10^{\circ}$ 간격으로 음상정위에 대한 주관평가들 실시하였으며, 주관평가 자료를 이용하여 개인과 전체 평균에 대한 방향 지각 에러(각도)를 계산하였다. 실험결과, MIT 머리전달함수에 비하여 Neumann 머리전달함수를 이용한 음상정위가 양호하게 나타났으며 음질에 대해서도 청취자들은 Neumann 머리전달함수에 의한 재생음이 보다 자연스럽고, 명확한 품질을 갖는다고 답하였다. -
본 논문에서는 1채널(mono)이나 2채널(stereo)의 오디오 입력을 5채널(center, left, right, left side, right side)로 출력시키는 음장 시스템을 설계하고 그 성능을 분석하였다. 가정의 리스닝 룸 같이 작은 공간에서 콘서트 홀 같은 커다란 공간의 음장을 재현하기 위한 멀티 채널 음장 시스템은 지연기, 초기 반사음처리기, 잔향기를 이용해 설계하였다. 초기 반사음 처리기의 지연과 이득은 실제 공간에서 측정한 암펄스 응답을 이용하여 결정하였으며, 구현된 초기 반사음을 전방 30
$^{\circ}$ 방향에서 재생함으로써 확장감을 증가시킬 수 있도록 하였다. 잔향기는 자연스러운 주파수 및 감쇠 특성을 갖도록 설계되었으며, 후방 60$^{\circ}$ 방향에서 재생되는 잔향의 상관 계수를 작게 함으로써 청취시 공간감을 느끼게 하였다. 설계된 음장 시스템은 무향실 데이터를 입력으로 시뮬레이션되었고, 그 결과로 얻어진 5개의 PCM 출력은 멀티 트랙 재생 장치에 의해 일반 리스닝 룸에서 재생된다. -
본 논문에서는 스테레오 스피커를 통해 입체 음향을 재생할 때 발생하는 크로스 토크(corss talk)를 제거하기 위한 트랜스오럴 필터를 실시간으로 구현하였다. 실시간 처리를 위하여 일반적인 트랜스오럴 필터를 재구성하였으며, 범용 DSP(Digital Signal Processor) 칩인 TMS320C40을 사용하였다. 메인 프로그램은 C-언어를 이용하여 작성하였으며, 빠른 연산을 필요로 하는 컨벌루션 함수는 어셈블러 언어를 이용하여 최적화 하였다. 구현된 트랜스오럴 필터의 평가를 위해서 더미 헤드를 이용하여 녹음된 binaural 신호와 DSP를 이용하여 실시간으로 합성된 binaural 신호를 스테레오 스피커를 통해 재생하여 청취 실험하였다. 청취 실험한 결과 머리 밖에서 음상 정위가 이루어지고 공간감과 거리감은 헤드폰으로 청취할 때 보다 우수하게 나타났다.
-
본 연구에서는 기존의 문헌에 자세히 기술되지 않은 주파수 분할 방법에 대한 고찰을 통해 과도음의 라우드니스 해석에 적합한 임계 대역 해석 방법을 제안하고, 이를 근거로 과도음의 라우드니스 모델을 구현하여 기존의 임상 실험 결과와의 비교함으로써 그 유효성을 확인하였다. 또한 순음의 라우드니스 해석에서 기존 라우드니스 모델이 안고 있는 신호해석 상의 문제점 등을 지적하고 이를 개선한 새로운 모델을 제시하였다. 개선 방법으로서 임계 대역폭의 1/2 간격으로 총 47개의 임계 대역 필터를 배치하여 필터의 경계에 순음이 존재할 때 발생할 수 있는 라우드니스 오차를 최소화 하였다. 또한 이 모델에서는 Zwicker가 제안했던 기존의 방법을 제안된 임계 대역 필터에 적합하도록 수정하는 작업이 포함되었다.
-
monaural 신호는 귀의 특성과 인간의 청취 특성을 정확하게 반영하지 못하는 문제점이 있다. 귀 자체의 특성이 binaural인 것을 생각하면 monaural 신호를 이용한 방법은 정확한 결과가 나오기 어렵다. 따라서 이 논문에서는 monaural 신호를 이용한 음질 평가 시스템의 단점을 보완하고 귀의 binaural 특성을 살린 binaural 음질 평가 시스템을 구현하였다. 소리에 대한 심리음향학 인자로는 monaural 평가에서 사용했던 loudness, sharpness, roughness, fluctuation strength, annoyance, pleasantness를 binaural에 맞도록 수정하였으며, monaural 평가에서는 사용하지 않았던 tonality를 추가하여 pleasantness의 annoyance의 계산식을 수정하였다.
-
성덕대왕 신종을 비롯한 한국범종의 독특한 특성으로 맥놀이 현상을 들 수 있는데, 이것은 한국범종의 독창적인 형상과 재질에서 기인한다. 본 논문에서는 종의 형상과 재질을 달리하였을 때 종소리의 특성이 어떻게 달라지는가를 확인하고, 이로부터 가장 좋은 소리를 내는 종의 조건을 찾아보고자 한다. 이를 위해 주석 함량, 형상, 두께가 다른 열다섯 개의 모형종에 대해서 고유 주파수의 변화와 맥놀이 현상을 알아보았다. 그리고 한국범종과 외국종과의 차이점을 알아보기 위해, 일본종과 중국종의 대표적인 형상을 갖는 모형종을 한국범종을 모델로 한 모형종과 비교해 보았다. 또한, 울림통을 종의 아래에 설치하여, 울림통의 크기와 울림통과 종의 아래에 설치하여, 울림통의 크기와 울림통과 종 사이의 거리에 따른 종소리의 변화도 분석하였다.
-
In the experiment carried out on 20 college students, recorded were frontal, temporal and occipital EEG, skin conductance response, skin conductance level, heart rate and respiration rate during listening to two music fragments with different affective valences and white noise administered immediately after negative visual stimulation. Analysis of physiological patterns observed during the experiment suggests that affective auditory stimulation with music is able to selectively modulate autonomic and cortical activity evoked by preceding aversive visual stimulation and to restore initial baseline levels. On other hand, physiological responses to white noise, which does not possess emotion-eliciting capabilities, evokes response typical for orienting reaction after the onset of a stimulus and is rapidly followed by habituation. Observed responses to white noise were similar to those specific to attention only and had no evidence for any emotion-related processes. Interpretation of the obtained data is considered in terms of the role of emotional and orienting significance of stimuli, dependence of effects on the background physiological activation level and time courses of attention and emotion processes. Physiological parameters are summarized with regard to their potential utility in differentiation of psychological processes induced by auditory stimuli.
-
가야금과 바이올린의 소리 발생 특성을 이해하기 위하여 모드해석을 수행하였다. 바이올린과 가야금은 크게 현과 몸체 그리고 이 둘을 연결하는 부분으로 구성되어 있다. 소리는 이들의 유기적인 관계로부터 발생된다. 실험을 통해 살펴본 결과, 저주파 대역에서 바이올린의 진동은 크게 앞, 뒷판의 진동, 몸체와 목 부분 사이의 비틀림 진동, 바이올린 전체가 하나의 보처럼 진동하는 현상으로 나누어 볼 수 있었다. 가야금 상판의 진동 형상은 약간 휘어진 형태를 가지며, 전체적으로 평판의 진동과 같은 모습을 보였다.
-
본 논문에서는 고주파수 대역의 진동 전달 현상을 묘사할 수 있는 원형파를 기본 개념으로 한 레이 추적기법(RTM)을 개발하였다. 2차원 원형파를 묘사할 수 있는 레이튜브 개념을 제안하고, 진동 연성경계에서의 입사파, 전달파, 그리고 반사파가 경계조건을 만족하도록 관계식을 유도하였다. 이를 평판 연속 구조물이 고주파수 진동 전달 해석에 적용하여 보았으며, 유사 해석 기법인 SEA 및 파동 인텐시티해석법(WIA)과의 비교를 수행하여 보았다. 그 결과, SEA에 비하여 이론해와 더 잘 맞는 예측 결과를 관찰할 수 있었으며 WIA와 유사한 결과를 보임을 확인할 수 있었다. 본 논문에서 제안된 RTM은 진동전도해석(VCA)과 같이 지역적 정보를 알 수 있는 장점도 가지고 있으며, 2차원 진동구조물의 고주파수 진동 전달 해석시 기존이 SEA 및 WIA를 대체할 수 있는 기법으로 판단된다.
-
경계요소법에 기초한 음향 홀로그래피의 재구성 정확도 향상을 위해서는 근접 음장에서의 음압 측정을 수반한다. 이에 따라 비전파음 성분이 측정에 포함되어 전달행렬의 특이성에 의한 오차를 줄일 수 있다. 그러나, 전달행렬 구성을 위해서 사용되는 일반적인 경계요소법은 Kirchhoff-Helmholtz 방정식의 기본해가 갖는 특이성 때문에 근접음장에서 큰 수치 오차를 유발하는 문제가 있다. 특이성이 제거된 경계 적분방정식을 도입하여 음향 홀로그래피를 수행함으로써 근접 음장에서의 수치오차 문제를 극복하고 정확한 음장 예측 및 전달 행렬을 구성할 수 있다. 본 연구에서는 단순한 수치 해석 모델을 이용하여 음향 홀로그래피 계산을 수행하였고, 일반 경계요소법을 사용한 경우와 비교하여 향상된 결과를 얻을 수 있음을 밝혔다.
-
The paper describes a theoretical and experimental study on the speed of the torsional elastic waves propagating in an axisymmetirc waveguide whose cross-sectional area varies periodically as an harmonic function of the axial coordinate. The approximate solution of the phase speed has been obtained using the perturbation technique for sinusoidal modulation of small amplitude. The experiment verifying the theoretical result consists of transmitting and receiving torsional waves by magnetostriction and measuring the wave speed in the waveguides with threaded surfaces.
-
Wave propagation in inhomogeneous elastic media is studied by using the Fourier method, where the spatial derivatives are computed by the FFT algorithm, while the time derivatives are expanded into the second order finite different expansion. For numerical examples, wave propagation in the layered half-plane are investigated. The comparisons of numerical and analytic results shows good agreement.
-
The various services that a broadband integrated services digital network (B-ISDN) carries, have a wide range of delay, delay jitter and cell loss probability requirements. Design of appropriate control schemes for B-ISDN is an extremely important and challenging problem. In this paper, we proposes a priority control scheme with a delay counter and a cell counter per each class type. The priority control for required service quality is performed with delay/loss factor obstained by comparing window counter with cell counter. The performance of proposed control scheme is estimated by computer simulation.
-
This paper present an access scenario to the Korean standard time service systems and those of world major cities was designed in the research for development of the time-announcing service systems. Elements of the system structure as well as statistics and user management were proposed as the main topics for the research. As a result of the research, a system was realized for world time announcing service by dialing 116.
-
최근 개인 휴대통신과 컴퓨터 기술의 발달로 유용한 데이터의 질적.양적 향상을 가져왔다. 이로 인해 저장중이거나 선로상에서의 전송중인 정보의 보호문제가 중요시되고 있다. 이러한 정보보호 문제가 중요시됨에 따라 정보보호를 위한 직접적인 암호화 방법중의 하나인 IDEA(International Data Encryption Algorithm)의 구현을 제안하고자 한다. IDEA는 블록 암호화 방식의 하나로서 64비트 데이터를 암호화하기 위해 128비트의 키를 사용한다. 본 논문에서 암호알고리즘 구현을 위하여 하드웨어 설계언어인 VHDL을 사용하였고, V-System을 이용하여 Simulation을 수행하였다. Coding된 알고리즘은 Synopsy를 사용하여 자동합성하였고, Xilinx사의 FPGA-4025를 Target으로 구현하였다.
-
DS/CDMA system rejected narrow-band interference and additional White Gaussian noise which are occured at multipath, intentional jammer and multiuser to share same bandwidth in mobile communication systems. Because of having not sufficiently obtained processing gain which is related to system performance, they were not effectively suppressed. In this paper, an matched filter channel model using backpropagation neural network based on complex multilayer perceptron is presented for suppressing interference of narrow-band of direct sequence spread spectrum receiver in DS/CDMA mobile communication systems. Recursive least square backpropagation algorithm with backpropagation error is used for fast convergence and better performance in matched filter receiver scheme. According to signal noise ratio and transmission power ratio, computer simulation results show that bit error ratio of matched filter using backpropagation neural network improved than that of RAKE receiver of direct sequence spread spectrum considering of con-channel and narrow-band interference.
-
주파수 합성기는 주로 PLL을 이용하여 설계하는데, PLL(Phase-lock loop)이란 출력신호 주파수를 항상 일정하게 유지하도록 구성된 주파수 부귀환 회로로써 기본적인 구성은 위상출력기, 저역통과필터, 전압 제어 발진기로 이루어진다. 이런 PLL의 기본적인 구성에 프로그래머블카운터를 VCO의 출력단에 부가하여 구성한 형태가 주파수합성기이다. 이 주파수합성기의 출력을 프로그래머블 디바이더에 입력하기 전에 주파수를 낮출 필요가 있는데, 현재 슈퍼헤테로다인 다운 컨버터방식과 프리스케일러방식과 펄스 스웰로 카운터를 사용하는 방식 등의 3가지 방법이 있다. 본 논문에서는 펄스 스웰로 카운터 방식의 주파수 합성기를 MATLAB의 GUI환경과 병행하여 시뮬레이션 과정을 통한 동작특성을 이해하고, 한 화면에서 이루어지는 조작에 의해 모든 주파수 합성기의 요소를 관찰할 수 있도록 모델링하였다. 그리고, 모델링한 주파수합성기와 실제 주파수합성기에서 예상되는 출력과 비교하여 그 결과에 있어서 얼마나 유사한지 살펴보았다.
-
본 연구의 목적은 한국어 마찰음과 파찰음을 변별적으로 지각하게 해 주는 결정적 단서를 찾아보려는 것이다. 마찰음의 마찰 소음 구간 길이를 감소시키고, 파찰음의 마찰 소음 구간 길이를 증가시키는 두 가지 실험을 통해 소음 구간의 길이 변화가 지각에 미치는 영향을 살펴 보았다. 실험 결과, 소음 구간 길이의 변화가 주된 지각적 단서임을 확인하였다.
-
본 연구의 목적은 한국에 존재하는 세 종류 파찰음/ㅈ,ㅊ, ㅉ/의 시간적.공간적 조음 특성을 전자구개도와 스펙트로그램 분석을 통하여 면밀히 검토해 보려는 것이다. 이를 위하여 두 실험이 행해 졌는데, 조음 음성학적인 실험(전자구개도를 이용한 실험)에는 한 명의 피험자가, 그리고 음향 음성학적인 실험(음향 자료의 스펙트로그램 분석)에는 세 명의 피험자가 발화한 자료가 이용되었다. 대상이 되는 세 자음들은 /ㅏ_ㅏ/, /ㅡ_ㅡ/, /ㅣ_ㅣ/ 등 세 모음 사이에서 발화되었으나, 모음이 자음의 조음에 미치는 영향, 즉 모음_자음 동시조음은 본 연구의 범위에서 제외되었다.
-
이 연구는 서울말과 경상도 말의 고저형(tonal patterns)을 외래어 읽기를 통해 비교해 본 것으로, 두 방언의 고저형에 변수로 작용하는 것이 음절수, 음절 구조(폐음절/개음절), 어두 자음의 성격(phonation type) 등임을 밝혔다. 두 방언은 이런 변수의 작용을 선택적으로 받는데 유형론적으로 비성조 언어인 서울말은 음절수, 어두 자음의 성격이 고저형에 영향을 주며, 성조 언어인 경상도말은 음절수와 음절의 구조가 외래어에 있어서는 고저형 결정에 중요한 역할을 하는 것으로 드러났다.
-
한국어의 운율구조는 발화문장(utterance), 억양구(intonational phrase), 악센트구(accentual phrase), 음운적 어절(phonological word), 음절(syllable) 순의 계층적 구조를 가지고 있다. 본 연구에서는 운율구조의 각 층에서 성조 이벤트가 얹혀지는 음절이나 또는 각 층의 운율단위말의 음절의 음향적 길이를 측정함으로써 첫째, 운율단위말의 음절의 음향적 길이 또한 계층적 순위를 보이는지 둘째, 성조 이벤트(tonal event)와 음향적 길이 사이에 높은 상관관계를 보이는지 보고자 한다. 즉, 두 가지 측면에서 길이비교가 수행되었는데 하나는 언어 보편적 현상으로 알려진 구말 장음화 현상으로써 각 층 운율적 단위의 마지막 음절의 모음 길이 비교이며 다른 하나는 억양구초 고성조가 실현되는 음절의 모음과 어절 내 모음, 그리고 고성조가 실현되는 억양구말 음절의 모음간의 길이 비교이다. 남녀 각각 200문장의 각 분절음과 운율분석을 한 후 길이에 대한 일원분산분석 실시 결과 억양구말은 악센트구말 보다 길었으나 악센트구말은 어절말과 차이를 보이지 않거나 남자 화자의 경우 오히려 짧게 나타났다. 그리고 남자화자의 경우 악센트구초 고성자가 얹혀지는 음절의 길이는 어절 내 어절말 음절을 제외한 그 외 음절과 화자에 따라 큰 차이를 보이지 않거나 그보다 조금 짧게 실현되는 것으로 나타났다. 위의 결과는 첫째, 단위말 음절 모음의 장음화는 운율적 구조의 층위에 일대일 대응을 보이지 않는 것으로 해석되며 둘째, 성조 이벤트와 그것이 실현되는 분절음의 음향적 길이와는 큰 상관관계를 보이지 않는 것으로 해석될 수 있겠다. 그러나 이러한 일반화에 대한 충분한 근거 제공을 위해서는 해당음절의 모음 길이 뿐만 아니라 초성자음의 길이간의 비교와 음절자체의 길이 비교 또한 필요한 것이며 모음길이에 대한 선행자음의 분절음적 영향 고려가 수반되어야 할 것으로 보인다. 다음 내용을 정리해 보고자 한다.리해 보고자 한다.rc$ 구입할 때 중점적으로 살펴보는 사항은 신선도와 순수재래종 여부, 위생상태였다. 한편 소비자가 언제나 구입할 수 없다는 의견이 85.2%나 되어 원활한 공급과 시장조성이 아직 정착되지 않고 있었다.
$\bigcirc$ 현재 유통되고 있는 재래종닭은 소비자 대부분이 잡종으로 인식하고 있었으며, 재래종과 일반육계와의 구별은 깃털색, 피부색, 정강이색등 외관상으로 구별하고 있었다. 체중에 대한 반응은 너무 작다는 의견이었고, 식품으로의 인식도는 비교적 고급식품으로 인식하고 있다.$\bigcirc$ 재래종닭고기의 브랜드화에 대한 견해는 젊고 소득이 높은 계층에서 브랜드화의 필요성을 강조하고 있다.$\bigcirc$ 재래종달걀의 소비형태는 대부분의 소비자가 좋아하였으나 아직 먹어보지 못한 응답자가 많았다. 재래종달걀의 맛에 대해서는 고소하고 독특하여 차별성을 느끼고 있었다.$\bigcirc$ 재래종달걀의 구입장소는 계란판매점(축협.농협), 슈퍼, 백화점, 재래닭 사육 농장등 다양하였으며 포장단위는 10개를 가장 선호하였고, 포장재료는 종이, 플라스틱, 짚의 순으로 좋아하였다.$\bigcirc$ 달걀의 가격은 200원정도를 적정하다고 하였으며, 크기는 (평균 52g)는 가장 적당하다고 인식하고 있으며, 난각색은 대부분의 응답자가 갈색을 선호하였다.$\bigcirc$ 재래종달걀의 구입시 애로사항은 믿을수 없고, 구입장소를 몰라서, 값이 싸다 등이었고, 앞으로 신뢰할 수 있고 위생적인 생산 및 유통체계가 확립될 경우 더 많이 소비하겠다는 의견이었다.$\bigcirc$ 재래닭 판매업소(식당)의 판매형태는 66.7%인 대부분의 업소가 잡종과 개량종 유색닭을 판매하고 있었으며, 1개 업소에서 1일 판 -
사람의 음성을 들으면, 사람은 물론이지만 처음 듣는 목소리에 대해서도 그 목소리의 주인공에 대한 막연한 이상이 그려지게 된다. 본 논문은 이러한 현상이 얼마나 신빙성이 있는지, 즉, 음성만을 듣고 짐작한 그 음성의 주인공의 모습과 실제의 모습이 과연 얼마나 관계가 있는지를 알아보고자 하는 연구의 초기 단계에 대한 보고이다. 본 연구에서는 이처럼 음성이 전달하는 시각적 정보의 신빙성을 확인하기 위하여 남녀 각 8명의 사진을 찍고, 같은 내용의 짧은 문장을 녹취한 후, 100명 이상의 피실험자들에게 개별적으로 녹음을 듣고 가장 잘 어울릴 듯한 사진을 고르도록 할 것이다. 우선적으로 여성 8명의 녹음을 약간명(48명)의 피실험자에게 들려주어 실험한 결과, 목소리의 주인공을 바로 찾는 경우는 드물었지만, 흥미로운 것은 비록 틀린 경우라도 어떤 특정한 목소리는 어느 특정한 사진과 집중적으로 연결되었다는 것이다. 이 결과를 source-filter theory와 연관시켜 생각해보고, 이를 바탕으로 좀 더 구체적인 앞으로의 연구방향을 제시한다.
-
본 논문에서는 음성신호처리의 기초적인 해석법인 FFT와 LP분석법에 대하여 기본적인 이론과 함께 분석과정에서 알아두어야 할 사항들을 정리한다. 아울러 이러한 분석을 실제 음성신호를 대상으로 행함에 있어서 주의해야 할 점들을 실제음성을 처리한 그림과 함께 설명한다.
-
영어에서 자음의 유.무성 대립이 선행모음에 미치는 영향은 다른 여느 언어에서보다 두드러지게 커서 언어 보편적이기보다는 영어 특유의 음운현상으로 보는 견해가 주류를 이루고 있다. 본 연구에서는 영어를 학습하고 있는 한국어 화자들이 영어특유의 이 현상을 어떻게 인지하여 실현하고 있는지를 발성실험을 통하여 알아보고 더 나아가 모음길이가 후행자음의 유.무성 인지에 어떤 실마리로 작용하는지 인지실험을 통하여 알아보았다.
-
본 논문의 목적은 자연음에 가까운 합성음을 구현하기 위한 기초작업으로 한국어의 운율구조를 담화구조와 연관시켜 그 상관관계를 밝히는데 있다. 특히 문장내에서 주격표지로 작용하는 '이/가/은/는' 조사의 운율패턴에 중점을 두었다. 주어가 문장 내에서 어떤 자리에 오는가에 의해 조사어절을 구분해 본 결과 Fo값은 문장의 뒤, 즉 동사 앞 위치로 갈수록 낮아졌다. 중립적 문장에서 문두의 위치라면 '은/는' 조사의 기본주파수가 두드러짐이 예상되며, 이와 상대적으로, 담화가 구성되어 의사소통의 의미가 많이 가미될수록 '은/가' 조사의 두드러짐이 예상된다고 정리해 볼 수 있다. 운율구 경계의 발생은 특정한 문장성분의 전.후에서 주로 나타나는데 절이나 독립어 뒤에서, 그리고 부사어, 관형어, 목적어 앞에서 빈번히 일어남을 알 수 있었다.
-
국악전용 공연장으로 지어진 국립국악 소극장의 음향 특성을 실내 음선도, 암소음, 잔향시간 및 음압분포에 의해 분석.평가하였다. 연구결과 무대 앞부분과 객석모서리에서 음선경로차가 17m 이상으로 나타나 회주공조현상의 발생이 예측되며 남부순환도로와 인접하여 소극장내에 높은 암소음이 측정되었다. 잔향시간의 측정결과 과다한 실내 흡음력으로 인해 공석시에 계획값 보다 0.8초 정도가 짧으며 이는 관객입장시 더욱 악화될 것이 예측되어 1석당 실용적을 증가와 실내 흡음력을 가능한 줄일 필요가 있다. 음압레벨은 음악당 전 객석에서 고른 음압분포가 보이고 있으나 무대 음원에서 객석전열 사이에 초기 음압감쇠가 크게 나타나 무대주변의 음압 보강이 요구된다.
-
본 논문은 고속철도 역사의 통과구간 설계에 있어서 소음방지에 효과적인 설계안을 검토하기 위하여 7가지의 다양한 대안의 모델을 시뮬레이션하여 그 결과를 비교 분석하였다. 고속열차의 최대 운영속도 300 km/h 기준시 승강장의 허용소음도는 약 91 dB(A) 일 때 이를 만족하는 설계안은 통과구간의 양쪽에 설치하는 방음벽으로는 부족하며 통과구간을 곡면유리로 폐쇄한 터널식의 설계가 허용소음도를 만족하는 것으로 나타났다.
-
본 연구에서는 time averaging과 depth profiling기술을 음향현미경에 적용하여 5MHz 대역의 초음파 영상처리 시스템을 구성하였으며 기존의 피크값 검출기술과 상호 비교, 분석하였다. time averaging기술에서는 한 지점에서 반사된 tone burst파 전체를 디지털 오실로스코프를 통해 시간영역에서 A/D변환하고 변환된 512개 데이터들의 평균값을 취함으로써 영상을 얻을 수 있었으며, 이 기술은 시간영역에서 smoothing효과를 이용하여 산란이 심한 영역에 대한 영상을 개선시킬 수 있었다. depth profiling기술은 기준신호에 대한 반사신호의 시간 지연값을 최소 분해능 2ns로 검출함으로써 샘플의 3차원적인 실제 기하학적인 모양을 상대적인 크기로 얻을 수 있었다.
-
본 연구에서는 50% Tukey 창함수를 이용하여 위너필터를 설계하고 표면결함의 영상을 개선하였다. 이 위너필터는 높은 공간주파수 성분에 대해 낮은 잡음이득을 주며 안정된 필터 동작 특성을 보였다. 실험을 위하여 쿼드러춰 방식의 초음파현미경을 구성하고 시편으로 10원주화를 사용하였다. 실험결과 개선된 영상은 블러링 효과가 제거되어 우수한 영상 화질을 나타내었다.
-
고유음향 임피던스가 다른 물질이 층상구조를 이루고 있는 매질내에서 임의의 한 층에 형성된 이차원 초음파 음장이 다른 매질로 전파될 때에의 특성을 각스펙트럼법에 의해 해석하였다. 음원으로서는 baffle된 원형 트랜스듀서를, 층상구조를 매질로서는 물과 생체조직(지방)의 경계를 각각 고려하였다. 해석에 있어서는 먼저 각스펙트럼 분해요소, 즉, 음원의 크기 및 거리에 의존하는 기준음장의 최적 크기와 샘플링 간격을 균질매질을 이용하여 결정한 다음, 그 요소를 층상매질에 적용하였다. 그 결과, 경계면에서의 입사각(공간주파수)의 의존하는 투과계수에 입사음장의 곱으로 나타내어지는 투과음장은 각스펙트럼법에 의해 짧은 시간내에 정도 높게 산출될 수 있음을 보인다.
-
전립선 비대증 및 각종 고형암 조직을 제거하기 위해 이용되는 고강도 집속형 초음파 시스템은 초음파의 조직에 대한 열 효과를 이용한다. 이 경우 수MPa의 고 압력 초음파를 사용하기 때문에 수술시 초음파에 의한 조직내의 공동 현상이 수반되고 이로 인해 초음파의 집속 효과가 감소하게 된다. 본 논문에서는 초음파 공동 현상을 억제하기 위하여 초음파의 주파수 특성을 고려하였다. 초음파의 크기는 일정하게 유지하면서 증가하는 주파수로 변조된 초음파와 비선형 고저파 (nonlinear harmonics) 성분을 포함한 왜곡된 초음파에 대한 기포의 반응을 Gilmore 기포 모델을 이용하여 관찰하였다. 초음파의 주파수 변조는 10
$\mu\textrm{s}$ 동안 초기 주파수 1 MHz부터 시작하여 7 MHz까지 선형적으로 증가하도록 하였다. 파형을 왜곡시키는 고저파 성분의 크기는 주파수에 역 비례 하도록 하였다. 초음파의 기본 주파수는 1 MHz로 하였고, 압력은 0.1 MPa과 1 MPa의 두 경우를 고려하였다. 초기 기포의 반경은 1$\mu\textrm{m}$ 으로 하였고, 기포 주위의 유체는 물로 가정하였다. 시뮬레이션 결과로부터, 주파수를 변조시키거나 파형을 왜곡시킨 초음파에 대한 기포의 진동은, 동일한 압력의 정현파에 대한 경우 보다 작은 것으로 나타났다. 주파수 변조된 초음파에 반응한 기포의 진동은 압력이 낮을 때 (0.1 MPa), 변조된 주파수가 기포의 공진 주파수인 3 MHz 부근에서 최대치를 보이다가 이후 급격히 감소하는 경향을 보였다. 반면, 압력이 높아지면 (1 MPa) 기포의 진동은 주파수의 증가와 함께 감소하다가 3 MHz 이상으로 변조 될 경우, 유의한 변화를 보이지 않는 것으로 나타났다. 이 결과는 초음파의 적절한 주파수 성분 조절로 초음파 공동 현상을 일정 수준 억제할 수 있음을 시사한다. 고려가 수반되어야 할 것으로 보인다. 다음 내용을 정리해 보고자 한다.리해 보고자 한다.rc$ 구입할 때 중점적으로 살펴보는 사항은 신선도와 순수재래종 여부, 위생상태였다. 한편 소비자가 언제나 구입할 수 없다는 의견이 85.2%나 되어 원활한 공급과 시장조성이 아직 정착되지 않고 있었다.$\bigcirc$ 현재 유통되고 있는 재래종닭은 소비자 대부분이 잡종으로 인식하고 있었으며, 재래종과 일반육계와의 구별은 깃털색, 피부색, 정강이색등 외관상으로 구별하고 있었다. 체중에 대한 반응은 너무 작다는 의견이었고, 식품으로의 인식도는 비교적 고급식품으로 인식하고 있다.$\bigcirc$ 재래종닭고기의 브랜드화에 대한 견해는 젊고 소득이 높은 계층에서 브랜드화의 필요성을 강조하고 있다.$\bigcirc$ 재래종달걀의 소비형태는 대부분의 소비자가 좋아하였으나 아직 먹어보지 못한 응답자가 많았다. 재래종달걀의 맛에 대해서는 고소하고 독특하여 차별성을 느끼고 있었다.$\bigcirc$ 재래종달걀의 구입장소는 계란판매점(축협.농협), 슈퍼, 백화점, 재래닭 사육 농장등 다양하였으며 포장단위는 10개를 가장 선호하였고, 포장재료는 종이, 플라스틱, 짚의 순으로 좋아하였다.$\bigcirc$ 달걀의 가격은 200원정도를 적정하다고 하였으며, 크기는 (평균 52g)는 가장 적당하다고 인식하고 있으며, 난각색은 대부분의 응답자가 갈색을 선호하였다.$\bigcirc$ 재래종달걀의 구입시 애로사항은 믿을수 없고, 구입장소를 몰라서, 값이 싸다 등이었고, 앞으로 신뢰할 수 있고 위생적인 생산 및 유통체계가 확립될 경우 더 많이 소비하겠다는 의견이었다.$\bigcirc$ 재래닭 판매업소(식당)의 판매형태는 66.7%인 대부분 -
초음파 산업분야에 널리 사용되고 있는 PZT 압전 세라믹 진동자의 경우 높은 품질계수로 인하여 대역폭이 좁고, 진동 시 두께방향 진동뿐만 아니라 횡방향 진동으로 인하여 초음파 신호를 분석하는데 여러 가지 어려움이 항상 존재하였다. 따라서 본 연구에서는 PZT 세라믹스와 고분자 재료인 Epoxy를 사용하여 1-3 접속도를 갖는 압전 복합재료를 제조하였다. 이를 이용하여 초음파 트랜스듀서를 제작하였고, 이에 대한 전기음향변환능률을 어드미턴스 loop를 측정하여 구하였다. 유전율, 공진 주파수 등을 포함한 기본적인 트랜스듀서의 파라메터들은 공진 부근에서 전기적인 임피던스로부터 측정하였다. 이러한 파라메터들을 적용하여 주파수에 대한 트랜스듀서의 성능을 평가하였다. Pulse-echo법을 이용하여 삽입손실율을 구하고 임펄스 반응을 통하여 주파수 대역폭에 대해서 측정하였다. 그 결과 어드미턴스 loop로부터 두께방향모드를 제외한 횡방향 모드는 거의 나타나지 않았다. 유전율은 5.25㎊m이었고, 공진주파수 1.65MHz에서 -8dB의 최소 손실이 발생하였다. 주파수대역폭은 -6dB에서 64%(Q ; 1.56)의 대역폭이 측정되었고 전기기계 결합계수는 0.54이고 전기기계변환능률은 52%, 기계음향변환능률은 31%로 측정되었다.
-
수중 프로펠러의 비공동 소음을 수치적으로 해석하였다. Ffowcs Williams-Hawkings 형태의 음향상사 방정식을 시간영역에서 해석하였으며 임의의 형상과 하중조건을 가지는 프로펠러의 소음 예측이 가능하도록 하였다. 또한 좌표계 변환을 통해 관찰자에 대해 상대적 운동이 있는 경우에도 소음 예측이 가능하도록 하였다. 균일/비균일 유입류 조건을 갖는 수중 프로펠러에 대해 소음 해석을 수행하였고 각각의 조건에 대해 음원별 소음 강도와 방향성을 예측하였다. 수치 해석결과 프로펠러 표면상의 압력 변화에 따른 비정상 하중에 의한 이중극 소음이 지배적인 것으로 나타났다. 이러한 음원별 접근법은 수중 프로펠러의 운용시 지배적인 소음원을 구별하고 그 특성을 파악하여 적절한 소음 제어책을 마련하는 기반이 될 것이다.
-
본 논문은 천해 상에서 목표물로부터 방사되어 견인 이동되는 하이드로폰을 통하여 입사되는 광대역 신호에 대한 DOA (Direction-Of Arrival) 추정기법을 제안한다. 견인 배열 어레이를 이용하는 경우 고정된 위치의 배열 하이드로폰을 사용하는 경우와는 달리 움직임에 의한 도플러 주파수 천이 값이 발생하며 배열 상에 입사되는 광대역 신호는 각 주파수성분에 따라 서로 다른 고유 벡터 영역을 갖게 된다. 따라서 주파수 성분별로 처리하여 평균 공간 스펙트럼을 구하여 입사각을 추정하는 기존의 Incoherent 처리기법은 심각한 추정 오차를 발생시킨다. 본 논문에서는 이러한 문제점을 해결하기 위하여 각 주파수 성분에 대한 고유한 벡터영역들을 Coherent 변환과정을 거쳐서 통합된 벡터영역으로 변환하여 공간 스펙트럼을 추정하고 이를 통하여 입사각을 추출한다. 시뮬레이션 결과를 통하여 Cherent 처리기법을 이용한 입사각 추정상의 우수한 성능을 확인하였다.
-
수중에서 발생된 기포들의 상화작용에 의한 방출주파수의 변화를 알아보기 위해 선배열 기포에 대해 이론적으로 연구하였다. 기포들의 결합진동에 의한 방출주파수는 가능한 가장 저주파수의 음파가 발생됨을 설명하였으며, 일부의 기포가 음원역할을 하는 실제적인 선배열 기포의 경우는 방출주파수가 기포의 총 개수보다는 음원기포의 개수와 기포간 거리에 좌우됨을 밝혔다. 이러한 이론결과는 참고문헌[6]의 실험결과에 비교적 잘 일치하였다. 이것은 기포간의 결합진동은 기포들의 초기 발생조건에 따라 이론적으로 다르게 다루어야 함을 의미한다.
-
본 연구에서는 GAT(Geometry Acoustic Theory)를 이용한 표적신호 합성모델의 이론적 배경을 제시하고, 수치모델의 결과를 음향수조에서 축소표적 실험자료 결과와 비교한다. GAT에 의한 표적신호 합성모델은 3차원 해양환경에서 음원과 표적에 의한 음장을 적절히 묘사할 뿐만 아니라 표적 형상에 의한 효과를 정밀하게 계산함으로써 고 정밀도의 표적신호 합성을 가능하게 한다.
-
This paper describes the application of a coupled finite element-boundary element method to obtain the steady-state response of a hydrophone. The particular structure considered is a flooded piezoelectric spherical shell. The hydrophone is three-dimensionally simulated to transduce an incident plane acoustic pressure onto the outer surface of the sonar spherical shell to electrical potentials on inner and outer surfaces of the shell. The acoustic field formed from the scattered sound pressure is also simulated. And the displacement of the shell caused by the externally incident acoustic pressure is shown in temporal motion. The coupled FE-BE method is described in detail.
-
한국해양연구소 온누리호에 장착된 에어건 배열에서 건 간격에 따른 빔 패턴 변화를 확인하였으며 남극해역에서 획득된 탐사자료와 비교하였다. 컴퓨터 모의과정과 배열 이론을 이용하여 신호진폭 및 빔 폭 변화 등을 시간 및 주파수 영역에서 분석하였다. 154 Hz에서 송이배열 (cluster array) 및 폭 배열 (wide array)의 빔 폭 변화는 배열 형태보다는 건 간격에 큰 영향을 받고 있어 배열 형태가 달라도 빔 폭은 서로 유사하게 변한다. 건 간격이 클수록 송이배열이 90
$^{\circ}$ 의 빔 패턴에서 주엽 (mainlobe)이 최대치가 되는 것과는 달리 폭배열은 0$^{\circ}$ 에서 최대치를 나타내며 부엽 (sidelobe)은 건 간격과 무관하게 나타난다. 두 배열의 선형간섭이 점차 줄어드는 건 간격은 2.43 m이다. 남극해 탐사자료는 건 간격이 증가함에 따라 주신호 진폭은 약하게 기포는 강하게 증가한다. 이러한 결과는 빔 패턴 변화에서도 마찬가지로 나타나는데 건 간격이 클수록 주엽의 빔 폭이 점차 좁아져 강한 빔 패턴을 나타냄으로서 남극 탐사자료와 서로 잘 일치한다. -
본 논문에서는 천해 환경에서 multitone MFP를 하기 위한 다양한 시뮬레이션을 수행하고 여러 관점에서 multitone MFP의 성능을 분석하였다.
-
해양음향 토모그래피는 해수중을 전파하는 음파의 전파시간을 측정하여 이것으로부터 수온 및 유속의 분포를 구하는 새로운 관측기법이다. 해양음향 토모그래피에 의한 실시간 유속측정 시스템을 구축하기 위한 기초실험으로서 해양음향 토모그래피의 유속측정 유효성을 검증하기 위하여 쌍방향 음파전파의 해양음향 토모그래피 실험을 1997년 4월중에 거제도 남쪽해역에서 실시하였다. 실험시의 해양물리 환경을 고찰하고 토모그래피에 의한 유속측정 결과를 초음파 유속계(ADCP)에 의한 유속측정 결과와 비교 분석하였다. 그 결과 토모그래피에 의한 유속측정은 매우 양호하게 나타나, 향후 유속측정법으로 활용성이 크리라 기대되었다.
-
수중폭발성음원인 SUS(signal underwater sound)는 수중에서의 폭발과 동시에 충격파와 기포파들이 연속적으로 발생한다. 이러한 신호는 광범위한 주파수대역을 가지고 전파거리가 길어지면서 굴절과 반사등의 다중경로 전파효과에 의한 신호의 변형까지 생긴다. (1,2,3). 본 연구에서는 deconvolution 방법을 이용하여 수신신호중에서 기포파효과를 최소화시켜 충격파의 수신기 도달시간을 파악하고, 각 충격파들의 전파경로를 추정하여 이 중 직접경로와 해저면 반사경로의 신호를 이용하여 해저면 반사계수를 계산하였다.
-
본 논문에서는 한 쌍의 수동소나를 이용하여 미지의 잠항물체의 존재 유무를 확인하고 각 센서에 도달하는 시간지연의 차를 평가하는 Detection과 Tracking 알고리즘을 연구한다. 이 과정에서 이동하는 표적의 속력에 의한 도플러효과를 보상하는 2차원 확률분포 함수를 적용함으로 보다 정확한 결과를 도출한다. 관측신호의 Cross-Correlation과 Bayesian Method를 이용하여 계산한 시간지연과 도플러효과 비의 이차원 Likelihood 함수로부터 사후확률 (Posterior Probability)을 구하여 발견 평가와 추적을 수행한다.
-
본 연구에서는 기존의 SLAM에서는 불가능한 진폭과 위상 정보를 동시에 검출할 수 있는 쿼드러춰 검출기를 설계 제작하여 SLAM을 구성하고 진폭과 위상영상을 복원하여 기존의 SALM 영상과 비교분석하였다. 실험을 위하여 동작주파수가 10MHz인 쿼드러춰 검출기를 제작하여 SLAM시스템을 구성하고 시편으로는 다른 패턴을 갖는 두 개의 층으로 이루어진 평면구조물을 알루미늄으로 가공하여 실험하였다. 실험결과 다층구조물에 대한 진폭과 위상 영상을 복원할 수 있었고 기존의 SLAM 영상과 비교하여 양호한 분해능과 콘트라스트를 나타냈으며 특히 기존의 방법으로는 얻을 수 없었던 위상영상을 얻을 수 있었다.
-
3D 음장 재생을 위한 기존의 방법 중 HCI(Human Computer Interface)에서 가장 효과적인 방법으로는 HRTF를 이용한 재생방법을 들 수 있다. 하지만 이 방법의 문제점은 표준 HRTF가 없다는 것이며 따라서 평균값을 가진 HRTF를 사용할 수밖에 없다. 이는 많은 부분에서 음상정위의 문제점으로 나타내어진다. 본 논문은 기하학적 인체 모델링을 통한 구조적인 HRTF 모델로 기존의 Pole/Zero, Series expansion(PCA) 모델링의 문제점인 유용성, 시스템의 복잡성을 극복할 수 있는 최근 이론을 소개하고 구현 방법에 대해 알아보고자 한다. 또한 본 연구팀에서 개발한 측정 HRTF를 이용한 3D 음장 재현 시스템으로 기존 스테레오 시스템에서는 불가능했던 머리 밖 음상정위 실험 결과를 보여주고 개선점에 대해 조사해 보았다.
-
이정권 309.1
일반적으로 음향 문제에 상용되는 경계요소법은 Kirchhoff-Helmholtz 적분 방정식에 약특이성과 강특이성의 커널을 갖고 있어, 경계면에 매우 근접한 음장을 해석할 때 수치 적분 과정에서 큰 오차를 유발한다. 본 연구에서는 평면파 성분을 이용하여 약특이성 방정식 및 특이성이 제거된 음장 음압의 과도한 오차는 약특이성 경계 적분 방정식의 적용으로 제거될 수 있었다. 부드러운 경계면을 가진 경우는 모든 특이성의 제거가 가능하여 특이성 처리를 위한 특별한 처리가 불필요하게 되었다. 제안된 방법을 검증하기 위하여 몇 가지 단순한 모델에 대하여 경계 요소 계산을 수행하였고, 경계면 부근의 근접 음장에서 음압 예측의 정확도가 향상되는 결과를 얻었다. -
판 구조물의 전달 손실은 효과적인 차음 설계를 위한 필수적인 지표 중 하나이다. 특히, 흡/차음재 부착등 적층에 의한 차음 성능의 변화 예측이 중요하다. 실제의 차음 구조물은 유한한 크기를 갖게 마련인데, 현재까지는무한 판 이론에 제한각이나 경계 손실등을 적용하여 그 값을 산출함으로써 판의 유한효과를 고려하였지만, 해석의 임의성으로 인해 일반적인 적용이 어렵다. 이에 본 연구에서는 흡음재가 부착된 유한한 면적을 갖는 적층판의 음향 전달 손실을 임계 주파수 미만의 주파수 대역에 대해 예측하고 흡음재의 부착에 따른 전달 손실의 변화를 관찰하였다. 판은 무한한 강체 배플위에 있다고 가정하였고, 모드 전개법을 응용하여 개개의 판모드들의 거동을 고려하였다. 여기서 흡음재는 공극질 재료로 가정하여 Biot의 이론을 적용하였다. 해석 결과로부터, 흡음재등이 부착된 적층판에 대해서는 일반적인 제한각의 적용이 어렵고, 그 영향을 충분히 고려할 수 있는 새로운 예측 도구의 필요성을 확인하였다.
-
본 논문에서는 실음향학의 기본가정이 되고 있는 확산음장 이론에 대한 타당성을 고찰하였으며, 실의 경계면에서 입사에너지의 각도 분포를 입사 및 반사파의 간섭효과를 고려한 해석적 방법으로 구한 결과와 수치해석적 방법인 Ray tracing 기법을 이용한 결과와 비교하였다. 비교 결과는 경계면에서의 입사각에 대한 에너지 분포는 확산음장 이론에 의한 균일 분포가 아니라 Gaussian 분포와 유사한 경향을 보여 주었다.
-
Network-based real-time multimedia applications require guaranteed performances of communication service. Also according to increased bandwidth and processing performance in the future high speed networks, it is possible to make multimedia real-time applications such as distributed real-time applications including video conference, medical imaging, and video education. These applications have characteristics of stringent performance requirements in terms of delay, delay jitter and maximum loss rate. This paper proposes a new delay control for Broadband networks with FCFS queueing. The delay control provides an alternative solution to a current problem in real-time communication; traffic distortion, which makes it difficult to meet such real-time requirements. In simulations, it shows that the proposed delay control can guarantee local and end-to-end delay.
-
한국인과 일본인의 한국어 모음 포먼트값 차이 비교 연구에서, 한국어 [이]는 한국인이 일본인에 비하여 혀의 높이가 낮게 나타났으며 한국어 [에, 애, 오] 모음에서 한국인은 일본인에 비하여 혀의 높이가 높게 나타난 것으로 추론되었다. 후설 모음 [오, 우, 으]에서 한국인은 일본인에 비하여 혀 위치는 보다 후설성으로, 한국어 [어]는 한국인이 일본인에 비하여 혀 위치가 전설성으로 발음하는 것으로 추론되었다. 한국인과 일본인의 일본어 모음 포먼트값 차이 비교 연구에서, 일본어 [이]를 제외한 모든 모음에서 한국인은 일본인에 비하여 혀의 높이는 높게 나타났으며 일본어, [오, 우]에서 혀 위치에 한국인은 일본인에 비하여 보다 후설성으로 발음하는 것으로 추론 가능했다.