통합 검색 | Korea Science

MPEG 오디오 부호화기를 위한 향상된 프리 에코 컨트롤 알고리듬 (Enhanced Pre echo Control Algorithm for MPEG Audio Coders)

이창준;이재성;박영철
- 방송공학회논문지
- /
- 제11권2호
- /
- pp.191-199
- /
- 2006
본 논문은 심리음향 모델 II(PAM II)를 기반으로 한 MPEG 오디오 코더에 대해서 효율적으로 프리 에코(pre echo)를 제어하는 알고리듬을 제안한다. 프리 에코 제어는 PAM II에서 마스킹 임계값 계산의 마지막 단계로써, 현재 프레임에 대해서 발생하는 양자화 오차를 최소화시키는 역할을 한다. 기존에 부호화기에서 프리 에코는 추정되는 마스킹 임계치가 이전 프레임에서 얻어진 값을 넘지 않도록 제한함으로써 결정된다. 기존의 방법에서 사용되는 프리 에코 제어는 단구간 블록(short block)은 물론 장구간 블록(long block)에 대해서도 사용되는데, 이는 마스킹 임계값을 불필요하게 떨어뜨려 전체적인 양자화 잡음 레벨을 높이는 문제를 발생시킨다. 본 논문에서는 이러한 문제를 해결할 수 있는 효율적인 프리 에코 제어 과정을 제안하였다. 음질 테스트 결과에서 변화가 심한 오디오 신호에 대해서 ITU R 테스트를 시행한 결과 제안된 방법이 평균적으로 0.4점 이상 개선된 결과를 보였다.
PDF KSCI

효율적인 하드웨어 구조의 Viterbi Scorer를 이용한 실시간 격리단어 인식 시스템의 구현 (A Real-Time Implementation of Isolated Word Recognition System Based on a Hardware-Efficient Viterbi Scorer)

조윤석;김진율;오광석;이황수
- The Journal of the Acoustical Society of Korea
- /
- 제13권2E호
- /
- pp.58-67
- /
- 1994
HMM을 이용한 알고리즘은 대용량 음성인식 시스템을 비롯하여 많은 시스템에 적용되어 왔다. 음성인식 시스템을 범용의 프로세서들을 가지고 구현할 경우 많은 계산량과 데이터들로 말미암아 실시간의 성능을 얻을 수 없다. 따라서 실시간 음성인식을 위해서는 인식을 가속화 시키기 위한 전용 하드웨어를 개발하는 것이 요구되어진다. 본 논문에서는 HMM을 이용한 격리단어 인식 시스템을 구현하는 내용을 다루고 있다. 음성인식 시스템은 호스트 컴퓨터와 DSP 보드 그리고 프로토타입 Viterbi scoring 보드로 이루어져 있다. 음성신호로부터 특징 벡터를 추출하는 과정은 DSP 보드에서 이루어지고, Viterbi scoring 보드는 세 개의 field-programmable gate array 칩들을 사용하여 설계되었다. Viterbi scoring 보드는 하드웨어적으로 효율적인 Viterbi scoring 구조를 채택하고 있고 음성인식을 위한 Viterbi 알고리즘을 수행한다. 제작된 시스템은 10MHz로 동작하고, 한 프레임 즉 10ms 동안에 100.000 스테이트를 처리할 수 있다.
PDF

상태 공유와 결정트리 방법을 이용한 효율적인 문맥 종속 프로세스 모델링 (Efficient context dependent process modeling using state tying and decision tree-based method)

안찬식;오상엽
- 한국멀티미디어학회논문지
- /
- 제13권3호
- /
- pp.369-377
- /
- 2010
HMM(Hidden Markov Model)을 사용하는 어휘 인식 시스템에서 인식 시 훈련 중에 나타나지 않는 모델들로 인해 인식률의 저하를 가져오며 인식 대상 어휘가 변경되거나 추가되면 데이터베이스의 수집과 훈련 과정을 수행하여 모델을 재생성해야 하고 그에 따른 시간과 추가 비용이 초래된다. 본 논문에서는 결정 트리 방법과 모델 공유 방법을 사용하여 효율적인 문맥 종속 프로세스 모델링 방법을 제안하였다. 제안한 방법은 생성된 모델들로부터 모델 공유 방법을 이용하여 모델의 재생성 과정을 줄이고 강인하고 정확한 문맥 종속 음향 모델링을 제공한다. 또한, 모델의 수를 줄이고 훈련 중에 나타나지 않는 모델들에 대해 문맥 종속 유사 음소 모델을 제공하여 훈련 중에 나타나지 않는 모델의 문제점을 해결하고 훈련성을 확보하였다. 제안된 방법으로 6종류의 음성 데이터베이스를 이용하여 어휘 종속 인식과 어휘 독립 인식 실험을 수행한 결과 어휘 종속 인식 실험에서는 98.01%의 성능을 보였고, 어휘 독립 인식 실험에서 97.38%의 성능을 보였다.
PDF KSCI

전자 트랜스듀서 방식에 의한 청각보조용 이식형 인공중이 시스템 설계 (Design of Implantable Middle Ear Hearing Aids Using an Electromagnetic Transducer)

조진호;송병섭;김명남;원철호;박세광;이상흔
- 센서학회지
- /
- 제6권6호
- /
- pp.466-475
- /
- 1997
본 논문에서는 초소형 코일-마그넷으로 구성되는 전자 트랜스듀서를 이용하는 청각보조용 이식형 인공중이를 설계하였다. 세라믹 방식의 진동체에 비하여 음향특성은 우수하나 효율이 낮은 것이 문제점으로 지적되고 있는 전자 트랜스듀서 방식의 진동체를 효과적으로 구현하기 위하여 객관화된 진동체의 설계방안을 제시하였으며 시스템의 전력 전달 효율을 향상시킬 수 있도록 FM방식의 음성신호 전달용 체외기와 체내기를 설계하였다. 설계된 트랜스듀서 및 체외기와 체내기의 실험세트를 만들어 금속스트립 및 사체의 측두골을 대상으로 진동특성을 측정하였다. 그 결과 FM방식의 신호전달기법이 갖는 장점을 확인할 수 있었으며 증폭된 입력 음압에 해당하는 진동을 효과적으로 이소골에 전달할 수 있음을 보였다.
PDF

채널 간 위상차 파라미터 생략 기법을 이용한 오디오 부호화 (An Audio Coding Technique Employing the Inter-channel Phase Difference Skip)

김현휘;김인철
- 방송공학회논문지
- /
- 제21권3호
- /
- pp.369-379
- /
- 2016
본 논문에서는 음성/음악 통합 압축 기술(USAC)에 적용된 공간 오디오 부호화 기법인 MPEG 서라운드에서 채널 간 위상차(IPD) 파라미터를 효과적으로 생략하는 기법에 대해 다룬다. 기존의 방법에서는 파라미터 밴드의 IPD 파라미터가 모두 작은 경우에도 전체를 처리하여 전송한다. 이러한 경우 생략을 통해 비트 효율을 향상시킬 수 있다. IPD 파라미터의 심리음향적 민감도를 고려하여 청취 환경에서 인지하지 못하는 문턱 값을 추정하고, 문턱 값 아래의 위상차를 발생시키는 IPD 파라미터는 0으로 설정하고 전송하지 않는다. 제안하는 채널 간 위상차 파라미터 생략 기법을 적용하면 기존에 비해 38% 정도의 위상 파라미터 절감 효과를 얻을 수 있고, MUSHRA 청취 실험을 통해 복호화된 오디오의 음질 하락이 없음을 보인다.
https://doi.org/10.5909/JBE.2016.21.3.369 인용 PDF KSCI KPUBS HTML

자동차 고무 소음 차폐성능 검사 장비의 개발 (Test Equipment Development of Performance in the shielding rubber of Auto-Noise)

김석현
- 한국산업정보학회논문지
- /
- 제7권5호
- /
- pp.190-194
- /
- 2002
본 연구의 최종 개발목표는 편리하고 값싸고, 신뢰도 있고, 성능 좋은 컴퓨터 자동 소음차폐성능 측정기의 개발에 있다. 자동차 및 건축물의 안락한 환경은 현대의 필수 불가결한 요건이다. 본 논문은 자동차용 바킹류 및 방음고무에 의한 소음차폐의 성능 측정을 향상시키는 부분에 중점을 두었다. Sound Card를 이용하여 손쉽게 음성을 획득 할 수 있도록 하였으며 음향실과 측정실의 음성 획득을 한 방향으로만 하여 회로의 복잡성을 줄였다. 개발된 최종 시스템은 개발 시판되고 있는 시스템보다 측정방법이 간편하고 빠른 기계적 응답성을 갖추고 있다. 짧은 시간 안에 전체적인 주파수별 소음차폐성능을 달수 있도록 "대강보기" 항목도 첨가하여 각종 건축 및 고무 제품의 차폐성능 검사를 효율적으로 할 수 있도록 하였다.
PDF

강압형 컨버터를 이용한 70W CDM 램프용 전자식 안정 기의 개발 (Development of an Electronic Ballast for 70W Ceramic Discharge Metal Halide Lamps with Step Down Converter)

김일권;길경석;김진모
- 한국정보통신학회논문지
- /
- 제6권7호
- /
- pp.1055-1061
- /
- 2002
본 논문은 70[w]급 세라믹 방전관 메탈할라이드 램프용 전자식 안정기의 설계 덴 제작에 대하여 기술하였다. 개발한 안정기는 정류회로, 능동성 역률개선회로, 하프브리지 인버터, LC 공진회로 및 제어회로로 구성되며, 램프의 재점등에 필요한 타이머 기능을 부가하였다. 점등시 램프에는 음향공명현상 과 플리커 현상 을 피하기 위하여 40[kHz]의 고주파 전압이 인가되도록 하였다. 실험결과로부터 역률과 효율은 각각 99.8[%] ,93.1[%]로 평가되었다.
PDF KSCI

사용자 질의 패턴 분석을 통한 효율적인 음악 검색 시스템의 구현 (Implementation of an Efficient Music Retrieval System based on the Analysis of User Query Pattern)

노승민;황인준
- 정보처리학회논문지A
- /
- 제10A권6호
- /
- pp.737-748
- /
- 2003
디지털 음악 컨텐츠의 활용이 보편화되고 음악 데이터의 양이 방대해지면서 데이터베이스로부터 음악 컨텐츠를 효과적으로 질의하고 검색하는 기능이 절실해졌다. 본 논문에서는 사용자들이 자주 질의하는 멜로디 부분을 이용하여 음악 검색을 보다 빠르고 효과적으로 수행할 수 있는 음악 검색 시스템인 FMF(Fast Melody Finder)를 제안한다. 이 기법은 어떤 음악에 대해 사용자가 기억하고 질의하는 내용이 대개 음악의 특정 선율에 한정되어 있다는 사실에 기반하고 있으며, 사용자의 이러한 질의 패턴을 이용하여 자주 질의되는 부분을 인덱스로 사용함으로써 사용자가 원하는 곡을 빠르게 찾아낼 수 있게 해준다. 또한 이러한 선율들을 다루기 위해서, 사용자의 허밍에 의한 음향 질의와 오선지를 통한 질의로부터 추출된 음높이와 음의 길이를 분석하여 UDR과 LSR 스트링으로 변환함으로써 더욱 정확한 질의를 할 수 있다. 프로토타입 시스템을 구현하고 다양한 실험을 통하여 논문에서 제안하는 기법의 우수성을 보인다.
https://doi.org/10.3745/KIPSTA.2003.10A.6.737 인용 PDF KSCI

DAVIC 표준의 프로토콜 시험 방안 연구 (Protocol Testing Methodology of DAVIC Standard)

오행석;박기식;이상호
- 한국정보처리학회논문지
- /
- 제6권1호
- /
- pp.203-215
- /
- 1999
최근 정보통신 제품 및 서비스 산업의 발달로 Vod, Teleshopping 등의 멀티미디어 서비스를 위한 사용자 시스템의 개발이 한창이다. 그러나 구현된 제품이 국제 표준과 일치하지 않으면 제품은 시장 경쟁력을 상실하게 된다. 따라서 관련 프로토콜의 특성을 고려한 적합성 시험은 제품 및 서비스의 상호운용성의 확보를 위해 필수적이라 할 수 있다. 본 논문은 디지털 음향영상 통신 프로토콜로 자리 잡고 있는 DAVIC(Digital Audio Visual Counci)표준의 주요 프로토콜에 대한 구현 제품의 체계적이고 효율적인 적합성 시험 방법으로서 프로토콜 스택내의 단일 계층 시험 및 스택간의 관계 시험 방법 및 구조를 제안하고자 한다.
PDF

한국어 자소 기반 Hybrid CTC-Attention End-to-End 음성 인식 (Hybrid CTC-Attention Based End-to-End Speech Recognition Using Korean Grapheme Unit)

박호성;이동현;임민규;강요셉;오준석;서순신;;김지환
- 한국정보과학회 언어공학연구회:학술대회논문집(한글 및 한국어 정보처리)
- /
- 한국정보과학회언어공학연구회 2018년도 제30회 한글 및 한국어 정보처리 학술대회
- /
- pp.453-458
- /
- 2018
본 논문은 한국어 자소를 인식 단위로 사용한 hybrid CTC-Attention 모델 기반 end-to-end speech recognition을 제안한다. End-to-end speech recognition은 기존에 사용된 DNN-HMM 기반 음향 모델과 N-gram 기반 언어 모델, WFST를 이용한 decoding network라는 여러 개의 모듈로 이루어진 과정을 하나의 DNN network를 통해 처리하는 방법을 말한다. 본 논문에서는 end-to-end 모델의 출력을 추정하기 위해 자소 단위의 출력구조를 사용한다. 자소 기반으로 네트워크를 구성하는 경우, 추정해야 하는 출력 파라미터의 개수가 11,172개에서 49개로 줄어들어 보다 효율적인 학습이 가능하다. 이를 구현하기 위해, end-to-end 학습에 주로 사용되는 DNN 네트워크 구조인 CTC와 Attention network 모델을 조합하여 end-to-end 모델을 구성하였다. 실험 결과, 음절 오류율 기준 10.05%의 성능을 보였다.
PDF

검색결과 599건 처리시간 0.031초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)