통합 검색 | Korea Science

화자 구분 시스템의 관심 화자 추출을 위한 i-vector 유사도 기반의 음성 분할 기법 (I-vector similarity based speech segmentation for interested speaker to speaker diarization system)

배아라;윤기무;정재희;정보경;김우일
- 한국음향학회지
- /
- 제39권5호
- /
- pp.461-467
- /
- 2020
잡음이 많고 여러 사람이 있는 공간에서 음성인식의 성능은 깨끗한 환경보다 저하될 수밖에 없다. 이러한 문제점을 해결하기 위해 본 논문에서는 여러 신호가 섞인 혼합 음성에서 관심 있는 화자의 음성만 추출한다. 중첩된 구간에서도 효과적으로 분리해내기 위해 VoiceFilter 모델을 사용하였으며, VoiceFilter 모델은 여러 화자의 발화로 이루어진 음성과 관심 있는 화자의 발화로만 이루어진 참조 음성이 입력으로 필요하다. 따라서 본 논문에서는 Probabilistic Linear Discriminant Analysis(PLDA) 유사도 점수로 군집화하여 혼합 음성만으로도 참조 음성을 대체해 사용하였다. 군집화로 생성한 음성에서 추출한 화자 특징과 혼합 음성을 VoiceFilter 모델에 넣어 관심 있는 화자의 음성만 분리함으로써 혼합 음성만으로 화자 구분 시스템을 구축하였다. 2명의 화자로 이루어진 전화 상담 데이터로 화자 구분 시스템의 성능을 평가하였으며, 분리 전 상담사(Rx)와 고객(Tx)의 음성 Source to Distortion Ratio(SDR)은 각각 5.22 dB와 -5.22 dB에서 분리 후 각각 11.26 dB와 8.53 dB로 향상된 성능을 보였다.
https://doi.org/10.7776/ASK.2020.39.5.461 인용 PDF KSCI

서브 밴드 CSP기반 FLD 및 PCA를 이용한 동작 상상 EEG 특징 추출 방법 연구 (A Method of Feature Extraction on Motor Imagery EEG Using FLD and PCA Based on Sub-Band CSP)

박상훈;이상국
- 정보과학회 논문지
- /
- 제42권12호
- /
- pp.1535-1543
- /
- 2015
뇌-컴퓨터 인터페이스는 사용자의 뇌전도(Electroencephalogram: EEG)를 획득하여 생각만으로 기계를 제어하거나 신체장애를 가진 사람에게 손 또는 발과 같은 신체를 대신하여 의사 전달 수단으로 사용될 수 있다. 본 논문에서는 동작 상상 EEG를 분류하기 위해 Sub-Band Common Spatial Pattern(SBCSP)를 기반으로 필터 선택을 하지 않는 특징 추출 방법에 대해 연구한다. 4~40Hz의 동작 상상 신호를 4Hz 대역마다 나눈 9개의 서브 밴드에 각각 CSP를 적용한다. 이후 Fisher's Linear Discriminant(FLD)를 사용하여 도출된 값들을 결합한 FLD 점수 벡터에 차원 축소를 위한 Principal Component Analysis(PCA)를 적용하여 클래스 구분을 위한 최적의 평면에 특징을 투영한다. 데이터베이스는 BCI CompetitionIII dataset IVa(2 클래스: 오른손 다리)를 이용하며, 추출된 특징은 Least Squares Support Vector Machine(LS-SVM)의 입력으로 사용된다. 제안된 방법의 성능은 $10{\times}10$ fold cross-validation을 이용하여 분류 정확도로 나타낸다. 본 논문에서 제안하는 방법은 피험자 'aa', 'al', 'av', 'aw', 'ay'에 대하여 각각 $85.29{\pm}0.93%$, $95.43{\pm}0.57%$, $72.57{\pm}2.37%$, $91.82{\pm}1.38%$, $93.50{\pm}0.69%$의 분류 정확도를 보였다.
https://doi.org/10.5626/JOK.2015.42.12.1535 인용 KSCI

스핀밸브 바이오 센서를 이용한 혈액과 나노입자의 자성특성 검출 (The Detection of Magnetic Properties in Blood and Nanoparticles using Spin Valve Biosensor)

박상현;소광섭;안명천;황도근;이상석
- 한국자기학회지
- /
- 제16권3호
- /
- pp.157-162
- /
- 2006
이온빔 증착 스퍼터링법과 고아 리소그래피법으로 FeMn-스핀밸브 바이오 센서를 제작하였다. 혈액내의 Fe를 포함한 헤모글로빈(Hemoglobin)과 나노 자성입자의 자성검출은 최대 자장감응 약 $0.1{\sim}0.8%/Oe$인 거대자기저항 스핀밸브 바이오 센싱소자를 이용하였다. 사용된 혈액은 인체의 피였고, Co-페라이트 나노 자성입자는 수용성 무정형 실리카로 코팅이 되었으며, 그 크기의 평균직경의 범위는 9nm에서 50nm이었다. 실제 크기가 $5x10{\mu}m^2 $ 혹은 $2x6{\mu}m^2 $로 제작된 센싱소자의 4 전극 중 전류 입력단자에 흐르는 감지전류는 1 mA로 하였다. 혈액과 나노자성 입자가 소자의 중앙부분으로 떨어졌을 때, 출력신호는 각각 자성 여부의 검출 특성을 알 수 있는 충분한 크기로 나타났다.
https://doi.org/10.4283/JKMS.2006.16.3.157 인용 PDF KSCI

EEG기반 언어 인식 시스템을 위한 국제음성기호를 이용한 모음 특징 추출 연구 (EEG based Vowel Feature Extraction for Speech Recognition System using International Phonetic Alphabet)

이태주;심귀보
- 한국지능시스템학회논문지
- /
- 제24권1호
- /
- pp.90-95
- /
- 2014
인간과 기계를 연결하는 새로운 인터페이스인 Brain-computer interface (BCI)를 이용해 휠체어를 제어하거나 단어를 입력하는 등, 사용자를 위한 다양한 장치를 개발하는 연구들이 진행되어 왔다. 특히 최근에는 뇌파를 이용한 음성인식을 구현하고 이를 통해 무음통신 등에 적용하려는 시도들이 있었다. 본 논문에서는 이러한 연구의 일환으로 electroencephalogram (EEG) 기반의 언어 인식 시스템을 개발하기 위한 기초 단계로서, 국제음성기호에 기반을 둔 모음들의 특징을 추출하는 방법에 대한 연구를 진행하였다. 실험은 건장한 세 명의 남성 피험자를 대상으로 진행되었으며, 한 개의 모음을 제시하는 첫 번째 실험 과정과 두 개의 연속된 모음을 제시하는 두 번째 실험 과정으로 두 단계에 나누어서 실험이 진행되었다. 습득된 64개의 채널중 선택적으로 32개의 채널만을 사용해 특징을 추출하였으며, 사고 활동과 관련된 전두엽과 언어활동에 관련된 측두엽을 기준으로 영역을 선택하였다. 알고리즘 적용을 위해서 특징으로는 신호의 고유 값을 사용하였고, support vector machine (SVM)을 이용하여 분류를 수행하였다. 실험 결과, 첫 번째 단계의 실험을 통해서, 언어의 뇌파를 분석하기 위해서는 10차원 이상의 특징 벡터를 사용해야 됨을 알게 되었고, 11차원의 특징 벡터를 사용할 경우, 평균분류율은 최고 95.63 %로 /a/와 /o/를 분류할 때 나타났고, 가장 낮은 분류율을 보이는 모음은 /a/와 /u/로 86.85 %였다. 두 번째 단계의 실험에서는 두 개 이상의 모음을 발음하는 것이 단일 모음 발음과 어떤 차이가 있는지 확인해 보았다.
https://doi.org/10.5391/JKIIS.2014.24.1.090 인용 PDF KSCI

개인화된 건강 데이터의 대량 처리 모니터링을 위한 메시지 모델 및 동적 버퍼 할당 설계 (Design of Dynamic Buffer Assignment and Message model for Large-scale Process Monitoring of Personalized Health Data)

전영준;황희정
- 한국인터넷방송통신학회논문지
- /
- 제15권6호
- /
- pp.187-193
- /
- 2015
ICT 힐링플랫폼은 만성질환 예방을 목적으로 하며 개인의 생체신호 및 생황습관 등의 정보에 기반을 둔 질환 조기 경보를 목표로 한다. 이를 위한 2-step 개방형 시스템(TOS)에는 힐링플랫폼과 개인건강데이터 저장소간의 중계가 설계되었으며 데이터 처리과정을 실시간으로 전송(모니터링)하기 위한 대량 커넥션 기반의 publish/subscribe(pub/sub) 서비스가 고려되었다. 그러나 TOS pub/sub의 초기 설계에서는 커넥션 메시지를 deflate 알고리즘으로 인코딩하기 위해, 커넥션의 유휴(idle) 여부 및 메시지의 종류에 상관없이 동일한 버퍼를 할당한다. 본 논문의 동적 버퍼 할당은 다음과 수행된다. 우선 각 커넥션의 메시지 전송 유형을 큐잉하고, 각 큐는 tf-idf를 통해 특징(feature)추출 연산 후 벡터로 변환하여 k-means 클러스터에 입력하여 군집을 생성한다. 특정 군집으로 분류된 커넥션은 해당 군집의 자원 테이블에 따라 자원을 재할당 한다. 이때 각 군집의 센트로이드(centroid)는 해당 군집을 대표하는 큐잉 패턴을 사전에 선택하여 자원참조 테이블(버퍼 크기별 인코딩 효율)로 도출한다. 제안된 설계는 TOS의 인코딩 버퍼 자원을 네트워크 커넥션에 효율적으로 배분하기 위해, 군집 및 특징 연산을 위한 연산 자원과 네트워크 대역폭 간의 trade-off를 수행함으로써 TOS의 tps(단위 시간당 실시간 데이터 처리 모니터링 연결수)를 높이는데 활용할 수 있다.
https://doi.org/10.7236/JIIBC.2015.15.6.187 인용 PDF KSCI

부호책 제한을 가지는 표본 적응 프로덕트 양자기를 이용한 1차 마르코프 과정의 고 전송률 양자화 (High Bit-Rates Quantization of the First-Order Markov Process Based on a Codebook-Constrained Sample-Adaptive Product Quantizers)

김동식
- 대한전자공학회논문지SP
- /
- 제49권1호
- /
- pp.19-30
- /
- 2012
디지털 신호의 양을 줄이기 위한 손실 소스 부호화에서 양자화는 필수적이다. 이때 보다 효율적인 양자화를 위해서는 벡터양자기(vector quantizer: VQ)를 사용하는데, 벡터의 차수 또는 전송률이 올라감에 따라 VQ의 부호화 복잡도는 기하급수적으로 증가한다. 이를 보완하기 위하여 여러 변형된 VQ가 제안되어 있다. 이러한 변형된 VQ의 일종으로 표본 적응 프로덕트 양자기(sample-adaptive product quantizer: SAPQ)가 있는데, 벡터의 차수를 줄여서 부호화 복잡도를 줄일 수 있는 프로덕트 VQ(product VQ: PQ)와 유사한 구조를 가지지만, 일반 PQ보다 더 좋은 성능을 가지면서 일반 VQ보다는 부호화 복잡도가 낮고 부호책을 위한 메모리의 크기도 작은 일종의 구조적 제한을 가지는 VQ이다. 이러한 SAPQ 중에서 부호책의 구조가 양자화 공간의 대각선에 대칭 형태를 가지는 단순한 형태의 1-SAPQ가 있는데, 이러한 1-SAPQ의 성능은 동일한 분포를 가지며 서로 독립인 입력에 좋은 성능을 보인다. 본 논문에서는 1-SAPQ를 1차 마르코프 과정에 대하여 설계하고 그 성능을 평가하였다. 효율적인 1-SAPQ의 설계를 위하여 초기 부호책 설계 알고리듬을 제안하였으며, 수치해석을 통하여 1-SAPQ는 비슷한 부호화 복잡도를 가지는 VQ보다 좋은 성능을 보임을 보였다. 또한 DPCM(differential pulse coded modulation) 기법에 Lloyd-Max 양자화를 사용한 경우의 성능에 근접함을 보였다.
PDF KSCI

모바일 TV 튜너용 VHF대역 및 UHF 대역 가변 이득 저잡음 증폭기 (A VHF/UHF-Band Variable Gain Low Noise Amplifier for Mobile TV Tuners)

남일구;이옥구;권구덕
- 전자공학회논문지
- /
- 제51권12호
- /
- pp.90-95
- /
- 2014
본 논문에서는 다양한 모바일 TV 규격을 지원할 수 있는 모바일 TV 튜너용 VHF 및 UHF 대역 가변 이득 저잡음 증폭기를 제안한다. 제안한 VHF 대역 가변 이득 증폭기는 외부 매칭 소자를 제거하기 위해 저항 피드백을 이용하여 저잡음 증폭기와 저주파수 잡음 특성을 개선하기 위해 PMOS 입력을 사용하는 싱글-차동 증폭기, 이득 범위를 제어하기 위해 저항 피드백 부분과 감쇄기로 구성된다. 제안한 UHF 대역 가변 이득 증폭기는 잡음 특성과 외부 간섭 신호 제거 특성을 향상시키기 위해 협대역 저잡음 증폭기와 $g_m$ 가변 방식을 이용하여 이득을 제어할 수 있는 싱글-차동 증폭기와 감쇄기로 구성된다. 제안한 VHF 및 UHF 대역 가변 이득 저잡음 증폭기는 $0.18{\mu}m$ CMOS 공정을 사용하여 설계하였고, 전원 전압 1.8 V에서 각각 22 mA와 17 mA 의 전류를 소모하면서 약 27 dB와 27 dB의 전압 이득, 1.6-1.7 dB와 1.3-1.7 dB의 잡음 지수, 13.5 dBm와 16 dBm의 OIP3의 성능을 보인다.
https://doi.org/10.5573/ieie.2014.51.12.090 인용 PDF KSCI

MMIC 회로를 이용한 위성중계기용 30GHz대 저잡음증폭기 모듈 개발 (A 30 GHz Band Low Noise for Satellite Communications Payload using MMIC Circuits)

염인복;김정환
- 한국전자파학회논문지
- /
- 제11권5호
- /
- pp.796-805
- /
- 2000
30dB의 선형이득과 2.6dB의 잡음지수 성능을 갖는 위성통신중계기용 30GHz대 저잡음증폭기 모듈이 MMIC와 박막 MIC기술로 개발되었다. 두 종의 MMIC 회로가 저잡음증폭기 모듈에 사용되었는데, 하나는 초저잡음용 MMIC 회로이고, 다른 하나는 광대역 고이득용 MMIC 회로이다. MMIC 회로 제작에 사용된 증폭소자는 0.15$mu extrm{m}$게이트 길이를 갖는 pHEMT이다. 두 개의 MMIC 회로를 상호 연결하고 저잡음증폭기 모듈을 완성하기 위하여 박막기술을 이용하여 마이크로스트립 선로를 구현하였으며, 안정된 DC 전원 공급을 위하여 후막기술을 이용한 바이어스 회로를 개발하였다. 저잡음증폭기 모듈의 입력측은 위성중계기의 안테나로부터의 신호를 받아들이기 위하여 도파관 형태로 설계되었으며, 출력측은 주파수변환부와의 접속을 위하여 K-컨넥터로 구현되었다. 모든 제작 공정에는 실제 위성용 부품 제작 기술이 도입되었으며, 위성중계기에 탑재되는 부품에 요구되는 온도시험 및 진동시험을 실시하였다. 제작된 저잡음증폭기 모듈은 동작목표 대역인 30~31GHz에서 30dB 이상의 이득, $\pm$0.3dB의 이득평탄도, 그리고 2.6dB이하의 우수한 잡음지수를 가진 것으로 측정되었다.
PDF

대역통과여파기 특성을 갖는 통신위성중계기용 Ku-Band 저잡음증폭기의 설계 및 제작 (Design of Ku-Band Low Noise Amplifiers including Band Pass Filter Characteristics for Communication Satellite Transponders)

임종식;김남태;박광량;김재명
- 한국통신학회논문지
- /
- 제19권5호
- /
- pp.872-882
- /
- 1994
본 논문에서는 통신위성중계기의 송, 수신 신호의 크기에 따른 안테나부의 시스템 특성으로 고려하여 대역통과여파기 형태의 이득특성을 갖는 저잡음증폭기를 설계, 제작하였다. 한 예로써, 위성통신용 수신주파수인 14.0~14.5GHz.에서 2단 저잡음증폭기와 4단 증폭기를 설계, 제작하였다. 제작된 2단 저잡음증폭기는 대역내에서 20.3dB +- 0.1dB의 이득, 1.44dB+-0.04dB의 잡음지수, 송신주파수 대역(12.25~12.75GHz)에서 14dB의 Rejection을 보여주었다 이 저잡음증폭기는 이득, 잡음지수, 군지연 특성면에서도 모두 설계치와 잘 일치하였다. 또한 제작된 4단 증폭기는 42dB 이상의 이득에 +-0.25dB 이내의 평탄도를 보여 주었고, 송신주파수 대역에서의 Rejection은 28dB로 측정되었다. 본 논문에서 제작된 협대역 저잡음 증폭기는 위와 같은 송신대역 Rejection 특성으로 인하여 중계기의 수신부 입력여파기와 주파수변환부내의 여파기의 설계 사양을 완화시키고 설계 및 제작비용을 낮출 수 있다.
PDF

실시간 2차원 웨이블릿 영상압축기의 FPGA 구현 (FPGA Implementation of Real-time 2-D Wavelet Image Compressor)

서영호;김왕현;김종현;김동욱
- 한국통신학회논문지
- /
- 제27권7A호
- /
- pp.683-694
- /
- 2002
본 논문에서는 2D DWT(Discrete Wavelet Transform)를 이용하여 디지털 영상압축기를 FPGA에서 실시간 동작이 가능하도록 설계하였다. 구현된 웨이블릿을 이용한 영상압축기는 필터링을 수행하는 커널부와 양자화 및 허프만 코딩을 수행하는 양자화/허프만 코더부, 외부 메모리와의 인터페이스를 위한 메모리 제어부, A/D 컨버터로부터 영상을 받아들이기 위한 입력 인터페이스부, 불규칙적인 길이의 허브만 코드값을 32비트의 일정길이로 구성하는 출력 인터페이스부, 메모리와 커널사이 데이터를 정렬하는 메모리 커널 버퍼부, PCI와의 연결을 위한 PCI 입/출력부 그리고 그 밖에 타이밍을 맞추기 위한 여러 작은 모듈들로 구성된다. 열방향 읽기 동작을 행방향 읽기 동작으로 수행하기 위한 메모리 사상방식을 사용하여 외부 메모리에 영상을 저장하고 열방향의 수직 필터링 시 효율적으로 데이터를 메모리로부터 읽을 수 있게 한다. 전체적인 동작은 A/D 컨버터의 필드 신호에 동기하여 전체 하드웨어는 필드 단위로 파이프라인 동작을 하고 필드 단위의 동작은 DWT의 웨이블릿 필터링 레벨에 따라서 동작이 구분된다. 구현된 하드웨어는 APEX2KC EP20K600CB652-7의 FPGA 디바이스에서 11119(45%)개의 LAB와 28352(9％)개의 ESB를 사용하여 하나의 FPGA내에 사상될 수 있었고 부가적인 외부 회로의 필요없이 단일 칩으로써 웨이블릿을 이용한 영상압축을 수행할 수 있었다. 또한 33MHz의 속도에서 초당 30 프레임의 영상을 압축할 수 있어 실시간 영상 압축이 가능하였다.
PDF KSCI

검색결과 2,710건 처리시간 0.045초

이메일무단수집거부

이용약관

제 1 장 총칙

제 2 장 이용계약의 체결

제 3 장 계약 당사자의 의무

제 4 장 서비스의 이용

제 5 장 계약 해지 및 이용 제한

제 6 장 손해배상 및 기타사항

자세히 찾기

이미지 검색 (β)