• 제목/요약/키워드: Voice signal

검색결과 433건 처리시간 0.03초

대상객체 맥락 기반 생체정보 분석방법 (Method of Biological Information Analysis Based-on Object Contextual)

  • 김경준;김주연
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2022년도 춘계학술대회
    • /
    • pp.41-43
    • /
    • 2022
  • 최근 코로나-19의 유행에 따른 전염병 예방 및 차단을 위해 비접촉 생체 정보 취득 및 분석 기술이 주목을 받고 있다. 습식 및 부착형 생체정보 취득 방법은 정확하게 생체정보를 측정 할 수 있는 장점이 있지 만 밀 접촉에 따른 전염이 높아지는 위험성을 내포하고 있다. 이러한 문제점을 해결하기 위해 사람의 지문, 얼굴, 홍채, 정맥, 음성, 서명 등의 생체 정보를 자동화된 장치로 추출하는 비접촉 방식은 빅데이터와 AI 기술 적용으로 데이터 처리 속도가 빨라지고 인식 정확도가 높아지면서 다양한 산업에서 활용이 증가하고 있다. 그러나, 비접촉식 생체 데이터 취득 기술의 정확도가 개선되었지만, 비접촉 방법은 측정 대상 객체를 둘러싸고 있는 외부 온도, 습도, 조도 등의 주위 환경에 많은 영향을 받아 측정정보가 왜곡되는 현상이 발생하고 또한 정확도가 떨어지는 단점이 있다. 본 논문에서는 생체정보 분석을 위한 개인화 정보(이미지, 신호 등)의 해석을 위한 맥락기반 생체신호 모델링 기법을 제안 한다. 맥락기반 생체정보 모델링 기법은 성능 개선을 위해 생체정보 측정의 정황 정보와 사용자 정보를 복합적으로 고려하는 모델을 제시한다. 제안 모델은 예측 값 확률을 최대화할 수 있는 맥락기반 신호 해석을 통한 특징 확률분포를 기반으로 신호 정보를 분석한다.

  • PDF

실내 무선 통신로에서 파일럿 심볼을 삽입한 Concatenated FEC 부호에 의한 WATM의 성능 개선 (A Fault Tolerant ATM Switch using a Fully Adaptive Self-routing Algorithm - The Cyclic Banyan Network)

  • 박기식;강영흥;김종원;정해원;양해권;조성준
    • 한국통신학회논문지
    • /
    • 제24권9A호
    • /
    • pp.1276-1284
    • /
    • 1999
  • 본 논문에서는 실내 무선 통신로를 레일리 (Rayleigh) 페이딩 통신로와 라이시안 (Rician) 페이딩 통신로로 모델링한 다음, 페이딩 보상용 파일럿 심볼을 삽입한 Concatenated FEC 부호를 WATM에 적용하여 셀 비트 오율 (BER) 및 셀 손실 (CLP) 성능을 시뮬레이션을 통해 평가하였다. 또한 이를 통해 얻은 성능 평가 결과를 동일한 조건에서 컨벌루션 부호에 적용하여 얻은 성능 평가 결과와 비교하였다. 레일리 페이딩 통신로에서 음성 서비스의 최대 허용 BER ($\textrm{10}^{-3}$)을 기준으로 결과를 분석해 보면, 파일럿 심볼을 Concatenated FEC 부호에 삽입하는 경우가 컨벌루션 부호에 삽입하는 경우 보다 $E_b/N_o$면에서 약 4 dB의 성능 개선이 얻어짐을 알 수 있었다. 그리고 라이시안 페이딩 통신로에서 직접파 대 반사파 전력비를 나타내는 K 파라미터의 값이 6과 10인 경우, 음성 서비스의 최대 허용 BER을 기준으로 결과를 분석해 보면, 파일럿 심볼을 Concatenated FEC 부호에 삽입하는 경우가 $E_b/N_o$면에서 각각 4 dB와 2 dB의 성능 개선이 얻어짐을 알 수 있었다. 또한 K=6과 K=10인 라이시안 페이딩 통신로에서 CLP =$\textrm{10}^{-3}$을 기준으로 결과를 분석해 보면, 파일럿 심볼을 Concatenated FEC 부호에 삽입하는 경우가 $E_b/N_o$면에서 각각 3.5 dB와 1.5 dB의 성능 개선이 얻어짐을 알 수 있었다.

  • PDF

무선 네트워크 환경에서 멀티미디어 서비스를 위한 AP 선정 기법 (An AP Selection Scheme for Enhancement of Multimedia Streaming in Wireless Network Environments)

  • 류동우;왕위빈;강경진
    • 한국산학기술학회논문지
    • /
    • 제11권3호
    • /
    • pp.997-1005
    • /
    • 2010
  • 최근 무선 랜(WLAN : Wireless Local Area Network) 기술이 사용자에게 편리성과 유연성을 제공함에 따라 무선 분야에 대한 관심이 증가하고 있다. 무선 랜 어플리케이션의 웹 접근과 같은 표준화된 인터넷 서비스에서부터 멀티미디어 비디오 및 음성 서비스와 같은 분야에서 매우 엄격한 지연시간/처리율이 요구된다. 따라서, 무선 랜의 효율을 높이기 위해 AP(Access Point)들 간 트래픽의 공정하고 효율적인 부하의 분산이 중요한 문제가 된다. 본 논문에서는 보다 나은 로드 밸런스를 달성하고, 네트워크 리소스 사용률을 증가시키기 위한 AP 선정 기법을 제안한다. 제안된 기법은 부하 측정과 AP 선정의 주요 파라미터로서 활성화 검사 패턴과 네트워크 지연을 사용한다. 또한, 상향 링크/하향링크 지연을 관찰함으로써 AP 트래픽 부하를 예측하고, 로드 밸런스를 통해 링크 자원의 효율성을 극대화하기 위해 예측 결과를 사용한다. 제안하는 기법은 NS-2(Network Simulation-2)를 이용하여 SNR(Signal to Noise Ratio) 기법과 비교하였다. 제안한 기법은 전체 네트워크의 처리율이 12.5% 향상된 것으로 나타났고, 상향링크/하향링크 지연 시간은 36.84%, 60.42%씩 감소되었다. 또한 제안한 기법은 전체 네트워크 처리율을 증가시켰으며, 비디오와 음성서비스를 우수한 품질로 제공하면서 상향링크/하향링크의 지연 시간을 감소시킴을 확인하였다

잡음 환경에 효과적인 마스크 기반 음성 향상을 위한 손실함수 조합에 관한 연구 (A study on combination of loss functions for effective mask-based speech enhancement in noisy environments)

  • 정재희;김우일
    • 한국음향학회지
    • /
    • 제40권3호
    • /
    • pp.234-240
    • /
    • 2021
  • 본 논문에서는 잡음 환경에서 효과적인 음성 인식을 위해 마스크 기반의 음성 향상 기법을 개선한다. 마스크 기반의 음성 향상 기법에서는 심층 신경망을 기반으로 추정한 마스크를 잡음 오염 음성에 곱하여 향상된 음성을 얻는다. 마스크 추정 모델로 VoiceFilter(VF) 모델을 사용하고 추정된 마스크로 얻은 음성으로부터 잔여 잡음을 보다 확실히 제거하기 위해 Spectrogram Inpainting(SI)기법을 적용한다. 본 논문에서는 음성 향상 결과를 보다 개선하기 위해 마스크 추정을 위한 모델 학습 과정에 사용되는 조합된 손실함수를 제안한다. 음성 구간에 남아 있는 잡음을 보다 효과적으로 제거하기 위해 잡음 오염 음성에 마스크를 적용한 Triplet 손실함수의 Positive 부분을 컴포넌트 손실함수와 조합하여 사용한다. 실험 평가를 위한 잡음 음성 데이터는 TIMIT 데이터베이스와 NOISEX92, 배경음악 잡음을 다양한 Signal to Noise Ratio(SNR) 조건으로 합성하여 만들어 사용한다. 음성 향상의 성능 평가는 Source to Distortion Ratio(SDR), Perceptual Evaluation of Speech Quality(PESQ), Short-Time Objective Intelligibility(STOI)를 이용한다. 실험을 통해 평균 제곱 오차로만 훈련된 기존 시스템과 비교하여, VF 모델은 평균 제곱 오차로 훈련하고 SI 모델은 조합된 손실함수를 사용하였을 때 SDR은 평균 0.5dB, PESQ는 평균 0.06, STOI는 평균 0.002만큼 성능이 향상된 것을 확인했다.

차량 내 FM라디오를 이용한 VMS서비스 개선 연구 (A Study on Enhancing VMS Services by FM Car Radio)

  • 박범진;문병섭
    • 한국ITS학회 논문지
    • /
    • 제9권6호
    • /
    • pp.22-32
    • /
    • 2010
  • 근래 우리생활 깊숙이 자리잡은 유비쿼터스 개념은 과거 산업혁명 당시와 마찬가지로 사람들로 하여금 새로운 수요와 라이프스타일의 변화를 견인하고 있다. 특히, 교통부문은 '이동'이라는 특수한 여건 때문에 더욱 이러한 트랜드에 민감해지기 쉬운 경향이 있다. 이를 가장 잘 반영하는 것이 콘텐츠 시장이라 할 수 있는데, 최근 민간에서는 변화된 수요에 대응하기 위해서 맞춤형 개인교통정보의 개념을 발 빠르게 도입하고 있다. 하지만, 공공에서는 어떠한가? 불특정다수에게의 운전 중에 기본레벨의 교통정보제공이라는 목적을 가지고 도입된 ITS 1세대 산물인 VMS의 경우, 이러한 변화 속에서 능동적으로 변화하지 못하고 있다. 이에 본 논문에서는 불특정다수에게 '평등한 정보제공'이라는 '공공의 역할' 속에서, 고급화되고, 점점 개인단말기기를 선호하는 수요에 대응하기 위한 고도화된 VMS시스템(가칭 FM-VMS)에 대하여 기술하고자 한다. 본 논문에서 소개하는 FM-VMS는 차량 안에 장착된 라디오를 정보제공기기로 사용하여 운전자는 누구든지 음성과 문자를 받을 수 있는 장치이다. 핵심기술은 기존의 FM-DARC와 RDS와는 다른 방송중인 FM 주파수에 직접 디지털 신호를 삽입하는 Water Making기술로 이는 현재 방송 및 보안으로 활용되고 있다. Water Making 기술로 구현된 FM-VMS 시스템에 대한 Test를 통한 검지율은 Test용으로 사용한 VMS 주변 200m안에서 음성과 문자 모두 90% 이상의 검지율을 보였다. FM 주파수를 이용하여 공공(Public)이 구축한 VMS정보를 상대적 교통약자(교통정보의 취약계층)에게 실시간으로 음성으로 지역 교통정보를 제공하고 나아가 자동차 제조사와 연계하여 FM 주파수만으로 라디오 액정을 통하여 VMS 문자정보까지 받아 볼 수 있다면, ITS의 혁신뿐만 아니라, 새로운 부가가치를 창출할 수 있는 전기를 마련할 수 있을 것이다.

k-clustering 부공간 기법과 판별 공통벡터를 이용한 고립단어 인식 (Isolated Word Recognition Using k-clustering Subspace Method and Discriminant Common Vector)

  • 남명우
    • 대한전자공학회논문지TE
    • /
    • 제42권1호
    • /
    • pp.13-20
    • /
    • 2005
  • 본 논문에서는 M. Bilginer 등이 제안한 CVEM(common vector extraction method)을 이용하여 한국어 화자독립 고립단어 인식실험을 수행하였다. CVEM은 학습용 음성신호들로부터 공통된 특징의 추출이 비교적 간단하고, 많은 계산 량을 필요로 하지 않을 뿐만 아니라 높은 인식 결과를 보여주는 알고리즘이다. 그러나 학습 음성의 개수를 일정 한도 이상으로 늘릴 수 없고, 추출된 공통벡터들 간의 구별정보(discriminant information)를 가지고 있지 않다는 문제점을 가지고 있다. 임의의 음성군으로부터 최적의 공통벡터를 추출하기 위해서는 다양한 음성들을 학습에 사용해야만 하는데 CVEM은 학습용 음성 개수에 제한이 있으므로 지속적인 인식률 향상을 기대하기 어렵다. 또한 공통벡터들 간의 구별정보 부재는 단어 결정에 있어서 치명적인 오류의 원인이 될 수 있다. 본 논문에서는 CVEM이 가지고 있는 이러한 문제점들을 보완하면서 인식률을 향상시킬 수 있는 새로운 방법인 KSCM(k-clustering subspace method)과 DCVEM(discriminant common vector extraction method)을 제안하였고 이 방법을 사용하여 고립단어를 인식하였다. 그리고 제안한 방법들의 우수성을 입증하기 위해 ETRI에서 제작한 음성 데이터베이스를 사용, 다양한 방법으로 실험을 수행하였다. 실험 결과 기존 방법의 문제점들을 모두 극복할 수 있었을 뿐 아니라 기존에 비해 계산량의 큰 증가 없이 향상된 결과를 얻을 수 있었다.

실시간 윈도우 환경에서 DMS모델을 이용한 자동 음성 제어 시스템에 관한 연구 (A Study on the Automatic Speech Control System Using DMS model on Real-Time Windows Environment)

  • 이정기;남동선;양진우;김순협
    • 한국음향학회지
    • /
    • 제19권3호
    • /
    • pp.51-56
    • /
    • 2000
  • 본 논문은 음성인식을 이용한 실시간 윈도우 자동 제어 시스템에 관한 연구이다. 사용된 음성 모델은 수행 속도를 높이기 위해 제안된 가변 DMS 모델을 이용하였으며, 인식 알고리즘으로 이를 이용한 One-Stage DP 알고리즘을 사용한다. 인식 대상단어는 윈도우에서 자주 사용되는 66개의 윈도우 제어 명령어들로 구성한다. 본 연구에서 온라인으로 음성을 처리하기 위해 음성 검출 알고리즘을 구현하였으며, 기존 DMS(Dynamic Multi Section)모델 생성시 고정적으로 적용하던 섹션의 수를 입력 신호의 지속 시간을 고려하여 가변적으로 적용한 가변 DMS 모델을 제안하였다. 또한 윈도우에서 사용자 작업에 의해 현재 상태에 인식 대상으로 불필요한 인식 대상단어가 발생하게 되는데 이를 효율적으로 처리하기 위해 사용 모델을 재구성하여 사용하도록 제안하였으며, 인간의 청각적 특성을 고려하여 음성신호에서 개인의 특성은 제외하고 음성 자체의 특징만을 추출하여 특징 벡터를 생성하는 인지 선형 예측(Perceptual Linear Predictive)분석 방법을 이용하였다. 시스템 성능 평가 결과 가변 동적 다중 섹션 모델(Variable DMS model)과 기존의 DMS 모델은 인식률 면에서는 거의 동일하지만 인식 수행 속도는 제안된 모델의 계산량이 기존 모델보다 작기 때문에 향상되었고, 다중 화자 독립 인식률은 99.08%, 다중 화자 종속 인식률은 99.39%의 인식률을 나타내었으며, 실제 노이즈가 있는 환경에서 화자독립실험의 경우 96.25%의 인식률을 보여 주었다.

  • PDF

NGN 기반환경 에서의 VoIP QoS 관리체계 모델 설계 (A Study on Designing Method of VoIP QoS Management Framework Model under NGN Infrastructure Environment)

  • 노시춘;방기천
    • 디지털콘텐츠학회 논문지
    • /
    • 제12권1호
    • /
    • pp.85-94
    • /
    • 2011
  • QoS(Quality of Service)는 ITU-T Rec. E.800에 의해 서비스를 사용하는 형태, 특성 그리고 요구 수준에 따라 사용자의 요구에 부응하여 제공할 수 있는 네트워크 서비스의 성능지표로 표현된다. VoIP(Voice Over Internet Protocol) 서비스가 광범위하게 사용되고 있지만 QoS관련 문제점은 해결해야 할 현안 과제로 인식되고 있다. 본 연구는 NGN(Next Generation Network) 기반 환경에서 VoIP QoS 보증을 위해 어떤 체계하에서 품질이 관리 되어야 하는지를 도출하기 위해 VoIP 품질측정과 시험체계 모델을 제시 한다. 프레임워크는 VoIP 기술동향, 프로토콜 분석, 품질관리 항목 도출, 품질측정 기능개발, 프레임워크 설계, 프레임워크 검증 순서로 연구를 진행 한다. 이를 위해 QoS 측정 메트릭스, 측정구간과 측정계위, 측정도구와 측정장비, 측정방법 및 측정결과분석에 대한 일련의 프로세스와 관리체계를 모델화 하여 향후 VoIP QoS 보증활동에 응용토록 한다. 통신서비스 품질은 스스로 보장되지 않으며 끊임없이 측정되고 관리될 때 에만 목표 수준의 품질 확보가 가능하다. 특히 네트워크기술 패러다임 대 전환이 전개되고 있는 이 시기적인 중요성을 볼 때 VoIP QoS 관리에 대한 연구는 앞으로 활발하게 추진되어야 할 핵심 소재 이다. 본 연구를 통해 VoIP 품질관리 프레임워크를 적용 할 경우 품질관리가 가능함을 보여주고 있다.

음성인식기 구현을 위한 잡음에 강인한 음성구간 검출기법 (Robust Speech Segmentation Method in Noise Environment for Speech Recognizer)

  • 김창근;박정원;권호민;허강인
    • 융합신호처리학회논문지
    • /
    • 제4권2호
    • /
    • pp.18-24
    • /
    • 2003
  • 실시간 음성 인식기의 구현에 있어서 선행되어야 할 과제는 신뢰성 있는 음성구간 검출과 적절한 음성특징벡터를 구하는 것이다. 그러나, 주변 잡음이 인가되는 환경에서는 신뢰성 있는 음성구간 검출이 어렵게 되어 적절한 음성특징벡터를 구할 수 없게 되어 최종적으로 인식기의 성능 저하를 초래하게 된다. 이러한 문제점을 보완하기 위하여 본 논문에서는 일반적으로 사용되어지는 단구간 파러 스펙트럼 외에 잡음에 강인한 특성을 가질 수 있도록 하는 새로운 특징 파라메터로써 스펙트럼 밀도비교척도와 선형회귀를 이용한 선형결정함수를 사용하였다. 이러한 두 가지 파라메터를 추가하여 주변 잡음의 크기에 따라 각각의 (파라메터를 적절한 가중치로 조합하여 음성구간 결정을 수행한 다음 DTW를 사용하여 인식실험을 한 결과 주변 잡음이 존재하는 환경에서도 강인한 특성을 가짐을 확인할 수 있었다.

  • PDF

변형된 적응 스위칭 메디안 필터를 이용한 임펄스 잡음제거에 관한 연구 (A Study on Removing Impulse Noise using Modified Adaptive Switching Median Filter)

  • ;김남호
    • 한국정보통신학회논문지
    • /
    • 제15권11호
    • /
    • pp.2474-2479
    • /
    • 2011
  • 사회가 고도의 디지털 정보화 시대로 급속히 발전함에 따라 영상 및 음성 데이터 획득, 전송, 저장을 위한 멀티미디어 통신 서비스가 상용화 되어가고 있다. 그러나 여전히 데이터를 처리하는 과정에서 다양한 잡음에 의해 영상의 열화가 발생하고 있으며 이러한 잡음제거에 관한 연구는 지금까지 계속되고 있다. 따라서 본 논문에서는 임펄스 잡음을 제거하기 위해, 잡음 신호의 판단과 제거 등 두 과정으로 구성된 변형된 적응 스위칭 메디안 필터를 제안하였다. 제안한 알고리즘은 잡음 신호만을 제거하고 비잡음 신호는 그대로 보존하여, 우수한 에지 보존특성 및 잡음제거 능력을 나타내었다. 그리고 개선 효과의 판단 기준으로 PSNR(peak signal to noise ratio)을 사용하였으며, 객관적인 판단을 위해 기존의 방법들과 비교하였다.