• 제목/요약/키워드: 음성 신호 압축

검색결과 91건 처리시간 0.03초

Wavelet Packet을 이용한 고압축신호 개선에 관한 연구 (A Study on High-Compressed Signal Enhancement using Wavelet Packet)

  • 민웅규;장성욱;양성일;권영헌
    • 한국음향학회:학술대회논문집
    • /
    • 한국음향학회 1999년도 학술발표대회 논문집 제18권 2호
    • /
    • pp.85-88
    • /
    • 1999
  • Adapted Local Trigonometric Transforms은 매우 높은 energy compaction을 가지므로 음성 및 영상신호에 이용하려는 시도가 이루어지고 있다. [1] 그러나 이 경우 복원 된 신호에는 시간 영역에서 불연속점이 발생하여 일종의 tick noise가 발생한다. 또한 phase성분을 잃게 되어 금속성 잡음도 추가하여 나타난다. 본 논문에서는 이러한 문제점을 해결하기 위한 Polynomial fitting 방식과 Wavelet Packet Transforms 방식을 제안한다. Polynomial fitting 방식으로는 시간축상에서 발생하는 문제를 해결하고 Wavelet Packet Transforms으로 Phase 문제를 해결한다. [2,3] 실험결과, 압축이전의 신호와 비교할 때 SNR에 있어서 개선을 보이며 tick noise와 금속성 잡음이 제거된 개선된 신호음을 확인 할 수 있었다.

  • PDF

가우시안 코드북을 갖는 다중대역 비균일 음성 표본화법 (On a Multiband Nonuniform Samping Technique with a Gaussian Noise Codebook for Speech Coding)

  • 정형교;배명진
    • 한국음향학회지
    • /
    • 제16권6호
    • /
    • pp.110-114
    • /
    • 1997
  • 잡음 음성신호에 비균일 표본화 부호화법을 적용하면, PCM 균일표본화의 전송율 정도로 데이타 전송율이 높아진다. 이러한 문제점을 해결하기 위해 비균일 표본화법을 성분분리된 음성신호에 적용하는 방법으로서 다중대역 비균일 파형부호화(MNWC)법을 제안하였었다. 그렇지만, 고대역의 성분에 대해 가우시안 잡음의 평균레벨로 단순하게 모델링 하였기 때문에, 비균일 표본화법에 비해 음질의 열화가 초래되었었다. 따라서 본 논문에서는 이러한 단점을 극복하기 위해 고대역의 성분을 중심주파수가 서로 다른 16가지의 가우시안 잡음으로 모델링하였다. 이렇게 하였을 때, 제안된 방법은 MOS평가가 평균 3.16 정도로 고음질을 유지하면서도 기존의 비균일 표본화법에 비해 1.5배 정도의 압축 율을 얻을 수 있었다.

  • PDF

시간 영역 오토인코더의 성능 개선을 위한 다중 대역 손실 함수 (A Multi-band Loss Function for Improving Time-Domain Autoencoder)

  • 임유진;유정찬;서은미;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.78-79
    • /
    • 2021
  • 본 논문에서는 시간 영역 오토인코더의 성능 개선을 위한 다중 대역 손실 함수를 제안한다. 기존의 시간 영역 오토인코더를 사용하는 압축 및 복원 모델은 저 대역 손실에 치중되어 고 대역 신호를 생성하지 못하고 다운 샘플링된 신호를 결과로 출력하는 문제점을 가진다. 이를 해결하기 위해 대역별로 손실을 분리하여 가중치를 조절할 수 있는 다중 대역 손실 함수를 제안한다. 제안하는 손실 함수가 적용된 오토인코더에 음성 신호를 입력하여 학습을 진행한 결과, 다운 샘플링이 발생하지 않으며 고 대역 신호가 복원되는 것을 스펙트로그램을 통해 확인하였다.

  • PDF

원격 진료를 위한 실시간 생체 신호 취득, 전송 및 압축, 저장 시스템의 설계 및 구현 (Design and Implementation of a Real-time Bio-signal Obtaining, Transmitting, Compressing and Storing System for Telemedicine)

  • 정인교;김영준;박인수;이인성
    • 전자공학회논문지SC
    • /
    • 제45권4호
    • /
    • pp.42-50
    • /
    • 2008
  • 본 논문에서는 원격 의료 서비스를 위한 생체 신호 취득 및 전송 시스템의 실시간 신뢰성을 보장하기 위하여 ZigBee와 SIP/RTP를 기반으로 하는 실시간 생체 신호 전송 시스템의 성능 개선 방법을 제안하고 구현하였다. 기존의 시스템은 ZigBee기반의 유비쿼터스 센서 네트워크를 기반으로 사용자의 ECG 및 기타 생체 신호를 수집한다. 이 때 연속된 ECG 전송에 의하여 채널이 과다하게 점유되어 ECG 이외의 생체 신호를 전송할 때 패킷의 손실이 발생한다. 또한 하나의 RTP 세션을 통해 사용자의 음성과 ECG 및 기타 생체 신호를 순차적으로 전송하기 때문에 과중한 전송 스레드 부하와 지연이 발생한다. 따라서 본 논문에서는 ECG 전송 모듈의 채널 점유 문제를 해결하기 위해 Bluetooth를 보조 전송 수단으로 사용하고 복수의 RTP 세션과 전송 스레드를 사용하여 전송지연을 감소시키는 방법을 사용하였다. 또한 이산 웨이블릿 리프팅과 다단계 벡터 양자화 기반의 압축 방법을 적용하여 전송 및 저장되는 ECG를 압축하여 관리하는 구조를 제안하고 구현하였다. ECG의 압축은 데이터의 전송량을 감소시켜 시스템의 실시간 신뢰성을 향상시키며 데이터베이스의 저장 공간을 효율적으로 사용할 수 있도록 한다. 결과적으로 기존의 시스템에 대하여 유비쿼터스 센서 네트워크의 안정성을 확보할 수 있었고 실시간 전송 모듈의 프로세스 점유율을 약 20% 감소시킬 수 있었으며 실제 측정한 ECG를 압축한 결과 25.6:1의 압축률에서 약 3.25%의 PRD를 가지는 효율적인 ECG 관리가 이루어질 수 있었다.

ChipSet을 이용한 VoIP PHONE 시스템 개발 (An Implementation of a VoIP Phone system using ChipSet)

  • 안혁종;황승용;이진형;양희성;이상연;조성호
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2000년도 제13회 신호처리 합동 학술대회 논문집
    • /
    • pp.105-108
    • /
    • 2000
  • CTI[1]의 응용 영역 중에서 인터넷 폰이 최근 뜨거운 관심의 대상으로 떠오르고 있다. 인터넷을 이용한 음성전달 기술은 인터넷의 성장 보급과 더불어 나날이발전 하고 있는데, 이러한 음성전달기술을 이용해 개발된 소프트 웨어를 통칭해서 인터넷 폰이라고 부르고 있다. 이러한 변화 속에서 비용의 절감과 비디오 전화, 영상회의와 같은 응용에 적용할 수 있는, 본 개발은 One Encoder One Decoder 지원의 VoIP(Voice over Internet Protocol) Phone에 관한 것으로, 특히 압축하여 인터넷 망에 접속시켜 사용할 수 있는 PC 장착형 One Board 형태의 시스템을 구현하였다. 이 Board에 사용 된 칩셋은 국내 회사인 C&S Technology 사의SEAGUL723이며, PC인터페이스는 PCI(Peripheral Component Interconnect) 버스 방식을 이용하였다. 주요 연구내용에 있어서 하드웨어 부분은 내선제어모듈,PCI 모듈, 칩셋을 이용한 음성신호처리 모듈, Board제어 모듈 등이 있으며, 소프트 웨어 설계 부분에 있어서는 하드웨어 구동을 위한 시스템 드라이브, Application과 인터넷 상의 VoIP 통신을 위한 소프트웨어, 사용자를 위한 User Interface 소프트 웨어 등이 있다.

  • PDF

동영상에서 이미지와 음성신호를 이용한 검색 알고리즘 구현 (Search Algorithm Embodiment which uses the Image and Speech Signal from the Vido)

  • 신인경;이상범
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2010년도 한국컴퓨터종합학술대회논문집 Vol.37 No.1(B)
    • /
    • pp.88-91
    • /
    • 2010
  • 정보통신망 및 멀티미디어 기술의 발전으로 인해 정보의 형태는 단순한 텍스트 데이터에서 멀티미디어 데이터로 전환되고 있다. 멀티미디어 기술은 저장, 재생, 압축 등 관련 기술의 빠른 발전과 미디어의 사회, 문화적 역할이 계속 증가함에 따라 우리 사회 전반에 걸쳐 매우 광범위하게 사용되고 있으며, 이로 인해 동영상 검색등의 많은 검색을 요구 하고 있으나, 동영상 검색의 문제점은 생산되는 컨텐츠에서 동영상이 가지고 있는 비중은 계속해서 높아지지만 쌓아진 데이터를 검색하기엔 몇 가지 문제점이 있다. 첫 번째는 데이터의 중복성이고 두 번째는 제목, 내용 그리고 Keyword가 일치하지 않으며, 세 번째는 저자권 침해 등이 있다. 본 연구에서는 본 논문에서는 빠르게 변화되고 있는 정보화 시대에 맞게 동영상에서 음성과 얼굴영역을 검출하여, 검색 시 효율적이고 정확한 데이터의 검색이 이루어 질 수 있도록 검색 알고리즘을 제안하고 소개하며, 이중 두 번째의 문제점인 제목, 내용 그리고 Keyword의 불일치한 점에 두어 검색 시 영상의 이미지 검색과 음성을 통하여 keyword를 찾아 효율적이고 검색율의 높일 방법을 연구한다.

  • PDF

음성신호 압축 및 복원을 위한 음성 천이구간 검출과 근사합성 방식 (Speech Transition Detection and approximate-synthesis Method for Speech Signal Compression and Recovery)

  • 이광석;김봉기;강성수;김현덕
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 춘계종합학술대회 A
    • /
    • pp.763-767
    • /
    • 2008
  • 유 무성음의 음원을 이용한 음성부호화 시스템에서는 프레임 내에 유성자음과 무성자음이 공존하는 경우 음질의 왜곡을 수반할 수 있다. 따라서 프레임 내에 유성자음과 무성자음이 공존하지 않도록 하기 위해서 무성자음을 탐색 및 검출을 포함하는 천이구간을 제안하였다. 본 연구는 최소 자승법과 주파수 대역 분할법을 사용함으로써 TS 근사합성의 새로운 방식을 제시하였다 결과적으로 이 방식은 0.547kHz이하와 2.813kHz 이상에서의 주파수 정보를 이용함으로써 TS내에서 고품질의 근사합성 파형을 얻을 수 있었다. 중요한 것은 최대 오류신호는 TS내에 저 왜곡 근사 합성파형이 생길 수 있다는 것이다. 이 방식은 유성음/묵음/TS의 새로운 음성부호화, 음성해석 및 음성합성에 적용할 수 있으리라 생각한다.

  • PDF

WMV DCT의 HDL 설계 (HDL Design of DCT for WMV)

  • 민태훈;손승일;여협구
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국정보통신학회 2013년도 춘계학술대회
    • /
    • pp.779-782
    • /
    • 2013
  • 오늘날 우리 생활에 영상이나 이미지는 우리 실생활에 아주 밀접하게 연관되어 있다. 카메라, 휴대폰, TV, 영상 및 이미지 관련 기기들이 증가하고 이로 인해 영상이나 이미지 관련 서비스의 기술적인 요소들이 중요시되고 있다. 이러한 영상에서 기본적으로 사용하는 압축방식인 DCT는 직교 변환 방식의 국제 표준으로써, 정지 이미지나 동영상의 압축 파일등에서 사용된다. DCT(Discrete Cosine Transform) 알고리즘은 음성 및 영상 압축 등 많은 디지털 신호처리 분야에서 사용되고 있다. 본 논문에서는 WMV의 $4{\times}4$, $4{\times}8$,$8{\times}4$, $8{\times}8$ 4가지 모드에 대해 DCT를 지원할 수 있도록 C언어를 통해 상위 수준의 검증을 수행하고, 이를 HDL을 사용하여 코딩하고, Modelsim SE6.1을 사용해 회로 검증하였다.

  • PDF

대역분리-비균일표본화 방법을 이용한 새로운 음성신호의 파형부호화 연구 (A New Speech Waveform Coding Based on the Nonuniform Sampling Method with Separated to High-Low Band)

  • 배명진;이주헌;임성빈;이원철
    • 한국음향학회지
    • /
    • 제14권5호
    • /
    • pp.89-93
    • /
    • 1995
  • 균일표본화에서 나타나는 샘플간의 잉여정보를 더욱 줄임으로써, 요구되는 데이타량을 크게 줄일 수 있는 방법으로 비균일표본화 방법이 고려된다 그러나, 음성신호의 경우 이러한 비균일표본화 방법을 바로 적용하면, 필요한 데이타량이 균일표본화에 견주어 크게 줄어들지 않게 된다. 특히, 잡음환경하에서는 오히려 균일표본화의 경우보다도 데이타량이 커질 수 있다. 이러한 단점을 보완하기 위해서, 먼저 음성신호를 적당히 저대역 필터링을 한 후 비균일표본화를 적용하고, 고대역성분에서의 오차는 잡음신호로 보완하는 방법을 제안한다. 제안된 방법은 기존의 비균일표본화 방법보다 약1.8배의 데이타압축효과를 얻을 수 있었다.

  • PDF

8kbps에 있어서 ACFBD-MPC에 관한 연구 (A Study on ACFBD-MPC in 8kbps)

  • 이시우
    • 한국산학기술학회논문지
    • /
    • 제17권7호
    • /
    • pp.49-53
    • /
    • 2016
  • 최근 무선네트워크의 효율을 높이기 위하여 신호압축 방식의 사용이 증가되고 있다. 특히, MPC 시스템은 비트율을 줄이기 위하여 피치추출 방법과 유성음과 무성음의 음원을 사용하였다. 일반적으로, 유성음원과 무성음원을 사용하는 MPC 시스템에 있어서, 같은 프레임 안에 모음과 무성자음이 있는 경우에 재생 음성파형에 일그러짐이 나타난다. 이것은 대표구간의 멀티펄스를 피치구간마다 복원하는 과정에서 재생 음성파형이 정규화 되는 것이 원인으로 작용한다. 본 논문에서는 재생 음성파형의 일그러짐을 제어하기 위하여 피치구간 마다 멀티펄스의 진폭을 보정하고, 특정 주파수를 이용하는 ACFBD-MPC(Amplitude Compensation Frequency Band Division-Multi Pulse Coding)를 제안하였다. 실험은 남자와 여자음성에서 각각 16개의 문장을 사용하였으며, 음성신호는 10kHz 12bit로 A/D 변환하였다. 또한 8kbps의 부호화 조건에서 ACFBD-MPC 시스템을 구현하고, ACFBD-MPC의 SNR를 평가하였다. 그 결과 ACFBD-MPC의 남자 음성에서 14.2dB, 여자 음성에서 13.6dB 임을 확인할 수 있었으며, ACFBD-MPC가 기존의 MPC에 비하여 남자음성에서 1dB, 여자음성에서 0.9dB 개선되는 것을 알 수 있었다. 이 방법은 셀룰러폰이나 스마트폰과 같이 낮은 비트율의 음원을 사용하여 음성신호를 부호화하는 방식에 활용할 수 있을 것으로 기대된다.