• 제목/요약/키워드: 음성 품질

검색결과 507건 처리시간 0.028초

마스크 착용에 의해 왜곡된 음성의 품질 향상을 위한 CycleGAN 기술 (CycleGAN for Enhancement of Degraded Speech by Face Mask)

  • 임유진;유정찬;서은미;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2022년도 하계학술대회
    • /
    • pp.63-64
    • /
    • 2022
  • 마스크 착용은 대화나 통화 등의 의사소통에 불편함을 초래하고 음성의 품질과 명료도를 떨어트린다. 이를 해결하기 위해 음성 향상 기술이 필요하며, 머신러닝 기반의 다양한 음성 향상 방법이 개발되었다. 지도 학습을 위해 마스크 착용 유무에 따라 일대일로 대응된 음성 데이터를 확보하는 것은 매우 어렵고, 따라서 일대일로 대응된 데이터가 필수적이지 않은 비지도 학습이 요구된다. 본 논문에서는 비지도 학습방식을 사용하면서 콘텍스트를 유지하며 특징을 변경할 수 있는 CycleGAN을 이용하여 마스크 착용에 의한 음성 왜곡을 복원 시키는 기술을 제안한다. 스펙트로그램 기반으로 마스크 착용에 의해 왜곡된 음성을 마스크 미착용 음성으로 변환하여 음성의 품질을 향상시켰다. 청취평가를 진행한 결과 품질이 향상된 음원의 선호도가 더 높음을 확인하였으며 스펙트로그램을 통해 3 kHz 이상의 고대역 에너지가 증가하는 것을 확인하였다. 이를 통해 CycleGAN을 이용한 비지도 학습으로 마스크 착용에 의해 왜곡된 음성의 품질을 향상시킬 수 있음을 확인하였다.

  • PDF

IEEE 802.11 무선랜에서 음성신호의 딜레이 바운드에 관한 분석 (Modeling and Analysis of Delay Bound for Voice Traffic in the IEEE 802.11 Wireless LAN)

  • 최원석;김영용
    • 한국정보처리학회:학술대회논문집
    • /
    • 한국정보처리학회 2003년도 춘계학술발표논문집 (중)
    • /
    • pp.1485-1488
    • /
    • 2003
  • IEEE 802.11 무선 랜 환경에서 멀티미디어 트래픽이 효과적으로 전송퇴기 위해서는 정해진 딜레이 바운드내에서 전송이 완료되어야 한다 대표적인 멀티미디어 트래픽인 음성신호를 전송할 때의 단방향 딜레이 바운드는 echo canceller를 쓰지 않았을 경우 $25ms{\sim}30ms$ 이다. 딜레이 바운드를 지키지 못하고 전송된다면 시간에 민감한 음성신호의 특성 때문에 음성품질이 유지되지 않을 뿐만 아니라 채널의 혼잡을 유발하게 된다. 본 논문에서는 음성의 품질이 보장되는 기준을 95%이상의 패킷이 성공적으로 전달되는 경우로 제한하여 음성의 딜레이 바운드에 관한 분석을 시도하였다. 이를 위해 음성패킷이 drop될 확률을 수학적인 분석을 통해 유도하고 시뮬레이션을 통한 검증을 시도하였다. 시뮬레이션에서는 IEEE 802.11의 두 가지 기본적인 MAC(Multiple Access Control) 프로토콜인 DCF와 PCF를 사용해서 음성신호를 전송할 때 딜레이 바운드를 지키지 못하는 음성 패킷을 사전에 drop 시킴으로써 몇 개의 음성 노드가 손실율 5% 이내 (음성의 품질이 유지되는 한계)를 만족시키는지를 음성신호를 발생시키는 STA 수와 손실율의 관계를 통해 알아보았다.

  • PDF

와이브로 네트워크를 통한 음성 서비스의 측정 기반 품질 기준 수립 (Service Quality Criteria for Voice Services over a WiBro Network)

  • 김범준
    • 한국전자통신학회논문지
    • /
    • 제6권6호
    • /
    • pp.823-829
    • /
    • 2011
  • 본 논문은 현재 상용화되어 국내에서 서비스가 제공되고 있는 무선 접속 시스템인 와이브로 네트워크를 통해서 패킷기반 음성 서비스가 제공되는 경우 예상되는 서비스 품질에 관한 것이다. 무선 환경에서 패킷기반 음성 서비스를 위한 체계적인 서비스 품질 관리 방안 수립을 위한 노력의 일환으로 이미 개발된 품질 측정 소프트웨어[2][3]를 이용하여 다양한 시나리오 하에서 음성 서비스의 품질을 측정하였다. 측정 결과의 분석을 통해서 현 시점에서 와이브로 네트워크를 통해서 음성 서비스가 제공될 경우 서비스 품질이 상당히 양호할 것임을 확인할 수 있었다. 추가적으로 무선 전송 환경의 변화가 음성 서비스의 품질에 미치는 영향을 알아보기 위한 또 다른 실험을 통해서 음성 서비스 품질의 급격한 저하 현상이 나타나는 무선 품질 지표의 값을 확인할 수 있었다.

HSDPA 시스템을 통한 음성 서비스의 측정 기반 품질 기준 수립 (Service Quality Criteria for Voice Services over a HSDPA System)

  • 김범준
    • 한국전자통신학회논문지
    • /
    • 제7권2호
    • /
    • pp.249-255
    • /
    • 2012
  • 본 논문은 현재 상용화되어 국내에서 서비스가 제공되고 있는 무선 접속 시스템인 HSDPA (High Speed Downlink Packet Access) 시스템을 통해서 패킷기반 음성 서비스가 제공되는 경우 예상되는 서비스 품질에 관한 것이다. 무선 환경에서 패킷기반 음성 서비스를 위한 체계적인 서비스 품질 관리 방안 수립을 위한 노력의 일환으로 이미 개발된 품질 측정 소프트웨어[2][3]를 이용하여 다양한 시나리오 하에서 음성 서비스의 품질을 측정하였다. 측정 결과의 분석을 통해서 현 시점에서 HSDPA 시스템을 통해서 음성 서비스가 제공될 경우 서비스 품질이 상당히 양호할 것임을 확인할 수 있었다. 추가적으로 무선 전송 환경의 변화가 음성 서비스의 품질에 미치는 영향을 알아보기 위한 또 다른 실험을 통해서 음성 서비스 품질의 급격한 저하 현상이 나타나는 무선 품질 지표의 값을 확인할 수 있었다.

MGCP Parameter를 이용한 VoIP서비스 음성품질 관리 시스템 설계 및 구현 (Design and Implementation of Voice Quality Management System by using MGCP parameter in VoIP Service)

  • 류내원;황부현
    • 한국정보과학회:학술대회논문집
    • /
    • 한국정보과학회 2004년도 가을 학술발표논문집 Vol.31 No.2 (3)
    • /
    • pp.325-327
    • /
    • 2004
  • VoIP는 음성 및 데이터 통합 뿐만 아니라 차세대 네트웍 등의 기반이 되는 기술이며, 인터넷전화 / IP Telephony, 화상회의, 메신저 서비스 등 여러 서비스에 활용되고 있다. 이러한 VoIP 서비스 제공시에 가장 중요시되는 부분이 음성품질이며 이를 측정 및 관리하는 기술이 필수적으로 필요하다. 지금까지는 품질측정장비를 가지고 직접 측정하는 것이 전부였으나 본 연구는 IETF의 VoIP 표준 프로토콜인 MGCP중 파라미터 값을 이용하여 ITU-T의 음성품질 기준인 R factor(G.107)를 계산해 내고 중앙에서 모든 단말 및 사용자들의 실제 발생한 통화에 대한 음성품질을 관리할 수 있는 시스템을 설계 및 구현한다.

  • PDF

오피니언 테스트에 의한 전화 음성품질 평가 (Assessment of Telephone Speech Transmission Quality by Opinion Test)

  • 권윤주;장대영;강경옥;강성훈
    • 한국음향학회지
    • /
    • 제11권1호
    • /
    • pp.14-21
    • /
    • 1992
  • 본 연구에서는 통신망의 음성품질 기준을 설정하기 위하여, 음성품질 열화요인 중 음량정격 및 측음 마스킹 정격에 대한 일련의 주관평가를 실시하여, 음량정격과 평균 오피니언 점수 및 측음 마스킹 정격과 평균 오피니언 점수와의 상관을 구하였다. 또한 음성품질에 대한 사용자 백분율을 도출하여 사용자의 오피니언을 기본으로 하는 음성품질 기준을 제안하였다.

  • PDF

최적 통화품질에 관한 오피니언 평가

  • 강성훈;강경옥;장대영;권윤주
    • 전자통신동향분석
    • /
    • 제6권3호
    • /
    • pp.92-100
    • /
    • 1991
  • 본 고에서는 통신망의 통화품질의 기준을 설정하기 위하여, 음성품질 열화요인 중 음량정격 및 측음 마스킹 정격에 대한 일련의 주관평가를 실시하여, 음량정격과 평균 오피니언 점수 및 측음 마스킹 정격과 평균 오피니언 점수와의 상관을 구하였고, 또한 음성품질에 대한 사용자 백분율을 도출하여 사용자의 오피니언을 기본으로 하는 음성품질 기준에 대하여 기술하였다.

음성회의 시스템에서의 동적인 에러복구 기법 (A Dynamic Error Correction Technique in Audio Correction Technique in Audio Conference Systems)

  • 윤성덕;안종석
    • 한국멀티미디어학회:학술대회논문집
    • /
    • 한국멀티미디어학회 1998년도 추계학술발표논문집
    • /
    • pp.196-201
    • /
    • 1998
  • 최근 Mbone을 통한 다양한 회의 시스템들이 등장하고 있다. 이들 회의 시스템은 주로 영상회의 시스템과 음성회의 시스템으로 이루어져 있으며, 사람들은 영상보다 음성에 더 민감하기 때문에 음성품질이 영상품질보다 더 중요하다. 현재 인터넷은 QoS(Quality Of Service)를 제공하지 않기 때문에, 인터넷을 사용하는 음성 회의 시스템들도 근본적으로 품질을 보장할 수 없다. 따라서 음성품질을 향상시키기 위한 다양한 방법들이 연구되었고, 대표적인 기법으로 중복정보(redundant information) 복구기법이 있다. 본 논문에서는 기존의 중복정보 복구기법을 개선한 동적 중복정보 복구기법을 제안한다. 이 기법은 네트워크의 상태에 따라 중복정보의 양을 조절하기 때문에 중복정보의 효율을 향상시킬 수 있다. 실제 인터넷을 통한 실험에서 평균 9%의 성능향상이 있었다.

  • PDF

VoIP의 음성품질/대역효율 개선을 위한 음성패킷 처리 (Voice Packet Processing Scheme for Voice Quality and Bandwidth Efficiency in VoIP)

  • 김재원;손동철
    • 한국멀티미디어학회논문지
    • /
    • 제7권7호
    • /
    • pp.896-904
    • /
    • 2004
  • 본 논문에서는 10msec 프레임의 가변전송률 G.729 음성부호화기를 설계하여 VoIP에서의 대역 효율을 개선하고, 부전송률 부호화기 도입을 통한 인터넷 프로토콜에서 발생하는 패킷 손실구간의 음성 품질을 개선할 수 있는 방안을 도출하였다. 가변 전송률 음성부호화기 설계는 음성 통화중 발생하는 약 60% 정도의 묵음 구간을 활용하는 기법으로서 활성 음성구간은 8kbps로 전송하고,비 활성 음성구간은 1kbps로 전송함에 의하여 고정 전송률 방식의 음성 부호화기에 비하여 평균 패킷 전송량을 약 50% 감소시켜 대역 효율을 개선할 수 있다. 제안 방법의 성능은 동일 프레임 크기를 갖는 ITU-T G.729B방식과 감지 활성도의 변화분과 음성품질 손상 구간의 비율을 기준으로 비교 평가하였다. 그리고 인터넷 환경에서의 패킷 손실에 의한 음성 품질 저하 방지는 4kbps 부전송률 음성부호화기 도입과 오류 발생 전후의 패킷에 의한 오류은닉 방법을 활용하였으며, 성능은 재생 음성품질로서 평가하였다. 본 논문에서 설계한 가변 전송률 부호화 방식은 고정 전송률 방식에 대비하여 평균 음성 패킷의 전송량을 1/2로 감소시켜 대역효율 개선이 가능하며, 감소된 전송률을 손실 패킷구간에 활용하는 경우 8kbps 고정 전송률 방식과 동일 대역이용에서 3dB의 음성품질 개선이 가능하여 VoIP 성능 개선이 가능하리라 사료된다.

  • PDF

원헝 ad hoc 방식의 음성 컨퍼런스 시스템 (Voice Conference System Based On Circular ad hoc)

  • 김철한
    • 한국정보통신설비학회:학술대회논문집
    • /
    • 한국정보통신설비학회 2003년도 하계학술대회
    • /
    • pp.123-126
    • /
    • 2003
  • 최근 컴퓨터 및 통신 기술의 발전으로 인터넷 전화 서비스가 증가하고 있다. 지금까지의 인터넷 전화 서비스는 1:1 방식의 서비스가 주류를 이루었으나, 점차 다자간 음성 채팅, 원격 강의 등과 같은 N:N 방식의 음성 컨퍼런스 서비스에 대한 수요가 급증하고 있다. 그러나 기존의 음성 컨퍼런스 시스템은 별도의 컨퍼런스 서버 구축, 부하 집중 사용자 수의 증가에 따른 음성 트래픽 증가 등의 문제로 일정한 통화 품질을 유지하기 어렵다는 단점이 있다. 따라서, 본 논문에서는 이와 같은 문제를 개선하기 위한 ad hoc 방식의 음성 컨퍼런스 시스템을 제안하였다. 그리고 이 시스템의 성능 분석을 통하여 최소 4명의 참여자까지 일정한 음성 품질이 보장됨을 확인함으로써 본 논문에서 제안하는 시스템의 타당성을 검증하였다.

  • PDF