• 제목/요약/키워드: 음성다중방송

검색결과 23건 처리시간 0.024초

중첩 U-Net 기반 음성 향상을 위한 다중 레벨 Skip Connection (Multi-level Skip Connection for Nested U-Net-based Speech Enhancement)

  • 황서림;변준;허준영;차재빈;박영철
    • 방송공학회논문지
    • /
    • 제27권6호
    • /
    • pp.840-847
    • /
    • 2022
  • 심층 신경망(Deep Neural Network) 기반 음성 향상에서 입력 음성의 글로벌 정보와 로컬 정보를 활용하는 것은 모델의 성능과 밀접한 연관성을 갖는다. 최근에는 다중 스케일을 사용하여 입력 데이터의 글로벌 정보와 로컬 정보를 활용하는 중첩 U-Net 구조가 제안되었으며, 이러한 중첩 U-Net은 음성 향상 분야에도 적용되어 매우 우수한 성능을 보였다. 그러나 중첩 U-Net에서 사용되는 단일 skip connection은 중첩된 구조에 알맞게 변형되어야 할 필요성이 있다. 본 논문은 중첩 U-Net 기반 음성 향상 알고리즘의 성능을 최적화하기 위하여 다중 레벨 skip connection(multi-level skip connection, MLS)을 제안하였다. 실험 결과, 제안된 MLS는 기존의 skip connection과 비교하여 다양한 객관적 평가 지표에서 큰 성능 향상을 보이며 이를 통해 MLS가 중첩 U-Net 기반 음성 향상 알고리즘의 성능을 최적화시킬 수 있음을 확인하였다. 또한, 최종 제안 모델은 다른 심층 신경망 기반 음성 향상 모델과 비교하여서도 매우 우수한 성능을 보인다.

스마트폰에서 실시간 음성 통신을 위한 UDP Socket Server 구현 (Implement UDP Socket Server for Real-time Voice Communication on Smart-phone)

  • 강지희;손한비;임양미
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2017년도 추계학술대회
    • /
    • pp.79-81
    • /
    • 2017
  • 최근 오디오 기반의 그룹 대화 통신 기술이 급격히 발전하고 있는데 이는 원거리 간의 회의 또는 긴급 구조망, 음성 인식을 활용한 기술 분야에서 필요로 하기 때문이다. 과거 오디오 그룹 간의 실시간 서비스는 영상 통신보다 타이밍에 있어서 사용자에게 딜레이 되는 값을 전송하는 즉 버퍼 컨트롤이 문제가 되어 잘 사용되지 않았었다. 하지만 최근 다중경로 라우팅, QoS 전송량 감소 기술들이 소개되면서 N:N의 대화가 가능하게 되었다. 본 연구에서는 UDP Socket 방식을 활용하여 N:N 실시간 음성 서비스를 개발한다. 이는 무선단말기를 활용하여 3~4인이 그룹핑 되어 노래 경쟁을 할 수 있는 앱에 적용하여 개발하였다. 운전자가 혼자 운전할 때, 다른 지역에서 운전하는 사람들과 음성인식 인터페이스를 활용하여 즉각적인 그룹을 만들고, 자신과 다른 사람들이 노래를 부르고, 듣고 평가하는 과정에서 재미를 느끼게 함으로써 졸음을 방지할 수 있도록 개발하였다.

  • PDF

지능형 고품질 서비스를 위한 오디오 개발 (Implementation of The Audio for HiMCS System)

  • 송재종;이석필;장세진
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2003년도 신호처리소사이어티 추계학술대회 논문집
    • /
    • pp.77-80
    • /
    • 2003
  • 본 논문에서는 디지털방송과 인터넷의 융합에 따른 MPEG-2/4/7 방송 및 인터넷 콘텐츠를 비롯한 게임등과 같은 다양한 멀티미디어 서비스를 제공하기 위한 차세대 지능형 고품질 홈 엔터테인먼트 시스템 Platform 개발에서 사용될 MPEG-4 오디오를 개발한다. 인터넷 상에서의 스트리밍 서비스를 위해서는 저 전송률과 고 품질의 비디오/오디오 알고리즘이 필요하다. 이러한 서비스를 제공하기 위하여 MPEG-4 오디오는 음성에서 고품질의 다중 채널의 오디오까지, 그리고 자연음(Natural Sound)에서 합성음에 이르기까지 다양한 알고리즘을 제공한다. 본 논문에서는 지능형 고품질 미디어 에이전트 시스템에 적합한 MPEG-4 AAC, MPEG-1 Layer-3인 MP3, G.723.1을 구현하고, 이 시스템에 알맞은 7㎑ 대역폭을 가지는 광대역(Wideband) 음성신호를 16kbps로 압축하는 음성 압축기를 제안 및 개발한다.

  • PDF

시간 영역 오토인코더의 성능 개선을 위한 다중 대역 손실 함수 (A Multi-band Loss Function for Improving Time-Domain Autoencoder)

  • 임유진;유정찬;서은미;박호종
    • 한국방송∙미디어공학회:학술대회논문집
    • /
    • 한국방송∙미디어공학회 2021년도 추계학술대회
    • /
    • pp.78-79
    • /
    • 2021
  • 본 논문에서는 시간 영역 오토인코더의 성능 개선을 위한 다중 대역 손실 함수를 제안한다. 기존의 시간 영역 오토인코더를 사용하는 압축 및 복원 모델은 저 대역 손실에 치중되어 고 대역 신호를 생성하지 못하고 다운 샘플링된 신호를 결과로 출력하는 문제점을 가진다. 이를 해결하기 위해 대역별로 손실을 분리하여 가중치를 조절할 수 있는 다중 대역 손실 함수를 제안한다. 제안하는 손실 함수가 적용된 오토인코더에 음성 신호를 입력하여 학습을 진행한 결과, 다운 샘플링이 발생하지 않으며 고 대역 신호가 복원되는 것을 스펙트로그램을 통해 확인하였다.

  • PDF

고품질 AT-DMB 서비스를 위한 계층적 미디어 처리용 시뮬레이터 개발 (Development of Hierarchical Media Processing for High Quality AT-DMB Service)

  • 전도영;김민성;장승민;유홍연;홍성훈
    • 대한전기학회:학술대회논문집
    • /
    • 대한전기학회 2008년도 심포지엄 논문집 정보 및 제어부문
    • /
    • pp.86-88
    • /
    • 2008
  • 지상파 방송(DMB: Digital Multimedia Broadcasting)은 음성, 영상, 데이터와 같은 다양한 멀티미디어 신호를 디지털 방식으로 변조하여 이동 중에 방송을 청취 할 수 있는 차세대 디지털방송 서비스이다. 하지만 한정된 대역폭으로 인한 비디오 전송율의 한계에 따라 최대 CIF(Common Interleaved Frame)급 화면해상도까지 서비스가 가능하다. 그러나 지상파 DMB 전송 고도화망에서는 계층 변조(Hierarchical Modulation)전송 기법을 통하여 추가의 전송대역폭을 확보할 수 있다. 또한 스케일러블 비디오 코딩(Scalable Video Coding)부호화 방식을 이용하여 고전송효율/고품질의 이동 멀티미디어 방송서비스를 제공할 수 있는 고품질 AT(Advanced Terrestrial)-DMB 시스템이 가능하다. 이러한 고품질 AT-DMB의 개발에 있어서 여러 방식들이 제시됨에 따라 시뮬레이터를 통한 다중화 시스템의 분석이 필요하다. 본 논문에서는 고품질 AT-DMB가 가능한 스케일러블 비디오 방식을 JM8.8을 사용하여 구현하였으며, 다중화 시스템의 실험을 하였다. 또한 시뮬레이터를 통하여 확보된 계층 간의 화질 차이와 엔지니어를 위해 비트스트림의 분석화면 및 PSNR을 제공 하였다.

  • PDF

고품질 AT-DMB 서비스를 위한 계층적 미디어 처리용 시뮬레이터 개발 (Development of Hierarchical Media Processing for High Quality AT-DMB Service)

  • 전도영;김민성;장승민;유홍연;홍성훈
    • 대한전자공학회:학술대회논문집
    • /
    • 대한전자공학회 2008년도 하계종합학술대회
    • /
    • pp.177-178
    • /
    • 2008
  • 지상파 방송(DMB: Digital Multimedia Broadcasting)은 음성, 영상, 데이터와 같은 다양한 멀티미디어 신호를 디지털 방식으로 변조하여 이동 중에 방송을 청취할 수 있는 차세대 디지털방송 서비스이다. 그러나 지상파 DMB 전송 고도화망에서는 계층 변조(Hierarchical Modulation)전송 기법을 통하여 추가의 전송대역폭을 확보할 수 있다. 또한 스케일러블 비디오 코딩(Scalable Video Coding)부호화 방식을 이용하여 고전송효율/고품질의 이동 멀티미디어 방송서비스를 제공할 수 있는 고품질 AT(Advanced Terrestrial)-DMB 시스템이 가능하다. 이러한 고품질 AT-DMB의 개발에 있어서 여러 방식들이 제시됨에 따라 시뮬레이터를 통한 다중화 시스템의 분석이 필요하다. 본 논문에서는 고품질 AT-DMB가 가능한 스케일러블 비디오 방식을 JSVM8.8을 사용하여 구현하였으며, 다중화 시스템의 실험을 하였다. 또한 시뮬레이터를 통하여 복호된 계층 간의 화질 차이와 엔지니어를 위해 비트스트림의 분석화면 및 PSNR을 제공 하였다.

  • PDF

유럽 디지털 지상파 방송 시스템(DVB-T)의 전송스트림 역다중화에 관한 연구 (A Study on Transport Stream Demultiplexing of Digital Terrestrial Broadcasting Systems)

  • 송형돈;노시찬;손승일;김인기;강민구;임화섭
    • 한국정보통신학회:학술대회논문집
    • /
    • 한국해양정보통신학회 2008년도 추계종합학술대회 B
    • /
    • pp.540-543
    • /
    • 2008
  • 본 논문은 DVB-T 전송스트림의 비디오, 오디오 및 그 외의 데이터의 다중화를 고찰하고, 효율적인 역다중화에 대한 연구이다. DVB 시스템은 위성, 케이블, 지상파, 휴대용 등 모든 전송 매체에 디지털 TV 및 데이터 방송을 제공하며 전송(Transport) 시스템으로 MPEG-2 시스템을 채택하였다. MPEG-2 시스템은 여러 가지 영상과 음성, 데이터 스트림을 하나의 스트림으로 다중화하고 188byte 크기의 전송 스트림 패킷을 사용한다.

  • PDF

암묵 데이터를 활용한 인문학 인풋값과 다중 모달리티의 가중치 할당 방법에 관한 연구 (A Study on the Weight Allocation Method of Humanist Input Value and Multiplex Modality using Tacit Data)

  • 이원태;강장묵
    • 한국인터넷방송통신학회논문지
    • /
    • 제14권4호
    • /
    • pp.157-163
    • /
    • 2014
  • 이용자의 감성은 그 어느 때보다 기업, 정부 그리고 개인 간의 소통에서 중요한 변수로 인식된다. 특히 수많은 연구에서 이용자의 감성을 파악하는 방법으로 음성 톤, 속도, 얼굴 표정, 몸의 이동 방향과 속도, 제스쳐 등이 사용된다. 다중 모달리티는 단일의 모달리티보다 정확도가 높은 반면 멀티 센싱에 따른 인식률 한계와 데이터 처리 부하 그리고 센싱된 값을 추론하는 우수한 알고리즘이 요구된다. 즉 다중 모달리티는 각 모달리티의 개념, 속성이 상이하여 인간의 감성값이라는 표준화된 값으로 전환하는데 오류가 발생할 수 있다. 이 문제를 해결하기 위해 다중 모발리티 중관계망 분석, 문맥 파악, 디지털 필터 등의 기술을 이용하여 이용자에게 우선 순위를 갖는 감성 표현 모달리티를 추출할 필요가 있다. 특정 상황에 우선 순위를 갖는 모달리티와 그 주변을 에워싼 다른 모발리티를 암묵 값으로 처리하면 감성 인식에 있어 컴퓨터 자원의 소비 대비 견고한 시스템을 구성할 수 있다. 본 연구 결과, 암묵 데이터를 활용하여 다중 모발리티 중 가중치를 어떻게 부여할지에 대하여 제안하였다.

소규모 그룹에서의 음성 통신을 위한 TDMA 기반의 릴레이 프로토콜 (A TDMA-based Relay Protocol for Voice Communication on a Small Group)

  • 황상호;박창현;안병철
    • 한국인터넷방송통신학회논문지
    • /
    • 제13권1호
    • /
    • pp.259-266
    • /
    • 2013
  • 근거리 무선 통신은 전송 거리에 제약이 있어 마스터 주변의 노드만이 통신이 가능하다. 기존의 블루투스와 지그비와 같은 통신은 ad hoc을 위한 기술을 제공함에도 불구하고 실시간 대화를 위한 멀티 홉 전송에는 적절하지 못하다. 본 논문은 TDMA을 이용하여 소규모의 여러 사용자들이 서로 대화할 수 있는 릴레이 프로토콜을 제안한다. 제안한 릴레이 프로토콜은 TDMA를 이용하여 실시간으로 데이터 또는 음성의 다중 홉 재전송이 가능하다. 제안하는 프로토콜은 라우팅 경로에 따라 주파수를 달리하여 패킷을 전송하는 방법으로 이동에 따른 채널 효율의 감소를 줄여 네트워크의 성능을 높이고 있다. NS-2 시뮬레이션을 통하여 제안한 프로토콜이 실시간 음성 전달에서 전송 지연과 패킷 손실률에 있어 우수한 성능을 가지고 있음을 보인다.