DOI QR코드

DOI QR Code

Low-Latency Implementation of Multi-channel in AoIP/UDP-based Audio Communication

AoIP/UDP 기반 오디오 통신의 다중 채널 Low-Latency 구현

  • 양승도 ((주)바이콤, 한국공학대학교 컴퓨터공학) ;
  • 최진구 (한국공학대학교 컴퓨터공학)
  • Received : 2023.03.24
  • Accepted : 2023.06.09
  • Published : 2023.06.30

Abstract

Fire and disaster broadcasting systems are divided into analog, digital, and network-based digital public address systems, and important specifications in network-based digital public address systems are low-latency audio, high sampling rate, and multi-channel input and output. In the past, it has been widely used to the AoE method for distinguishing based on the MAC address of the data link layer. However, this method has a problem of increasing complexity and cost. This proposal is an AoIP/UDP method, which allows communication to be easily distinguished by IP address without the need for a separate redundant network, so that the network can be freely used and configured, and cost can be reduced by reducing complexity. After implementing the AoIP/UDP method, the experimental results showed that the cost was improved with the equivalent performance with 2.66ms latency.

화재 재난방송 시스템에서는 아날로그, 디지털, 네트워크 디지털 전관 방송 시스템으로 나뉘며, 네트워크 디지털 전광 방송 시스템에서 중요한 사양은 낮은 대기 시간(Low-latency), 높은 샘플링 레이트, 다채널 입출력이다. 기존에 데이터링크 층의 MAC 주소 기반으로 구별하는 AoE(Audio over Ethernet) 방법을 널리 사용하고 있다. 그러나 이 방법은 복잡성과 비용이 증가하는 문제가 있다. 이에 본 제안은 AoIP(Audio over Internet Protocol)/UDP 방식으로 별도의 중복적인 네트워크가 필요 없이 IP(Internet Protocol) 주소로 손쉽게 구별하는 통신을 할 수 있어 네트워크를 자유롭게 사용 구성하고 복잡도를 낮추어 비용을 낮출 수 있도록 제안한다. AoIP/UDP 방식으로 구현 후 실험결과 2.66ms 대기 시간 성능으로 동등한 성능으로 비용의 개선함을 보였다.

Keywords

Ⅰ. 서론

화재, 지진 및 해일 재난방송을 의무적으로 설치해야 하는 비상 방송과 안내방송에 사용되는 전관 방송 시스템에서는 아날로그, 디지털 전관 방송 시스템, 그리고 네트워크 디지털 전관 방송 시스템으로 나눌 수 있다.

네트워크 디지털 전광 방송 시스템에서 중요한 사양은 통상 10ms 미만의 낮은 대기 시간 전송 및 고품질 빠른 시인성의 48kHz 이상의 샘플링 레이트, 및 오디오 8채널 이상 입출력 다채널로 크게 볼 수 있다[1].

AoE의 MAC 주소 기반은 기존 IP 기반 네트워크 장비들과의 사용이 어려워 오디오 전용의 네트워크 장비를 사용하는 등의 문제로 국부적인 장비와 동과 동, 건물과 건물 사이에 연결 시에 오디오 전송 네트워크를 구성해 주어 복잡성이 증가하고 비용이 상승한다[1].

본 제안은 그림 1의 파란색으로 표시된 오디오 네트워크 부분을 AoIP/UDP를 적용하는 제안으로 전관 방송 시스템의 요구 사양을 만족하면서 낮은 대기 시간, 높은 샘플링 레이트, 다채널 AoIP/UDP 방식으로 별도의 중복적인 네트워크가 필요 없이 일반 장비를 통해 IP 주소로 손쉽게 구별하는 통신을 할 수 있어 네트워크를 자유롭게 사용 구성하고 복잡도를 낮추어 비용을 낮출 수 있는 결과를 얻게 된다.

Ⅱ. 관련 연구

1. 전관 방송 시스템

전관 방송은 주로 학교, 관공서, 대형 빌딩, 항만, 공항 등 내부에서 비상 방송 사용되며, 내부 안내방송에도 사용된다. 아날로그 방식은 배선 비용이 많이 들고 장거리 전송 시 음질이 저하되는 등 문제가 있지만, 디지털 방식은 음질과 전송 속도가 개선되며, 네트워크의 디지털 방식은 설치 및 유지보수 비용이 감소한다.

현재 대부분은 네트워크 디지털 방식으로 발전하고 있으며, 기술 발전과 개선으로 높은 품질의 방송 서비스와 안전한 방송 환경을 제공하고 있다[2-4].

네트워크 디지털 전관 방송 시스템은 크게 입력 오디오 소스, 제어 시스템, 오디오 증폭, 및 스피커 출력으로 구성된다. 입력 오디오 소스로서 유무선 마이크, CD 재생기, 디지털 튜너, 및 디지털 리모트 마이크로폰 스페이션 등이 있다. 제어 시스템은 입력되는 오디오 신호의 레벨과 볼륨 관리 및 가공하여 출력과 화재 신호 수신기 및 네트워크 기능을 포함하고 있으며 하이브리드 화재 데이터 수신기, 디지털 믹서, 시스템 메인 제어기, 네트워크 디지털-아날로그 변환기, 제어 컴퓨터, 구역 제어기가 있다. 오디오 증폭으로는 증폭기가 마지막으로 스피커 출력으로 통신공사영역이 있다. 지금까지의 정의를 적용하는 네트워크 디지털 전광 방송 시스템은 그림 1과 같다.

OTNBBE_2023_v23n3_59_f0001.png 이미지

그림 1. 네트워크 디지털 전관 방송 시스템

Fig. 1. Network digital public address system

2. AoE(Audio over Ethernet)

AoE는 고음질, 낮은 대기 시간 전문 오디오전송을 위한 것으로 OSI 1계층에서 3계층까지 포괄하고 있으나 주로 OSI 2계층 데이터링크 계층에서 MAC 주소 기반으로 구별하여 디지털 오디오를 배포하며 통상 10ms 미만 낮은 대기 시간으로 운영된다. 아날로그에서의 다수의 꼬여진 선들과 오디오 선들은 표준 네트워크 선들로 교체되는 장점은 있으나 AoE 시스템은 고성능 네트워크가 필요하고 일반적으로 오디오 데이터 압축을 하지 않고 사용한다. 3계층 인터넷 계층 IP 주소 기반을 사용하는 것은 AoIP로 구분된다[1].

3. AoIP

인터넷 프로토콜로 디지털 오디오의 배포를 한다. TCP, UDP 또는 RTP(Real-time Transport Protocol)를 기반으로 IP를 통해 고품질 오디오를 전송하기 위한 많은 독점 시스템이 존재한다. 단일 건물이나 음악 공연장 내에서 이더넷을 통한 오디오가 사용되어 오디오 데이터 압축과 때에 따라서 IP 캡슐화를 피할 수 있다. 잘 알려진 개방된 표준으로는 유럽 방송 연합의 ACIP(Audio Contribution over IP)가 있다[5-7].

Ⅲ. 설계 및 구현

1. 설계

전관 방송 시스템의 고음질, 낮은 대기 시간을 보장하기 위해 압축하지 않고 WAN에는 연결하지 않으며 국부 시스템과 건물과 건물, 동과 동 사이의 오디오 네트워크를 구성 사용한다.

System main controller를 UDP 송신기로 Network D/A converter를 UDP 수신기로 칭한다. 또한, 각각의 UDP 송신기와 수신기 간의 오디오 입력과 출력 채널 사이의 1:N의 관계로 입출력 채널 간의 디지털 회로 구성을 할 수 있다. 1:N의 예로 오디오 입력 채널1을 UDP 송신기에 연결과 수신기는 지정된 오디오 출력 채널 1-8까지 동시 출력할 수 있다.

소프트웨어에서 네트워크 디지털 전관 방송의 주요 성능 사양은 표1과 같다. 통상 대기 시간은 10ms미만 이고 설계는 2.66ms가 되어 만족한다. 채널은 초등학교의 경우 총 6학년 6채널 입출력이 요구되고, 재난방송 2개의 채널이 필요하여 총 입출력에 각각 8채널이 필요하다[1].

표 1. 설계 고려 주요성능 사양

OTNBBE_2023_v23n3_59_t0001.png 이미지

Table 1. Design consideration Key perforamce specifications

가능한 UDP 페이로드 크기는 이더넷 데이터통신 최대 전송 단위 MTU(Maximum Transfer Unit) 1500 bytes에서 IP 주소로 20바이트와 UDP 헤더 8바이트를 제외한 총 1472 bytes가 된다.

오디오 블록 샘플은 128 word (256 bytes)이고 수식 1와 같이 4배이므로 패킷 페이로드에서 제어 헤더 128 words를 제외하고 나머지 공간에 오디오 패킷들을 전송하여 4개 채널의 오디오를 UDP 첫 번째와 두 번째 패킷에 실어 2회 전송하여 제1 사이클로 하는 총 8채널 오디오를 동시 전송한다.

\(\begin{aligned}\text {Available Channel Per UDP packet}\\\begin{array}{l} =\frac{U D P_{\text {payload }}-\text { Control }}{\text { AudioBlockSamples }} \\ =\frac{[1472 \text { bytes }-128 \text { words }(256 \text { bytes })]}{128 \text { words }(256 \text { bytes })} \\ =\text { floor }(4.75)=4 \end{array}\end{aligned}\)       (1)

그림 2의 UDP 전송 구조는 MTU 1500 bytes에서 IPv4 주소 0-19를, 헤더는 주소 20-27까지 차지한다. 데이터 부분은 주소 28-1499까지 차지한다. 제1, 2번째 패킷 전송을 제1 사이클이라 한다. 각 패킷에서 제어와 오디오 채널이 실린다.

OTNBBE_2023_v23n3_59_f0002.png 이미지

그림 2. UDP 전송 구조

Fig. 2. UDP Transport structure

대기 시간을 제어하고 음의 시차에 의해 잡음이나 음색에 손상이 되지 않게 하고자 샘플링 레이트 48kHz 및 코덱 IC에서 오디오 디지털 신호를 전달하는 TDM(Time division multiplexing)의 시간을 한 묶음으로 한다. 오디오 재생이 실속하지 않게 대응하는 행동 방식을 설정한다. 설계되는 대기 시간은 수식 2과 같다.

\(\begin{aligned}\begin{array}{l}\text { Latency }=\frac{1}{\text { Sample Rate }(\mathrm{Fs})} \times \text { TDMcycleclocks } \\ =\frac{1}{48 \mathrm{kHz}} \times 256 \text { clocks }=2.66 \mathrm{~ms}\end{array}\end{aligned}\)       (2)

지금까지의 정의를 적용하는 UDP 송신의 주요 프로그램 순서도는 그림 3과 같다. 대기 시간 도달 2.66ms가 확인되면 오디오 처리를 한 후 오디오 기록 큐 버퍼로 복사되고 UDP 버퍼로 복사하는 과정을 거친다.

OTNBBE_2023_v23n3_59_f0003.png 이미지

그림 3. UDP 송신기의 순서도

Fig. 3. A Flowchart of UDP sender​​​​​​​

첫 번째 패킷을 보내기 위해 1-4채널의 오디오 패킷을 지정된 채널 버퍼로 복사한다. 첫 번째 순서정보를 제어 헤더 버퍼에 저장한다. 지정된 오디오 채널 버퍼에서 UDP 버퍼로 복사 및 목적 IP 주소로 전송한다.

두 번째 패킷 전송은 5-8채널의 오디오 패킷에 대하여 첫 번째 패킷 전송과 동일 과정으로 거친다. UDP 수신기로부터 제어 헤더 버퍼 영역 일부를 사용하는 피드백 데이터를 수신한다. 현재 카운트되는 시간을 변수에 저장하여 다음 대기 시간 도달 확인에 활용한다. 기타 제어 루틴을 실행한 후 다시 대기 시간 도달 여부를 확인 반복한다.

UDP 수신기의 순서도는 그림 4와 같다. 수신 확인 후 수신한다. 제어 헤더에서 UDP 순서정보를 확인 후 첫번째이면 채널1-4까지의 오디오 데이터를 버퍼에 저장 및 재생한다. 두 번째이면 채널5-8까지의 오디오 데이터를 버퍼에 저장 및 재생한다. 피드백 데이터를 UDP 송신기로 전송하여 제어에 활용한다.

OTNBBE_2023_v23n3_59_f0004.png 이미지

그림 4. UDP 수신기의 순서도

Fig. 4. A Flowchart of UDP receiver​​​​​​​

2. 구현

그림 5는 UDP 송신기 System main controller이고 그림 6은 UDP 수신기 Network D/A converter이다.

OTNBBE_2023_v23n3_59_f0005.png 이미지

그림 5. UDP 송신기(System main controller)

Fig. 5. UDP Sender(System main controller)

OTNBBE_2023_v23n3_59_f0006.png 이미지

그림 6. UDP 수신기(Network D/A converter)

Fig. 6. UDP Sender(Network D/A converter)

디지털 사운드 처리와 AoIP/UDP 네트워크를 같이 구현할 수 있는 디지털 신호 처리기능이 내장된 ARM Cortex-M7 600MHz로 주요 성능 사양에 만족하게 구현하였다. 구현된 의사 코드는 그림 7의 UDP 송신기와 그림 8의 UDP 수신기와 같다.

OTNBBE_2023_v23n3_59_f0007.png 이미지

그림 7. UDP 송신기의 의사 코드

Fig. 7. UDP Sender’s pseudo-code

OTNBBE_2023_v23n3_59_f0008.png 이미지

그림 8. UDP 수신기의 의사 코드

Fig. 8. UDP Receiver’s pseudo-code

Ⅳ. 실험 및 결과

1. 실험환경

대기 시간, QoS, 및 8채널 동시 입출력 확인을 위하여 그림 9과 같이 구성하였다. 패킷 분석을 위한 도구가 중간에 연결되고 네트워크 스위치가 연결된다.

OTNBBE_2023_v23n3_59_f0009.png 이미지

그림 9. 대기 시간, QoS 및 8채널 입출력을 위한 시험 구성

Fig. 9. Test configure for latency, QoS, and 8-channel I/O​​​​​​​

그림 10과 같이 Audio Precision사의 525 AP(Audio analyzer)를 통해 음색을 확인하는 시험으로 20Hz에서 20kHz까지의 주파수를 측정한다.

OTNBBE_2023_v23n3_59_f0010.png 이미지

그림 10. AP525 오디오 분석기

Fig. 10. AP525 Audio Analyzer​​​​​​​

2. 실험결과

동시에 다채널 8채널 오디오의 입출력을 확인하고자 UDP 송신기에 8채널 입력한 후, UDP 수신기의 8채널 출력을 스피커 통해 동시 출력됨을 확인하였다.

오디오 매트릭스의 각 입력 채널별로 출력에 대한 1:N 시험도 진행하여 좋은 결과를 얻었다.

음색 시험결과는 그림 11와 같이 그래프가 선형으로 좋은 결과를 보여준다. 그림 12과 같이 대기 시간을 측정한 후 수식 3와 같이 확인하면 설계와 근사 일치하는 0.002659초(2.659ms)가 측정된다. QoS는 4분 40초 음성전송에 대한 패킷 분석을 하여 송 수신 패킷 수와 에러 패킷 수를 확인하였으며 보낸 패킷 100%와 수신한 패킷 100% 및 에러 패킷 0%의 좋은 결과를 보여준다.

OTNBBE_2023_v23n3_59_f0011.png 이미지

그림 11. 음색 확인을 위한 Frequency 선형성

Fig. 11. Frequency linearity test result for timbre

OTNBBE_2023_v23n3_59_f0012.png 이미지

그림 12. 대기 시간

Fig. 12. Latency

UDP 시작시각 – 이전 UDP 시작시각

= 13.376676초 – 13.374017초

= 0.002659초 = 2.659ms       (3)

Ⅴ. 결론

기존 화재 재난방송의 비상 방송과 안내방송을 위한 네트워크 디지털 전관 방송 시스템에서 AoE 방법을 사용해 MAC 주소로 구분해왔으나, 이 방법은 복잡성과 비용이 증가하는 문제가 있었다. 본 제안은 낮은 대기 시간, 높은 샘플링 레이트, 다채널 입출력을 만족하면서 AoIP/UDP 방식을 사용해 IP 주소로 간단하게 구별하는 방법을 제안하고, 이 방법을 통해 복잡도를 낮추고 네트워크 구축 및 유지보수 비용을 낮추는 결과를 가져왔다. 실험결과, AoIP/UDP 방식은 2.66ms 대기 시간 성능으로 기존 방법과 동등한 성능을 보여주어 비용의 개선함을 보였다.

References

  1. Audio over Ethernet, https://en.wikipedia.org/wiki/Audio_over_Ethernet
  2. Juphil Cho, Kwan-Woong Kim, and Daeik Kim, "Development of Integrated Mixer Controller for Digital Public Address", The Journal of The Institute of Internet, Broadcasting and Communication, Vol. 17, No. 1, pp. 19-24, Feb 2017. DOI: https://doi.org/10.7236/JIIBC.2017.17.1.19.
  3. Jung-Sook Kim, Chee-Won Song, "Development of Integrated Public Address System for Intelligent Building", Journal of The Korean Institute of Intelligent Systems, Vol. 21, Issue 2, pp. 212-217, April 2011. DOI: https://doi.org/10.5391/JKIIS.2011.21.2.212.
  4. Public address system, https://en.wikipedia.org/wiki/Public_address_system
  5. Audio over IP, https://en.wikipedia.org/wiki/Audio_over_IP
  6. Chris Chafe et al., "A simplified approach to high quality music and sound over ip", Proc. COST G-6 Conference on Digital Audio Effects, Verona, Italy, Dec 2000.
  7. Tae-Joon Kim., "A Study on Open software based IP Network System Practice Platform and Practicing Scenario", Journal of the Korea Academia-Industrial cooperation Society, Vol. 21, No. 10 pp. 106-114, Oct 2020. DOI: https://doi.org/10.5762/KAIS.2020.21.10.106