一. 前言
目前比較成熟的以太網音頻傳輸技術主要是CobraNet和EtherSound。前者已經開發和使用多年,用戶較多,交互性好,缺點是網絡延時長;后者解決了延時的問題,但是開發和使用普及程度稍差。本文之目的通過客觀地分析數字音頻網絡的機理,對比各 種傳輸技術,以求證哪一種傳輸網絡更適合大家。
二. 音頻網絡的內部結構
OSI參考模型是數據網絡工作的基礎,它為每一層之間的通信規定了公共的方式,以OSI模型作為基礎使音頻網絡簡單化。相對于構成OSI模型的七個層,音頻網絡可以簡單分解為兩大主要部分:控制和傳輸。配置、監控以及實時設備控制都可以歸入控制類別,并且用了幾個標準的通信協議。傳輸顧名思義,就是把數字音頻搬來搬去。
控制申請可以在應用層的標準協議中找到。音頻中的應用層協議有Telnet、HTTP以及簡單網絡管理協議(SNMP)。Telnet是網絡電傳的縮寫,是最早的英特網協議之一。它規定了機器通信的命令行格式。百威媒體矩陣,使用了這種技術,稱為RATC,作為遙控媒體矩陣中設備的一種方法。SNMP是網絡上用于監控的一個協議,在網絡運行中心(NOC)的監控中是一個關鍵技術。它是應用層協議,通過UDP/IP協議與網絡上的設備進行通信,可以溝通多重數據傳輸技術。在大多數情況下,當音頻信號傳輸時,基于TCP/IP協議的控制可以在同一網絡上運行,如CobraNet和Dante設計為允許數據通信與音頻通信共存。
組織并管理音頻比特是音頻傳輸的工作,通常是由音頻協議完成的。Aviom、CobraNet以及EtherSound等都是為在網絡上傳輸而組織比特的協議。傳輸可以分為兩種:物理傳輸和邏輯傳輸。
純粹的物理層技術,像Aviom,使用硬件來組織和移動數字比特。通常會用一塊專利芯片用來組織并控制它們。基于以太網的技術把音頻分包,然后發送到數據鏈接層和物理層,就可以在以太網設備上傳輸。以太網既是邏輯技術也是物理技術,在數據鏈接層把音頻進行分包或者“分幀”,然后發送到物理層以便于移動到網絡上的另一臺設備上去。
三. 以太網結構的數字音頻網絡
數字音頻網絡由音頻輸入模塊、以太網Switch、計算機、音頻傳輸設備組成。音頻輸入模塊把模擬信號轉換為數字信號,或者用于接收AES信號源信號,計算機運行并配置系統軟件。網絡中專門有一臺音頻傳輸設備起著傳導器的作用,讓其他所有設備同步、有序、及時地傳輸組包信息,信號流的傳輸方式可以是點到點的單播形式,也可以是點到多點的多播方式。
國際標準化組織ISO制訂的網絡互聯模型OSI中,以太網幀結構歸屬于數據層。在以太網構建的局域網中,MAC幀則是最大的一個數據包了,其它所有的同步或非同步信息都是包含在這個數據包中進行傳輸的,表1是標準以太網(即DIX格式)MAC幀的格式。
需要注意的是MAC幀只是完成了數據層(OSI第二層)協議的工作,當數據傳輸到目的地以后,MAC幀就已經被打開,而只將上圖中“數據”這個部分傳輸到上層協議中,上層協議(或處理單元)還要繼續分析這個數據包。如CobraNet數據包樣被“封裝”在MAC幀中,但由于MAC幀中標注的協議類型號是X’88-19,只限于數據鏈路層,所以這個數據包不會再向網絡層或更高層傳送而直接被送到了CobraNet的同步解碼器。在每個MAC幀的最后還有4個字節的幀校驗序列FCS(Frame Check Sequence),負責檢查整個MAC幀的數據的準確性。這個檢查是非常必要的,對于整個數據幀,1bit的錯誤信息就有99.9%的概率被檢測出來。而對于這些錯誤,更高級的協議(如TCP)甚至可以要求源服務器重發這個幀。
四. 幾種基于太網架構傳輸技術的比較
盡管以太網是決定音頻網絡效率高低和協作性能好壞的基礎,模擬音頻信號還是不能很容易地被轉換成數據并在標準的以太網絡中傳輸,這是因為音頻信號時效性極強。在音頻網絡中,數據包的延遲發送將導致音頻信號的流失和不連貫。以太網是一種異步技術,不具備實時概念,傳送管理也是“非確定性的”,這意味著以太網不能百分之百地保證某一數據包的及時送達。因此為了音頻數據實時、穩定的傳輸,網絡必須要有某種確定性的時效傳輸技術。Avoim 、EtherSound、CobraNet以及Dante技術就可以提供這樣的技術。
先用OSI模型作為框架了解這四種傳輸技術。
1.Aviom公司獨自研制的A-NetTM 數字音頻傳輸技術是建立在物理層技術,使用標準的Cat-5e線纜和RJ-45端子。一條五類線可以傳輸多通道(64*64)、無壓縮、超短延時(整個系統0.8毫秒)、遠距離(點對點設備間150米)的數字音頻,適用于音頻信號源較多(8路話筒&線路以上),信號源和控制室、監聽室、錄音室、演播室的距離較遠,追求高品質信號傳輸及個人調音監聽的場所。可以采用環型、星型以及兩者相結合的系統架構。


2.CobraNet是一個完全的以太網技術,數據鏈路層的兩個子層都得到了使用。CobraNet是美國PeakAudio公司開發的一種在以太網上傳輸專業非壓縮音頻信號的技術,它可以在100M以太網下單向可以傳輸64個48kHz、20bit的音頻信號通道(48kHz、24bit信號為56路);除音頻信號外,還可以傳輸RS485串口通信數據及其它非同步IP數據;開放的MIB文件,支持SNMP。 CobraNet必須使用星型(或連星型)網絡結構,所有的CobraNet設備都必須通過以太網交換機互相連接在一起。CobraNet傳輸協議的構建依靠3種基本數據包來完成:一是同步數據包(Beat Packet),它是由網絡中的Master設備發出的同步指令數據,作為每個同步周期的起始數據包與網絡中的全部設備保持精準同步,也就是系統中需要用戶設置一個“Master”。一個數據包大約100個字節,每秒鐘發送750次,總共占用大約1M的帶寬;二是同步音頻數據包(Isochronous Data Packet),也是CobraNet需要傳送的真正數據內容,可以單播(Unicast)也可以多播(Broadcast)出去。音頻數據包數據在整個CobraNet數據中占據了絕大多數,一個包大約包含了1280個字節的數據,加之其它報頭和報尾數據,一個Bundle(在48kHz、20bit采樣率下,每個Bundle包含8個PCM音頻數據通道)大約要消耗8M的帶寬;三是預約請求數據包(Reservation Packet),它是由除了Conductor以外的所有CM-1發出的廣播數據包,包含了發送請求數據和優先級等重要信息。每個包含100字節的數據量,總共約占用10k左右的帶寬。在此系統中無論音頻信息量多大,其占用帶寬固定,音頻的采樣頻率固定,延時也是固定的。
[Page]
3.EtherSound是并非完全的以太網技術,但它沒有在數據鏈路層的子層中使用邏輯鏈接協議。EtherSound是由法國Digigram公司開發的一種基于以太網傳輸音頻信號的技術。傳輸能力為單方向64個24bit、48kHz(或44.1kHz)采樣頻率的音頻通道。EtherSound系統可以采用菊花鏈結構或以太網星型結構或者這兩種結構的混合形式。當數據流通過以太網交換機進行傳輸時,只能是沿著一個方向(Downstream)傳遞音頻數據,也就是說無論這臺交換機上連接了多少個EtherSound設備,同時只能有一臺經過配置的設備可以向網絡中發送音頻數據,其它節點只能用來接收。這種數據包是廣播類型的。對于數據量比較小的非同步控制信號,則可以進行雙向傳輸的。EtherSound數據包中包含同步和音頻數據。EtherSound同步方式借鑒了總線式同步數據傳送方式,如火線IEEE1394接口協議,數據包發送的頻率就是同步頻率。同步發送的數據是從第一個設備中產生。這個第一就是由用戶在搭建系統的時候根據系統的配置自己設定的,并將其命名為“Primary Master”,一個完整的EtherSound系統只能有一個“Primary Master”。如果系統同步時鐘定義在44.1kHz的話,那么“Primary Master”就按照44.1kHz的速度向外發送固定長度為236字節的以太網結構數據包,之后的所有音頻必須使用相通的采樣頻率。從而總數據流量可以計算出=44100×236×8=83.3Mbit/s;同理48kHz采樣下的數據流量為90.6Mbit/s。雖然它不能傳遞串口信號以及其它IP數據,但是它的技術最大的亮點就是極低的延時。
4.Dante基于IP/以太網,被認為是OSI第四層傳輸技術。它是以IP數據結構在以太網中傳遞實時音頻信號的技術。如圖音頻信號通過專用轉換器轉換成TCP/IP網絡信號并傳送到網絡中,音頻信號以數據包的形式在網上路由到任意的輸出轉換器,并轉換成模擬信號提供給揚聲器或者記錄設備。可以兼容采樣率不同的數字設備。對于一些處理設備,如數字處理器和數字調音臺等,無需數字、模擬轉換,而是直接在網絡環境中處理數據包。在這個過程中,每個設備不需要關心自己的信號要路由到哪里去,也無需關心這些信號是從哪里來,這大大減輕了斷點設備的配置復雜性。全部的路由可以由一個專用的軟件,使用一一對應的通道名稱就可以完成這個路由過程。
Dante采用了很簡單的zoroconf(無需人為去配置網絡結構的協議,所有的配置都是自動完成的)協議,簡化了網絡的運行模式,為整個音頻系統提供了一個簡單的路由方法。利用自動配置服務器自動查找接口設備、標識標簽以及區分IP地址等工作,而無需啟動高層級別的DNS或者DHCP服務,同時也省略了復雜的手工網絡配置。


Dante系統采用了IEEE1588精密時鐘協議進行時鐘同步,網絡中的每個音頻設備都緊密跟蹤這個基準時鐘,基準時鐘采用絕對時間標識。音頻信號的采樣頻率跟隨高解析度的時間拍,并將同步信息一起打包以UDP/IP形式傳送,這些數據包跟隨絕對時間戳在網絡中傳遞,確保網絡中的任何位置的節點都可以以同一基準時間輸出相同采樣頻率的源信號。由于每個網絡音頻接口的都是將本地時鐘頻率同步到了基準絕對時間,所以它們的數據包在打包和解包的過程中產生的數據量是完全相同的,這就不會因為緩存數據過載(或太少的數據引起的緩存旁路)引起同步損失而丟失音頻數據。

音頻通道的傳輸模式可以是單播,也可以是多播,最大限度地利用已有的網絡帶寬。對于多播的數據包,采用了樹形的分發方式傳遞數據,并且只將數據傳送到那些希望接收到的接收器中,而不會到處廣播。這樣做可以大大減輕網絡的帶寬壓力。
通過以上對各傳輸技術的分析,我們可以通過表3對幾種不同網絡傳輸技術的主要參數進行對比。
五. 總結
網絡音頻看起來很混亂,但增進對OSI模型的了解能幫助我們在混亂中理出順序。它不止提供了對各種技術的理解,還為專業數據提供了交流的共同語言。使用OSI模型作為基礎保持音頻網絡的簡單化,把它分解為兩個功能部分(控制和傳輸),這將幫助我們在各自的應用中決定哪一種網絡技術是最適合的。