本文將圍繞音頻信號的數(shù)字化、以太網(wǎng)的傳輸方式、數(shù)字音頻信號對以太網(wǎng)的要求、QoS服務(wù)質(zhì)量、傳統(tǒng)以太網(wǎng)傳輸實時數(shù)據(jù)流的方式、以太網(wǎng)音視頻橋接(AVB)技術(shù)等幾個方面展開說明。
在傳統(tǒng)的音響系統(tǒng)里,聲音信號是模擬信號,它的振幅具有隨時間連續(xù)變化的特性。對模擬音頻信號進(jìn)行處理、存儲和傳送都會引入噪聲和信號失真,并且隨著復(fù)制次數(shù)的增加,每次都會加入新的噪聲和失真,信號質(zhì)量會越來越差。而數(shù)字音頻技術(shù)的出現(xiàn),解決了上述模擬信號中的諸多問題。
數(shù)字音頻技術(shù)是把模擬音頻信號變換為振幅不變的脈沖信號,音頻信號的信息量全部包含在脈沖編碼調(diào)制(PulseCodeModulation,PCM)中。各種處理設(shè)備引入的噪聲和產(chǎn)生的失真與數(shù)字信息完全分離。因此,數(shù)字音頻信號具有:復(fù)制不走樣、抗干擾能力強(qiáng)、動態(tài)范圍大、可遠(yuǎn)距離傳輸、可以遠(yuǎn)程監(jiān)控等優(yōu)點。
現(xiàn)如今,數(shù)字音頻信號還可以融入到網(wǎng)絡(luò)傳輸系統(tǒng)中,在一條傳輸線路上同時實行多路音頻信號的傳輸,大大節(jié)省了傳輸運行成本,簡化了傳輸線路。
音頻信號的數(shù)字化
將模擬信號轉(zhuǎn)換成數(shù)字信號,需要對模擬信號進(jìn)行一系列的處理,如圖1所示,先對模擬信號進(jìn)行采樣,再經(jīng)過低通濾波器去除掉采樣中產(chǎn)生的高頻失真,通過量化將采樣后的數(shù)值調(diào)整為整數(shù),再經(jīng)過二進(jìn)制編碼后生成數(shù)字信號。

采樣,是每隔一定的時間間隔,抽取信號的瞬時幅度值。每一秒鐘所采樣的次數(shù)叫做采樣頻率。以CD為例,采樣頻率為44.1kHz,即1秒鐘對模擬信號進(jìn)行了44100次取值,如圖2b所示,采樣后的信號變成了多個密布的點。采樣頻率越高,抽取的點密度越高,信號也就越精準(zhǔn)。

在圖2b中采樣過后的信號除了原始頻譜之外,還會額外產(chǎn)生一些高頻的失真,形成新的頻譜。這些失真的頻譜以nfu(n為正整數(shù))為中心、左右對稱,它的頻譜分布與原信號的頻譜形狀相同。采用低通濾波器(LPF)把新增加的多余的頻譜濾掉就可以恢復(fù)原信號的頻譜。
根據(jù)奈奎斯特(Nyquist)采樣定理:采樣頻率fs大于或等于采樣信號最高頻率fu的2倍,就可以通過低通濾波器恢復(fù)無失真的原始信號。如果fs<2fu,采樣過程中產(chǎn)生的一部分高頻失真會與原始頻譜相互疊加,如圖3中會產(chǎn)生頻譜混疊失真的現(xiàn)象,這種疊加是無法用低通濾波器分開的。

因此采樣頻率fs必須大于原信號中最高頻率的2倍以上,新增加的頻譜與原信號的頻譜才不會相互疊加。例如,人耳的聽音頻率上限是20kHz,采樣頻率最低應(yīng)為40kHz。但低通濾波器有一定的截止邊沿寬度,是按一定規(guī)律逐步對信號衰減濾除的,為了較好的防止產(chǎn)生高頻失真,通常fs=(2.1~2.5)fu。CD的采樣頻率是44.1kHz,它等于20kHz的2.205倍。
采樣后的振幅值并不是整數(shù),且是隨機(jī)變化的。還需要將這些隨機(jī)變化的振幅值通過四舍五入的方法將其變換為能用二進(jìn)制數(shù)列來表達(dá)的數(shù)值,這個過程就是量化,單位是bit(比特),如圖4中采樣和量化所示。采樣值是6.4的幅值量化后取整數(shù)6,采樣值是3.6的幅值量化后取整數(shù)4。

將量化后的二進(jìn)制數(shù)組按照時間順序排列成可以順序傳送的脈沖序列,這個過程就是編碼。由于數(shù)字電路以開關(guān)的通和斷(1和0)兩種狀態(tài)為基礎(chǔ),可以大大簡化數(shù)字電路的運算,因此二進(jìn)制編碼在數(shù)字技術(shù)中獲得了廣泛的應(yīng)用。

量化級數(shù)越多,量化誤差就越小,聲音質(zhì)量就越好,如圖5所示,3bit是23個二進(jìn)制數(shù),6bit是26個二進(jìn)制數(shù)。對于音頻信號,由于動態(tài)范圍較大,而且要求的信噪比又高,所以量化的取值大一些,通常為16bit,甚至20-24bit。
以太網(wǎng)的傳輸方式
以太網(wǎng)創(chuàng)建于1980年,它是一種可以在互連設(shè)備之間相互傳送數(shù)據(jù)的技術(shù)。發(fā)展至今日,因它具有成本低、速率快、可靠性高等特點被廣泛的應(yīng)用。我們可以通過以太網(wǎng)傳送Email、圖片、聲音、視頻等等。以太網(wǎng)絡(luò)使用CSMA/CD(載波監(jiān)聽多路訪問及沖突檢測)技術(shù),是一種爭用型的介質(zhì)訪問控制協(xié)議。
它的工作原理是:發(fā)送數(shù)據(jù)前先偵聽信道是否空閑,若空閑,則立即發(fā)送數(shù)據(jù)。若信道忙碌,則等待一段時間至信道中的信息傳輸結(jié)束后再發(fā)送數(shù)據(jù);若在上一段信息發(fā)送結(jié)束后,同時有兩個或兩個以上的節(jié)點都提出發(fā)送請求,則判定為沖突。
若偵聽到?jīng)_突,則立即停止發(fā)送數(shù)據(jù),等待一段隨機(jī)時間,再重新嘗試。我們稱這種傳輸機(jī)制為“BestEffort”(盡力而為),也就是說當(dāng)數(shù)據(jù)抵達(dá)端口后,本著FlFO(先入先出)的原則轉(zhuǎn)發(fā)。不對數(shù)據(jù)進(jìn)行分類,當(dāng)數(shù)據(jù)進(jìn)入端口的速度大于端口能發(fā)送的速度時,F(xiàn)IFO按數(shù)據(jù)到達(dá)端口的先后順序讓數(shù)據(jù)進(jìn)入隊列,同時,在出口讓數(shù)據(jù)按進(jìn)隊的順序出隊,先進(jìn)的數(shù)據(jù)將先出隊,后進(jìn)的數(shù)據(jù)將后出隊。采用CSMA/CD控制方式的特點是:原理比較簡單,技術(shù)上容易實現(xiàn),網(wǎng)絡(luò)中各工作站處于平等地位,不需集中控制,不提供優(yōu)先級控制。
在以太網(wǎng)中,我們經(jīng)常會遇到“帶寬”一詞,它是指在單位時間(一般指的是1秒鐘)內(nèi)能傳輸?shù)臄?shù)據(jù)量。也就是在規(guī)定時間內(nèi)從一端流到另一端的信息量,即數(shù)據(jù)傳輸率。數(shù)字信息流的基本單位是bit(比特),時間的基本單位是s(秒),因此bit/s(比特/秒,也用bps表示)是描述帶寬的單位,1bit/s是帶寬的基本單位。不難想象,以1bit/s的速率進(jìn)行通信是非常緩慢的。幸好我們可以使用通信速率很快的設(shè)備,比如56k的調(diào)制解調(diào)器利用電話線撥號上網(wǎng),其帶寬是56000bit/s(1k=1000bit/s),電信ADSL寬帶上網(wǎng)在512kbit/s至100Mbit/s之間,而現(xiàn)如今的以太網(wǎng)則可以輕松達(dá)到100Mbit/s以上(1Mbit/s=1000*1000bit/s=1,000,000bit/s)。
以千兆網(wǎng)(1Gbit/s)為例:假如說交換機(jī)的端口帶寬是1Gbit/s,也就是1000,000,000bit/s,則說明每秒可傳輸1000,000,000個二進(jìn)制的“位”,那么1bit所占用的時間是1÷1000,000,000=1ns。也就是每個二進(jìn)制位(1bit)之間的時間間隔大于1ns時,就不會發(fā)成沖突,如圖6所示。

但在以太網(wǎng)傳輸中,并不是以二進(jìn)制位(bit)來傳輸?shù)?,而是?ldquo;幀”為單位的。如圖7所示,在一幀中至少包含了46Byte(字節(jié))的數(shù)據(jù),那么一個最小的以太網(wǎng)幀是72Byte;如果一幀中包含的最大數(shù)據(jù)是1500Byte,那么一個最大的以太網(wǎng)幀是1526Byte。

網(wǎng)絡(luò)設(shè)備和組件在接收一個幀之后,需要一段短暫的時間來恢復(fù)并為接收下一幀做準(zhǔn)備,也就是相鄰兩幀之間是有一個間隙的,IFG(InterframeGap)幀間距。IFG的最小值是12Byte,如圖8所示。

我們假設(shè)這兩幀數(shù)據(jù)在千兆網(wǎng)(1Gbit/s)內(nèi)傳輸,那么兩幀之間的時間間隔大于96ns就不會發(fā)生沖突。
隨著網(wǎng)絡(luò)帶寬的提升,千兆網(wǎng)在傳統(tǒng)以太網(wǎng)的基礎(chǔ)上對幀的數(shù)據(jù)量做出了一定的修改。采用了載波延伸(GamierExtension)的方法,將最小字節(jié)擴(kuò)展到512Byte,即凡是發(fā)送幀長不足512Byte時,就填充特殊字符(0F)補(bǔ)足。當(dāng)許多短幀需要發(fā)送時,如果每一幀都擴(kuò)展為512Byte,會造成資源的巨大浪費。因此又設(shè)定了幀突發(fā)(FrameBursting)的方法,可以解決此問題,第一個短幀使用載波延伸,一旦發(fā)送成功,則隨后的短幀連續(xù)發(fā)送直到1500Byte為止。此期間由于線路始終處于“忙”的狀態(tài),不會有其它站點搶占信道。
傳統(tǒng)以太網(wǎng)如何傳輸實時數(shù)據(jù)流(音、視頻流)?
以太網(wǎng)通過RTP(Real-timeTransportProtocol)實時傳輸協(xié)議為數(shù)據(jù)提供了具有實時特征的端對端傳送服務(wù)。RTP本身并不能保證傳送,也不能保證防止無序傳送。因此,想要對所有的數(shù)據(jù)流進(jìn)行排序,就離不開對數(shù)據(jù)的緩沖(Buffer)。但是,一旦采用緩沖的機(jī)制就又會帶來新的問題——延時。所以我們在網(wǎng)絡(luò)上聽歌、看電影的時候,都會緩沖后才開始播放。但這個緩沖時間,在專業(yè)音、視頻傳輸領(lǐng)域里是不能被接受的。
數(shù)字音頻信號對以太網(wǎng)的要求
我們以CD為例,它的采樣頻率是44.1kHz,量化位數(shù)是16bit。每次采樣的時間是1÷44.1×1000≈22.7μs。我們對聲音的要求是連續(xù)不間斷的,也就是要求每個采樣下的數(shù)據(jù)傳輸間隔不能大于22.7μs。而在千兆網(wǎng)(1Gbit/s)里,兩幀之間的最小時間間隔只有96ns,遠(yuǎn)小于我們所要求的22.7μs,那么在這個帶寬下,我們是完全可以傳輸連續(xù)不間斷的音頻信號的。
如果我們在1Mbit/s的帶寬下傳輸數(shù)據(jù),那么1bit所占用的時間是1÷1,000,000=1μs,兩幀之間的間隔是96μs,這時候如果傳輸CD數(shù)字音頻信號就會存在斷斷續(xù)續(xù)的問題了。
從上面兩個例子不難看出,只要網(wǎng)速足夠快,也就是網(wǎng)絡(luò)有足夠的帶寬,我們就可以很順利的在網(wǎng)絡(luò)上傳輸數(shù)字音頻信號。但大多數(shù)情況下,由于帶寬通常是由多個設(shè)備共享的,我們不單單只用它去傳輸一路數(shù)字音頻信號,我們會同時傳送多路數(shù)字音頻信號,還會傳輸郵件、網(wǎng)頁、圖片等等其它的數(shù)據(jù)。而所有的發(fā)送端沒有基于時間的流量控制,那么這些發(fā)送端永遠(yuǎn)是盡最大可能發(fā)送數(shù)據(jù)。這樣來自不同設(shè)備的數(shù)據(jù)流就會在時間上產(chǎn)生重疊,即我們前文所說的沖突。這一定會影響數(shù)字音頻信號的傳輸,為了改善這種傳輸機(jī)制,提高部分?jǐn)?shù)據(jù)傳輸效率,以太網(wǎng)通過QoS優(yōu)先機(jī)制進(jìn)行轉(zhuǎn)發(fā),可以保證一部分?jǐn)?shù)據(jù)的傳輸。
(未完待續(xù))