啊用力?嗯?轻一点原神宵宫,尿口扩张videos,国产精品久久久久精品爆乳接种 ,荡公乱妇HD电影中文字幕


微博

QQ

ISDN的音頻編碼

2005-10-13 劉敏 中央人民廣播電臺 依馬獅網


    數字音頻需要傳送大量的數據,例如在我們經常使用的一條普通的電話線上,每秒就能傳送64000比特,如果沒有進行數據壓縮,那么我們就需要在音頻通道上以706kb/s的速度來傳送所希望達到的CD音質的音頻(16比特/44.1kHz)。但是現在遠程數據傳送所使用的電話線卻只能實現8比特/8kHz(或64kb/s)的速度,而這只是我們需要的11%。
    可以嘗試通過降低音質來減少數據量,通過測算,只有大于78dB的動態范圍的音頻才能夠滿足家庭收聽,而每一比特的采樣寬度大致能產生6dB的動態范圍,由此需要13比特的量化,即使是這樣的話,如果還是利用我們的電話線,還是超出了93%,所以這條道路是行不通的。
    音頻編碼技術最先采用的是ADPCM編碼,主要是利用少量的編碼來表示有效音頻采樣間的不同差別和比較個別值。由于其本身的特點,要適應不同比較,導致效率比較低。G.722和APT-X就是這類編碼模式,它們大約能降低1/4的原有數據量。G.722通過鎖定比特數和人聲模式的關系來提高效率。在ISDN上用于談話和新聞類的節目是足夠了,但是如果需要傳送高保真的音樂,則需要更為有用,功能強大的編碼算法,而這種算法的基礎就是心理聲學。利用心理聲學,音頻編碼能被設計得更加適合我們的聽覺,其更為細致的算法能更好的表現音質間的差別。

    知覺編碼的基本規律
    知覺編碼(心理聲學編碼),就是我們只需要傳輸能被人類聽覺系統所感知的那一部分音頻內容。
    我們最為理想的傳輸方式是,沒有任何損傷的音頻進行不添加任何噪聲的變換后再完美的被編碼,這樣就不會丟失或損壞任何的信息。但不幸的是,不連續的壓縮比導致個別信號的冗余有變化。例如像持續正玄波這一類含有大量冗余的信號,而其他一些接近寬帶的噪聲,則會偶然出現,不含任何冗余。查找冗余需要花費大量時間。用于實時通話的任何信道系統必須要有持續的輸出率,并能適應任何出現的情況,因此僅依靠減少冗余度來提高音頻的壓縮率是不可能的。
    心理聲學家幸運地找到一個清楚的結論,在人類聽覺系統中發現有一個“屏蔽”效應。可以利用這個在時域和頻域都被發現存在的屏蔽效應來減少數據的傳輸。對于音頻編碼幫助最有效的就是在頻域里面。研究表明,一個頻率確定的聲音或者窄帶噪聲會在頻域上形成以其本身為中心的一個門限電平曲線,其他所有低于這個電平曲線的信號都會被它屏蔽掉。舉個例子,如果我們聽到一個典型的搖滾樂,其頻譜固定,這個時候出現了另外一個簡單持續的樂音,其頻譜在搖滾樂頻譜的附近。這時聽覺門限隨之改變并被提高,人耳對這個持續樂音附近的信號感覺會變弱,先前可被聽見的搖滾樂音就被“屏蔽”在當前的“屏蔽區域”之內。  

ISDN的音頻編碼
圖1 頻域下的屏蔽效果

    借助屏蔽效應,研發者們用過濾器組把輸入音頻分解成多個頻帶來進行分析和處理。計算出最大的屏蔽噪聲電平和可能的比特數,使得所有的量化噪聲都位于頻譜上每一點的屏蔽門限之下。所以對于廣播傳輸來說,我們就可以丟掉這部分內容或者是用最簡化的比特數來量化。任何因初始化所產生的噪聲,如果在“屏蔽門限”之下,那么都是聽不見的。這個屏蔽區域是由頻率,幅度和所以聲音的綜合分布來決定的。
    G.722
    G.722是最早期應用最廣泛的模式,上世紀70年代開發,1984年被CCITT定義標準,而且現今還在使用。G.722是所有模式中延時最低的,但音質很差,費用低廉,使用低頻帶ADPCM技術,通過傳輸有效采樣值之間的不同來降低傳輸數據。通過我們實際使用發現,G.722在7.5kHz處有一個頻率響應,此時音質最差,所以在我們看來,這種技術只適合于不需要高保真音質的單聲道語言傳輸。
    MPEG Layer2&3
    多年以前,國際標準組織ISO/IEC頒布了ISO/MPEG的標準,用來對圖像編碼和音頻編碼確定一個全球的標準,以便它們的存貯和傳輸。早先應用最廣的音頻編碼器技術大多數都是在MPEG的基礎上發展起來。MPEG標準是開放發展的,1992年,在MPEG-1中推出了三種不同的音頻編碼模式,每一個都有不同的碼率和應用范圍,這就是著名的Layer-1.2和3。層數越高就越復雜。Layer-1沒有太大作用,Layer-2被廣泛應用于DAB、電視伴音、廣播播出系統。在歐洲,Layer-3被用于廣播編碼,并發展成為著名的網絡電子消費品MP3。而MPEG-2則開辟了新的天地,許多附加的改進功能被應用于Layer-2和Layer-3。在1997年,MPEG標準首次增加了AAC家族。MPEG-4現在也已經出臺。
    MPEG AAC高級音頻編碼
    MPEG-2 AAC是被MPEG確定的較新的音頻編碼系統,并在1997年3月成為國際標準,是一種高水準的音頻壓縮工具,能較好的處理比特率超過64kb/s或低于16kb/s的數據流。
    AAC研究者們選擇了一種模塊化設計方式,能更好的提供一種框架結構來滿足特別的應用要求。和以前的Layers相比,AAC具有了一些新功能,如“瞬間噪聲成型”,“逆適應線性預測”等。AAC支持采樣率為(8-96kHz)、比特率為(16-576kHz)的所以組合模式,支持48種聲音通道。AAC因為其模塊化設計,比以往的MPEG Layer-2&3更為強大。本身的框架結構能夠被不斷的新的東西填充,這就使得不同發展方面的內核相互融合,彼此吸收精華成為可能。
ISDN的音頻編碼
圖2 AAC編碼器的程序框圖

    與MPEG的層相比,AAC具有以下新的增加的功能:
    a. 增加的過濾器段能提供2048的頻率分析,是以前Layer-3的四倍;
    b. 瞬間噪聲成型,一種使瞬間干擾最小化的新模塊程序,特別有利于語言信號;
    c. 可預測模塊導向,用力量化如高音等特別信號的高效編碼;
    d. 知覺噪聲消除,讓量化分析更容易被控制,數據利用效率高
    因為AAC的模塊化,使用者可以選擇不同的模塊自由組合成一個新編碼來滿足需要。換句話說,新模塊可能被發展并移植到其基本結構中,使用不同的模塊產生不同的組合。
    AAC是建立在與Layer-3相似的結構之上,所以保持與之相同的以下很多優點:
    1.冗余降低  Huffman編碼將出現頻率高的值用短字符來表示,很少采用長字符,這些就能使編碼效率大大提高。沒有任何冗余,因為整個編碼過程是無損的。
    2.比特存儲緩沖  通常,如果沒有噪聲的情況,一段音樂當中的臨界部分在現有的數據率下是不能被編碼的。這類序列要求更高些的數據率來避免沖突。而另一方面,一些信號很容易被編碼,如果幀很簡單,那么不需要的比特就可以進入存儲緩沖區中,當幀變得很多,需要比特時,緩沖區又可以重新向外輸出數據。
    3.附屬數據  數據緩存對于像文本或控制信號這類附屬數據可以提高一種高效的解決辦法:把它們存在一個特別的緩存區內,根據是否被需要來控制其在輸出比特流中的多少。
    4.Joint Stereo模式利用了立體聲程序素材中的冗余度,編碼器可以根據程序素材在四種模式:L、R、L+R和L-R中來回切換。
    以上便是AAC研發者們的成功。AAC的編碼功能是Laye

視聽科技視頻號 廣告
發表評論