自從谷歌的阿爾法狗“人工智能(下文稱AI)”機器人程序在2016年擊敗了世界頂級圍棋大師李世石以來,人們開始更加重視人工智能的發展。近年來人們的話題逐漸變成了談論一個令人驚訝的事實,那就是一大批工作崗位即將很快被全新的AI機器人大師們所替代。幾乎沒有任何職業是安全的:從較為大眾化的電話接線員、推銷員、餐廳和商場服務人員到專業性較強的外科醫生、律師、專業技術工種等等,甚至是廣播影視節目制作人和音樂制作人們也要為此而開始擔憂自己的前途了,因為聰明的AI算法很有可能很快就會使他們在工作中的角色變得多余。人們往往認為,偏藝術和情緒類的工作是最需要體現人性化的地方,也是最不容易被AI所取代的,然而從當今聲音制作行業的種種發展跡象來看,AI已經在逐步影響整個廣播節目制作的每個過程,從節目創作、演出到錄音、混音和母帶制作各個環節。也許我們會覺得在節目制作中加入自己的創意性成分是我們人類獨有的技能,但無論你有什么特殊的技能,一個設計完善的AI程序所具有的深度學習功能將很快把你的特點給模仿下來。
AI在生活中幾乎無處不在。在西方國家,自動駕駛汽車和虛擬助手已經開始徹底改變人們的日常生活。在專業領域,廣播節目的音頻制作也逐漸成為了AI研究的沃土。AI到底是什么?在傳統的數字音頻工作站或數字信號處理插件中,都包含著由程序員們創建的一套指令系統。這些指令解釋了我們人類在與軟件交互時所提供的數據和用戶反饋信息,并由軟件來計算出結果。例如,當我們使用一個壓縮器插件來處理一條人聲軌時,插件會以一種可預測的方式來響應我們的參數設定和聲音素材的動態起伏。這對我們的工作可能非常有用,但其產生的效果完全取決于我們如何設置壓縮器的參數。因此不同的人聲素材可能就需要不同的壓縮比,或需要完全不同的另一套處理手法。這就表明傳統音頻軟件完全無法幫助我們來做出這些處理決定,而需要我們利用自己過去的經驗和學習到的技巧來判斷新的錄音素材該如何去處理。如果換成基于AI設計的壓縮器,情況會有所不同。AI壓縮器算法可以分析特定歌手的表現,將其與其他歌手的演唱大數據庫進行比較并生成適當的壓縮設置,以此給制作人提供良好的建議——AI軟件可以模仿這些人類的認知技能。這樣基于AI的壓縮器不僅可以為用戶提供如何設置壓縮參數的建議,而且可以自行決定最佳的設置。通過對大量現有人聲錄音數據的采集和分析,AI軟件將自己建立一個人們心目中“良好的人聲壓縮”這樣的數學模型,并通過將這些學習模型與新的人聲軌進行比較和適當應用。這樣一來AI壓縮器就是基于自己的學習經驗來進行判斷,而不是我們給它的經驗。在前人的人聲制作成品中去學習經驗模型并自動調整出自己的閾值、壓縮比、啟動釋放時間等一系列設置,而無需我們用戶告知自己過去的經驗或決策,這樣的行為特點就是典型的AI機器學習。這些概念同樣適用于許多其它節目制作場景,并且已經在深刻改變我們制作音頻節目的種種方式,同時AI技術已經悄悄的在編曲創作和母帶制作等領域也產生著重大影響。
在節目的編曲和創作上,AI引擎會聆聽用戶的聲音,就算用戶沒有具備基礎的樂理知識或是作曲編曲知識也不用擔心,AI會將他們隨口哼唱的旋律變成他們最喜愛的歌曲風格,只需幾秒鐘就可以,甚至可以在手機上就能完成這樣的創作并即時播放出來。因為AI強大的學習功能會隨時記錄用戶所哼唱的旋律和選擇的節奏類型,并應用相應的AI算法來編排器樂并演奏出來,同時制作出一系列樂器軌道。用戶只需要輕松哼出自己的曲調,并在交互界面中選擇自己需要的風格類型就可以。這給節目的編曲和創作工作帶來了極大的方便和豐富的靈感!同時,不僅是普通用戶,許許多多的知名藝術家也在與AI引擎的開發企業進行密切合作,不斷添加新的音樂風格類型,并且AI的學習算法也在不斷的發展壯大。將來甚至可以做到在沒有任何音樂培訓、錄音室設備投入和聘用音樂制作人成本的情況下,將節目專業而高效的制作出來。
在節目的母帶處理環節,AI引擎的工作也是可圈可點。目前已經有好幾家國外公司開始提供在線的自動化AI母帶制作服務。基于AI技術的母帶處理引擎可以很好的“聆聽”未經處理的歌曲,準確識別該風格類型并應用合適的母帶均衡器、多段壓縮器和其他必要的處理手段,所有這些工作過程都無需人工干預。同時這種處理也是自適應的,通過在整個音軌中不斷的調整均衡、壓縮和其它處理工具來適應歌曲的風格和用戶的需求。AI引擎每次遇到新的音樂風格時,由于它的自主學習算法,它都會學到新的“知識”并且讓自己變得更好。AI技術正在以非常專業的水平掌握著各種各樣的聲音制作技巧,并且可以做到即便是專業人士也很難分辨一首歌是由真人工程師還是由AI來進行母帶處理的——可見AI引擎在過去的幾年里已經迅速達到了相當高的復雜程度。而越來越多專業和非專業用戶的參與也會讓AI變得越來越強大,不久的將來很可能會超過專業音樂工作室和錄音棚的效率,真正開始滿足大眾化藝術制作的需求了。同時AI設計和制造公司們為AI參與的音頻制作建立的強大而開放的網絡環境,也讓所有節目內容制作者能夠低門檻、高效率、高質量的制作音樂節目。隨著AI的發展,這樣的制作環境和概念也許即將變成一種主流,任何需要復雜處理的事情都可以交給AI來完成,而無需人類音頻工程師的參與。

圖1 運用于節目編曲與創作中的一些AI技術:人工智能與神經網絡(MIR)、音樂信息大數據檢索、音樂研究與音樂創作、聲音設計和音樂制作、數字音頻信號處理(DSP)、可移動音頻技術研發。

圖2 AI引擎的自主學習功能正在對聲音素材的振幅、頻率、瞬態響應、響度等等各方面特性進行自動分析。

圖3 基于AI技術的智能母帶處理引擎,用戶界面非常簡單易用。只需要從“溫暖、平衡、開放”三種風格里選擇目標的聲音風格傾向,以及“低、中、高”三種主觀響度中選擇所需的響度大小,引擎就能自動處理出用戶需要的聲音結果,并在左邊提供處理前/后的片段循環對比試聽。
因此,AI已經能通過自主學習,自動掌握優化原始音頻的一系列技術手段。基于這種強大的機能,相關的科技公司正在開發基于云端的AI生態系統。讓所有注冊用戶在其中可以隨意調用AI服務來幫助自己完成任何節目制作任務,包括樂曲的創作和演奏、聲音的產生與合成、音樂的混音和母帶制作等等一系列工作。未來的節目制作人角色,實際會變成利用多種AI算法來執行特定的節目制作任務這樣一種形態。這些AI算法將逐步學習、適應和理解制作人的各種聲音需求,從而做出能給人內心帶來共鳴的最佳選擇。而那些經驗特別豐富的節目制作人還可以通過優化和訓練AI算法,來達成特定的制作技巧。例如:如何針對特定風格的打擊樂或者弦樂來使用均衡器。這也將成為這個AI生態系統的一個重要組成部分。同時,其他用戶也可以對此均衡算法的質量進行打分評級,進一步加深優化整個系統的運行。此外,用戶們還可以通過上傳具有自己風格特征的節目素材庫來構建和充實整個AI算法,并以此訓練AI的學習模型,評估所得新算法的質量以確保高質高效的運轉。這樣對于那些重復度極高的手工制作任務,也無需制作人投入數十甚至上百小時才能完成,全部交給訓練好的AI引擎去自動處理就可以了!人們可以將更多的時間留給創意性思維。


圖4 AI的自動學習功能正在分析聲音素材所需的均衡處理方案,并給出一系列優化好的處理參數建議和結果。
如果將來AI能發展到幾秒鐘內制作出一張唱片或者一部廣播節目,這是否意味著音樂家和節目制作人們將失去工作呢?同時人類的創造性思維會不會因為AI的幫助而變得越來越懶惰和不再具有任何作用呢?現在還不得而知。實際上AI作為一個很好的輔助工具,或是可以稱為提高制作人創造力的一種工具,最大的問題在于它所做的一切都是學習和復制前人創造出的內容,但聲音制作的特殊之處恰恰在于它的創新性和獨創性——人類的創造性思維是會不斷推陳出新的。但在這個過程中,人類的思維往往會被一些生理和心理因素所局限,這個時候AI就是我們的好伙伴、好幫手了。創造AI這個工具的目標,并不一定是要替代任何人所做的事情,更有可能是為了構建一種良好而高效的工具供人們使用。
并且將這種世界性的、大眾化的創作理念盡可能延伸到我們生活的方方面面,創造一種全新的藝術氛圍和環境。幾百年前如果人們需要創作音樂,就需要先花費大量時間精力去學習音樂理論并使用紙和筆來將自己的音樂寫下來,同時費盡心思尋找演奏家或是贊助商來將你的作品表達給世人欣賞。而現在這個門檻降低了許多,人們只需掌握很少的技術或是專業知識,有智能手機、智能制作軟件,甚至是AI的協助,簡單的表達出自己的創造性思維,就能自動生成所需的音樂。但這樣的大眾參與并不會影響專業音樂制作人的工作。這就好比當年電子合成器剛被發明出來時,每個人都在擔心現場演奏的音樂家們要失業了,但事到如今傳統的管弦樂隊依然存在和發展著。
因此,隨著科學技術的進步,我們表達自己所需的技術條件的確在大幅下降,從筆和紙到磁帶再到數字化再到移動化創作,所有的制作都在變得越來越輕松,同時也有越來越多的人參與到這樣的創作中來,人們的想法也越來越容易變為現實。那么可以預見的是,AI肯定會在未來的制作過程中發揮極大的作用,它將會給人們的創意思維和創造性帶來爆發式的增長,同時,音樂家和聲音節目制作人們也會因此擁有更多時間進行創作并以全新的方式來創造出自己的作品,而將那些繁瑣重復的基礎任務全部留給AI去完成。基于云端的節目制作也很可能變成人們在線互動娛樂的一個重要組成部分,廣大消費者們也可以通過基于AI的生態系統來創造和分享自己全新的音樂,世界即將迎來一個全新的“AI時代”。