
從本地存儲遷移到云存儲可能使缺乏經(jīng)驗的用戶碰到其處理內(nèi)部存儲時所沒有遇到的新知識。最明顯的區(qū)別在于,云存儲用戶按耗用付費(通常是按月或按時間),并按他們發(fā)送數(shù)據(jù)到云的存儲類型付費。這兩個條件都是由與云服務(wù)提供商達成的協(xié)議設(shè)定的(圖1)。

圖1 基于特性的云存儲參數(shù)。安全取決于有效或云存儲實體提供的具體措施。公有和混合存儲成本是一種“隨用隨付”的模式,有時會發(fā)生變化——并認為要么是“非本地”要么是多樣化的(對混合而言)存儲架構(gòu)。
從定義上講,云存儲是一種將一個或多個位置的數(shù)據(jù)傳輸?shù)竭h程存儲系統(tǒng)并存儲的服務(wù)模型。云存儲組件由云存儲提供商管理。存儲提供商的解決方案的職責包括維護、備份和對用戶的可用性。可用性通常由協(xié)議規(guī)定,有時稱為合同或服務(wù)水平協(xié)議(SLA)。
存儲可用性有兩個組成部分:檢索(恢復(fù))數(shù)據(jù)的時間因素和存儲成本因素。通常,這兩者是聯(lián)系在一起的。例如,如果用戶將其數(shù)據(jù)深度存儲,并且常規(guī)(日常)應(yīng)用不依賴于這些數(shù)據(jù),那么每單位GB的成本要比持續(xù)的、容易存取的、低延遲/快速恢復(fù)的存儲應(yīng)用(如在編輯、渲染或合成時)要低得多。
虛擬化基礎(chǔ)架構(gòu)
當存儲基于基礎(chǔ)架構(gòu)(包括可訪問接口、近乎即時的彈性和可擴展性、多租戶和按量資源)時,存儲通常是基于云的和“虛擬化的”。按量資源,也稱為按使用付費,為那些提供可能無限存儲容量的資源。這種應(yīng)用通常出現(xiàn)在企業(yè)級IT環(huán)境中,它已經(jīng)從固定費用(每月費用)結(jié)構(gòu)轉(zhuǎn)變?yōu)榘词褂酶顿M的費用結(jié)構(gòu)。
按使用付費的一個常見結(jié)構(gòu)是蘋果的iTunes模式,可說是“免費體驗,然后為你想‘擁有’的東西付費”。顯然,在云存儲中,用戶不會“擁有”存儲數(shù)據(jù)的物理平臺,但用戶將根據(jù)其結(jié)構(gòu)、持續(xù)時間/可用性、其可存取性和使用存儲空間的時間長短為其使用付費。
邏輯存儲池
云服務(wù)提供商將管理和維護用戶遷移到云的數(shù)據(jù)。數(shù)據(jù)通常分布在不同的商用存儲系統(tǒng)中。數(shù)據(jù)存儲拓撲可以是在本地、第三方管理的數(shù)據(jù)中心內(nèi)、公有云或私有云內(nèi)。
在本地環(huán)境中,由于各種原因,數(shù)據(jù)可能在邏輯池中結(jié)構(gòu)化。在這樣的共享環(huán)境中,存儲池是由各種物理存儲資源聚合而成的容量。池大小可能不同,產(chǎn)生可變但聚合的性能(IOPS),并提供諸如緊密結(jié)合的管理和集群數(shù)據(jù)保護等集合性改進。邏輯池通常由管理員通過管理界面配置。云基礎(chǔ)設(shè)施通常采用這種邏輯存儲形式。
生的和熟的——湖泊和水坑
存儲池可等同于數(shù)據(jù)湖,盡管這兩個衍生品之間存在差異。數(shù)據(jù)湖是一個存儲庫,保存大量未經(jīng)處理的原始數(shù)據(jù),這些數(shù)據(jù)被稱為源數(shù)據(jù)或原子數(shù)據(jù)。數(shù)據(jù)在沒有特定組織的情況下在其中被推送的巨大位元桶是數(shù)據(jù)湖的一種形式。處理后的數(shù)據(jù)被稱為“熟”數(shù)據(jù),但這種稱謂不多見。
原始數(shù)據(jù)不一定被稱為“信息”,原因是需有一個抽象或應(yīng)用層面的使用,通過處理完成,將其價值從原始提升到信息目的。數(shù)據(jù)坑是建立在大數(shù)據(jù)技術(shù)基礎(chǔ)上的單一用途的數(shù)據(jù)集市,本質(zhì)上是來自數(shù)據(jù)湖的提取物。
按需存儲
人們都不愿意為自己不需要或不用的東西付費。在云中,存儲服務(wù)是按需提供的,可根據(jù)需要彈性增減存儲容量。選擇云存儲消除了購買、管理、折舊和維護存儲基礎(chǔ)設(shè)施的需求(圖2)。

圖2 云存儲的5個主要優(yōu)點
云模式從根本上降低了每GB存儲的成本。不過,云存儲提供商,也被稱為托管服務(wù)提供商(MSP),可能會增添與那些自有的、本地存儲不同的營運開支。增加的運營成本可能會令某些基于云的技術(shù)變得較昂貴,這要看是否考慮了存儲的使用方式和使用時間等因素。在選擇和構(gòu)建云存儲解決方案時,要尋找各種選項。
體貼周到的訪問重排
云提供商為其各種服務(wù)、實用工具和體系結(jié)構(gòu)編制了許多有用且適當?shù)拿Q。截至2021年, Azure和AWS各提供200多種不同的產(chǎn)品和服務(wù)。根據(jù)適當價格調(diào)整數(shù)據(jù)存儲器并利用云中的不同位置的概念是一個日益流行的話題。
在不給用戶增加負擔的情況下優(yōu)化存儲成本,采用自動化方法可以稱為“體貼周到”。這樣的架構(gòu)亦稱為分層存儲,它們并不新鮮,特別是對于本地設(shè)施。在非云數(shù)據(jù)中心中,在可訪問性和速度非常重要的情況下,使用高性能存儲進行編輯、合成或渲染的實踐是很常見的,這就是所謂的第1層(Tier 1)存儲。
大型SAN或光纖通道數(shù)據(jù)存儲可能是一個費錢的主張。并非所有的數(shù)據(jù)工作流程都需要這個能力,所以需求不高的數(shù)據(jù)通常被推到第2層(中層)環(huán)境中。很少被使用或留出來用于保護或冗余(長期)的存檔數(shù)據(jù)被認為是第3層(Tier 3),它可能在磁帶或?qū)ο蟠鎯ζ鳎ɑ騼烧撸┥稀S行┤诉€可能把第3層用作一次性事件,將數(shù)據(jù)推送到云上(稱為深度存檔),因為他們知道短期內(nèi)不需要快速調(diào)用。
通過智能降低成本
在云存儲歷史的早期,將數(shù)據(jù)移動到不同的數(shù)據(jù)容器是人工和通過用戶的具體指示完成的。雖然更深存儲可能有成本優(yōu)勢,但對于那些早期的云存儲用戶來說,這種人工工作并無好處。
隨著各種新服務(wù)的出現(xiàn),數(shù)據(jù)量的增加以及用戶對云提供商的接受度(即信任度)的不斷提高,情況已經(jīng)變化。
通過學習數(shù)據(jù)使用模式的元素,2017-2018年期間引入了云存儲層間無人參與的云存儲遷移。通過在云存儲之間自動遷移數(shù)據(jù),用戶和云提供商獲得了新的優(yōu)勢。通過簡單地識別數(shù)據(jù)的訪問時間,云提供商將把休眠狀態(tài)存儲器轉(zhuǎn)移到一個 “更深”的層次,無需聯(lián)系數(shù)據(jù)的用戶/所有者。
用戶通常在注冊或建立特定SLA時授權(quán)自動遷移。 操作可能通過與工作指令或行動有關(guān)的用戶界面或API。隨著時間的推移,向這一做法增加智能也在不斷發(fā)展。智能分層為云服務(wù)提供商提供了將存檔層擴展到其它層的機會,這反過來相應(yīng)地改進了成本結(jié)構(gòu)。
適應(yīng)性
當使用云存儲服務(wù)時,用戶應(yīng)該觀察自動化選項,并通過云提供的模型評估分層和自動化存儲選項的價值。對于持續(xù)數(shù)月到數(shù)年的大型項目,一系列指引可能是適當?shù)摹J褂每缍鄠€活動的共享數(shù)據(jù)集的小型項目可能會產(chǎn)生不同的答案。
在沿著任何云存儲路徑走之前,要對特定工作流的數(shù)量、頻率、容量和適用性進行試驗。不要讓 “我沒有注意到這”的借口成為更高的存儲成本的理由,這樣做提供不了更好的結(jié)果。B&P