你看啊,數據就像水一樣,可以奔流不息,也可以寧靜安閑,可以熱情活躍,也可以冷若冰霜,可以飄於雲端,也可以降下“暴雨”(如果沒做好防範,就會出現災 難)。水常常自發尋求相應的地勢空間注入,數據也會在硬盤上尋求填充空間。水會順流而下,沿途支流不斷匯集壯大,最後百川歸海。同樣地,數據流也會源源不 斷注入數據池(或叫存儲池)、數據湖,於是有了信息海洋。對了,數據和水都可以存放在桶或容器裏方便攜帶,隻是此“桶”非彼“桶”,此“容器”非彼“容 器”。
動態時 熱情奔放
靜態時 冷寂寧靜
學過地理的都知道,自然界裏的水在順流而下時,上遊淤積物也跟著衝刷下來,為保證水質,就得人為進行過濾。這就好比數據在源源不斷存入的同時,為保證高可用以及業務連續性,就得考慮做備份保護,以應對來自物理層麵或邏輯層麵的各種安全威脅。
當然,隻保證水質是遠遠不夠的。對於水資源的管理、開發和利用還可以做得更多。羞羞答答在线网站可以建造高低不一的設施來控製水流,比如水壩,可以關閘蓄水防洪,也可以 開閘放水發電。同樣地,羞羞答答在线网站可以采用不同的管理軟件來管理數據。要實現數據中心裏的“水資源”的貯存和管理,羞羞答答在线网站得采用很多不同的技術。數據中心包括服務 器、存儲、網絡以及各種管理組件,針對不同層次的“水資源”,得相應采取不同技術來應對。
水壩<.……>數據中心
要實現數據的有效管理,如果隻是一味阻止更多數據的產生和存儲是行不通的。還是先看看更高效的科學用水方法吧:循環利用、優化用水習慣、節約現有水資源同時 尋找新水源。由此可見,要實現數據存儲性能優化,比起阻止更多數據的產生和存儲,更應該積極尋找新方法減少諸如“數據腳印”(data footprint)的影響。
支幾招實現 DFR(data footprint reduction,減少數據腳印)的思路:
1存檔:包括活躍數據和非活躍數據
2備份及數據保護:例如重新考量數據是否保留、數據使用頻率、全部備份還是部分備份
3清理、壓縮和碎片整理
4重複數據刪除及某些數據管理(清理、刪除)
5存儲分層,精簡配置,節約空間快照
6RAID,複製及糾刪碼等技術配置的再訪問
如今企業用戶越來越注意到“水”裏暗藏的“能量”或“礦物質”的價值,當海量數據不斷被收集、存儲、分析,他們對不同的“海水”裏到底會挖掘出什麽滿心期待。
我想關於水和數據之間的關聯一定還有很多。既然對水資源的管理、保護、存儲和利用從古到今就是人類文明的大課題,自然也積累了很多寶貴經驗,如能從中借鑒啟發,打開新時代數據存儲的新思路,未嚐不是一種新視角。