隨著資料量的爆發式增長,數位化轉型成為整個it行業的熱點,資料也開始需要更深度的價值挖掘,因此需要確保資料中保留的原始資訊不丟失,從而應對未來不斷變化的需求。當前以oracle為代表的資料庫中介軟體已經逐漸無法適應這樣的需求,於是業界也不斷的產生新的計算引擎,以便應對資料時代的到來。在此背景下,資料湖的概念被越來越多的人提起,希望能有一套系統在保留資料的原始資訊情況下,又能快速對接多種不同的計算平台,從而在資料時代佔據先機。
資料湖(data lake)以集中式儲存各種型別資料,包括:結構化、半結構化、非結構化資料。資料湖無需事先定義schema,資料可以按照原始形態直接儲存,覆蓋多種型別的資料輸入源。資料湖無縫對接多種計算分析平台,對hadoop生態支援良好,儲存在資料湖中的資料可以直接對其進行資料分析、處理、查詢,通過對資料深入挖掘與分析,洞察資料中蘊含的價值。
阿里雲物件儲存oss(object storage service)是阿里雲提供的海量、安全、低成本、高可靠的雲儲存服務。其資料設計永續性不低於99.9999999999%(12個9),服務可用性(或業務連續性)不低於99.995%。oss具有與平台無關的restful api介面,您可以在任何應用、任何時間、任何地點儲存和訪問任意型別的資料。
oss在作為資料湖儲存,充分滿足資料湖的關鍵特性:
海量資料儲存:
高效資料計算:
安全資料管理:綜合以上內容,在未來面向海量資料的資料湖場景下,物件儲存oss非常適合企業構建海量、高效、安全的資料湖。
更多資料湖相關資訊交流**入阿里巴巴資料湖技術釘釘群(儲存後用釘釘掃碼)
實現軟體的可用性
繼續趕超世界先進水平 常用的可用性戰術總結,通常用於以下幾個方面 1 錯誤檢測 3個戰術 命令 響應。在錯誤發生前阻止,先由本地元件進行低階判斷,再通過遠端高階判斷 心跳。定時傳送資訊或資料給檢測元件 異常。這個就不用再說了 2 錯誤恢復 4個戰術 表決。輸出評判資料,交給表決元件表決,採用 多數規...
Dubbo的高可用性
現象 zookeeper註冊中心宕機,還可以消費dubbo暴露的服務。原因 健壯性 l 監控中心宕掉不影響使用,只是丟失部分取樣資料 l 資料庫宕掉後,註冊中心仍能通過快取提供服務列表查詢,但不能註冊新服務 l 註冊中心對等集群,任意一台宕掉後,將自動切換到另一台 l註冊中心全部宕掉後,服務提供者和...
MongoDB集群的可用性測試
測試mongodb的可用性 連線正在執行的mongodb集群,檢視各分片。向test集合插入10條記錄並查詢。測試primary 成員down 機時secondary 成員是否會自動競爭為 primary 複製集shard1的 down 機前狀態 關閉server2 機器上的 mongodb 程序。...