讀模式與寫模式

2021-07-23 00:15:48 字數 585 閱讀 2548

rdbms是寫模式

hive是讀模式

我們傳統的關係型資料庫rdbms是寫模式。在rdbms裡,我們對錶進行資料操作時候,rdbms會用資料庫的第一第二第三正規化去檢查資料的規範性,如果不符合規範,資料庫就拒絕資料的載入和操作。這個驗證過程消耗資源,在資料量大的時候,會影響效率。因為日常的關係型資料庫處理的資料不是很多,效率慢點沒關係。

大資料在對資料的載入的時候不進行校驗,如果校驗將降低效率,導致訊息阻塞,影響資料庫的讀取效率。

關係型資料庫rdbms主要處理的是結構化的資料,對資料來源本身就有很好的規範,載入結構化有規範的資料時候,可以進行校驗。而hadoop等的大資料平台儲存的資料來源有些是結構化的,有些不是結構化的,無規律的,沒聯絡的資料。無法進行校驗,檢測。如果檢測,將導致大量不符合第一第二第三正規化的資料不能儲存。

所以,hive這種讀的模式,載入資料很快,減少延遲。而在資料具體使用的時候,再去處理,極高地提高了效率。如果補資料不符合建表規範,比如:表字段是int型別,而匯入的是string型別,則hive會儲存為null。

hive不支援對行的操作,只支援對資料的覆蓋和追加操作。

讀《領域驅動設計與模式實戰》

有關領域驅動方面的書籍不多,jimmy的 領域驅動設計與模式實戰 便是其中的一本。讀本書前,最好有讀過eric的 領域驅動設計 ddd 與martin fowler的 企業應用架構模式 poeaaa 否則很難看懂。這是一本注重實踐與應用的書籍,作者將多年從事軟體開發的經驗融入書中,結合tdd向讀者展...

初讀設計模式

初讀設計模式,給我的感覺就是 深奧 天馬行空 自己基礎不紮實。於是上網找了找方法 參考 該如何去讀設計模式 設計模式 最熟悉的陌生人。很多人應該都有這種感受,早就知道設計模式,也能隨口說出幾種,但是不知道每種是怎麼回事。或者說只知道工廠模式等幾個常用,簡單的。估計那也是靠記憶,而不是真正的理解。我也...

讀大話設計模式有感 策略模式

策略模式是一種定義一系列演算法的方法,所有演算法完成的都是相同的工作,只是實現不同,所以可以以相同的方式呼叫所有的演算法,減少各種演算法類與使用演算法類之間的耦合。演算法公共介面類 public inte ce computestrategy實現類1 public class addstrategy...