對於hana這個記憶體式資料庫雖然已經發布五年左右,但是it界對於hana資料庫的了解知之間甚少,甚至很多人沒有聽過。想必大家都熟知的資料庫如mysql和oracle,hana和這兩種資料庫一樣都是資料關係型資料庫。
因為大家想必都對mysql比較熟悉,我在這裡就拿mysql為例,以mysql為代表對比著講解一下hana。
想必大家都知道現今資料庫分為兩種,關係型資料庫和非關係型資料庫。常見的關係型資料庫就是mysql、oracle等,非關係型資料庫如hbase、redis。其中hbase和傳統的關係型資料庫不同之處並不僅僅是是否為關係型資料庫,還有一點和關係型資料庫例如mysql不一樣,那就是hbase是列式儲存,而mysql是行式儲存。
的儲存情況,如圖可以看出行式儲存是以行為單位在資料庫裡面儲存,而列式儲存是以列為單位進行儲存的。當我們向資料庫一行行插資料的時候行式儲存很明顯會有優勢,而當我們一行行從資料庫裡面讀資料的時候也是行式儲存佔優勢。假如當我們並不想取出乙個完整行的時候,假如select一列那麼列式儲存就佔優勢,而且在我們作聚合運算的時候也是以列為單位的。在現在的大型企業裡面,曾經有人統計過資料庫裡面的列將近35%是用不到的,所以當我們進行資料分析的時候用行式儲存效率比之列式儲存低。
為什麼列式儲存在資料分析方面效率較高?原因之一是在進行查詢的時候不必要的列可以不查詢出來,減少了資料的傳輸;原因之二是既然是資料分析那麼必然要進行聚合操作,如max,min等,而進行聚合操作時在列上進行的,列式儲存是以列為單位儲存的,所以在進行資料分析時效率較行式儲存高。
Hbase列式儲存入門教程
目錄 hbase是一種分布式 可擴充套件 支援海量資料儲存的nosql資料庫。分布式是因為hbase底層使用hdfs儲存資料,可擴充套件也是基於hdfs的橫向擴充套件能力,作為大資料的儲存當然支援海量資料的儲存,nosql非關係型資料庫表結構和關係型資料庫 如mysql 的邏輯結構 物理結構很不一樣...
列式儲存處理
下面以gbase 8a分析型資料庫為例,描述列儲存對資料儲存與管理的作用。面對海量資料分析的 i o 瓶頸,gbase 8a 把錶資料按列的方式儲存,其優勢體現在以下幾個方面。不讀取無效資料 降低 i o 開銷,同時提高每次 i o 的效率,從而大大提高查詢效能。查詢語句只從磁碟上讀取所需要的列,其...
列式儲存簡介
關係表結構是被人們普遍接受的資料模型,通常一行資料由多個屬性組成,每個屬性是一列。但是磁碟是一維的,檔案只能順序寫,那麼先寫誰後寫誰呢?不同的寫檔案順序就對應了不同的儲存模型。傳統資料庫通常採用行式儲存,即先存一行資料,再存下一行資料。在大資料時代,乙個常見分析型場景是在資料倉儲中進行分析,如商店的...