列儲存與行儲存的區別

2021-08-16 22:51:51 字數 838 閱讀 1425

寫入:行儲存的寫入是一次完成,資料的完整性因此可以確定。

列儲存需要把一行記錄拆分成單列儲存,寫入次數明顯比行儲存多。

行儲存在寫入上占有很大的優勢

資料修改:

行儲存是在指定位置寫入一次,列儲存是將磁碟定位到多個列上分別寫入。

行儲存在資料修改也是佔優的

資料讀取:

行儲存通常將一行資料完全讀出,如果只需要其中幾列資料,就會存在冗餘列

列儲存每次讀取的資料是集合中的一段或者全部。

由於列儲存的資料是同質的,這種情況使資料解析變得容易。行儲存則複雜的多,因為在一行記錄中儲存了多種型別的資料,資料解析需要在多種資料型別之間頻繁轉換,這個操作很消耗cpu

所以列儲存的解析過程中更有利於分析大資料

顯而易見,兩種儲存格式都有各自的優缺點:行儲存的寫入是一次性完成,消耗的時間比列儲存少,並且能夠保證資料的完整性,缺點是資料讀取過程中會產生冗餘資料,如果只有少量資料,此影響可以忽略;數量大可能會影響到資料的處理效率。列儲存在寫入效率、保證資料完整性上都不如行儲存,它的優勢是在讀取過程,不會產生冗餘資料,這對資料完整性要求不高的大資料處理領域,比如網際網路,猶為重要。

什麼時候應該使用行式儲存?什麼時候應該使用列式儲存呢?

如果你大部分時間都是關注整張表的內容,而不是單獨某幾列,並且所關注的內容是不需要通過任何聚集運算的,那麼推薦使用行式儲存。原因是重構每一行資料(即解壓縮過程)對於hana來說,是乙個不小的負擔。

列式儲存的話,比如你比較關注的都是某幾列的內容,或者有頻繁聚集需要的,通過聚集之後進行資料分析的表。

列儲存與行儲存

上個月參加了乙個 雲儲存的技術討論會。這乙個月裡,陸續收到幾位同學討論 大資料儲存和處理的郵件。今天是週末,索性把這個月的交流內容整理寫下來,供各位參考。目前大資料儲存有兩種方案可供選擇 行儲存和列儲存。業界對兩種儲存方案有很多爭持,集中焦點是 誰能夠更有效地處理海量資料,且兼顧安全 可靠 完整性。...

行儲存與列儲存

列式儲存 columnar or column based 是相對於傳統關係型資料庫的行式儲存 row basedstorage 來說的。簡單來說兩者的區別就是如何組織表 翻譯不好,直接抄原文了 row based storage stores atable in a sequence of row...

行儲存和列儲存的區別

列儲存不同於傳統的關係型資料庫,其資料在表中是按行儲存的,列方式所帶來的重要好處之一就是,由於查詢中的選擇規則是通過列來定義的,因此整個資料庫是自動索引化的。按列儲存每個欄位的資料聚集儲存,在查詢只需要少數幾個欄位的時候,能大大減少讀取的資料量,乙個欄位的資料聚集儲存,那就更容易為這種聚集儲存設計更...