Hive部分 行式儲存和列式儲存的比較

2021-08-21 11:50:08 字數 731 閱讀 4621

行式儲存和列式儲存的比較:

列式儲存(columnar or column-based)是相對於傳統關係型資料庫的行式儲存(row-basedstorage)來說的。簡單來說兩者的區別就是如何組織表:

ø  row-based storage stores atable in a sequence of rows.

ø  column-based storage storesa table in a sequence of columns.

行式儲存下一張表的資料都是放在一起的,但列式儲存下都被分開儲存了。所以它們就有了如下這些優缺點:

行式儲存:

優點:資料被儲存在一起了,insert和update更加容易

缺點:選擇(selection)時即時只涉及某幾列,所有資料也都會被讀取

列式儲存:

優點:查詢時只有涉及到的列會被讀取;投影(projection)很高效;任何列都能作為索引

缺點:選擇完成時,被選擇的列要重新組裝,insert/update會比較麻煩

列式儲存和行式儲存

行式儲存資料庫和列式儲存資料庫,隨著業務深入,技能增長,經常會碰到,今天來理解一下。列式儲存 clolumn based 和行式儲存 row based 都是相對於對方的,他們的區別是在磁碟的儲存方式不同,所以在讀寫資料時,方式不同,以至於他們的適用場景也都不同。列式儲存資料庫主要包括 hbase,...

列式儲存和行式儲存的區別

列式儲存 columnar or column based 是相對於傳統關係型資料庫的行式儲存 row basedstorage 來說的。簡單來說兩者的區別就是如何組織表 翻譯不好,直接抄原文了 row based storage stores atable in a sequence of row...

行式儲存與列式儲存

行式儲存與列式儲存 行式儲存 資料儲存以行為單位,儲存完一行就會跳到第二行 row based store。維護大量的索引,儲存成本比較高,不能做到線性擴充套件,對於隨機讀的效率高。最大的特點就是對事務的處理能力支援的非常好。行式儲存最大的優點是關係之間的解決方案,行式儲存實現了關係型資料庫,如果表...