行式儲存
同一行的資料儲存在一起
優點適用於需要獲取一整行的情況
缺點不適用於只需要獲取少量幾行的情況,因為這種情況下會將涉及的行的資料全部讀取出來
將同一列的資料連續儲存優點
缺點不適用於讀取整行的情況,因為需要讀取多列
介於行式和列式之間,當每個列都是乙個列族時,此時就是列式儲存;當只有乙個列族時,此時就是行式儲存
每個region中包含多個store,每個store用來儲存乙個列族中的資料
每個store中有乙個memstore和多個hfile,首先將資料寫入到memstore,超過閾值刷寫到磁碟生成乙個hfile,hfile滿足一定條件會進行合併(一般框架設計涉及到寫磁碟都會優先寫入到記憶體中)
HBase基本概念
1.簡介 hbase是乙個分布式的 面向列的開源資料庫,源於google的一篇 bigtable 乙個結構化資料的分布式儲存系統 hbase是google bigtable的開源實現,它利用hadoop hdfs作為其檔案儲存系統,利用hadoop mapreduce來處理hbase中的海量資料,利...
TensorFlow學習筆記(一) 基本概念
tensorflow學習筆記 一 基本概念 tensorflow用張量這種資料結構來表示所有的資料。用一階張量來表示向量,如 v 1.2,2.3,3.5 如二階張量表示矩陣,如 m 1,2,3 4,5,6 7,8,9 可以看成是方括號巢狀的層數。1 編輯器 編寫tensorflow 實際上就是編寫p...
HBase內的基本概念
在搭建集群的時候,我們需要去了解hbase各個部分是做什麼的,否則一上來就找文章進行搭建,完全就是按著人家的做,而根本不知道自己在做什麼 hbase的部署結構主要分為master伺服器和regionserver伺服器,master也可以配置ha,即乙個活動節點,乙個備用節點,當活動節點掛掉,備用節點...