本週學習了教材中的第四章:分布式資料庫hbase
通過學習本章內容學習到hbase跟傳統關聯式資料庫有很大的區別,
(1)資料型別:關聯式資料庫都是運用了關係模型,主體-屬性的方法來找出對應關係來進行儲存,而hbase採用了很簡單的資料模型,他將資料儲存為未解釋的字串。
(2)資料操作:關聯式資料庫有很多操作,表連線等,hbase不存在這些複雜的操作,只有增刪改查。
(3)儲存模式:關聯式資料庫是通過行來進行操作,例如增加完整的一行,刪除完整的一行。而hbase是通過列來進行操作,同時儲存的時候hbase也是通過列來進行儲存的
(4)資料索引:傳統關聯式資料庫是二維表,而hbase是四維表,關聯式資料庫通過乙個2個關鍵值便能索引到資料,而hbase只有乙個索引---行鍵。
(5)資料維護:關聯式資料庫中,更新操縱新資料會覆蓋就資料,而在hbase中會保留舊資料。
(6)可伸縮性:關聯式資料庫因為是進行行操作,一旦表建好了,增加屬性就很難進行操作,而hbase是通過列操作,增加一列來進行橫向擴充套件就變得更容易。
hbase的四個維度:行鍵、列族、列名、時間戳。
三個主要功能元件:1.庫函式:提供客戶端和hbase的埠連線訪問,2.master主伺服器:負責管理和維護hbase表的分割槽資訊,3.region伺服器:負責儲存和維護分配給自己的region,處理來自客戶端的讀寫請求。
暑假周進度總結(4)
本週學習了第三章 分布式檔案系統hdfs 通過本章的學習 我知道分布式檔案系統hdfs其是由很多廉價機器組成,並且其分為名稱結點和資料結點,名稱結點儲存元資料,而資料結點儲存檔案的內容,名稱結點是主結點,資料結點是從結點。hdfs有很多的優良特性,如廉價相容的硬體裝置 機房中的廉價機器 流資料讀寫 ...
暑假周進度(二)
1 本週在乙個基本的web專案上實現了oracle對資料的增刪改查,並且將河北省科技創新平台的資料庫改為oracle,現在可以正常使用之前通過mysql實現的功能。看了幾節廈門大學林子雨的大資料網課,初步了解了大資料的基礎。學習會計的進度,本週進行的不多,兩本書各進行了兩小節的內容。2 本週遇到的問...
暑假周進度(一)
1 放假後的第一周,去體驗了一把家教的過程,雖說並不太成功,但也算從中獲得了一些經驗。家教,說簡單也簡單,只要用心認真耐心,將知識授予學生,讓學生吃透知識 家教說難也難,有些時候,一些家長對教員要求比較高,或者會出現一些家教資訊前後不一的情況,未必都是一帆風順。重新調整了一下,開始進行oracle的...