大資料的學習之路,一直在到處學習零零閃閃的東西,但是從來麼有對自己學習的東西進行整理,以及後續做過的東西,一直找不到對應的東西,接下來會對自己的學習記錄下來,以及同類問題遇見的得以解決
4v特徵:
volume:資料量大,pb級別
velocity:輸入和處理速度快:流式資料
value:價值密度低
oitp:online transaction processing 聯機事務處理(insert、update、delete)
acid:所有資料可追溯
傳統關係型資料庫操作(oracle mysql pg)
oiap:online analytic processing 聯機分析處理
oitp:後台操作、前台展示、資料設計
oiap:hbase spark
大資料學習之路 1
大資料的特點 1.資料 廣 資料格式多樣化 結構化資料 非結構化資料 excel檔案 文字檔案 資料量大 最少是tb級別的,甚至可能是pb級別的 資料增長速度快等 針對以上特點,要考慮的問題 1.資料 廣,如何採集彙總?sqoop,cammel,datax等工具 2.資料採集後,如何儲存?對應出現了...
我的大資料學習之路
2020年是艱難的一年,公司效益不好,每個月到手的工資變少了,從那一刻開始有了危機意識,我的這份工作是傳統行業,在畢業選職業的時候沒有認真對待,一步錯步步錯,現在我開始是從新規劃自己的職業路線,這樣付出了時間和金錢的代價。2021年我的願望是跳到網際網路公司,做大資料相關的工作 同時自己的生活也開始...
大資料之路 資料同步
資料同步基礎 資料同步技術更通用的含義是不同系統間的資料流轉,有多種不同的應用場景。主資料庫與備份資料庫之間的資料備份,以及主系統與 子系統之間的資料更新,屬於同型別不同集群資料庫之間的資料同步。另外,還有不同地域 不同資料庫型別之間的資料傳輸交換,比如分布 式業務系統與資料倉儲系統之間的資料同步。...