進入大資料學習當中,相關的專業詞彙很多,尤其是涉及到技術概念,對於概念詞彙的理解,對於後續的技術學習和掌握,也是有好處的。今天我們來著重講解大資料當中的兩個重要概念,分布式計算以及伺服器集群。
大資料技術當中,分布式是非常核心的概念,從儲存到計算到分析,大資料處理的整個流程當中,分布式不可或缺。
對於如何實現大資料處理,有集中式和分布式兩種思路。
所謂集中式,就是通過不斷增加處理器的數量,來增加單個計算機的處理能力,從而實現處理大批量資料。但是集中式,需要昂貴的大型機,光是成本費用就不是一般的公司能夠承受得住的。
而分布式,則是通過把一組計算機串聯起來形成系統,然後將需要處理的大批量資料分散到各個機器上去執行,最後將分別計算的結構進行合併,得出最終結果。
在分布式系統內,單個計算機的能力不算強,但是每台機器負責一部分計算任務,多台機器同時平行計算,這樣處理資料的速度得到大大提公升。隨著需求的提公升,只需要在集群系統當中增加機器,就能實現更大規模的資料處理。
分布式計算,使得大資料處理的成本大大降低,所以才能支援大資料在更多企業更多場景下的應用落地。
伺服器集群,由互相連線在一起的伺服器群組成的乙個並行式或分布式系統。
由於伺服器集群中的伺服器執行同乙個計算任務,因此,從外部看,這群伺服器表現為一台虛擬的伺服器,對外提供統一的服務。
儘管單台伺服器的運算能力有限,但是將成百上千的伺服器組成伺服器集群後,整個系統就具備了強大的運算能力,可以支援大資料分析的運算負荷。
hadoop大資料集群,就是對分布式計算和伺服器集群的一次成功的實踐,而學習大資料,hadoop一直都是必學的一塊重點。
關於大資料技術基本概念,分布式計算與伺服器集群,以上就為大家做了乙個簡單的介紹了。大資料快速發展,大資料技術也在不斷迭代更新,但是分布式計算和伺服器集群,仍然是必須掌握的重點技術概念。
大資料概念解析 分布式儲存與資料庫
大資料技術當中,在海量資料的儲存環節,涉及到兩個重要的概念,就是分布式資料儲存與資料庫,穩定高效安全的資料儲存,才能為後續的計算分析環節,提供穩固的支援。今天的大資料概念解析,我們來講講分布式儲存與資料庫。進入大資料時代,資料特徵發生了明顯的變化,資料規模大 非結構化 半結構化的資料多,使得大資料儲...
分布式實踐之概念解析
1.分布式和集群 分布式 乙個業務分拆多個子業務,部署在不同的伺服器上 集群 同乙個業務,部署在多個伺服器上 小飯店原來只有乙個廚師,切菜洗菜備料炒菜全乾。後來客人多了,廚房乙個廚師忙不過來,又請了個廚師,兩個廚師都能炒一樣的菜,這兩個廚師的關係是集群。為了讓廚師專心炒菜,把菜做到極致,又請了個配菜...
分布式計算 雲計算與大資料 第五章
tcp ip協議是internet最基本的協議,其中應用層的主要協議有telnet ftp smtp等,是用來接收來自傳輸層的資料或者按不同應用要求與方式將資料傳輸至傳輸層 傳輸層的主要協議有udp tcp,是使用者使用平台和計算機資訊網內部資料結合的通道,可以實現資料傳輸與資料共享 網路層的主要協...