it公司大資料情況

2021-08-20 20:12:50 字數 963 閱讀 8708

公司

計算模型

資料中心

備註亞馬遜

spark,hadoop

aws服務在全世界有 11個區域雲,每個區域有多組資料中心,每組有至少乙個資料中心,每個資料中心有5萬到8萬台伺服器,它在全世界有 28 組資料中心,估計超過 150 萬台伺服器。(2014資料)

facebook

hadoop

已經配備18萬台伺服器。hadoop與hive集群由3000臺8核、32g記憶體、12tb空間的伺服器組成,總計達到2.4萬核、96tb記憶體、36pb空間。(2012資料)

hadoop

伺服器的規模達到數十萬臺;資料規模已達到eb級別,資料總量接近兩個eb,日誌更新量每天超過1pb;最大單集群離線計算規模超萬台,達到10萬核的計算能力。(2015資料)

google

hadoop,dataflow

全球伺服器估計2000萬台。google現在通過在巨大的伺服器群集上執行平均100,000個mapreduce任務,來每天處理超過20pb的資料。google乙個標準的機器群集節點(node)是由2個2ghz intel至強處理器(超執行緒),4gb記憶體,2個160gb ide硬碟和1個千兆網路連線組成。(2013資料)

阿里spark,yarn

飛天5k單點集群擁有超過10萬核計算的能力、100pb儲存空間,可處理15萬併發任務數,承載億級別檔案數目。(2013資料)

yarn

單集群最大規模達到6000臺、cpu(14萬核)、記憶體(380 tb)、磁碟( 7.2萬塊)、儲存容量(100 pb)(2014資料)

yahoo

hadoop

在雅虎雲物件儲存上,每乙個節點(被稱作乙個物件儲存裝置),有60tb的儲存,這都是基於x86的伺服器。雅虎已經嘗試過每個節點配置12-72個裝置。每個集群有54個這樣的節點,總容量可達3.2 pb。

微軟hadoop,spark

100萬台伺服器(2013資料)

公安大資料公司

明略資料成立於2014年,最初做大資料平台開發,繼而轉型垂直行業大資料應用,並於2017年成為行業人工智慧先行者。明略資料首個涉足的垂直行業是公共安全,以刑偵場景切入,主打公安大資料情報分析系統。隨即將業務拓展至金融和工業領域。2016年,明略資料訂單收入過億元,每年以100 200 增速快速成長。...

目前公司大資料專案結構

採集資料 上傳資料 mq 大資料 link 持久層hardoop 負責資料更新 mysql 用於查詢歷史資料 用於展示實時資料 web 一 什麼是mq mq使用經驗總結 mq經驗總結 首先了解什麼是mq?mq的作用是什麼?mq是通訊中介軟體。他的作用是省去開發人員開發通訊工具的時間,節省開發成本,提...

大資料給公司帶來了什麼?

乙個公司如果開始要做大資料,成本是需要考慮的 1 機器。會比傳統的業務更消耗伺服器,單機配置一般也比較高。2 人員。bi,分析師,應用研發,架構,演算法,每種型別的人 都不便宜 3 資料為導向 或者慢慢轉換為以資料為導向 會對原有的產品產生額外的負擔。比如大量的日誌輸出,上報等等 在實際的發展過程中...