[日期:2011-04-09]
[字型:大 中 小]
mapr官網截圖
日前在紐約舉行的乙個海量資料結構化會議上,通過了乙個新的面向終端裝置的分布式架構計畫——mapr。
據了解,mapr是hadoop中的乙個特殊版本,並有可能在今年晚些時候推出。該公司位於加州的san jose,此公司對此已經進行了為期兩年的研究。
根據美國**交易委員會提交的檔案顯示,該公司已經從barry eggers風險投資公司和peter sonsini新企業協會上籌集到了約900萬美元的資金。而根據該公司的**上的顯示內容表示,mapr的相關技術將改變map/reduce相關的體系規則,但它的作為遠不止這些。(
mapr能做什麼?
據介紹,marp是乙個比現有hadoop分布式檔案系統還要快三倍的產品,並且也是開源的。mapr配備了快照,並號稱不會出現spof單節點故障,且被認為是與現有hdfs的api相容。因此非常容易替換原有的系統。
mapr背後的技術大牛
不容忽視的是,幾個頂尖技術人員對mapr的誕生起了決定性的作用。
其中乙個是m.c. srivas,這是一位前google員工,也是該公司的創始人和首席技術官。
john schroeder,是lightspeed vc、calista technologies(被微軟收購)、rainfinity(被emc收購)的前首席執行官。並且是marp的共同創始人。
marp首席應用架構師ted dunning
ted dunning是site tuner 和veoh networks首席科學家,marp首席應用架構師。他創造了musicmatch公司,這也是在itune**服務普及之前是非常受歡迎的公司。同時他也是apache mahout資料探勘專案的關鍵人物。
hadoop的未來或因mapr改變
儘管apache的hadoop仍然是目前使用最廣泛的開源分布式計算版本,但競爭對手正對其虎視眈眈,比如cloudera、mapr這些。在現階段,mapr可能比apache hadoop有不止一點的優勢,但是apache也正在努力改善其分布式系統hdfs的架構,並可能在2023年的使其具備快照功能。(李智/譯)
Hadoop分布式系統架構詳解
主要思想是 分組合併 思想。分組 比如 有乙個大型資料,那麼他就會將這個資料按照演算法分成多份,每份儲存在 從屬主機上,並且在從屬主機上進行計算,主節點主要負責hadoop兩個關鍵功能模組hdfs map reduce的監督。合併 將每個機器上的計算結果合併起來 再在一台機器上計算,得到最終結果。這...
架構三 引入本地快取和分布式快取
其實這個階段拿出分布式快取,有些早,前期主要用的是本地快取,我使用到的技術主要是ehcahe,這個記憶體基本就存在你應用執行的伺服器上面,這個有個很大的問題就是,不適合長久儲存,如果長久儲存,資料量很大的時候,會占用你的服務記憶體很大一部分空間,分布式快取用的比較多的是memcached以及後期的r...
從單塊架構到分布式架構之資料庫集群(三)
資料庫集群主要有主備 主從 分庫 分表等方案。主要用來做儲存高可用,當主庫掛了之後可以利用備庫來代替主庫,備庫不提供任何的訪問能力。問題所在 主備資料同步是有延時的,資料量非常大的情況下可能會達到一分鐘以上。如果這個時候主庫所在伺服器宕機,可能會造成備庫資料不一致的情況。當主庫恢復正常執行之後,是把...