近期在研究hadoop時,發現hadoop的版本號非常混亂。原來的版本號都說0.x.x開始,後來發現有1.x.x和2.x.x 這樣就不太清楚了。
0.20.2版本號曾經(不含該版本號)的配置檔案都在default.xml中。
0.20.x以後的版本號不含有eclipse外掛程式的jar包,因為eclipse的版本號不一,所以就須要自己編譯源**生成相應的外掛程式。
0.20.2——0.22.x版本號的配置檔案集中在conf/core-site.xml、
conf/hdfs-site.xml
和 conf/mapred-site.xml
. 中。
0.23.x 版本號有加入了yarn技術,配置檔案集中在 conf/core-site.xml, conf/hdfs-site.xml, conf/yarn-site.xml and conf/mapred-site.xml.這4個檔案上,好像技術變化比較大,但改動了什麼技術我不清晰,希望有大俠解答。同一時候他也對資料夾的更新做了對應的變化(仿linux),資料夾結構更加的清晰了然。
或許正式0.23.x版本號的變化比較大,或許改動或加入了新的技術。讓非常多基於hadoop的一些外掛程式難以相容,如hive、hbase、pig等都基於0.23.x曾經的版本號。然而曾經的版本號又要更新,所以在更新版本號上不知道使用什麼版本號編號?
所以apache就開始統一版本,這樣從版本就能夠區分hadoop的功能。
0.22.x 直接公升級到1.0.0
0.23.x 直接公升級到2.0.0
這樣就把hadoop分為兩個版本號 1和2
1版本號:主要基於原來的技術的公升級和發展,同一時候支援其他技術的支援。假設想用hbase、hive等技術就僅僅有選擇 版本號1
2版本號:主要基於新技術的推廣和發展,假設僅僅是基於hadoop開發,這個是乙個非常好的選擇。
以上僅僅代表個人的理解和觀點,同一時候也僅僅對版本號的變化表面說明,最技術上的變化就不懂了!
ok ,希望能給你帶來點收穫,假設不正確,就不要往心裡去,這樣會誤導你。高人指點。
Hadoop版本變遷
hadoop版本變遷 到2012年5月為止,apache hadoop已經出現四個大的分支,如圖2 1所示。apache hadoop的四大分支構成了四個系列的hadoop版本。1.0.20.x系列 2.0.21.0 0.22.x系列 這一系列版本將整個hadoop專案分割成三個獨立的模組,分別是 ...
版本號簡述
版本號簡介 版本號一般分為major 主版本號 minor 次版本號 revision incremental 修正版本號 一般格式為major.minor.revison 如何界定軟體什麼時候該用什麼樣的版本號呢?1 專案初版本時 版本號可以為 0.1 或 0.1.0,也可以為 1.0 或 1.0...
比較版本號
題目 比較兩個版本號 version1 和 version2。如果 version1 version2 返回 1,如果 version1 version2 返回 1,除此之外返回 0。你可以假設版本字串非空,並且只包含數字和 字元。字元不代表小數點,而是用於分隔數字序列。例如,2.5 不是 兩個半 ...