在搭建spark的過程中遇到了許多的問題,但是引起這些問題的原因都是因為環境變數沒有設定好導致的,這裡總結的一些優秀的博文,可以供以後參考
搭建hadoop單機偽分布式
搭建hadoop 分布式集群
在搭建hadoop的過程中,在執行的時候出現了ssh報錯的問題,解決辦法
spark 的集群搭建 有兩個比較優秀的部落格
總的來說搭建集群需要對linux的環境變數設定正確,這是重點,也是難點
最後附上linux的環境變數的解析
需要注意的問題
決策樹id3和c4.5的差別?各自優點?boost演算法 cart 回歸樹用平方誤差最小化準則,分類樹用基尼指數最小化準則 gbdt與隨機森林演算法的原理以及區別。優化演算法中常遇到的kkt條件?作用是?最近鄰演算法knn 分類與回歸 l1和l2函式?l1和l2正則項的比較,如何解決 l1 求導困難...
混淆中需要注意的問題
1.compress引數對混淆效果的影響。若指定compress引數.png gif以及.jpg,resources.arsc會大大減小安裝包的體積。若要支援2.2,需要保證resources.arsc壓縮前小於1m。2.作業系統對7z的影響。實驗證明,linux和mac的7z效果更好。4.渠道包的...
mysql安裝中需要注意的問題
size medium 1,mysql安裝過程中最主要是的配置過程,作為乙個的練習選擇developer machine即可。如果是有專門一台機器作為mysql的服務的機器,選擇dedicated mysql sever machine即可。2,接下來選擇 multifunction databas...