最近一直在看簡歷,面試同學,發現符合要求的很少。本文是同學們進入阿里雲等公司的hadoop核心研發崗位的乙個指引,需要具備哪些要求,如果不具備則可以往這方面努力。
如果 以下的問題不能很好回答,還是多多學習啊。 如果很好回答,對阿里雲有興趣,歡迎找我。
這裡涉及一般為
演算法基礎知識,氣泡排序、鍊錶、樹、線性回歸……
分布式理論:資料分布方式、lease機制、日誌技術、兩階段提交、cap理論、quorum機制
作業系統
……比如:
主要考察編碼能力,一般來講,經常寫**的同學可能比較上手。
一般為5個題目,其中有2個演算法題目。筆試過的同學80%都說比較簡單,但是做起來就是不太理想。這個要注意平時寫**要記住關鍵的詞(因為寫**沒有自動補全,基本就是紙上或者在記事本上寫的)
社群技術交流釘釘大群 阿里雲 hbase+spark社群 【強烈推薦!】 群內每週進行群直播技術分享及問答
hadoop分布式安裝
工欲善其事,必先利其器。在資料橫行的時代,我們的大神hadoop 出來了,作為分布式處理資料 不但快,而且一般用配置不高的電腦業可以做集群。那麼,現在就開始安裝我們的hadoop 進入hadoop之旅 檔案,這裡就去 apache 的命令進行解壓 tar zxvf hadoop x.tar.gz 好...
hadoop分布式快取
概念 使用distributedcache方法 1.在main方法中載入共享檔案的hdfs路徑,路徑可以是目錄也可以是檔案。可以在路徑中末位追加 別名,在map階段可以使用該別名 string cache hdfs cache cache myfile myfile是別名job.addcachefi...
hadoop偽分布式
首先是本機模式的搭建,如 1 hdfs dfs ls 檢視本地分布式檔案系統,查詢結果為你本機linux檔案系統,說明你的本地模式已經搭建成功 2 進入安裝目錄hadoop資料夾下,進入etc hadoop下對四個配置檔案進行配置 core site.xml hdfs site.xml mapred...