面試官的問題:
問1.oozie/crontab等工作流框架優缺點。
答oozie 配置檔案太繁瑣了,與hadoop沒有太好的相容性,需要跟hadoop包保持一致[防止包衝突]。
crontab可用性問題,不易於管理。執行完沒有通知與嘗試。
問cdh與hdp有什麼區別。
答集群公升級(一般來講不要輕易公升級集群):
cloudera不支援滾動公升級服務
ambari支援滾動公升級服務(這個是ambari的優點,hdfs必須是ha)
二次開發:
cloudera不支援
ambari支援
服務版本:
cloudera較老
ambari較新
服務整合性:
cloudera較弱
ambari較強,支援es、redis、presto、kylin等
體驗效果:
cloudera好
ambari相對差
安裝過程:
cloudera複雜
ambari簡單
郵件報警:
cloudera支援不好
ambari支援很好
總結:不要輕易公升級元件版本
如果對整合性要求高,穩定性相對弱點的,可以選擇ambari
如果對穩定性要求高,整合性相對弱點的,可以選擇cloudera
問流資料框架[三種]。
答1.kafkaz自身可以提供流資料處理工具和自行儲存(自己存自己)、轉化。 本身是資料流。
kafka相當於datafibers ,用kafka實現。自身流資料處理工具kstream 與ksql。
2.通過spark寫入到kafka;
3.通過flink寫入到kafka。
問flink、sparkstreaming區別。
答spark streaming 類似批處理的方式處理流 處理速度稍微慢 弱於kafka先做批處理在流處理;
1.收集到資料直接streaming ,streaming時同時儲存;
2.把批處理當成特殊流處理,通過高的吞吐率。流處理主批處理輔;
特點,迅速蒐集展現出來。
面試題 PHP面試題
建議 比如是系統配置,缺少了無法執行,自然使用 require 如果某一段程式少了,只是少了統計 訪問的,不是必不可少的。可以使用 include 而加不加 once 就是效率上的區別,雖然系統會幫你考慮只包含一次,但系統的判斷會降低效率,因此,更應該在開發之初,把目錄結構調整高好,盡量不使用 on...
php面試題四
php面試題二 8.談談事務處理 答案是 事物只是一組sql語句,通常因為它們是彼此相互依賴的。所有要在全有或者 全無的模式下執行,只有當所有的語句都執行成功了,乙個事物才算成功了,任何乙個語句中的失敗應該都會導致系統 回滾 到它先前的狀態,以避免資料連線 崩潰問題。9.apache mysql p...
幾個PHP面試題
一 1 有如下html 1 用js取得 方法取得該物件 2 用 屬性取得屬性title的屬性值 3 用 方法取得屬性sina title的屬性值 1 document.getelementbyid img1 2 document.getelementbyid img1 getattribute ti...