1、gbdt和隨機森林的主要區別
2、單顆樹的構建過程(說了id3,c4.5)
3、競賽相關流程
基於樹模型有必要做標準化嗎(樹模型沒必要,svm/神經網路有必要)
這麼多維度是怎麼構建出來的
把兩個特徵做除法得到了新特徵,在gbdt有沒有這個必要
(有,雖然gbdt可以做到兩列特徵的關聯,但是比例特徵和關聯特徵是有區別的,因為你沒辦法確定他是不是準確關聯了你目標的兩列特徵。
比如我先基於 a列做分叉,再基於b列做分叉,有個很弱的比例特徵的表徵。在a的基礎上比如 a < 500,然後再在b的基礎上比如 b < 100,那麼這兩個同時滿足的話 是可以學到一定的比例關係。但是如果對應的 a = 5000 b = 1000,就沒辦法學習到了。
同時,可能會在 a點的右分支的左分支表徵一樣的資訊,相當於把模型複雜化了。但是如果我們輸入比例特徵的話,第乙個**節點可能就不是a,而是 b/a了,輸入比例特徵 是有利於模型進行學習的)
4、腫瘤專案相關(文字形式,影象形式)
影象用了什麼演算法(cnn/alexnet)
文字有沒有用到cnn,樣本大概有多少例
在cnn(深度學習)上融合文字的feature有沒有可能性
演算法模型在後面想怎麼完善去提高準確率(模型融合)
5、cnn的網路結構(輸入層、卷積層、激勵層、池化層、全連線層)
relu的形式,數學公式是什麼,和sigmoid的影象有什麼區別
全連線層的基本結構是什麼,乙個神經網路可以有幾個全連線層
6、有沒有遇到過c++裡的countdown問題。(沒有遇到過)
那講一講linux搜尋字串格式(grep -rn ./) 和find的區別
7、了解目前實習情況,在**用到spark服務,一般用的是什麼資料庫
8、mysql裡的join有幾種。有沒有用過hadoop
9、海量數量取出最大的幾個數(top k問題)
參考 10、最近看過的三篇**(遷移學習、gan、lstm)
介紹一下lstm的基本資料單元
11、滿二叉樹和完全二叉樹的區別
(滿二叉樹是指這樣的一種二叉樹:除最後一層外,每一層上的所有結點都有兩個子結點。在滿二叉樹中,每一層上的結點數都達到最大值,即在滿二叉樹的第k層上有2k-1個結點,且深度為m的滿二叉樹有2m-1個結點。
完全二叉樹是指這樣的二叉樹:除最後一層外,每一層上的結點數均達到最大值;在最後一層上只缺少右邊的若干結點。)
12、有沒有git或者csdn位址
13、再問了一遍為什麼要在菊廠做雲計算=。=當時面試了都問了你哪些問題。
阿里巴巴 2018秋招研發工程師筆試題
2.菜鳥倉庫是乙個很大很神奇的地方,各種琳琅滿目的商品整整齊齊地擺放在一排排貨架上,通常一種品類 sku 的商品會放置在貨架的某乙個格仔中,格仔設有統一的編號,方便工人們揀選。有一天沐哲去菜鳥倉庫參觀,無意中發現第1個貨架格仔編碼為1,第2 3個分別為1,2,第4 6個格仔分別是1,2,3,第7 1...
2023年阿里巴巴校招筆試題
校招找工作的同學,可以看看,非常有幫助!推薦 產品經理 阿里巴巴2015校園招聘筆試題 研發工程師 阿里巴巴2015校園招聘筆試題 研發工程師 阿里巴巴2015校園招聘筆試題2 國際安全運營專員 阿里巴巴2015校園招聘筆試題1 產品運營 阿里巴巴2015校園招聘筆試題1 前端開發工程師 阿里巴巴2...
展訊校招2023年秋招筆試題
1 kmalloc vmalloc malloc的區別 vmallocmem unsigned char vmalloc 1000000 printk 1 vmallocmem addr x vmallocmem return 0 void exit mem module exit void mod...