1.設某棵三叉樹中有36個節點,則該三叉樹的最小高度是( )
a. 3 b. 4 c. 5 d. 6
2.一顆高度為4 的平衡二叉樹,其最少節點數為( )
a. 5 b. 6 c. 7 d. 8
3.以下哪些是判別式模型( )
a. 最大熵 b. 決策樹 c. 條件隨機場 d. 樸素貝葉斯
4.以下哪些演算法可以用來降維( )
a. latent dirichlet allocation
b. word2vec
c. principal component analysis
d. auto encoder
5.下列哪些優化演算法主要用來解無約束優化問題( )
a .隨機梯度下架
b .lbfgs
c .共軛梯度法
d .smo
e .擬牛頓法
6.以下哪種模型不適合序列標註問題( )
a. recurrent neural network
b. conditional random field
c. convolution neural network
d. hidden markov model
7.【單選】下面哪個不是神經網路的啟用函式?( )
a. sigmoid b. relu c. 反正切tanh d. 交叉熵ce
8.以下說法正確的是( )
a .機器學習中使用l2正則化可以得到平滑的權值
b .在adaboost演算法中,所有被錯分的樣本的權重更新比例相同。
c .boosting和bagging都是組合多個分類器投票的方法,二者都是根據單個分類器的正確率決定其權重。
d .梯度下降有時會陷於區域性極小值,但em演算法不會。
e .在核回歸中,最影響回歸的過擬合性和欠擬合之間平衡的引數為核函式的寬度。
9.下面哪種stl容器的實現和其它三個不一樣( )
a. set b. deque c. multimap d. map
10.以下哪些是防止過擬合可以採用的方法?( )
a .使用正則化項
b .擴增測試資料集
c .決策樹模型剪枝
d .early stop
11.當使用者使用稀疏特徵進行訓練時,對於離散特徵預設值應該如何處理效果較好( )
a. 直接刪除該特徵 b. 對預設值付給乙個全新值來標記 c. 當零處理直接忽略 d. 使用平均值代替
12.現有一段文字,其中只有a,b,c,d,e包含五個字母,它們出現的次數分別是a出現1次,b出現2次,c出現10次,d出現6次,e出現4次,那麼經過哈弗曼編碼後,各個字母對應的編碼可能是下面哪一組?( )
a. a=1101,b=1100,c=0,d=10,e=110
b. a=1100,b=1101,c=0,d=10,e=111
c. a=1111,b=1101,c=10,d=0,e=110
d .a=1101,b=1100,c=10,d=0,e=111
13.在電影票房**工作中,假如使用梯度下降優化均方差損失函式,並且希望模型訓練效更偏重於票房較大的電影樣本,不能實現這個目的的操作是:( )
a.在訓練資料中直接複製大票房電影的資料
b.修改損失函式,使其偏重大票房電影的誤差
c.增加大票房電影獨有的特徵,例如訪問流量是否大於一定閾值
d.針對大票房資料,在訓練時增加學習步長
14.以下哪種不是非穩定排序演算法( )
a.歸併排序 b.快速排序 c.堆排序 d.希爾排序
15.一共三個結點的二叉樹可能出現多少種結構( )
a. 3 b. 4 c .5 d. 6
16.設有乙個棧,元素一次進棧的順序是a,b,c,d,e。下列可能的出棧順序有?( )
a .abced
b .eabcd
c .bcdae
d .edcba
17."同事去美團上班,自己開車,滴滴拼車,滴滴快車,騎滑板車的概率分別是0.3,0.2,0.1,0.4,各種方式遲到的概率分別1/4,1/3,1/12,0,下列語句中正確的是"( )
a .如果他準點,那麼騎滑板車的概率大於等於0.5
b .單人出行(自己開車或者滴滴快車)準點機會比滴滴拼車要低
c .如果他遲到,自己開車的概率是0.5
d .如果他準點,使用滴滴的概率等於自己開車的概率
18.hmm的無監督訓練方法是?( )
a. em演算法 b. viterbi演算法 c. 前向-後向演算法 d. 梯度下降演算法
19.以下關於經典的k-means聚類的說法哪個是錯誤的?( )
a .k-means聚類演算法是全域性收斂的
b .k-means的聚類結果和初始聚類中心點的選取有關
c .k-means聚類演算法的時間複雜度是o(nkt),其中n為樣本個數,k為聚類團數量,t為迭代次數
d .k-means聚類演算法無法自動確定聚類團數量
20.邏輯回歸的損失函式是?( )
a .log對數損失函式
b .平方損失函式
c .指數損失函式
d .hinge損失函式
e .0-1損失函式
21.機器學習中能夠用於指導特徵選擇的指標( )
a .資訊增益 b.資訊增益率 c.基尼係數 d.資訊熵
22.美團點評是大家吃喝玩樂的生活好幫手: 比如大家搜尋」7天連鎖酒店」,會返回一系列相關的結果。如果要識別這句話的商家核心詞-「7天」,以下哪種方法識別商家核心詞準確率最低,不能直接使用?( )
a.通過分析使用者搜尋日誌,人工制定模板或規則來識別
b.標註一些資料,抽取特徵,用crf訓練出模型來識別
c.使用word2vec訓練詞向量,對詞聚類,根據詞屬於的類別來識別
d.人工整理商家核心詞詞表,按是否命中詞表裡的詞來識別
23.以下哪些主要用於無監督的深度學習網路( )
a .restricted boltzmann machines
b .autoencoder
c .deep belief networks
d .recurrent neural network
24.假定乙個二維陣列的定義語句為「int a[3][4]=,};」,則元素a[1][2]的值為( )
a.5 b. 4 c. 2 d. 8
25.以下兩種描述分別對應哪兩種對分類演算法的評價標準?( )
① 美團推薦的餐廳有多少是使用者喜歡的
② 使用者喜歡的餐廳有多少被美團推薦了
a .precision, recall
b .recall, precision
c .precision, auc
d .recall, auc
26.下列說正確的是?( )
a.回歸函式a和b,如果a比b更簡單,則a幾乎一定會比b在測試集上表現更好
b.梯度下降有時會陷於區域性極小值,但em演算法不會
c.在adaboost演算法中,所有被錯分的樣本的權重更新比例相同
d.當訓練資料較少時更難發生過擬合
27.下面那個不是序列標註模型?( )
a .hmm b .me(最大熵) c .memm d .crf
28.快速排序的最壞時間複雜度是?( )
a. o(lgn) b.o(n) c. o(nlogn) d. o(n*n)
參***:
美團點評2023年秋招筆試題
2017 8 31 19 00 21 20 輸入一串只有1和0的串,擷取子串能構成1010或010這樣的串 相鄰不重複 求構成這樣的串的最大長度 例子 輸入n 代表輸入串的長度 8 輸入 1 1 0 0 1 1 0 1 構成的子串 10101 即長度為5 輸出 5 import sys if nam...
美團點評2017秋招筆試程式設計題 題解
昨晚臨時做了下美團2017年的校招題 純屬無聊 感覺美團的題就做得很舒服了,考想法,量小,只要你的idea夠好,就幾行,學習了!大富翁遊戲,玩家根據骰子的點數決定走的步數,即骰子點數為1時可以走一步,點數為2時可以走兩步,點數為n時可以走n步。求玩家走到第n步 n 骰子最大點數且是方法的唯一入參 時...
題解 美團點評2017秋招筆試程式設計題
順序從第四題開始寫到第一題 給出兩個字串 可能包含空格 找出其中最長的公共連續子串,輸出其長度。輸入描述 輸入為兩行字串 可能包含空格 長度均小於等於50.輸出描述 輸出為乙個整數,表示最長公共連續子串的長度。示例1輸入 abcde abgde 輸出 2分析 列舉各種長度的各種情況肯定是要超時的 那...