a 只有 1
b 只有 2
c 只有 3
2. 下面哪個/些超引數的增加可能會造成隨機森林資料過擬合?
1 樹的數量
2 樹的深度
3 學習速率
a 只有 1
b 有1、2
c 只有 3
d 都正確
3. 下面哪一項對梯度下降(gd)和隨機梯度下降(sgd)的描述是正確的?
1 在 gd 和 sgd 中,每一次迭代中都是更新一組引數以最小化損失函式。
2 在 sgd 中,每一次迭代都需要遍歷訓練集中的所有樣本以更新一次引數。
3 在 gd 中,每一次迭代需要使用整個訓練集或子訓練集的資料更新乙個引數。
a 只有 1
b 只有 2
c 只有 3
d 都正確
4. 兩個變數的 pearson 相關性係數為零,但這兩個變數的值同樣可以相關。
a 正確
b 錯誤
5. 下面哪個選項中哪一項屬於確定性演算法?
a pca
b k-means
c 以上都不是
6. 假定特徵 f1 可以取特定值:a、b、c、d、e 和 f,其代表著學生在大學所獲得的評分。
在下面說法中哪一項是正確的?
a 特徵 f1 是名義變數(nominal variable)的乙個例項。
b 特徵 f1 是有序變數(ordinal variable)的乙個例項。
c 該特徵並不屬於以上的分類。
d 以上說法都正確。
7. 假設有乙個如下定義的神經網路:
如果我們去掉relu層,這個神經網路仍能夠處理非線性函式,這種說法是:
a 正確的
b 錯誤的
8. 選擇logistic回歸中的one-vs-all方法中的哪個選項是真實的。(n>2)
a 我們需要在n類分類問題中適合n個模型
b 我們需要適合n-1個模型來分類為n個類
c 我們需要只適合1個模型來分類為n個類
d 這些都沒有
9. 假設對給定資料應用了logistic回歸模型,並獲得了訓練精度x和測試精度y。現在要在同一資料中新增一些新特徵,以下哪些是錯誤的選項。
注:假設剩餘引數相同。
a 訓練精度提高
b 訓練準確度提高或保持不變
c 測試精度提高或保持不變
10. logistic回歸分類器是否能對下列資料進行完美分類?
注:只可使用x1和x2變數,且只能使用兩個二進位制值(0,1)。
a 是
b 否
c 不確定
d 都不是
獲取答案和詳細的答案解析:
機器學習題 含答案和解析
1.目標變數在訓練集上的7個實際值為 1,1,1,1,0,0,0 目標變數的熵近似值是 log3 7 0.847,log4 7 0.560 a 0.683 b 0.683 c 0.724 d 0.243 2.關於k means聚類演算法說法不正確的是 a 對大資料集有較高的效率並且具有可伸縮性。b ...
機器學習題 含答案和解析
1.假設x公司的員工收入分布中位數為 35,000,25 和75 比例處的數值為 21,000 和 53,000。收入 1會被認為是異常值嗎?a 是 b 否 c 需要更多資訊 d 以上都不對 2.眾所周知,身高體重呈正相關。忽略圖表大小 變數被標準化了 下列兩張圖哪張更像描繪身高 x軸 體重 y軸 ...
機器學習題 含答案和解析
1.如下散點圖使用了邏輯回歸 黑線是決策邊界 對所有資料點進行了正確分類。若使用 high infinite regularisation 正則化無限大 時偏差會如何變化?a 偏差很大 b 偏差很小 c 不確定 d 都不是 2.假設,下圖是邏輯回歸的代價函式 現在,圖中有多少個區域性最小值?a 1 ...