1. 假設x公司的員工收入分布中位數為$35,000,25%和75%比例處的數值為$21,000 和$53,000。收入$1會被認為是異常值嗎?
a 是
b 否
c 需要更多資訊
d 以上都不對
2. 眾所周知,身高體重呈正相關。忽略圖表大小(變數被標準化了)下列兩張圖哪張更像描繪身高(x軸)體重(y軸)的圖表?
a 圖2
b 圖1
c 兩張都是
d 無法確定
3. 下圖顯示了由x**y的回歸線,圖上的值展示了每個預期的離差,請據此計算sse(殘差平方和)
a 3.02
b 0.75
c 1.01
d 以上都不對
4. 變數的相關係數可以為零,對嗎?
a 是
b 否
5. 若兩個變數相關,它們之間一定有線性關係嗎?
a 是
b 否
a a比b高
b a比b低
c 兩者相同
d 以上都不對
7. 為了評價乙個簡單線性回歸模型(單自變數),需要多少個引數?
a 1
b 2
c 不確定
a 1和2
b 1和3
c 2和3
d 1,2和3
9. 我們可以通過一種叫「正規方程」的分析方法來計算線性回歸的相關係數,下列關於「正規方程」哪一項是正確的?
1.我們不必選擇學習比率
2.當特徵值數量很大時會很慢
3.不需要迭代
a 1和2
b 1和3
c 2和3
d 1,2和3
10. 下列哪項可以評價回歸模型?
1.r方
2.調整r方
3.f統計量
4.rmse/mse/mae
a 2和4
b 1和2
c 2,3和4
d 以上所有
獲取答案和詳細的答案解析:
機器學習題 含答案和解析
1.目標變數在訓練集上的7個實際值為 1,1,1,1,0,0,0 目標變數的熵近似值是 log3 7 0.847,log4 7 0.560 a 0.683 b 0.683 c 0.724 d 0.243 2.關於k means聚類演算法說法不正確的是 a 對大資料集有較高的效率並且具有可伸縮性。b ...
機器學習題 含答案和解析
a 只有 1 b 只有 2 c 只有 3 2.下面哪個 些超引數的增加可能會造成隨機森林資料過擬合?1 樹的數量 2 樹的深度 3 學習速率 a 只有 1 b 有1 2 c 只有 3 d 都正確 3.下面哪一項對梯度下降 gd 和隨機梯度下降 sgd 的描述是正確的?1 在 gd 和 sgd 中,每...
機器學習題 含答案和解析
1.如下散點圖使用了邏輯回歸 黑線是決策邊界 對所有資料點進行了正確分類。若使用 high infinite regularisation 正則化無限大 時偏差會如何變化?a 偏差很大 b 偏差很小 c 不確定 d 都不是 2.假設,下圖是邏輯回歸的代價函式 現在,圖中有多少個區域性最小值?a 1 ...