1. 對數機率回歸(logistics regression)和一般回歸分析有什麼區別?
a 對數機率回歸是設計用來**事件可能性的
b 對數機率回歸可以用來度量模型擬合程度
c 對數機率回歸可以用來估計回歸係數
d 以上所有
2. 在乙個n維的空間中, 最好的檢測outlier(離群點)的方法是()
a 作正態分佈概率圖
b 作盒形圖
c 馬氏距離
d 作散點圖
3. 一般,k-nn最近鄰方法在()的情況下效果較好
a 樣本較多但典型性不好
b 樣本較少但典型性好
c 樣本呈團狀分布
d 樣本呈鏈狀分布
4. 解決隱馬模型中**問題的演算法是
a 前向演算法
b 後向演算法
c baum-welch演算法
d 維特比演算法
5. 下列不是svm核函式的是
a 多項式核函式
b logistic核函式
c 徑向基核函式
d sigmoid核函式
6. 以下哪個是常見的時間序列演算法模型
a rsi
b macd
c arma
d kdj
7. 下列屬於無監督學習的是
a k-means
b svm
c 最大熵
d crf
8. 下列哪些不適合用來對高維資料進行降維
a lasso
b 主成分分析法
c 聚類分析
d 小波分析法
e 線性判別法
f 拉普拉斯特徵對映
9. 下列方法中,不可以用於特徵降維的方法包括
a 主成分分析pca
b 線性判別分析lda
c 深度學習sparseautoencoder
d 矩陣奇異值分解svd
e 最小二乘法leastsquares
10. 機器學習中做特徵選擇時,可能用到的方法有?
a 卡方
b 資訊增益
c 平均互資訊
d 期望交叉熵
e 以上都有
獲取答案和詳細的答案解析:
機器學習題 含答案和解析
1.目標變數在訓練集上的7個實際值為 1,1,1,1,0,0,0 目標變數的熵近似值是 log3 7 0.847,log4 7 0.560 a 0.683 b 0.683 c 0.724 d 0.243 2.關於k means聚類演算法說法不正確的是 a 對大資料集有較高的效率並且具有可伸縮性。b ...
機器學習題 含答案和解析
1.假設x公司的員工收入分布中位數為 35,000,25 和75 比例處的數值為 21,000 和 53,000。收入 1會被認為是異常值嗎?a 是 b 否 c 需要更多資訊 d 以上都不對 2.眾所周知,身高體重呈正相關。忽略圖表大小 變數被標準化了 下列兩張圖哪張更像描繪身高 x軸 體重 y軸 ...
機器學習題 含答案和解析
a 只有 1 b 只有 2 c 只有 3 2.下面哪個 些超引數的增加可能會造成隨機森林資料過擬合?1 樹的數量 2 樹的深度 3 學習速率 a 只有 1 b 有1 2 c 只有 3 d 都正確 3.下面哪一項對梯度下降 gd 和隨機梯度下降 sgd 的描述是正確的?1 在 gd 和 sgd 中,每...