機器學習題 含答案和解析

2021-10-21 13:33:32 字數 1142 閱讀 9024

1. 對數機率回歸(logistics regression)和一般回歸分析有什麼區別?

a  對數機率回歸是設計用來**事件可能性的

b  對數機率回歸可以用來度量模型擬合程度

c  對數機率回歸可以用來估計回歸係數

d  以上所有

2. 在乙個n維的空間中, 最好的檢測outlier(離群點)的方法是()

a  作正態分佈概率圖

b  作盒形圖

c  馬氏距離

d  作散點圖

3. 一般,k-nn最近鄰方法在()的情況下效果較好

a  樣本較多但典型性不好

b  樣本較少但典型性好

c  樣本呈團狀分布

d  樣本呈鏈狀分布

4. 解決隱馬模型中**問題的演算法是

a  前向演算法

b  後向演算法

c  baum-welch演算法

d  維特比演算法

5. 下列不是svm核函式的是

a  多項式核函式

b  logistic核函式

c  徑向基核函式

d  sigmoid核函式

6. 以下哪個是常見的時間序列演算法模型

a  rsi

b  macd

c  arma

d  kdj

7. 下列屬於無監督學習的是

a  k-means

b  svm

c  最大熵

d  crf

8. 下列哪些不適合用來對高維資料進行降維

a  lasso

b  主成分分析法

c  聚類分析

d  小波分析法

e  線性判別法

f  拉普拉斯特徵對映

9. 下列方法中,不可以用於特徵降維的方法包括

a  主成分分析pca

b  線性判別分析lda

c  深度學習sparseautoencoder

d  矩陣奇異值分解svd

e  最小二乘法leastsquares

10. 機器學習中做特徵選擇時,可能用到的方法有?

a  卡方

b  資訊增益

c  平均互資訊

d  期望交叉熵

e  以上都有

獲取答案和詳細的答案解析:

機器學習題 含答案和解析

1.目標變數在訓練集上的7個實際值為 1,1,1,1,0,0,0 目標變數的熵近似值是 log3 7 0.847,log4 7 0.560 a 0.683 b 0.683 c 0.724 d 0.243 2.關於k means聚類演算法說法不正確的是 a 對大資料集有較高的效率並且具有可伸縮性。b ...

機器學習題 含答案和解析

1.假設x公司的員工收入分布中位數為 35,000,25 和75 比例處的數值為 21,000 和 53,000。收入 1會被認為是異常值嗎?a 是 b 否 c 需要更多資訊 d 以上都不對 2.眾所周知,身高體重呈正相關。忽略圖表大小 變數被標準化了 下列兩張圖哪張更像描繪身高 x軸 體重 y軸 ...

機器學習題 含答案和解析

a 只有 1 b 只有 2 c 只有 3 2.下面哪個 些超引數的增加可能會造成隨機森林資料過擬合?1 樹的數量 2 樹的深度 3 學習速率 a 只有 1 b 有1 2 c 只有 3 d 都正確 3.下面哪一項對梯度下降 gd 和隨機梯度下降 sgd 的描述是正確的?1 在 gd 和 sgd 中,每...