博雅資料機器學習06
線性回歸
from sklearn import linear_model
from numpy import mat, array, mean
# 根據x和y訓練模型並計算**值y_pred
x = insurance.drop(['charges'], axis=1)
y = insurance['charges']
ws = linearregression(x, y)
y_pred = mat(x.values)*ws
y_pred = array(y_pred).reshape(y_pred.shape[0],) # 將矩陣轉換為一行多列的array格式
# 自定義決定係數函式,並對訓練得到的模型進行評價
def r2_score(y_true, y_pred):
sst = sum((y_true-mean(y_true))**2)
ssr = sum((y_true-y_pred)**2)
sse = sum((y_pred-mean(y_true))**2)
r2 = 1-float(ssr)/sst
return round(r2,2)
score = r2_score(y, y_pred)
print(score)
# sklearn模型訓練結果
from sklearn import linear_model, metrics
regr = linear_model.linearregression(fit_intercept=false)
regr.fit(x, y)
y_pred = regr.predict(x)
score_sklearn = round(metrics.r2_score(y, y_pred),2)
print(score_sklearn)
博雅資料機器學習10
博雅資料機器學習10 貝葉斯定理 計算隊1獲勝的概率prob win 1 prob win 1 1 prob win 0 計算隊1取勝時隊0是東道主的概率 prob win 1 home 0 1 prob win 1 home 1 計算隊0取勝時隊0是東道主的概率 prob win 0 home 0...
博雅資料機器學習09
博雅資料機器學習09 k近鄰演算法 宣告儲存k個鄰居的index的列表 index list 遍歷每個測試樣本的與訓練集的舉例,item型別為dict for item in distances item的型別為dict,即 使用sorted函式對item按照distance進行公升序排列,並取前1...
博雅資料機器學習02
博雅資料機器學習02 特徵標準化 請在下方作答 def min max data 最小值 data min data.min 最大值 data max data.max 最大值與最小值之間的差值 diff data max data min 根據minmax標準化的定義實現 new data dat...