## 設定字符集,防止中文亂碼
import
matplotlib
matplotlib.rcparams[
'font.sans-serif
']=[u'
simhei']
matplotlib.rcparams[
'axes.unicode_minus
']=false
#x為披薩的直徑
x = np.array([[6],[8],[10],[14],[18]]).reshape(-1,1)
#y是披薩的**
y = [7,9,13,17.5,18]
plt.figure()
plt.title(
'披薩直徑和**的關係')
plt.xlabel("直徑
")plt.ylabel("**
")plt.plot(x,y,'ro
')plt.axis([0,25,0,25])
plt.grid(true)
#建立線性回歸模型
from sklearn.linear_model import
linearregression
lr = linearregression(copy_x=true, fit_intercept=true, n_jobs=none,
normalize=false)
#引數介紹
#fit_intercept:是否有截據,如果沒有則直線過原點。
#normalize:是否將資料歸一化。
#copy_x:預設為true,當為true時,x會被copied,否則x將會被覆寫。(這一引數的具體作用沒明白,求大神指教了)
#n_jobs:預設值為1。計算時使用的cpu核數。
lr.fit(x,y)
#畫出圖
#輸出斜率
(lr.coef_)
#輸出截距
(lr.intercept_)
xx=range(0,25)
yy = lr.coef_*xx+lr.intercept_
plt.plot(xx,yy,'g
')#輸出rss殘差平方和
print("
rss:%.2f
" % np.mean((lr.predict(x)-y)**2))
#**乙個直徑之前從未見過的披薩**
test_pizza = np.array([[12]])
predicted_price =lr.predict(test_pizza)[0]
print("
**直徑為%d的披薩**為 $%f
" % (12,predicted_price))
#評價模型
#score可以直接輸出r方
**直徑為%d的披薩**為 $%f
" % (12,predicted_price))
**直徑為12的披薩**為 $13.681034
scikit learn機器學習簡介
目錄 機器學習 問題設定 載入示例資料集 學習和 模型永續性 約定拓展知識鏈結 在本節中,我們介紹整個scikit learn中使用的機器學習詞彙,並給出了乙個簡單的學習示例。機器學習 問題設定 通常,學習問題會考慮一組n個資料樣本,然後嘗試 未知資料的屬性。如果每個樣本都大於乙個數字,例如是多維條...
機器學習及scikit learn
1.機器學習基本步驟 1 定義一系列函式 2 定義函式的優劣 3 選擇最優函式 2.什麼是scikit learn?1 面向python的免費機器學習庫 2 包含分類 回歸 聚類演算法,比如 svm 隨機森林 k means等 3 包含降維 模型選擇 預處理等演算法 4 支援numpy和scipy資...
機器學習 scikit learn(1)
1.通過樣本來 未知的資料 通過學習資料集的特徵 訓練集 training set 來應用到新的資料上。2.監督學習 分類 樣本屬於多於兩個類,我們想要從已經標記過的資料來 未標記資料的類 digits 回歸 如果想要的輸出包括多餘乙個連續的變數 無監督 訓練集包括一系列的向量x而沒有相對應的y 目...