呼叫葡萄酒質量的csv檔案,對葡萄酒質量與年份的關係進行**
import numpy as np
import matplotlib.pyplot as plt
from sklearn.linear_model import linearregression
from sklearn.model_selection import train_test_split
data = np.
genfromtxt
('linear.csv'
,delimiter =
',')
plt.
scatter
(data[1:
,0],data[1:
,1])
plt.
title
('age vs quality (test set)'
)plt.
xlabel
('age'
)plt.
ylabel
('quality'
)plt.
show
()
x_train,x_test,y_train,y_test = train_test_split(data[1:,0],data[1:,1],test_size = 0.3)
x_train = x_train[:,np.newaxis] #給資料增加維度,linearregression需要2維資料; 變成n行一列
x_test = x_test[:,np.newaxis]
model = linearregression()
model.fit(x_train,y_train)
#訓練集的散點圖
plt.
scatter
(x_train,y_train, c =
'b')
#模型對訓練集**
plt.
plot
(x_train,model.
predict
(x_train)
,c =
'r',linewidth =5)
plt.
title
('age vs quality(training)'
)plt.
xlabel
('age'
)plt.
ylabel
('quality'
)plt.
show
()
#測試集的散點圖
plt.
scatter
(x_test,y_test, c =
'b'#模型對測試集**
plt.
plot
(x_test,model.
predict
(x_test)
,c =
'r',linewidth =5)
plt.
title
('age vs quality(testing)'
)plt.
xlabel
('age'
)plt.
ylabel
('quality'
)plt.
show
()
機器學習2 過擬合和正則化
1 過擬合和欠擬合 1 泛化 機器學習模型學習到的概念在新輸入樣本上的表現 2 擬合 用逼近目標函式的遠近程度來描述擬合的好壞。過擬合 指某個模型過度學習了訓練資料中的細節和雜訊,以致模型在新的資料上表現很差。過擬合更可能在無引數非線性模型中發生,如決策樹。欠擬合 指某個模型在訓練和 時表現都不好,...
機器學習(西瓜書)學習筆記2 假設空間和歸納偏好
首先,有兩個概念 歸納和演繹。簡言之,歸納就是特殊推一般,演繹就是一般推特殊。機器學習是從大量樣本訓練,再利用測試資料進行測試。很顯然,機器學習屬於歸納的過程,亦稱 歸納學習。以西瓜舉例,西瓜成熟與否和西瓜的色澤 根蒂 敲聲這三個屬性有關係,色澤的屬性值 烏黑 青綠。根蒂的屬性值 蜷縮 硬挺。敲聲的...
機器學習 邏輯回歸2 多分類問題和過擬合問題
邏輯回歸1 現實生活中常遇到很多多分類學習任務,有些二分類學習方法可以直接推廣到多分類,但在現實更多情形下,我們是基於一些策略,利用二分類學習器來解決多分類問題。利用二分類學習器進行的多分類學習可以分為三種策略 給定資料集d x1,y1 x2,y2 xm,y m d x1,y 1 x2,y 2 x ...