機器學習專案2 葡萄酒質量和年份的關係

2021-10-16 01:24:20 字數 1715 閱讀 8074

呼叫葡萄酒質量的csv檔案,對葡萄酒質量與年份的關係進行**

import numpy as np

import matplotlib.pyplot as plt

from sklearn.linear_model import linearregression

from sklearn.model_selection import train_test_split

data = np.

genfromtxt

('linear.csv'

,delimiter =

',')

plt.

scatter

(data[1:

,0],data[1:

,1])

plt.

title

('age vs quality (test set)'

)plt.

xlabel

('age'

)plt.

ylabel

('quality'

)plt.

show

()

x_train,x_test,y_train,y_test = train_test_split(data[1:,0],data[1:,1],test_size = 0.3)

x_train = x_train[:,np.newaxis] #給資料增加維度,linearregression需要2維資料; 變成n行一列

x_test = x_test[:,np.newaxis]

model = linearregression()

model.fit(x_train,y_train)

#訓練集的散點圖

plt.

scatter

(x_train,y_train, c =

'b')

#模型對訓練集**

plt.

plot

(x_train,model.

predict

(x_train)

,c =

'r',linewidth =5)

plt.

title

('age vs quality(training)'

)plt.

xlabel

('age'

)plt.

ylabel

('quality'

)plt.

show

()

#測試集的散點圖

plt.

scatter

(x_test,y_test, c =

'b'#模型對測試集**

plt.

plot

(x_test,model.

predict

(x_test)

,c =

'r',linewidth =5)

plt.

title

('age vs quality(testing)'

)plt.

xlabel

('age'

)plt.

ylabel

('quality'

)plt.

show

()

機器學習2 過擬合和正則化

1 過擬合和欠擬合 1 泛化 機器學習模型學習到的概念在新輸入樣本上的表現 2 擬合 用逼近目標函式的遠近程度來描述擬合的好壞。過擬合 指某個模型過度學習了訓練資料中的細節和雜訊,以致模型在新的資料上表現很差。過擬合更可能在無引數非線性模型中發生,如決策樹。欠擬合 指某個模型在訓練和 時表現都不好,...

機器學習(西瓜書)學習筆記2 假設空間和歸納偏好

首先,有兩個概念 歸納和演繹。簡言之,歸納就是特殊推一般,演繹就是一般推特殊。機器學習是從大量樣本訓練,再利用測試資料進行測試。很顯然,機器學習屬於歸納的過程,亦稱 歸納學習。以西瓜舉例,西瓜成熟與否和西瓜的色澤 根蒂 敲聲這三個屬性有關係,色澤的屬性值 烏黑 青綠。根蒂的屬性值 蜷縮 硬挺。敲聲的...

機器學習 邏輯回歸2 多分類問題和過擬合問題

邏輯回歸1 現實生活中常遇到很多多分類學習任務,有些二分類學習方法可以直接推廣到多分類,但在現實更多情形下,我們是基於一些策略,利用二分類學習器來解決多分類問題。利用二分類學習器進行的多分類學習可以分為三種策略 給定資料集d x1,y1 x2,y2 xm,y m d x1,y 1 x2,y 2 x ...