在參加「資料探勘」比賽中遇到了關於函式高次擬合的問題,然後就整理了一下原始碼,以便後期的學習與改進。
在本次「資料探勘」比賽中感覺收穫最大的還是對於神經網路的認識,在接近一周的時間裡,研究了進40種神經網路模型,雖然在持續一周的挖掘比賽把自己折磨的慘不忍睹,但是收穫頗豐。現在想想也挺欣慰自己在這段時間裡接受新知識的能力。關於神經網路方面的理解會在後續博文中補充(剛提交完**,還沒來得及整理),先分享一下高次擬合方面的知識。
# coding=utf-8
import matplotlib.pyplot as plt
import numpy as np
import scipy as sp
import csv
from scipy.stats import norm
from sklearn.pipeline import pipeline
from sklearn.linear_model import linearregression
from sklearn.preprocessing import polynomialfeatures
from sklearn import linear_model
''''' 資料匯入 '''
defloaddataset
(filename):
datamat =
labelmat =
csvfile = file(filename, 'rb')
reader = csv.reader(csvfile)
b = 0
for line in reader:
if line[50] is
'': b += 1
else:
csvfile.close()
print
"absence time number: %d" % b
return datamat,labelmat
xarr,yarr = loaddataset('data.csv')
x = np.array(xarr)
y = np.array(yarr)
# x = np.arange(0, 1, 0.002)
# y = norm.rvs(0, size=500, scale=0.1)
# y = y + x ** 2
defrmse
(y_test, y):
return sp.sqrt(sp.mean((y_test - y) ** 2))
defr2
(y_test, y_true):
return
1 - ((y_test - y_true) ** 2).sum() / ((y_true - y_true.mean()) ** 2).sum()
defr22
(y_test, y_true):
y_mean = np.array(y_true)
y_mean[:] = y_mean.mean()
return
1 - rmse(y_test, y_true) / rmse(y_mean, y_true)
plt.scatter(x, y, s=5)
#分別進行1,2,3,6次擬合
degree = [1, 2,3, 6]
y_test =
y_test = np.array(y_test)
for d in degree:
#普通# clf = pipeline([('poly', polynomialfeatures(degree=d)),
# ('linear', linearregression(fit_intercept=false))])
# clf.fit(x[:, np.newaxis], y)
# 嶺回歸
clf = pipeline([('poly', polynomialfeatures(degree=d)),
('linear', linear_model.ridge())])
clf.fit(x[:, np.newaxis], y)
y_test = clf.predict(x[:, np.newaxis])
print('多項式引數%s' %clf.named_steps['linear'].coef_)
print('rmse=%.2f, r2=%.2f, r22=%.2f, clf.score=%.2f' %
(rmse(y_test, y),
r2(y_test, y),
r22(y_test, y),
clf.score(x[:, np.newaxis], y)))
plt.plot(x, y_test, linewidth=2)
plt.grid()
plt.legend(['1', '2','3', '6'], loc='upper left')
plt.show()
對python實現二維函式高次擬合的示例詳解
在參加 資料探勘 比賽中遇到了關於函式高次擬合的問題,然後就整理了一下原始碼,以便後期的學習與改進。在本次 資料探勘 比賽中感覺收穫最大的還是對於神經網路的認識,在接近一周的時間裡,研究了進40種神經網路模型,雖然在持續一周的挖掘比賽把自己折磨的慘不忍睹,但是收穫頗豐。現在想想也挺欣慰自己在這段時間...
二維陣列查詢python實現
二維陣列查詢 劍指offer經典面試題 在乙個二維陣列中,每一行都按照從左到右遞增的順序排序,每一列都按照從上到下遞增的順序排序。請完成乙個函式,輸入這樣的乙個二維陣列array m n 和乙個整數k,判斷陣列中是否含有該整數。比較最右邊一列第乙個元素array max 0 與目標數字k大小,存在以...
python 實現二維向量旋轉
現有一起點在原點 0,0 處的向量 5,8 選擇乙個基向量 此基向量可以選任意方向 大小 要將現有向量旋轉至基向量方向,該怎麼做?設定基向量為 0,2 則 基向量 v1 np.asarray 0 2 v2 np.asarray 5,8 計算方向向量 unit v1 v1 np.linalg.norm...