sklearn進行資料分析

2021-09-11 10:46:35 字數 1352 閱讀 3953

#呼叫線性回歸函式

from sklearn.linear_model import linearregression

#匯入資料集

#這裡將全部資料用於訓練,並沒有對資料進行劃分,上例中

#將資料劃分為訓練和測試資料,後面會講到交叉驗證

loaded_data = datasets.load_boston()

data_x = loaded_data.data

data_y = loaded_data.target

#設定線性回歸模組

model = linearregression()

#訓練資料,得出引數

model.fit(data_x, data_y)

#利用模型,對新資料,進行**,與原標籤進行比較

print(model.predict(data_x[:4,:]))

print(data_y[:4])

from sklearn.model_selection import train_test_split

from sklearn import datasets

#k近鄰函式

from sklearn.neighbors import kneighborsclassifier

iris = datasets.load_iris()

#匯入資料和標籤

iris_x = iris.data

iris_y = iris.target

#劃分為訓練集和測試集資料

x_train, x_test, y_train, y_test = train_test_split(iris_x, iris_y, test_size=0.3)

#print(y_train)

#設定knn分類器

knn = kneighborsclassifier()

#進行訓練

knn.fit(x_train,y_train)

#使用訓練好的knn進行資料**

pandas進行資料分析

最近參加了一次apmcm,題目給出了很多 我們需要對資料進行分析。顯然,作為一名會python的大學生,肯定不會直接在 上進行各種變動,本文就如何使用pandas對excel 進行資料分析做一些介紹。3.1 讀取所有表中的職業 讀取所有表中的職業 pros.xlsx中有所有職業 pros path ...

python進行資料分析

python進行資料分析 1 import numpy as np arr np.random.randn 4,4 arr1 np.where arr 0,2,1 arr1.min arr1.max arr1.mean arr1.cumsum 0 arr1.cumsum 1 arr1.mean 0 ...

資料分析學習 使用Pandas進行資料分析

在對資料進行分析時,首先需要了解相關的名詞在該行業裡的含義,即查閱相關知識對題目進行整體把握。下面是進行資料分析的步驟 1 讀取資料 import pandas as pd data pd.read csv data train.csv 2 對資料進行預處理 具體包括 1 剔除空白值超過一半的列 h...