原始碼:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
def datasets_demo():
'''sklearn資料集使用
:return:
'''# 獲取資料集
iris = load_iris()
print("鳶尾花資料集:\n", iris)
print("檢視資料集描述:\n", iris["descr"])
print("檢視特徵值的名字:\n",iris.feature_names)
print("檢視特徵值:\n", iris.data, iris.data.shape)
print("*" * 30)
# 資料集劃分
x_train, x_test, y_train, y_test = train_test_split(iris.data, iris.target, test_size=0.2, random_state=22)
print("訓練集的特徵值:\n", x_train, x_train.shape)
return none
if __name__ == '__main__':
pass
# **1:sklearn資料集使用
datasets_demo()
這是看完7集以後敲下的
機器學習之Sklearn庫
sklearn庫是在numpy scipy和matplotlib的基礎上開發而成的,因此在介紹sklearn的安裝前,需要先安裝這些依賴庫。numpy是乙個開源的python科學計算庫。scipy庫是sklearn庫的基礎,它是基於numpy的乙個整合了多種數學演算法和函式的python模組。mat...
sklearn機器學習 PCA
pca使用的資訊量衡量指標,就是樣本方差,又稱可解釋性方差,方差越大,特徵所帶的資訊量越多 原理推導 class sklearn decomposition.pca n components none,copy true whiten false svd solver auto tol 0.0,it...
sklearn 機器學習庫
pipeline parameters steps 步驟 列表 list 被連線的 名稱,變換 元組 實現擬合 變換 的列表,按照它們被連線的順序,最後乙個物件是估計器 estimator memory 記憶體引數,instance of sklearn.external.joblib.memory...