匯出iris資料集
from sklearn import datasets
import pandas as np
iris_datas = datasets.load_iris()
iris_data是乙個類似字典的物件。
print(iris_datas.data) # 資料集中的資料
print(iris_datas.target_name) # iris的種類
iris = pd.dataframe(iris_datas.data, columns=['speallength', 'spealwidth', 'petallength', 'petallength'])
iris.shape
iris.head()
(150, 4)
speallength spealwidth petallength petallength
0 5.1 3.5 1.4 0.2
1 4.9 3.0 1.4 0.2
2 4.7 3.2 1.3 0.2
3 4.6 3.1 1.5 0.2
4 5.0 3.6 1.4 0.2
描述性統計
iris.describe().t # 描述性統計轉置
花萼長度與寬度/花瓣長度與寬度的視覺化,判斷是否僅依據其即可判別鳶尾花品種。
from collection import counter, defaultdict
import matplotlib
import matplotlib.pyplot as plt
matplotlib.rcparams['font.sans-serif'] = ['simhei']
style_list = ['o', '^', 's'] # 設定點的不同形狀,不同形狀預設顏色不同,也可自定義
data = iris_datas.data
labels = iris_datas.target_names
cc = defaultdict(list)
for i, d in enumerate(data):
p_list =
c_list =
for each in [0, 2]:
for i, (c, ds) in enumerate(cc.items()):
draw_data = np.array(ds)
p = plt.plot(draw_data[:, each], draw_data[:, each+1], style_list[i])
plt.legend(map(lambda x: x[0], p_list), c_list)
plt.title('鳶尾花花瓣的長度和寬度') if each else plt.title('鳶尾花花萼的長度和寬度')
plt.xlabel('花瓣的長度(cm)') if each else plt.xlabel('花萼的長度(cm)')
plt.ylabel('花瓣的寬度(cm)') if each else plt.ylabel('花萼的寬度(cm)')
機器學習iris資料集匯入
iris資料集在模式識別研究領域應該是最知名的資料集了,有很多文章都用到這個資料集。這個資料集裡一共包括150行記錄,其中前四列為花萼長度,花萼寬度,花瓣長度,花瓣寬度等4個用於識別鳶尾花的屬性,第5列為鳶尾花的類別 包括setosa,versicolour,virginica三類 也即通過判定花萼...
用TensorFlow實現iris資料集線性回歸
本文將遍歷批量資料點並讓tensorflow更新斜率和y截距。這次將使用scikit learn的內建iris資料集。特別地,我們將用資料點 x值代表花瓣寬度,y值代表花瓣長度 找到最優直線。選擇這兩種特徵是因為它們具有線性關係,在後續結果中將會看到。本文將使用l2正則損失函式。用tensorflo...
鳶尾花 Iris 資料集
2.pandas庫基礎操作 3.資料視覺化 tf.keras.utils.get file fname,origin,cache dir 引數 說明fname origin 檔案的url位址 cache dir train url train path tf.keras.utils.get file...