keras是tensorflow2.0的核心高階api,其內建了一些常用的公共資料集,給開發者使用。
以波士頓房價資料集為例,其涵蓋了麻省波士頓的506個不同郊區的房屋資料。有404條訓練資料集和102條測試資料集。
每條資料有14個字段,包含13個屬性和乙個房價資料
獲取波士頓房價資料集:
1資料拿到了,就順便看看各個屬性和房價之前的關係吧,這裡對每個屬性和房價的關係進行視覺化:import
tensorflow as tf
2 boston_housing = tf.keras.datasets.boston_housing #
34 (train_x,train_y),(test_x,test_y) = boston_housing.load_data() #
獲取訓練集和測試機
1來看看結果:import
tensorflow as tf
2import
matplotlib.pyplot as plt
3 boston_housing = tf.keras.datasets.boston_housing #
45 (train_x,train_y),(_,_) = boston_housing.load_data(test_split=0) #
獲取訓練集
67 title = ['
crim
', '
zn', '
indus
', '
chas
', '
nox', '
rm', '
age', '
dis',8
'rad
', '
tax', '
ptratio
', '
b-1000
', '
lstat']
9 plt.figure(figsize = (12,12)) #
設定畫布大小為12*12英吋
1011
for i in
range(len(title)):
12 plt.subplot(4,4,i+1) #
繪製 4*4 子圖
13 plt.scatter(train_x[:,i], train_y) #
繪製散點圖
1415 plt.xlabel(title[i]) #
x軸標籤
16 plt.ylabel("
price($1000)'s
") #
y軸標籤
17 plt.title(str(i+1)+'
.'+title[i]+'
- price
') #
設定子圖標題
1819 plt.tight_layout()#
使標題座標軸不重疊
20 plt.suptitle('
各個屬性與房價的關係
', x=0.5, y=1.02, fontsize=20) #
全域性標題
21 plt.show()
然後就可以使用這些資料來進行後續的資料清洗、模型訓練和結果評價了。
Keras 資料集介紹
基本的使用情況差不多介紹的差不多了,我也是邊學習邊寫部落格,其中難免有很多理解錯誤的地方或者理解不到位的地方,還請各位博友多多指點。python view plain copy print?keras.datasets.cifar10 keras.datasets.cifar10cifar10資料集...
Keras打亂輸入資料集
實驗資料集 2096 351,第一列為y,餘下350列為特徵x 分割輸入x和輸出y x dataset 1 351 y dataset 0 打亂訓練集 index i for i in range len dataset 下面這種寫法也可以 index np.arange len dataset n...
Keras資料集匯入問題
keras 中文文件 當採用文件推薦方法即如下 匯入資料集時 from keras.datasets import fashion mnist x train,y train x test,y test fashion mnist.load data 如本例的fashion mnist 時尚物品資料...