假設我們現在有資料:data,label
方法一:
# 打亂資料順序
import random
index =
[i for i in
range
(len
(data))]
random.shuffle(index)
data = data[index]
label = label[index]
打亂後的結果:
方法二:
data_size = data.shape[0]
# 資料集個數
arr = np.arange(data_size)
# 生成0到datasize個數
np.random.shuffle(arr)
# 隨機打亂arr陣列
data = data[arr]
# 將data以arr索引重新組合
label = label[arr]
# 將label以arr索引重新組合
當然還有其他的方法,這裡提到的僅做參考。在我的專案中可以實際體驗: 打亂資料集的方法
原始資料存在一定的分布規律,所以學習曲線不平滑,如果資料量夠大的話,打亂後會呈現隨機分布,學習後更能體現樣本的共性。為了加強模型的泛化能力,有時候需要打亂資料集 包括特徵資料和標籤 但是顯然還是要保證每一條資料中的特徵資料和標籤的對應關係 可以進行如下操作 1.通過隨機化index import r...
JavaScript隨機打亂陣列
var arr 4,1,67,12,45,121,3 arr.sort function arr.sort function sort 是對陣列進行排序 他的是這樣工作的。每次從陣列裡面挑選兩個數 進行運算。如果傳入的引數是0 兩個數字置不變。如果引數小於0 就交換位置 如果引數大於0就不交換位置 ...
pandas隨機抽取資料和打亂資料
一,pandas.dataframe.sample 隨機選取若干行 1 資料切片選取 1.1 pandas.dataframe.sample 隨機選取若干行1.1.1 功能說明 有時候我們只需要資料集中的一部分,並不需要全部的資料。這個時候我們就要對資料集進行隨機的抽樣。pandas中自帶有抽樣的方...