python中隨機打亂資料集

假設我們現在有資料:data,label

方法一：

# 打亂資料順序
import random
index =
[i for i in
range
(len
(data))]
random.shuffle(index)
data = data[index]
label = label[index]

打亂後的結果：

方法二：

data_size = data.shape[0]
# 資料集個數
arr = np.arange(data_size)
# 生成0到datasize個數
np.random.shuffle(arr)
# 隨機打亂arr陣列
data = data[arr]
# 將data以arr索引重新組合
label = label[arr]
# 將label以arr索引重新組合

當然還有其他的方法，這裡提到的僅做參考。在我的專案中可以實際體驗：

打亂資料集的方法

原始資料存在一定的分布規律，所以學習曲線不平滑，如果資料量夠大的話，打亂後會呈現隨機分布，學習後更能體現樣本的共性。為了加強模型的泛化能力，有時候需要打亂資料集包括特徵資料和標籤但是顯然還是要保證每一條資料中的特徵資料和標籤的對應關係可以進行如下操作 1.通過隨機化index import r...

JavaScript隨機打亂陣列

var arr 4,1,67,12,45,121,3 arr.sort function arr.sort function sort 是對陣列進行排序他的是這樣工作的。每次從陣列裡面挑選兩個數進行運算。如果傳入的引數是0 兩個數字置不變。如果引數小於0 就交換位置如果引數大於0就不交換位置 ...

pandas隨機抽取資料和打亂資料

一，pandas.dataframe.sample 隨機選取若干行 1 資料切片選取 1.1 pandas.dataframe.sample 隨機選取若干行1.1.1 功能說明有時候我們只需要資料集中的一部分，並不需要全部的資料。這個時候我們就要對資料集進行隨機的抽樣。pandas中自帶有抽樣的方...

python中隨機打亂資料集

打亂資料集的方法

JavaScript隨機打亂陣列

pandas隨機抽取資料和打亂資料

相關推薦