python中隨機打亂資料集

2021-09-24 23:39:51 字數 1120 閱讀 8086

假設我們現在有資料:data,label

方法一:

# 打亂資料順序

import random

index =

[i for i in

range

(len

(data))]

random.shuffle(index)

data = data[index]

label = label[index]

打亂後的結果:

方法二:

data_size = data.shape[0]

# 資料集個數

arr = np.arange(data_size)

# 生成0到datasize個數

np.random.shuffle(arr)

# 隨機打亂arr陣列

data = data[arr]

# 將data以arr索引重新組合

label = label[arr]

# 將label以arr索引重新組合

當然還有其他的方法,這裡提到的僅做參考。在我的專案中可以實際體驗:

打亂資料集的方法

原始資料存在一定的分布規律,所以學習曲線不平滑,如果資料量夠大的話,打亂後會呈現隨機分布,學習後更能體現樣本的共性。為了加強模型的泛化能力,有時候需要打亂資料集 包括特徵資料和標籤 但是顯然還是要保證每一條資料中的特徵資料和標籤的對應關係 可以進行如下操作 1.通過隨機化index import r...

JavaScript隨機打亂陣列

var arr 4,1,67,12,45,121,3 arr.sort function arr.sort function sort 是對陣列進行排序 他的是這樣工作的。每次從陣列裡面挑選兩個數 進行運算。如果傳入的引數是0 兩個數字置不變。如果引數小於0 就交換位置 如果引數大於0就不交換位置 ...

pandas隨機抽取資料和打亂資料

一,pandas.dataframe.sample 隨機選取若干行 1 資料切片選取 1.1 pandas.dataframe.sample 隨機選取若干行1.1.1 功能說明 有時候我們只需要資料集中的一部分,並不需要全部的資料。這個時候我們就要對資料集進行隨機的抽樣。pandas中自帶有抽樣的方...