隨機取樣獲取部分資料集和label

numpy中的隨機數模組同樣可以進行取樣，可以利用numpy.random.choice()函式實現。

numpy.random.choice(a, size=none, replace=true, p=none)

主要有四個引數，其中

a為一維待取樣序列，

size為取樣樣本數目，

replace代表是否重複取樣，

p如果設定的話與a等長代表序列中每個位置的取樣概率。

#numpy.random.choice(a, size=none, replace=true, p=none)

#從a(只要是ndarray都可以，但必須是一維的)中隨機抽取數字，並組成指定大小(size)的陣列

#replace:true表示可以取相同數字，false表示不可以取相同數字

#陣列p：與陣列a相對應，表示取陣列a中每個元素的概率，預設為選取每個元素的概率相同。

import os,sys
import random
import shutil

def
read_file
(path)
:# 的完整路徑
"""從資料夾中讀取資料"""
files_list = os.listdir(path)
file_path_list =
[os.path.join(path, img)
for img in files_list]
file_path_list.sort(
)return file_path_list

file_path=
["e:/software_installation_package/cuda/train/image"
,"e:/software_installation_package/cuda/train/label"]if
len(file_path)!=2
:raise valueerror(
"同時需要和標籤資料夾的路徑，路徑在前"
				PHP 使用POST 獲取不到部分資料問題
使用php開發的乙個專案,在測試階段客戶反饋說資料沒有儲存成功 而我之前測試是通過的，但按客戶的資訊上卻重現了問題 問題是這樣的 客戶通過瀏覽器進行儲存,但有些資料已經儲存成功，但某些資料卻沒有儲存成功 而我通過測試發現 post 某些資料竟然沒有，但有些是有的 而file get contents...
				我收藏的部分資料和資源收集
在我10月9號寫的個人技能矩陣中給自己布置了幾個作業，思維導圖的作業做完了。現在開始資料和資源收集的作業。堅持最少就是最多，盡量挑選自己懂的資源和能使用的資料。用不著的東西太多了就有些煩。其實我在9月15號寫的二學位工商管理教學計畫中說到以後的研究方向。裡面羅列了一些資料 艾瑞 易觀 中國網際網路絡...
				機器學習筆記3 拆分資料集和訓練集
拆分資料集和訓練集 from sklearn import cross validation for version 0.17 for version 0.18 from sklearn.model selection import train test split set the random s...

隨機取樣獲取部分資料集和label

PHP 使用POST 獲取不到部分資料問題

我收藏的部分資料和資源收集

機器學習筆記3 拆分資料集和訓練集

相關推薦