numpy中的隨機數模組同樣可以進行取樣,可以利用numpy.random.choice()函式實現。
numpy.random.choice(a, size=none, replace=true, p=none)
主要有四個引數,其中
a為一維待取樣序列,
size為取樣樣本數目,
replace代表是否重複取樣,
p如果設定的話與a等長代表序列中每個位置的取樣概率。
#numpy.random.choice(a, size=none, replace=true, p=none)#從a(只要是ndarray都可以,但必須是一維的)中隨機抽取數字,並組成指定大小(size)的陣列
#replace:true表示可以取相同數字,false表示不可以取相同數字
#陣列p:與陣列a相對應,表示取陣列a中每個元素的概率,預設為選取每個元素的概率相同。
import os,sys
import random
import shutil
def
read_file
(path)
:# 的完整路徑
"""從資料夾中讀取資料"""
files_list = os.listdir(path)
file_path_list =
[os.path.join(path, img)
for img in files_list]
file_path_list.sort(
)return file_path_list
file_path=
["e:/software_installation_package/cuda/train/image"
,"e:/software_installation_package/cuda/train/label"]if
len(file_path)!=2
:raise valueerror(
"同時需要和標籤資料夾的路徑,路徑在前"
PHP 使用POST 獲取不到部分資料問題
使用php開發的乙個專案,在測試階段客戶反饋說資料沒有儲存成功 而我之前測試是通過的,但按客戶的資訊上卻重現了問題 問題是這樣的 客戶通過瀏覽器進行儲存,但有些資料已經儲存成功,但某些資料卻沒有儲存成功 而我通過測試發現 post 某些資料竟然沒有,但有些是有的 而file get contents...
我收藏的部分資料和資源收集
在我10月9號寫的個人技能矩陣中給自己布置了幾個作業,思維導圖的作業做完了。現在開始資料和資源收集的作業。堅持最少就是最多,盡量挑選自己懂的資源和能使用的資料。用不著的東西太多了就有些煩。其實我在9月15號寫的二學位工商管理教學計畫中說到以後的研究方向。裡面羅列了一些資料 艾瑞 易觀 中國網際網路絡...
機器學習筆記3 拆分資料集和訓練集
拆分資料集和訓練集 from sklearn import cross validation for version 0.17 for version 0.18 from sklearn.model selection import train test split set the random s...