#coding=utf-8
def create_data():
#'''建立樣本'''
data=[[1,1,'y'],
[1,1,'y'],
[1,0,'n'],
[0,1,'n'],
[0,1,'n'],
]labels=['no su***cing','flippers']
return data,labels
def split_data(data,axis,value):
#根據某一特徵劃分資料
ret_data=
#結果列表
for v in data:
#遍歷樣本
if v[axis]==value:
#v[axis]樣本中第axis的特徵,value 預期的特徵值
reduced_v=v[:axis]
#樣本前axis個值
reduced_v.extend(v[axis+1:])
#樣本後axis個值
#得到的結果就是除選定的特徵外樣本中其他的值
#根據需求可返回不同的結果。比如我只想根據axis=1這個條件返回y or n這個結果
#單成乙個列表 ret_data.extend(v[axis+1:])
return ret_data
劃分資料集
如果要在乙個二維資料散點圖中間畫一條線將資料集分開,是按照x劃分還是y劃分呢 from math import log defcreatedataset dataset 1,1,yes 1,1,yes 1,0,no 0,1,no 0,1,no labels no su cing flippers r...
劃分資料集
import glob import shutil total file total file.txt train train.txt val val.txt bin path data l v bin 總的點雲資料集檔案路徑 如果是自己的路徑,就是 自己點雲資料夾 bin bin train di...
劃分資料集的方法
train split方法 1 匯入包 fromsklearn.model selectionimport train test split 2 函式介紹 train split arrays,test size,train size,random state,shuffle,stratify 3 ...