pandas按照 某類別 等比例劃分test集

2021-09-26 18:36:26 字數 1294 閱讀 6121

df = pd.read_csv(

'data4000.csv'

)# 讀取資料

test = pd.dataframe(

)# 劃分出的test集合

train = pd.dataframe(

)# 剩餘的train集合

tags = df[

'標籤'

].unique(

).tolist(

)# 按照該標籤進行等比例抽取

for tag in tags:

for i in

['y'

,'n']:

# 隨機選取0.2的資料

data = df[

(df[

'標籤'

]== tag)

&(df[

'是否'

]== i)

] sample = data.sample(

int(

0.2*

len(data)))

sample_index = sample.index

# 剩餘資料

all_index = data.index

residue_index = all_index.difference(sample_index)

# 去除sample之後剩餘的資料

residue = data.loc[residue_index]

# 這裡要使用.loc而非.iloc

# 儲存

test = pd.concat(

[test, sample]

, ignore_index=

true

) train = pd.concat(

[train, residue]

, ignore_index=

true

)# 儲存為tab分隔的文字

test.to_csv(

'test.tsv'

,sep=

'\t'

,index=

false

)train.to_csv(

'train.tsv'

,sep=

'\t'

,index=

false

)>>

>

len(df)

,len

(test)

,len

(train)

(4946

,972

,3974

)

cad等比例縮放快捷鍵 cad等比例縮放快捷鍵

cad等比例縮放快捷鍵是s鍵c鍵。常用cad的快捷鍵還有取消前一步操作ctrl z 快速選擇alt tk 提取輪廓alt mup 重複執行上一步命令ctrl j 開啟特性對話方塊ctrl 1以及新建圖形檔案ctrl n等等。計算機輔助設計 computer aided design 指利用計算機及其...

控制項大小隨視窗等比例變化

第一步 oninitdialog裡儲存對話方塊及其所有子窗體的rect區域 在主視窗類中新增成員變數 clistm listrect成員變數 crect rect getwindowrect rect m listrect.addtail rect 對話方塊的區域 cwnd pwnd getwind...

c 介面控制項介面等比例縮放

本篇部落格只針對本人在嘗試做乙個介面放大問題中所遇到的一些問題 目的 實現視窗放大,視窗內的控制項也等比放大 成功 1.anchor屬性改變取得的效果不理想 2.控制項放大比例不一樣 3.在放大的過程 現介面亂 看起來軟體有點像盜版 下面以下圖為例講解 當我們設計好視窗後是這樣的 當我們拉大時 網上...