#去除某幾列重複的行資料。'a','b'相同,則刪除重複行,保留第乙個。keep引數可以為first、last和false(不保留)
df.drop_duplicates(subset=
['a'
,'b'
],keep=
'first'
,inplace=
true
)#去除完全重複的行資料。保留第乙個
df.drop_duplicates(keep=
'first'
,inplace=
true
)
df.rename(columns=
,inplace=
true
)
#方法一:
from sklearn.utils import shuffle
df = shuffle(df)
#方法二:
#引數frac是要返回的比例。frac=0.3,表示抽樣30%的樣本;
#reset_index(drop=true)。表示打混後資料集的index(索引)還是按照正常的排序
按列拼接
按行拼接
(1)引數how:
inner:拿出的是兩邊都有的值。返回的結果是左右列的交集
outer:將 left、right的資料結合, 所有的行和列都拿出來,哪邊缺失,就補充nan。返回的結果是左右列的並集
left:按照left的dataframe為基準,右邊值為空的話就預設nan。返回的結果只包含左列
right:按照right的dataframe為基準,左邊值為空的話就預設nan。返回的結果只包含右列
(2)引數on:
key:代表在那幾列上進行merge
data=pd.merge(data1,data2,how=
'inner'
,on=
'left'
)
(3)重新命名:data3 = pd.dataframe(
(4)merge的三種操作:
(5)merge幾點說明
POI常用功能整理
讀取.xlsx常見方式有 1.workbook wb new xssfworkbook new fileinputstream filename 2.workbook wb workbookfactory.create new file filename 讀取.xls常見的方式有 1.workboo...
SAP常用功能
1 sap外觀 幫助圖示右側的按鈕是customizing of local layout 定製本地布局 按鈕,可以用它來變更sap gui顯示介面的風格。2 sap導航 1 在sap print list視窗裡,如果不想在保持期內儲存系統假離線請求,在print screen list 列印頁面列...
IOS 常用功能
對xib檔案的處理 xib的載入可以通過 nsbundle maibundle loadnibnamed nsstring str owner nsstring temp dic nsdictionary dic 載入 xib的fileowner檔案。然後通過下標得到sub 如果要獲取xib中固定的...