在做資料分析時,需要對資料進行處理,要求每隔n行取一行。
找了幾個方法都不是很滿意,最後去看了官方文件才想出乙個解決方案
這裡用到的是pandas的read_csv方法裡的skiprows引數,記錄如下:
# 使用skiprows引數,每隔10行取一行
radiation_20200701 = pd.read_csv(
"utsjoki_kevo_july_1st.csv"
,dayfirst=
true
,sep=
",",
header=
0,decimal=b"."
,index_col=0,
parse_dates=[[
0,1,
2,3]
],usecols=[0
,1,2
,3,6
], skiprows=
lambda x: x >
0and
(x-1)%
10!=
0)
Pandas DataFrame用法總結
1 將某一列滿足條件的資料的所在行提取出來 df ori pd.read excel f ivf data data add yuejing time data arrange no null23.xlsx df new df ori df ori.iloc 2 0.6 將某一列滿足條件 0.6 的...
Pandas DataFrame常用方法
1 獲取列名 1.1.鍊錶推導式 語法 col for col in df 返回結果 cvr1 cvr2 cvr3 cvr4 結果型別 list 1.2.通過columns屬性 columns屬性返回index,columns.values屬性返回 numpy.ndarray,可通過 tolist ...
Pandas DataFrame 按行構建
當我們從複雜 提取出逐個樣本的特徵時,繼而構成一條樣本並組成訓練或測試集時,比較容易想到的一點就是一行一行地構建dataframe。而pandas.dataframe 容許的輸入有numpy ndarray structured or homogeneous dict,or dataframe這些 ...