//檢視dataframe中的內容
persondf.show
//檢視dataframe部分列中的內容
persondf.select(persondf.col(「name」)).show
persondf.select(col(「name」),col(「age」)).show
persondf.select(「name」).show
//列印dataframe的schema資訊
persondf.printschema
//查詢所有的name和age,並將age+1
//過濾age大於等於18的
//按年齡進行分組並統計相同年齡的人數
如果想使用sql風格的語法,需要將dataframe註冊成表
persondf.registertemptable(「t_person」)
//查詢年齡最大的前兩名
//顯示表的schema資訊
sqlcontext.sql(「desct_person」).show
Dataframe常用操作
每次用dataframe的時候,各種操作想不起來,找來找去的 整理乙個自己常用的 刪除某列 del data column name data.drop winter axis 1,inplace true 刪除某行 data.drop data.index 16 17 inplace true r...
dataframe常用操作總結
初始化 可以使用array columns的格式,d pd.dataframe np.arange 10 reshape 2,5 df1 pd.dataframe snow m 22 tyrion m 32 sansa f 18 arya f 14 columns name gender age 也...
python的dataframe常用操作
data dataframe np.arange 16 reshape 4,4 index list abcd columns list wxyz print data print data 0 2 取前兩行資料 print print len data 求出一共多少行 print data.col...