python 包pandas的學習之路( )

2021-07-12 03:12:17 字數 879 閱讀 7023

1.開啟csv檔案使用data= pandas.csv_file(filename)

如果開啟的資料是亂碼則,在引數裡面設定下encoding 

2.讀取前m行 、後m行分別使用data.head(m)和data.tail(m)

3.使用groupby().sum後索引變為了multiindex不能在對其使用dataframe的相關操作,此時呼叫reset_index()就可以了。

如果採用groupby後保持原來的索引則設定引數as_index=false

tmp

.groupby

(['key1'

,'key2'

],as_index

=false).

sum()

4.讀寫csv檔案

讀取  pd.read_csv('foo.csv')

寫入  df.to_csv('foo.csv')

5.更改dataframe列的順序兩種方法

例子:原來的frame 列的順序為:['a','b','c'] 要將第』b'列移至末尾

方法一:

cols = list(df)
cols.insert(2, cols.pop(cols.index('b

')))

df = df.ix[:, cols]

方法二:

bcol = df['b

']df.drop(labels=['b

'], axis=1,inplace = true)

df.insert(2, 'b

', bcol)

Python包之Pandas介紹

前言 pandas 是乙個開源的軟體庫。dataframes和series是其兩個主要資料結構,被廣泛用於資料分析。series 是單維索引陣列,而dataframes 是具有列級和行級索引的 資料結構。pandas 是預處理資料集的絕佳工具,可提供高度優化的效能。numpy介紹 下面是詳細介紹 用...

Python強大的pandas包常用函式

import pandas as pd filepath01 r f data temp gd net loss data demo01.csv data01 pd.read csv filepath01 print data01.head 5 print data01.columns 返回全部列名...

python包pandas安裝和入門

如果用anaconda安裝python的話,可以直接使用conda install或者pip install。e anaconda3 c users conda install pandas或者 pip install pandas2.1資料預處理 資料預處理 import pandas as pd...