pandas的基本操作

準備工作：我們需要裝好pandas庫，然後引入它，一般簡寫為pd

import pandas as pd

1）生成乙個**

方法一：pd.dataframe() #三個引數，第乙個為填入的值，第二個index為**的行標，第三個columns為**的列標。第二三個引數如果不填則預設從0開始一直排下去。

#方法一直接使用np
df = pd.dataframe(np.arange(12)
.reshape((3
,4))
,columns=
['a'
,'b'
,'c'
,'d'])
#index表示列標，columns表示行標

a b c d 0 0 1 2 3 1 4 5 6 7 2 8 9 10 11

方法二：可以使用字典生成**

#方法二可以匯入字典，鍵表示列標，值表示這一列對應的所有值
df1 = pd.dataframe(
)

a b c d e 0 1.0 2021-01-29 1.0 3 foo 1 1.0 2021-01-29 1.0 3 foo 2 1.0 2021-01-29 1.0 3 foo 3 1.0 2021-01-29 1.0 3 foo

2）操作函式

#生成從20210129開始顯示時間的六個字串
操作函式
作用df.index
返回**df的行標
df.columns
返回**df的列標
df.values
返回**df的值
df.dtypes
返回**df每列的型別
df.t
轉置**df
注意： df是乙個例項
3）describe()
df1.describe(
)#對有資料的那幾列進行描述,求得其平均值，最大最小值等等
a	c	d
count  4.0	4.0	4.0
mean   1.0	1.0	3.0
std	0.0	0.0	0.0
min	1.0	1.0	3.0
25%	1.0	1.0	3.0
50%	1.0	1.0	3.0
75%	1.0	1.0	3.0
max	1.0	1.0	3.0
4）其他函式
#排序，axis為1對列標進行排序，0對行標進行排序，ascending為true為正序，若為false則為倒序
df1.sort_index(axis=
1,ascending =
false
)
#對指定的一列數值進行排序
df1.sort_values(by=
'a')
				pandas的基本操作
資料讀寫 讀入mysql資料庫資料 匯入第三方模組 import pymysql 連線mysql資料庫 conn pymysql.connect host localhost user root password test database test port 3306 charset utf8 讀...
				Pandas基本操作
常用技巧 1 讀取檔案 2 初步設定 最大顯示1000行 最大顯示20列 最大精度 3 去重 所有列相同為重複 k1相同為重複，保留最後乙個 預設保留第乙個 4 顯示當前路徑 5 jupyter下畫圖 6 計算運算時間 7 建立新變數 8 刪除乙個變數 9 刪除一行觀測 10 顯示前三行 11 顯示...
				pandas基本操作
pd.read csv filename 從csv檔案匯入資料 pd.read excel filename 從excel檔案匯入資料 pd.read sql query,connection object 從sql表 庫匯入資料 pd.read json json string 從json格式的字...

pandas的基本操作

pandas的基本操作

Pandas基本操作

pandas基本操作

相關推薦