pandas的基本操作

2021-10-18 06:24:54 字數 1829 閱讀 7459

準備工作:我們需要裝好pandas庫,然後引入它,一般簡寫為pd

import pandas as pd
1)生成乙個**

方法一:pd.dataframe() #三個引數,第乙個為填入的值,第二個index為**的行標,第三個columns為**的列標。第二三個引數如果不填則預設從0開始一直排下去。

#方法一直接使用np

df = pd.dataframe(np.arange(12)

.reshape((3

,4))

,columns=

['a'

,'b'

,'c'

,'d'])

#index表示列標,columns表示行標

a	b	c	d

0 0 1 2 3

1 4 5 6 7

2 8 9 10 11

方法二:可以使用字典生成**

#方法二可以匯入字典,鍵表示列標,值表示這一列對應的所有值

df1 = pd.dataframe(

)

a	   b   	     c	d	 e

0 1.0 2021-01-29 1.0 3 foo

1 1.0 2021-01-29 1.0 3 foo

2 1.0 2021-01-29 1.0 3 foo

3 1.0 2021-01-29 1.0 3 foo

2)操作函式

#生成從20210129開始顯示時間的六個字串

操作函式

作用df.index

返回**df的行標

df.columns

返回**df的列標

df.values

返回**df的值

df.dtypes

返回**df每列的型別

df.t

轉置**df

注意: df是乙個例項

3)describe()

df1.describe(

)#對有資料的那幾列進行描述,求得其平均值,最大最小值等等

a	c	d

count 4.0 4.0 4.0

mean 1.0 1.0 3.0

std 0.0 0.0 0.0

min 1.0 1.0 3.0

25% 1.0 1.0 3.0

50% 1.0 1.0 3.0

75% 1.0 1.0 3.0

max 1.0 1.0 3.0

4)其他函式

#排序,axis為1對列標進行排序,0對行標進行排序,ascending為true為正序,若為false則為倒序

df1.sort_index(axis=

1,ascending =

false

)

#對指定的一列數值進行排序

df1.sort_values(by=

'a')

pandas的基本操作

資料讀寫 讀入mysql資料庫資料 匯入第三方模組 import pymysql 連線mysql資料庫 conn pymysql.connect host localhost user root password test database test port 3306 charset utf8 讀...

Pandas基本操作

常用技巧 1 讀取檔案 2 初步設定 最大顯示1000行 最大顯示20列 最大精度 3 去重 所有列相同為重複 k1相同為重複,保留最後乙個 預設保留第乙個 4 顯示當前路徑 5 jupyter下畫圖 6 計算運算時間 7 建立新變數 8 刪除乙個變數 9 刪除一行觀測 10 顯示前三行 11 顯示...

pandas基本操作

pd.read csv filename 從csv檔案匯入資料 pd.read excel filename 從excel檔案匯入資料 pd.read sql query,connection object 從sql表 庫匯入資料 pd.read json json string 從json格式的字...