準備工作:我們需要裝好pandas庫,然後引入它,一般簡寫為pd
import pandas as pd
1)生成乙個**
方法一:pd.dataframe() #三個引數,第乙個為填入的值,第二個index為**的行標,第三個columns為**的列標。第二三個引數如果不填則預設從0開始一直排下去。
#方法一直接使用np
df = pd.dataframe(np.arange(12)
.reshape((3
,4))
,columns=
['a'
,'b'
,'c'
,'d'])
#index表示列標,columns表示行標
a b c d
0 0 1 2 3
1 4 5 6 7
2 8 9 10 11
方法二:可以使用字典生成**
#方法二可以匯入字典,鍵表示列標,值表示這一列對應的所有值
df1 = pd.dataframe(
)
a b c d e
0 1.0 2021-01-29 1.0 3 foo
1 1.0 2021-01-29 1.0 3 foo
2 1.0 2021-01-29 1.0 3 foo
3 1.0 2021-01-29 1.0 3 foo
2)操作函式
#生成從20210129開始顯示時間的六個字串
操作函式
作用df.index
返回**df的行標
df.columns
返回**df的列標
df.values
返回**df的值
df.dtypes
返回**df每列的型別
df.t
轉置**df
注意: df是乙個例項
3)describe()
df1.describe(
)#對有資料的那幾列進行描述,求得其平均值,最大最小值等等
a c d
count 4.0 4.0 4.0
mean 1.0 1.0 3.0
std 0.0 0.0 0.0
min 1.0 1.0 3.0
25% 1.0 1.0 3.0
50% 1.0 1.0 3.0
75% 1.0 1.0 3.0
max 1.0 1.0 3.0
4)其他函式
#排序,axis為1對列標進行排序,0對行標進行排序,ascending為true為正序,若為false則為倒序
df1.sort_index(axis=
1,ascending =
false
)
#對指定的一列數值進行排序
df1.sort_values(by=
'a')
pandas的基本操作
資料讀寫 讀入mysql資料庫資料 匯入第三方模組 import pymysql 連線mysql資料庫 conn pymysql.connect host localhost user root password test database test port 3306 charset utf8 讀...
Pandas基本操作
常用技巧 1 讀取檔案 2 初步設定 最大顯示1000行 最大顯示20列 最大精度 3 去重 所有列相同為重複 k1相同為重複,保留最後乙個 預設保留第乙個 4 顯示當前路徑 5 jupyter下畫圖 6 計算運算時間 7 建立新變數 8 刪除乙個變數 9 刪除一行觀測 10 顯示前三行 11 顯示...
pandas基本操作
pd.read csv filename 從csv檔案匯入資料 pd.read excel filename 從excel檔案匯入資料 pd.read sql query,connection object 從sql表 庫匯入資料 pd.read json json string 從json格式的字...