python pandas基礎使用大全

2021-10-06 12:00:00 字數 1183 閱讀 1503

一、生成資料表

匯入pandas庫

import numpy as np

import pandas as pd

讀取csv或者excel

df=pd.read_csv(

'a.csv'

)df=pd.read_csv(

'a.csv'

,header=1)

df=pd.read_csv(

'a.csv'

)

字典轉成dataframe

data=

data_pd=pd.dataframe(data)

二、資料表資訊檢視

維度檢視

df.shape
資料表基本資訊(維度、列名稱、資料格式、所佔空間等)

df.info(

)

檢視前10行資料、後10行資料

df.head(

)#預設前10行資料

df.tail(

)#預設後10 行資料

三、資料表清洗

用數字0填充空值

df.fillna(value=

0)

使用列prince的均值對na進行填充

df[

'prince'

].fillna(df[

'prince'

].mean(

))

資料替換,將sh替換成shanghai

df[

'city'

].replace(

'sh'

,'shanghai'

)

刪除重複值

df[

'city'

].drop_duplicates(

)#刪除後出現的重複著

df['city'

].drop_duplicates(keep=

'last'

)#刪除先出現的重複著

Python Pandas庫入門及基礎操作

pandas提供高效能易用資料型別和分析工具,可以用import pandas as pd引入,通常簡寫為pd。pandas主要提供兩個資料型別 series 一維 和dataframe 多維 基於上述資料型別提供各類操作 基本操作 運算操作 特徵類操作 關聯類操作等。series型別由一組資料及與...

Python Pandas基礎 結構化資料處理

python pandas基礎 結構化資料處理 目錄 1 seriesobj series 4,7,5,3 obj.index obj.valuesobj one 1obj obj 0 obj 2 np.exp obj a in objdata obj series data obj.name po...

Python pandas,建立Series型別

numpy只能處理數值型別的資料。pandas除了可以處理數值型別外,還可以處理非數值型別的資料 例如 字串 時間序列等 pandas常用的資料型別 series 一維,帶標籤的陣列,對應資料庫中的一條記錄 dataframe 二維,series容器,對應資料庫中的表 demo.py series的...