一、生成資料表
匯入pandas庫
import numpy as np
import pandas as pd
讀取csv或者excel
df=pd.read_csv(
'a.csv'
)df=pd.read_csv(
'a.csv'
,header=1)
df=pd.read_csv(
'a.csv'
)
字典轉成dataframe
data=
data_pd=pd.dataframe(data)
二、資料表資訊檢視
維度檢視
df.shape
資料表基本資訊(維度、列名稱、資料格式、所佔空間等)
df.info(
)
檢視前10行資料、後10行資料
df.head(
)#預設前10行資料
df.tail(
)#預設後10 行資料
三、資料表清洗
用數字0填充空值
df.fillna(value=
0)
使用列prince的均值對na進行填充
df[
'prince'
].fillna(df[
'prince'
].mean(
))
資料替換,將sh替換成shanghai
df[
'city'
].replace(
'sh'
,'shanghai'
)
刪除重複值
df[
'city'
].drop_duplicates(
)#刪除後出現的重複著
df['city'
].drop_duplicates(keep=
'last'
)#刪除先出現的重複著
Python Pandas庫入門及基礎操作
pandas提供高效能易用資料型別和分析工具,可以用import pandas as pd引入,通常簡寫為pd。pandas主要提供兩個資料型別 series 一維 和dataframe 多維 基於上述資料型別提供各類操作 基本操作 運算操作 特徵類操作 關聯類操作等。series型別由一組資料及與...
Python Pandas基礎 結構化資料處理
python pandas基礎 結構化資料處理 目錄 1 seriesobj series 4,7,5,3 obj.index obj.valuesobj one 1obj obj 0 obj 2 np.exp obj a in objdata obj series data obj.name po...
Python pandas,建立Series型別
numpy只能處理數值型別的資料。pandas除了可以處理數值型別外,還可以處理非數值型別的資料 例如 字串 時間序列等 pandas常用的資料型別 series 一維,帶標籤的陣列,對應資料庫中的一條記錄 dataframe 二維,series容器,對應資料庫中的表 demo.py series的...