%matplotlib inline
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
# 1.建立dataframe
dates = pd.date_range(
'20200401'
, periods=
6, freq=
'2d'
)data = pd.dataframe(data=np.random.randn(6,
4)+3
, index=dates, columns=
list
('abcd'))
# 2.重新建立
df1 = data.reindex(index=dates[0:
4], columns=
list
(data.columns)+[
'e']
)# 3.特定選擇賦值
df1.loc[dates[1:
3],'e']=
1# 4.刪除空值
df1.dropna(how=
'any'
,axis=0)
# 5.空值填充
df1.fillna(value=5)
# 6.判斷是否為空
pd.isnull(df1)
# 7.資料描述資訊
df1.describe
# 8.資料累加更新
df1.cumsum(
)df1.
(np.cumsum)
df1.cumsum(
)df1.
(lambda x:x.count(
),axis=1)
# 11.只能對series進行唯一計數
df1.loc[dates[2]
].value_counts(
)# 12.切片
df.iloc[:3
]df.iloc[7:
]# 13.concat合併 索引重排
df1 = pd.concat(
[df.iloc[0:
2], df.iloc[3:
5]], ignore_index=
true
)#14.merge 相當於sql中 inner join on
df1 = pd.merge(df.iloc[0:
2], df.iloc[3:
5],on=
'b')
# 15.簡單的分類聚合
df.groupby(
['a'
,'b'])
.sum
()
Python之資料分析(寶可夢資料分析)
在此感謝阿里雲天池平台提供的學習平台,並提供相應的教程供小白們學習資料分析。seaborn庫 seaborn 是基於 python 且非常受歡迎的圖形視覺化庫,在 matplotlib 的基礎上,進行了更高階的封裝,使得作圖更加方便快捷。即便是沒有什麼基礎的人,也能通過極簡的 做出具有分析價值而又十...
python資料分析之Numpy
numpy系統是python的一種開源的數值計算擴充套件 ndarray 多維陣列 所有元素必須是相同型別 ndim屬性,維度個數 shape屬性,各維度大小 dtype屬性,資料型別 coding utf 8 import numpy as np 生成指定維度的隨機多維資料 data np.ran...
Python 資料分析之scipy
scipy是一組專門解決科學計算中各種標準問題域的包的集合,主要包括下面這些包 匯入積分模組 import numpy as np 匯入numpy庫 from scipy import integrate 匯入定積分模組scipy.integrate.quad func,a,b 計算單重積分,引數分...