import pandas as pd
import numpy as np
# csv
pd.read_csv(fillname)
df.to_csv(fillname)
pd.dataframe(np.random.rand(10,
5))
df.tail(n)
df.shape
df.info(
)
df.describe(
)
value_counts()是一種檢視**某列中有多少個不同值的快捷方法,並計算每個不同值有在該列中有多少重複值。
value_counts()是series擁有的方法,一般在dataframe中使用時,需要指定對哪一列或行使用
s = pd.series([1
,2,3
,3,4
,np.nan,5,
5,5,
6,7]
)s.value_counts(dropna=
false
)
df.
(pd.series.value_counts)
df.iloc[
'a']
df.loc[
0]
df.columns =
['a'
,'b'
]
pd.isnull(
)
pd.notnull(
)
df.dropna(
)
df.fillna(x)
s = pd.series([1
,3,5
,np.nan,7,
9,9]
)s.astpye(
float
)
如果需要改變原資料,需要新增常用引數inplace=true
s.replace(1,
'one'
)
將陣列(series)中所有的1替換為』one』, 所有的3替換為』three』s.replace([1
,3],
['one'
,'three'
])
df.rename(columns=
)
df.rename(columns=
lambda x : x+
3)
df.set_index(
'column_one'
)
df.rename(index =
lambda x: x+
1)
df[
(df(col)
>
0.5)
& df(col)
>
0.7)
]
df.sort_counts(col1)
df.sort_count(
[col1,col2]
,ascending=
[true
,false
[)
df.groupby(col)
df.groupby(
[col1,col2]
)
df.groupby(col1)
[col2]
.mean(
)
df.pivot_table(index=col1,values=
[col2,col3]
,aggfunc=mean)
df.
(np,mean)
df.
(np.
max,axis=
1)
concat marge
df.describe(
)
df.corr(
)
df.median(
)
df.std(
)
Python 基礎速查表
資料型別 integer 256,15 float 253.23,1.253e 10 string hel lo goodbye mul til ine boolean true,false list value,tuple value,dictionary set 語句if 語句 if expre...
Git 命令速查表
複製乙個已建立的倉庫 git clone ssh 建立乙個新的本地倉庫 git init顯示工作路徑下已修改的檔案 git status git diff把當前所有修改新增到下次提交中 git add把對某個檔案的修改新增到下次提交中 git add p提交本地的所有修改 git commit a提...
Docker 命令速查表
1 容器生命週期管理 docker run 建立乙個新的容器並執行乙個命令 docker run options image command arg.options引數說明 引數說明 a stdin 指定標準輸入輸出內容型別 d後台執行容器,並返回容器的id i以互動式模式執行容器,通常與 t同時使...