目前pandas最新版本1.0.3
pandas 能讀取csv ,txt ,xls或者xls格式的檔案。
pandas 能寫入csv ,xls或者xls格式的檔案。
對於乙個series,其中最常用的屬性為值(values),索引(index),名字(name),型別(dtype)
就是表表.set_index(『索引』).head()
表.sort_values(by=『class』).head()
【問題一】 series和dataframe有哪些常見屬性和方法?
series屬性為值(values),索引(index),名字(name),型別(dtype)
series方法有series.values 返回值;series.name 返回命名;series.index返回索引;series.dtype 返回資料型別;series[『a』]返回a的值;series.mean()返回平均數等
dataframe的屬性有列和索引,與**相同
dataframe的方法有常用方法為統計資料,描述資料有describe和info、idxmax和nlarges(idxmax函式返回最大值,在某些情況下特別適用,idxmin功能類似;nlargest函式返回前幾個大的元素值,nsmallest功能類似)、groupby等
【問題二】 value_counts會統計缺失值嗎?
可以【問題三】 與idxmax和nlargest功能相反的是哪兩組函式?
nsmallest():返回最小的數
idxmin():返回最小數的索引
【問題四】 在常用函式一節中,由於一些函式的功能比較簡單,因此沒有列入,現在將它們列在下面,請分別說明它們的用途並嘗試使用。
sum:求和
mean: 求平均值
median: 中位數
mad: 根據平均值計算平均絕對離差
min: 最小值
max: 最大值
abs: 絕對值
std: 標準差
var: 方差
quantile: p分位數,常見為四分位
cummax: 取每一列的最大
cumsum: 每一列累加
cumprod: 對每一列累乘
diff: 一階差分
pct_change: 百分數變化
corr: 計算列一列的相關性,不計算包括na / null值的列
【問題五】 df.mean(axis=1)是什麼意思?它與df.mean()的結果一樣嗎?第一問提到的函式也有axis引數嗎?怎麼使用?
df.mean(axis=1)是表示在列的水平方向算均值
df.mean()是表示在列方向算均值
b.groupby([『action_type』,『combined_shot_type』]).count()
爬蟲第一次打卡
url data headers response requests.post url,data data,headers headers 發起請求 json data response.json print json data import requests from bs4 import bea...
python第一次打卡
號 表示注釋,作用於整行 多行注釋,用三個雙引號 運算子分為算術運算子 比較運算子 邏輯運算子 位運算子 三元運算子 其他運算子 運算子的優先順序 一元運算子優於二元運算子,先算術運算,後移位運算,最後位運算,邏輯運算最後結合。is,is not 對比的是兩個變數的記憶體位址 對比的是兩個變數的值 ...
Datawhale 第一次打卡
開源內容 1.enumerate enumerate is a built in function of python.my list banana grapes pear for c,value in enumerate my list,1 print c,value 類似於對錶進行排列,方便讀取...