將對一列進行計算返回乙個值
方法描述
series.all([axis, bool_only, skipna, level])
是否全為true
series.any([axis, bool_only, skipna, level])
是否有乙個為true
series.corr(other[, method, min_periods])
相關性series.count([level])
series.cov(other[, min_periods])
協方差series.cummax([axis, skipna])
series.cummin([axis, skipna])
series.cumprod([axis, skipna])
累乘series.cumsum([axis, skipna])
累加series.kurt([axis, skipna, level, numeric_only])
峰度series.max([axis, skipna, level, numeric_only])
最大值series.mean([axis, skipna, level, numeric_only])
平均值series.median([axis, skipna, level, …])
中位數series.min([axis, skipna, level, numeric_only])
最小值series.prod([axis, skipna, level, numeric_only])
乘積series.quantile([q, interpolation])
分位數series.skew([axis, skipna, level, numeric_only])
偏度series.std([axis, skipna, level, ddof, …])
標準差series.sum([axis, skipna, level, numeric_only])
求和series.var([axis, skipna, level, ddof, …])
方差series.is_unique
series.str.cat
拼貼字串
pandas聚合函式groupby
1.groupby聚合函式彙總 min 最小值 max 最大值 sum 求和 mean 平均數 std 標準差 size 按照groupby的值計算該值的個數 與count函式的區別在於,size函式會計算nan值,而count函式不會計算nan值 count 計算個數 nunique 去掉重複值後...
pandas 分組聚合
綜合使用 資料鏈結 統計每個國家的星巴克的數量 按照單字段聚合 codeing utf 8 import pandas as pd import numpy as np df pd.read csv data starbucks store worldwide.csv 按國家進行分組後會有很多列 然...
pandas聚合運算,分組運算
分組運算,先根據一定規則拆分後的資料,然後對資料進行聚合運算,如前面見到的 mean sum 等就是聚合的例子。聚合時,拆分後的第乙個索引指定的資料都會依次傳給聚合函式進行運算。最後再把運算結果合併起來,生成最終結果。先生成乙個dataframe 用key1的索引分類再求平均 df.groupby ...