什麼都不多說,注釋裡有解釋
from pandas import series,dataframe
import numpy as np
import os
df = dataframe()
print(df)
# 將'b'這一列拿出來,按「b」進行分組等操作
group = df.groupby(['b'])
print(group)
# group會自動去重,count()計算每組中非nan的個數
'''print(group.count())'''
# 每個組中非nan的平均值
'''print(df.groupby(['a','b']).mean())'''
# describe() 描述組內資料的基本統計量
b = ['one','two','one','two','two']
a = df.groupby(b).describe()
# 將結果儲存在csv檔案中,讀取csv檔案用read_scv()
if os.path.exists( r'c:\users\asus\desktop\python\資料分析\\01.csv' ) == false :
a.to_csv(r'c:\users\asus\desktop\python\資料分析\\01.csv','w')
print(a)
# head(n) 獲取每個組的前n行
df.groupby('b').head(2)
# transform() 的結果中屬於同行名的元素的值會相同
print(df.groupby('b').transform('mean'))
pandas聚合運算,分組運算
分組運算,先根據一定規則拆分後的資料,然後對資料進行聚合運算,如前面見到的 mean sum 等就是聚合的例子。聚合時,拆分後的第乙個索引指定的資料都會依次傳給聚合函式進行運算。最後再把運算結果合併起來,生成最終結果。先生成乙個dataframe 用key1的索引分類再求平均 df.groupby ...
pandas 分組聚合
綜合使用 資料鏈結 統計每個國家的星巴克的數量 按照單字段聚合 codeing utf 8 import pandas as pd import numpy as np df pd.read csv data starbucks store worldwide.csv 按國家進行分組後會有很多列 然...
pandas資料分組和聚合操作
python for data analysis dataframe可以在其行 axis 0 或列 axis 1 上進行分組。然後,將乙個函式應用到各個分組並產生新值。最後,所有這些函式的執行結果會被合併到最終的結果物件中去。groupby的size方法可以返回乙個含有分組大小的series。for...