在任何特定群體中,重要的因子通常只佔少數,而不重要的因子則占多數,因此只要能控制具有重要性的少數因子即能控制全域性。
資料展示
**實現
#-*- coding: utf-8 -*-
#菜品盈利資料 帕累託圖
from __future__ import print_function
import pandas as pd
#初始化引數
dish_profit =
'dish.xls'
#餐飲菜品盈利資料
data = pd.read_excel(dish_profit, index_col = u'菜品id'
)data = data[u'盈利'
].copy(
)data = data.sort_values(ascending =
false
)#逆序排序
import matplotlib.pyplot as plt #匯入影象庫
plt.rcparams[
'font.sans-serif']=
['simhei'
]#用來正常顯示中文標籤
plt.rcparams[
'axes.unicode_minus']=
false
#用來正常顯示負號
plt.figure(
)data.plot(kind=
'bar'
)plt.ylabel(u'盈利(元)'
)p =
1.0*data.cumsum(
)/data.
sum(
)p.plot(color =
'r', secondary_y =
true
, style =
'-o'
,linewidth =2)
plt.annotate(
format
(p[6],
'.4%'
), xy =(6
, p[6]
), xytext=(6
*0.9
, p[6]
*0.9
), arrowprops=
dict
(arrowstyle=
"->"
, connectionstyle=
"arc3,rad=.2"))
#新增注釋,即85%處的標記。這裡包括了指定箭頭樣式。
plt.ylabel(u'盈利(比例)'
)plt.show(
)
帕累託圖展示 python貢獻度分析以及相關性分析小例子
貢獻度又稱帕累託,80 的利潤來自20 的最暢銷的產品,而其他80 的產品只產生了20 的利潤。coding utf 8 菜品盈利資料 帕累託圖 from future import print function import pandas as pd 初始化引數 dish profit e pyt...
python資料分析
以網路爬蟲為例,網路爬蟲是乙個自動提取網頁的程式,爬蟲是搜尋引擎的第一步,也是最容易的一部。網頁搜尋,建立索引,查詢排序 用c c 效率高,速度塊,適合通用搜尋引擎做往往爬取。但是它的缺點也特別明顯 開發慢,寫起來又臭又長的。而python無論在資料分析還是在指令碼自動化編寫尚都是簡單,易學的。良好...
python資料分析
陣列間的算術運算 npwhere pandas的使用 np.random.rand 3,4 產生乙個3行4列的矩陣 0 1之間的 in 32 data1 1,2,3,4.0 in 34 arr1 np.array data1 in 35 arr1 out 35 array 1.2.3.4.in 37...