帕累託分析聽起來非常高大上的樣子,其實就是指標貢獻度分析,帕累託法則即二八(20/80)定律.
原因和結果、投入和產出,努力和報酬之間本來存在著無法解釋的不平衡,一般來說,投入和努力可以分為兩種不同的型別:多數,它們只能造成少許影響;少數,它們造成主要、重大的影響。比如乙個公司,百分之八十的利潤來自於百分之二十的暢銷產品,而其它百分之八十的產品只產生了百分之二十的利潤,再比如世界財富的80%為25%的人所擁有,在乙個國家的醫療體系中,20%的人口與20%的疾病,會消耗80%的醫療資源。
帕累託分析的思路就是通過二八原則,去尋找關鍵的那20%的決定性因素!
引入相關模組
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
建立資料,以10個品類的銷售額為例
data = pd.series(np.random.randn(10)
*1200
+3000
, index =
list
('abcdefghij'))
print
(data)
輸出結果:
對資料進行排序並建立營收柱狀圖
data.sort_values(ascending=
false
, inplace=
true
)# 由大到小排列
plt.figure(figsize =(10
,4))
data.plot(kind =
'bar'
, color =
'g', alpha =
0.5, width =
0.7)
plt.ylabel(
'營收_元'
)
建立累積佔比,找到超過80%累計佔比的節點值索引
p = data.cumsum(
)/data.
sum(
)# 建立累計佔比,series
key = p[p>
0.8]
.index[
0]
key_num = data.index.tolist(
).index(key)
print
('超過80%累計佔比的節點值索引為:'
,key)
print
('超過80%累計佔比的節點值索引位置為:'
,key_num)
建立營收累計佔比曲線
p.plot(style =
'--ko'
, secondary_y=
true
)# secondary_y → y副座標軸
plt.axvline(key_num,hold=
none
,color=
'r',linestyle=
"--"
,alpha=
0.8)
plt.text(key_num+
0.2,p[key]
,'累計佔比為:%.3f%%'
%(p[key]
*100
), color =
'r')
# 累計佔比超過80%的節點
plt.ylabel(
'營收_比例'
)
輸出決定性因素產品
key_product = data.loc[
:key]
print
('核心產品為:'
)print
(key_product)
輸出結果:
帕累託分析實現起來還是挺簡單的,關鍵點就是找到80%的位置
關注歡喜, 走向成功~
數學建模的影響因素分析方法
如果趕時間可直接看小結部分,再返回看正文 作為萌新參加了數學建模,為解決影響煤炭 的主要因素的問題,通過網路搜尋得到以下方法,簡單概括後方便今後回顧。因為希望可以幫助到今後需要速成這些知識的人,本文語言會盡量簡單,在便於理解的同時,不可避免的會失去部分準確度,因此僅供參考,如有錯誤,歡迎指出,並以專...
數學建模資料分析中的多元線性回歸分析
多元線性回歸分析 通過研究自變數 x xx 和因變數 y yy 的相關關係,嘗試去解釋 y yy 的形成機制,進而達到通過 x xx 去 y yy 的目的 2 多元線性回歸分析 7.擬合優度 r 2r 2 r2較低的解決方法 8.擾動項與異方差 9.多重共線性 3 stata的使用 不同分類的資料的...
空間分析建模目的 數學建模的6個基本步驟
數學建模 mathematical modeling 就是通過建立數學模型來解決各種實際問題的方法。數學建模沒有固定的格式和標準,也沒有明確的方法,通常有6個步驟 明確問題 合理假設 搭建模型 求解模型 分析檢驗 模型解釋 數學建模所處理的問題通常是各領域的實際問題,這些問題本身往往含糊不清,難以直...