做數學建模要學會的資料特徵分析方法 帕累託分析

2021-10-05 17:01:04 字數 2177 閱讀 8287

帕累託分析聽起來非常高大上的樣子,其實就是指標貢獻度分析,帕累託法則即二八(20/80)定律.

原因和結果、投入和產出,努力和報酬之間本來存在著無法解釋的不平衡,一般來說,投入和努力可以分為兩種不同的型別:多數,它們只能造成少許影響;少數,它們造成主要、重大的影響。比如乙個公司,百分之八十的利潤來自於百分之二十的暢銷產品,而其它百分之八十的產品只產生了百分之二十的利潤,再比如世界財富的80%為25%的人所擁有,在乙個國家的醫療體系中,20%的人口與20%的疾病,會消耗80%的醫療資源。

帕累託分析的思路就是通過二八原則,去尋找關鍵的那20%的決定性因素!

引入相關模組

import numpy as np

import pandas as pd

import matplotlib.pyplot as plt

%matplotlib inline

建立資料,以10個品類的銷售額為例

data = pd.series(np.random.randn(10)

*1200

+3000

, index =

list

('abcdefghij'))

print

(data)

輸出結果:

對資料進行排序並建立營收柱狀圖

data.sort_values(ascending=

false

, inplace=

true

)# 由大到小排列

plt.figure(figsize =(10

,4))

data.plot(kind =

'bar'

, color =

'g', alpha =

0.5, width =

0.7)

plt.ylabel(

'營收_元'

)

建立累積佔比,找到超過80%累計佔比的節點值索引

p = data.cumsum(

)/data.

sum(

)# 建立累計佔比,series

key = p[p>

0.8]

.index[

0]

key_num = data.index.tolist(

).index(key)

print

('超過80%累計佔比的節點值索引為:'

,key)

print

('超過80%累計佔比的節點值索引位置為:'

,key_num)

建立營收累計佔比曲線

p.plot(style =

'--ko'

, secondary_y=

true

)# secondary_y → y副座標軸

plt.axvline(key_num,hold=

none

,color=

'r',linestyle=

"--"

,alpha=

0.8)

plt.text(key_num+

0.2,p[key]

,'累計佔比為:%.3f%%'

%(p[key]

*100

), color =

'r')

# 累計佔比超過80%的節點

plt.ylabel(

'營收_比例'

)

輸出決定性因素產品

key_product = data.loc[

:key]

print

('核心產品為:'

)print

(key_product)

輸出結果:

帕累託分析實現起來還是挺簡單的,關鍵點就是找到80%的位置

關注歡喜, 走向成功~

數學建模的影響因素分析方法

如果趕時間可直接看小結部分,再返回看正文 作為萌新參加了數學建模,為解決影響煤炭 的主要因素的問題,通過網路搜尋得到以下方法,簡單概括後方便今後回顧。因為希望可以幫助到今後需要速成這些知識的人,本文語言會盡量簡單,在便於理解的同時,不可避免的會失去部分準確度,因此僅供參考,如有錯誤,歡迎指出,並以專...

數學建模資料分析中的多元線性回歸分析

多元線性回歸分析 通過研究自變數 x xx 和因變數 y yy 的相關關係,嘗試去解釋 y yy 的形成機制,進而達到通過 x xx 去 y yy 的目的 2 多元線性回歸分析 7.擬合優度 r 2r 2 r2較低的解決方法 8.擾動項與異方差 9.多重共線性 3 stata的使用 不同分類的資料的...

空間分析建模目的 數學建模的6個基本步驟

數學建模 mathematical modeling 就是通過建立數學模型來解決各種實際問題的方法。數學建模沒有固定的格式和標準,也沒有明確的方法,通常有6個步驟 明確問題 合理假設 搭建模型 求解模型 分析檢驗 模型解釋 數學建模所處理的問題通常是各領域的實際問題,這些問題本身往往含糊不清,難以直...