# -*- coding: utf-8 -*-
#1.概念:矩陣分析,是指根據事物(如產品,服務等)的兩個重要屬性(指標)作為分析的依據,進行關聯分析,找出解決
#問題的一種分析方法。
#矩陣分析法在解決問題和資源分配時,為決策者提供重要的參考依據,先解決主要矛盾,再解決次要矛盾,有利於提高工作效率,有
#利於決策者進行資源的優化配置。
#如何使用python進行矩陣分析:
import pandas
import matplotlib
import matplotlib.pyplot as plt
#使用rgb的方式定義好主題顏色:
maincolor =(42
/256,87
/256
,141
/256,1
);#設定字型:在畫圖的時候使用中文字型(畢竟python是外國人開發的語言,預設使用的不是中文,所以當我們需要在圖形中展示中文的時候,就需要設定為中文字型)
font =
matplotlib.rc(
'font'
,**font)
;#準備工作完成,開始匯入資料:
data = pandas.read_csv(
"d:/workspaces/python/pythonstudy/31.csv"
)#配置圖形格式:
fig = plt.figure(
figsize=(30
,20),
#尺寸設定(如果資料點比較多,可以調大這個尺寸,方便展示所有的資料)
dpi=80)
#新增子圖物件
sp = fig.add_subplot(
111)
#111含義:我們要把圖形分為一行一列,並且當前要操作第乙個子圖的意思
#設定座標軸的範圍:將軸最大值設定為實際最大值的1.1倍,這樣以來數值在圖上就不會顯示的太靠邊
sp.set_xlim([0
, data.gdp.
max()*
1.1]
)sp.set_ylim([0
, data.population.
max()*
1.1]
)#關閉座標軸、座標軸的刻度值(因為矩陣分析的圖不需要座標刻度)
sp.get_xaxis(
).set_ticks(
)sp.get_yaxis(
).set_ticks(
)#圖形設定完成,可以開始畫點:
sp.scatter(
data.gdp,
#gdp作為橫軸
data.population,
#population作為縱軸
alpha=
0.5,s=
200,marker=
'o',
#點的形狀
edgecolors=maincolor,
#點的顏色
linewidths=
5#點的大小
)#畫均值線:
sp.axvline(
x = data.gdp.mean(),
linewidth=
1,color=maincolor
)sp.axhline(
y = data.population.mean(),
linewidth=
1,color=maincolor
)#加深橫軸和縱軸的線
sp.axvline(
x =0,
linewidth=
3,color=maincolor
)sp.axhline(
y =0,
linewidth=
3,color=maincolor
)#設定橫軸和縱軸的標籤
sp.set_xlabel(
'gdp'
)sp.set_ylabel(
'人口'
)#畫標籤(把省名標註在圖上)
data.
(lambda row: plt.text(
row.gdp,
row.population,
row.province,
fontsize=15)
, axis=1)
plt.show(
)
執行結果截圖 Python資料分析筆記
數值型字元型 資料結構 取值 true 真 false 假 運算規則 與 一假為假,兩真為真 true true true false false false 或 兩假為假,一真為真 true true true false false falsenot 非 非真為假,非假為真 not true n...
python筆記29 資料分析之相關分析
coding utf 8 1.概念 相關分析 correlation analysis 是研究兩個或兩個以上隨機變數之間相互依存關係的方向和密切程度的方法。相關分析分為 線性相關 非線性相關 這裡我們主要介紹常用的線性相關,線性相關也稱為直線相關,也就是當乙個連續變數發生變動時,另乙個連續變數相應的...
Python資料分析筆記(二)
接上文python資料分析筆記 一 關注一些每行資料的 a 字段 發現這行含有url短操作的瀏覽器,裝置,應用程式的相關資訊 我們現在想要按微軟使用者和非微軟使用者對時區資訊進行分解,即想知道不同時區微軟使用者和非微軟使用者的比例 假定 a 欄位中含有 windows 的就認為是微軟使用者 首先,去...