數學建模多元分析例項
原文:linkage
cluster
zsore
dendrogram
clusterdata
squareform
例項
a = [1,0;1,1;3,2;4,3;2,5];
y = pdist(a,'cityblock');
yc = squareform(y);
z = linkage(y);
dendrogram(z);
t = cluster(z,'maxclust',3)
主成分分析(降低維度)
使用例項:
因子分析
使用例項
判別分析(判別個體所屬類別)
典型相關分析
對應分析(q型和r型的結合)
a = [543
342453
609261
360243
183;245
785630
597311
233108
69;300
200489
740365
324327
228;401
396395
693350
309263
143;147
117410
726366
447329
420];
%行和a_i_dot = sum(a,2);
%列和a_dot_j = sum(a);
%資料和
t = sum(a_i_dot);
%對應矩陣
p = a/t;
%邊緣分布
r = sum(p,2);
c = sum(p);
%計算行輪廓分布陣
row_prifile = a./repmat(sum(a,2),1,size(a,2));
%標準化資料陣
b = (p - r*c) ./ sqrt((r*c));
%對標準化後的資料陣作奇異值分解
[u s v] = svd(b,'econ');
%修改特徵向量的符號矩陣
w1 = sign(repmat(sum(v),size(v,1),1));
%使得v中每乙個行向量的分量和大於0
w2 = sign(repmat(sum(v),size(u,1),1));
%修改特徵向量的正負號
vb = v.*w1;
ub = u.*w2;
%計算慣量
lamda = diag(s).^2;
%計算卡方統計量的分解
ksi2square = t*(lamda);
%計算總卡方統計量
t_ksi2square = sum(ksi2square);
%計算貢獻率
con_rate = lamda/sum(lamda);
%計算累積貢獻率
cum_rate = cumsum(con_rate);
%求加權特徵向量
beta = diag(r.^(-1/2))*ub;
%求行輪廓座標
g = beta*s;
%求加權特徵向量
alpha = diag(c.^(-1/2))*vb;
%求列輪廓座標
f = alpha*s;
%樣本點的個數
num1 = size(g,1);
%行座標的取值範圍
rang = minmax(g(:,[1,2])');
%畫圖調整
delta = (rang(:,2)-rang(:,1))/(4*num1);
chrow = ;
strcol = ;
plot(g(:,1),g(:,2),'*','color','k','linewidth',1.3);
text(g(:,1),g(:,2)-delta(2),chrow);
hold on;
plot(f(:,1),f(:,2),'h','color','k','linewidth',1.3);
text(f(:,1)-delta(1),f(:,2)+1.2*delta(2),strcol);
xlabel('dim1');
ylabel('dim2');
多維標度分析
d = [0
1sqrt(3) 2
sqrt(3) 1
1; zeros(1,2) 1
sqrt(3) 2
sqrt(3) 1; zeros(1,3) 1
sqrt(3) 2
1; zeros(1,4) 1
sqrt(3) 1; zeros(1,5) 1
1;zeros(1,6) 1;zeros(1,7)];
d = d + d';
[y,eigvals] = cmdscale(d);
plot(y(:,1),y(:,2),'o','color','k','linewidth',1.3)
fisher線性判別 多元分析(3) 判別分析
木水小亭 數模系列 7 fisher判別分析 fisher discriminant analysis zhuanlan.zhihu.com 在計算距離時,我們最常用的歐式距離,但是在統計學中,歐式距離就不適用了,統計學中常用馬氏 mahalanobis 距離來定義 距離 這個概念,馬氏距離的計算公...
數學建模資料分析中的多元線性回歸分析
多元線性回歸分析 通過研究自變數 x xx 和因變數 y yy 的相關關係,嘗試去解釋 y yy 的形成機制,進而達到通過 x xx 去 y yy 的目的 2 多元線性回歸分析 7.擬合優度 r 2r 2 r2較低的解決方法 8.擾動項與異方差 9.多重共線性 3 stata的使用 不同分類的資料的...
R語言多元分析系列之一 主成分分析
主成分分析 principal components analysis,pca 是一種分析 簡化資料集的技術。它把原始資料變換到乙個新的座標系統中,使得任何資料投影的第一大方差在第乙個座標 稱為第一主成分 上,第二大方差在第二個座標 第二主成分 上,依次類推。主成分分析經常用減少資料集的維數,同時保...