在資料分析的過程中,我們常常需要分析兩個或兩個以上現象之間的因果關係,一般來說,常考慮下面的幾種分析方法:
相關分析
:不需要區分自變數和因變數,兩個或者多個變數之間是平等的關係。通過相關分析可以了解變數之間的密切程度。如:教育事業的發展與科學技術的發展存在著一定的關係,學生的數學成績與物理成績存在著一定的關係,相關分析就是要分析這種密切程度。
回歸分析
:區分自變數和因變數,適合於因變數和自變數均為連續變數的情況,建立回歸方程,要找出因變數和自變數之間的具體的相關關係。如「收入」和「產品銷售量」的回歸關係。
方差分析
:適用於因變數為連續性變數、
自變數為分類變數的情況,如「收入」對「使用者滿意度」的影響。
本小結著重總結相關分析。
相關型別: 1
、直線相關:兩變數呈線性共同增大,或一增一減,要求兩個變數服從聯合的正態分佈,若不服從,則要考慮變數變換,或者採用等級相關來分析。 2
、曲線相關:兩變數存在相關趨勢,但非線性。此時若進行直線相關,有可能出現無相關性的結論,曲線相關分析是一般都先將變數進行變數變換,以將趨勢變換為直線分析,或者採用曲線回歸方法來分析。
相關的方向
依照兩種變數變動的方向分,有正相關、負相關和無相關(零相關)。 1
、正相關:一種變數增加或減少,另一種變數也在增加或減少,兩種變數變動的方向相同,謂之正相關。 2
、負相關:一種變數增加或減少,另一種變數也在減少或增加,兩種變數變動的方向相反,謂之負相關。 3
、無相關:在兩種變數之間,一種變數變動時,另一種變數毫無變動,即使變動也無一定的規律,如人的相貌與人的思想品德,人的身體高矮與學習成績的好壞等是無什麼關係的,這兩種變數的關係謂之無相關或零相關。
相關分析針對的資料型別以及計算相關程度的統計量: 1
、兩個連續性變數:
兩個連續變數間呈線性相關時,且兩變數服從聯合正態分佈,使用
pearson
積差相關係數。若不滿足積差相關分析的適用條件時,使用
spearman
秩相關係數來描述。
spearman
相關係數又稱秩相關係數,是利用兩變數的秩次大小作線性相關分析,對原始變數的分布不作要求,屬於非引數統計方法,適用範圍要廣些。對於服從
pearson
相關係數的資料亦可計算
spearman
相關係數,但統計效能要低一些。
spearman
相關係數的計算公式可以完全套用
pearson
相關係數計算公式,但公式中的x和
y用相應的秩次代替即可。 2
、兩個有序分類變數:
kendall'stau-b
等級相關係數:用於反映分類變數相關性的指標,適用於兩個分類變數均為有序分類的情況。對相關的有序變數進行非引數相關檢驗;
取值範圍在
-1-1
之間,此檢驗適合於正方形**;
其他:偏相關分析
適用於在控制其他變數影響的情況下對兩個變數進行相關分析,被分析的兩個變數必須服從正態分佈。比如說,一般情況下,體重和身高呈正相關,如果還要考慮胸圍,則在胸圍固定的情況下(取胸圍的平均值,假設獲獎所有個體的胸圍都校正為相同的情況下)再求體重和公升高的相關(偏相關),則偏相關呈負值。
相關分析的總結
在乙個 w 視窗中,有著 n n 個畫素,在這個二維的視窗中每個點的梯度方向用 g 表示,則該視窗的梯度集為 g m i 1 w。為了求解該結構的走向,即求出該梯度集的法向 v v為單位向量 方向 v 可以通過計算 g 上的所有梯度在 g 上的投影的平方和的最小值得到。梯度在 g 上的投影的平方和的...
E OA相關故障分析總結
1 全員參與統計失敗 由於早期調整ec gy dept時調整cdepcode長度為100 cdepname長度為60 而統計表中兩張表的ec oa bumenqycy及 ec oa ftstatistics兩張表的字段字元長度過短導致統計出錯。修正後即可解決 2 資料庫資料清除 刪除惡意訪問日誌 d...
數學建模之相關分析分類與總結
相關分析是一種重要的統計方法,相關分析是研究兩個或兩個以上處於同等地位的隨機變數間的相關關係的統計分析方法。例如,人的身高和體重之間 空氣中的相對濕度與降雨量之間的相關關係都是相關分析研究的問題。相關分析與回歸分析之間的區別 回歸分析側重於研究隨機變數間的依賴關係,以便用乙個變數去 另乙個變數 相關...