Logistic回歸模型

2021-07-12 07:30:53 字數 911 閱讀 3933

一、logistic回歸模型

線性回歸模型要求因變數是連續型正態變數。

當因變數是分類變數時,logistic回歸模型是最好的回歸模型。

由於y只能取兩個值1或0,y的條件數學期望:

e(y|xi)=1*p(y=1|xi)+0*p(y=0|xi)=p(y=1|xi)

選擇乙個函式,p(y=1|x)=f(x)=logistic函式,作為回歸方程。即利用觀測資料(xi,yi)擬合乙個logistic函式。

根據logistic函式的定義

p=p(y=1|x)=exp(a+b*x)/(1+exp(a+b*x)),這裡p/(1-p)=exp(a+b*x)。

二、引數估計

極大似然估計的基本思想:既然一次取樣得到了樣本,那麼這個樣本出現的可能性應該極大,最大化思然函式,求出未知引數。

似然函式l=

πp(yi=m|x1i,x2i,...,xki)

對似然函式取對數求導,即可求得各係數。

三、回歸係數意義

回歸係數的估計值b反映了自變數x對因變數y的影響作用的大小。

四、擬合優度檢驗

ln(p/1-p)=a+b1*x1+b2*x2+...+bk*xk

皮爾遜x2檢驗法:通過比較模型**的和觀測的目標事件發生和不發生的頻數來檢驗模型成立的原假設。

x2統計量的值要是很小,意味著**值與觀測值之間沒有顯著區別,擬合很好,接受原假設模型。反之拒絕。

如何確定x2?

1、設定乙個「小概率」a(顯著性水平),一般取0.10,0.05,0.01,0.001等。

2、查表得到閾值x2。

3、比較,小於閾值接受,大於閾值拒絕。

五、流行資料分析平台及資料探勘工具介紹

sas    spss    weka    matlab    oracle    hadoop    

Logistic回歸模型

首先,可以通過向量化的方式來消除遍歷所有引數時使用的迴圈 然後,集中精力使用向量化技術消除另乙個迴圈,即用來遍歷所有訓練樣本的迴圈 第一步,將線性變換過程改寫為向量化 第二步,將啟用過程改寫為向量化 第三步,做偏導數的向量化 第四步,求出梯度中權值w的向量化表示 第五步,求出梯度中偏置b的向量化表示...

logistic回歸 logistic回歸

logistic回歸 logistic回歸分析可用於估計某個事件發生的可能性,這是乙個分類模型而不是乙個回歸模型!它的基本思想是利用一條直線將平面上的點分為兩個部分,即兩個類別,要解決的問題就是如何擬合出這條直線,這個擬合的過程就稱之為 回歸 logistic模型 假設你有乙個需要 的內容,要通過三...

logistic分類(logistic回歸 LR)

幾乎所有的教材都是從logistic分類開始的,因為logistic分類實在太經典,而且是神經網路的基本組成部分,每個神經元 cell 都可以看做是進行了一次logistic分類。所謂logistic分類,顧名思義,邏輯分類,是一種二分類法,能將資料分成0和1兩類。logistic分類的流程比較簡單...