如何進行負二項回歸分析?

2022-08-23 07:15:10 字數 3352 閱讀 9828

如果研究x對於

y的影響,

y是計數資料,一般可以使用

poisson

回歸進行研究。但是

poisson

回歸要求資料滿足等離散現象(平均值與方差相等),如果說資料具有一定的聚焦性,此時很可能就會產生過離散現象,即資料平均值與方差明顯不相等。此時使用負二項回歸更為科學。

比如研究傳染病人數,傳染病人數明顯具有一些空間聚焦現象;以及專利數量,很可能企業之間存在著某種空間意義上的競爭,導致資料具有聚焦現象,諸如此類資料其並不滿足poisson分布的獨立性原則。此類資料通常情況下方差會明顯的大於平均值,屬於過離散資料,此種資料在進行

poisson

回歸時會導致模型引數估計值的標準誤偏小

因而,如果計數資料不適合poisson分布時,尤其是資料過離散時,此時使用負二項回歸分析更合適。

當前有一項針對專利數量的影響關係研究,研究**對於企業的支援力度,是否一線城市,對於企業專利數量的影響情況。共收集10個城市的資料,如下:

x1是否一線城市

x2**扶持力度

y專利數量

weight企業數量08

40832817

1333218516

1305477215

1027215904

719205103

309621602

1612306502

3814820701

117267501

4181343

x1是否一線城市:數字

1表示為一線城市,數字

0表示非一線城市;

x2**扶持力度:數字越大表示對於企業申請專利時的扶持力度越大;

y專利數量:數字表示某城市調研所有企業申請成功的專利數量;

weight企業數量:數字表示某城市調研的企業數量。

關於過離散的檢驗有很多檢驗方法,在spssau系統中可有三種方式進行綜合判斷,分別如下:

登入spssau,選擇【實驗

/醫學研究】

--【負二項回歸】。

本例子中專利數量是基於『weight

企業數量』,因此『基數

eposure

【可選】』框中應該放入『

weight

企業數量』這項,如下圖:

(1)過度離散檢驗

在進行負二項回歸之前,專利數量的平均值是56.500,方差是

2480.944

,明顯平均值與方差不相等,存在過離散現象。而且使用

spssau

的poisson

回歸時,對其提供的

o檢驗發現,

o值明顯大於

1.96

(p=0.000 <0.05

),拒絕等離散假定,說明資料存在明顯的過離散現象,因此使用負二項回歸較為適合。

(2)負二項回歸模型似然比檢驗

spssau共輸出兩個**,分別是「負二項回歸模型似然比檢驗」,「負二項回歸分析結果彙總」。 「負二項回歸模型似然比檢驗」是針對整個模型的檢驗,如果說模型

p值小於

0.05

,意味著放入自變數更優,即模型有意義。「負二項回歸分析結果彙總」是回歸結果的具體結果。

模型似然比檢驗用於對整體模型有效性進行分析。

第一:首先對p值進行分析,如果該值小於

0.05

,則說明模型有效;反之則說明模型無效;

第二:aic值和

bic值可用於多次分析模型時的對比;此兩個值越低越好;如果多次進行分析,對比該兩個值的變化情況,綜合說明模型構建的優化過程;

首先對模型整體有效性進行分析,模型檢驗的原定假設為:是否放入自變數(x1是否一線城市

, x2

**扶持力度)兩種情況時模型質量均一樣;檢驗p值為

0.000

小於0.05

,因而說明拒絕原定假設,即說明本次構建模型時,放入的自變數具有有效性,本次模型構建有意義。

(3)負二項回歸分析結果彙總表

從上表可知,將x1是否一線城市

, x2

**扶持力度共

2項為自變數,而將

y專利數量作為因變數進行負二項回歸分析,從上表可以看出,模型公式為:

log(y)=-10.316 + 0.213*x1

是否一線城市

+ 0.680*x2

**扶持力度

+ ln(weight

企業數量

)。模型的偽

r方值(

mcfadden r

方)為0.196

,說明研究模型可以解決專利數量

19.6%

的原因。

具體分析可知:

x1是否一線城市的回歸係數值為

0.213

,但是並沒有呈現出顯著性

(z=0.462

,p=0.644>0.05)

,意味著

x1是否一線城市並不會對

y專利數量產生影響關係,即城市類別與專利數量無明顯關係。

x2**扶持力度的回歸係數值為

0.680

,並且呈現出

0.01

水平的顯著性

(z=6.490

,p=0.000 <0.01)

,意味著

x2**扶持力度會對

y專利數量產生顯著的正向影響關係

,以及優勢比

(or值

, exp(b)值)

為1.973

,意味著

x2**扶持力度增加乙個單位時,

y專利數量的增加幅度為

1.973

倍。

如何進行堆疊分析

1.平常會遇到程式卡的時間很久,不知道什麼原因,有可能是請求慢,或者是出錯了,或者是服務繁忙 一 windows環境下 1.必須有jdk,如果配置了環境變數則可以直接用cmd命令進入dos視窗,jps檢視現現行的程式,如 1680 emp 表示emp 執行的程序號,執行程式的時候,輸入jstack ...

如何進行軟體需求分析

概念 需求的定義包括從使用者角度 系統的外部行為 以及從 開發者角度 一些內部特性 來闡述需求。關鍵的問題是一定要編寫需求文件。我曾經目睹過乙個專案中途更換了所有的 開發者,客戶被迫與新的需求分析者坐到一起。系統的分析人員說 我們想與你談談你的需求。客戶的第一反應便是 我已經將我的要求都告訴你們前任...

如何進行軟體需求分析

如何進行軟體需求分析 1 概念 需求的定義包括從使用者角度 系統的外部行為 以及從開發者角度 一些內部特性 來闡述需求。關鍵的問題是一定要編寫需求文件。我曾經目睹過乙個專案中途更換了所有的開發者,客戶被迫與新的需求分析者坐到一起。系統的分析人員說 我們想與你談談你的需求。客戶的第一反應便是 我已經將...