如果研究x對於
y的影響,
y是計數資料,一般可以使用
poisson
回歸進行研究。但是
poisson
回歸要求資料滿足等離散現象(平均值與方差相等),如果說資料具有一定的聚焦性,此時很可能就會產生過離散現象,即資料平均值與方差明顯不相等。此時使用負二項回歸更為科學。
比如研究傳染病人數,傳染病人數明顯具有一些空間聚焦現象;以及專利數量,很可能企業之間存在著某種空間意義上的競爭,導致資料具有聚焦現象,諸如此類資料其並不滿足poisson分布的獨立性原則。此類資料通常情況下方差會明顯的大於平均值,屬於過離散資料,此種資料在進行
poisson
回歸時會導致模型引數估計值的標準誤偏小
因而,如果計數資料不適合poisson分布時,尤其是資料過離散時,此時使用負二項回歸分析更合適。
當前有一項針對專利數量的影響關係研究,研究**對於企業的支援力度,是否一線城市,對於企業專利數量的影響情況。共收集10個城市的資料,如下:
x1是否一線城市
x2**扶持力度
y專利數量
weight企業數量08
40832817
1333218516
1305477215
1027215904
719205103
309621602
1612306502
3814820701
117267501
4181343
x1是否一線城市:數字關於過離散的檢驗有很多檢驗方法,在spssau系統中可有三種方式進行綜合判斷,分別如下:1表示為一線城市,數字
0表示非一線城市;
x2**扶持力度:數字越大表示對於企業申請專利時的扶持力度越大;
y專利數量:數字表示某城市調研所有企業申請成功的專利數量;
weight企業數量:數字表示某城市調研的企業數量。
登入spssau,選擇【實驗
/醫學研究】
--【負二項回歸】。
本例子中專利數量是基於『weight
企業數量』,因此『基數
eposure
【可選】』框中應該放入『
weight
企業數量』這項,如下圖:
(1)過度離散檢驗
在進行負二項回歸之前,專利數量的平均值是56.500,方差是
2480.944
,明顯平均值與方差不相等,存在過離散現象。而且使用
spssau
的poisson
回歸時,對其提供的
o檢驗發現,
o值明顯大於
1.96
(p=0.000 <0.05
),拒絕等離散假定,說明資料存在明顯的過離散現象,因此使用負二項回歸較為適合。
(2)負二項回歸模型似然比檢驗
spssau共輸出兩個**,分別是「負二項回歸模型似然比檢驗」,「負二項回歸分析結果彙總」。 「負二項回歸模型似然比檢驗」是針對整個模型的檢驗,如果說模型
p值小於
0.05
,意味著放入自變數更優,即模型有意義。「負二項回歸分析結果彙總」是回歸結果的具體結果。
模型似然比檢驗用於對整體模型有效性進行分析。
第一:首先對p值進行分析,如果該值小於
0.05
,則說明模型有效;反之則說明模型無效;
第二:aic值和
bic值可用於多次分析模型時的對比;此兩個值越低越好;如果多次進行分析,對比該兩個值的變化情況,綜合說明模型構建的優化過程;
首先對模型整體有效性進行分析,模型檢驗的原定假設為:是否放入自變數(x1是否一線城市
, x2
**扶持力度)兩種情況時模型質量均一樣;檢驗p值為
0.000
小於0.05
,因而說明拒絕原定假設,即說明本次構建模型時,放入的自變數具有有效性,本次模型構建有意義。
(3)負二項回歸分析結果彙總表
從上表可知,將x1是否一線城市
, x2
**扶持力度共
2項為自變數,而將
y專利數量作為因變數進行負二項回歸分析,從上表可以看出,模型公式為:
log(y)=-10.316 + 0.213*x1
是否一線城市
+ 0.680*x2
**扶持力度
+ ln(weight
企業數量
)。模型的偽
r方值(
mcfadden r
方)為0.196
,說明研究模型可以解決專利數量
19.6%
的原因。
具體分析可知:
x1是否一線城市的回歸係數值為
0.213
,但是並沒有呈現出顯著性
(z=0.462
,p=0.644>0.05)
,意味著
x1是否一線城市並不會對
y專利數量產生影響關係,即城市類別與專利數量無明顯關係。
x2**扶持力度的回歸係數值為
0.680
,並且呈現出
0.01
水平的顯著性
(z=6.490
,p=0.000 <0.01)
,意味著
x2**扶持力度會對
y專利數量產生顯著的正向影響關係
,以及優勢比
(or值
, exp(b)值)
為1.973
,意味著
x2**扶持力度增加乙個單位時,
y專利數量的增加幅度為
1.973
倍。
如何進行堆疊分析
1.平常會遇到程式卡的時間很久,不知道什麼原因,有可能是請求慢,或者是出錯了,或者是服務繁忙 一 windows環境下 1.必須有jdk,如果配置了環境變數則可以直接用cmd命令進入dos視窗,jps檢視現現行的程式,如 1680 emp 表示emp 執行的程序號,執行程式的時候,輸入jstack ...
如何進行軟體需求分析
概念 需求的定義包括從使用者角度 系統的外部行為 以及從 開發者角度 一些內部特性 來闡述需求。關鍵的問題是一定要編寫需求文件。我曾經目睹過乙個專案中途更換了所有的 開發者,客戶被迫與新的需求分析者坐到一起。系統的分析人員說 我們想與你談談你的需求。客戶的第一反應便是 我已經將我的要求都告訴你們前任...
如何進行軟體需求分析
如何進行軟體需求分析 1 概念 需求的定義包括從使用者角度 系統的外部行為 以及從開發者角度 一些內部特性 來闡述需求。關鍵的問題是一定要編寫需求文件。我曾經目睹過乙個專案中途更換了所有的開發者,客戶被迫與新的需求分析者坐到一起。系統的分析人員說 我們想與你談談你的需求。客戶的第一反應便是 我已經將...