飯飯認認公尺
面板資料(panel data),也成平行資料,具有時間序列和截面兩個維度,整個**排列起來像是乙個面板。
面板資料舉例:
1、首先確定解釋變數和因變數;
2、r語言運算元據格式,部分截圖如下,這裡以index3為因變數,index1與index2為解釋變數:
##載入相關包
install.packages("mice")##缺失值處理
install.packages("plm")
install.packages("msbvar")
library(plm)
library(msbvar)
library(tseries)
library(xts)
library(mice)
data
2、單位根檢驗:資料平穩性
為避免偽回歸,確保結果的有效性,需對資料進行平穩性判斷。何為平穩,一般認為時間序列提出時間趨勢和不變均值(截距)後,剩餘序列為白雜訊序列即零均值、同方差。常用的單位根檢驗的辦法有llc檢驗和不同單位根的fisher-adf檢驗,若兩種檢驗均拒絕存在單位根的原假設則認為序列為平穩的,反之不平穩(對於水平序列,若非平穩,則對序列進行一階差分,再進行後續檢驗,若仍存在單位根,則繼續進行高階差分,直至平穩,i(0)即為零階單整,i(n)為n階單整)。
##單位根檢驗
tlist1
adf.test(tlist1)
tlist2
adf.test(tlist2)
3、協整檢驗/模型修正
單位根檢驗之後,變數間是同階單整,可進行協整檢驗,協整檢驗是用來考察變數間的長期均衡關係的方法。若通過協整檢驗,則說明變數間存在長期穩定的均衡關係,方程回歸殘差是平穩的,可進行回歸。
格蘭傑因果檢驗:前提是變數間同階協整,通過條件概率用以判斷變數間因果關係。
##格蘭傑因果檢驗
granger.test(tsdata,p=2)
4、模型選擇
面板資料模型的基本形式
也可寫成:
其中:
對於平衡的面板資料,即在每乙個截面單元上具有相同個數的觀測值,模型樣本觀測資料的總數等於nt。
當n=1且t很大時,就是所熟悉的時間序列資料;當t=1而n很大時,就只有截面資料。
form
rankdata
pool
pooltest(form,data=rankdata,effect="individual",model="within")#檢驗個體間是否有差異
pooltest(form,data=rankdata,effect="time",model="within")#檢驗不同時間是否有差異
wipooltest(pool,wi)#f檢驗判斷混合模型與固定效應模型比較
phtest(form,data=rankdata)##hausman檢驗判斷應該採用何種模型,隨機效應模型檢驗
pbgtest(form,data=rankdata,model="within")#lm檢驗,隨機效應模型檢驗
#檢驗是否存在序列相關
pwartest(form,data=rankdata)#wooldridge檢驗(自相關)小於0.05存在序列相關
summary(wi)##檢視擬合模型資訊
fixef(wi,effect="time")#不同時間對因變數的影響程度的係數估計值
inter
##根據模型引數,進行**;
注:有些地方,尤其r**部分有些亂,需根據實際資料情況進行選擇,函式的引數設定並未完全吃透,還需要繼續學習,如有不對的地方,再改正,目前的理解是這樣了,在本次資料場景中,實際資料應用中**效果不是很好,誤差稍大,這次未採用,以後遇到可以再嘗試。 面板資料分析步驟及流程 R語言
1 首先確定解釋變數和因變數 以index3為因變數,index1與index2為解釋變數 2 單位根檢驗 資料平穩性 為避免偽回歸,確保結果的有效性,需對資料進行平穩性判斷。何為平穩,一般認為時間序列提出時間趨勢和不變均值 截距 後,剩餘序列為白雜訊序列即零均值 同方差。常用的單位根檢驗的辦法有l...
r語言 面板資料回歸 R語言分析面板資料 簡單案例
r語言分析面板資料 簡單案例 標籤 r語言 面板資料 1.面板資料定義 2.r語言中進行面板資料分析的包 plm 3.乙個關於工資水平的案例 資料一覽 code r install.packages plm library plm data wages package plm rd plm lwag...
R語言 資料分析
二 大資料分析 三 資料分析常用工具 資料分析是指用適當的統計方法對收集來的大量第一手資料和第二手資料進行分析,以求最大化地開發資料資料的功能,發揮資料的作用。資料分析是為了驗證假設的問題,需要提供必要的資料驗證。分析模型構建完成後,需要利用測試資料驗證模型的正確性。資料分析是為了挖掘更多的問題,並...