計量經濟學中混頻資料的處理

2022-06-06 10:09:08 字數 3651 閱讀 5954

目錄橋接等式

混合資料抽樣(mixed-data sampling,midas)

ar-midas

案例相關軟體

參考文獻

從若干學術**中總結出的一些混頻資料處理技術、模型與使用案例,希望為賣方的巨集觀研究提供來自學術界的思路。為了顧及實踐中的可操作性,忽略了一些結構過於複雜的技術或模型。

標準的整合方法根據低頻資料的週期對高頻資料做平均或累加,另一種方法是根據低頻資料的週期選取高頻資料的最新值。

插值方法不常用,實施分兩步:

低頻資料對映到高頻時間索引上,缺失值用插值補全;

在增廣資料及上擬合模型引數。

可能需要考慮度量增加插值資料帶來的誤差。

由於統計資料的發布有時間延遲,在實際使用**模型時可能某些高頻資料尚未發布,這時就需要橋接等式補全未發布的資料。

橋接等式是用於連線高頻資料和低頻資料的線性回歸,橋接等式:

\[y_ = \alpha + \sum_^\beta_i(l)x_ + u_

\]其中,\(\beta_i(l)\) 是乙個階數為 \(k\) 的滯後多項式,\(x_\) 是整合後的高頻指標。

橋接等式的實施分兩步:

對高頻資料建立**模型,並將**資料整合,與低頻資料的頻率保持一致;

將整合後的資料放入橋接等式中做回歸。

高頻資料上的**模型通常是自回歸模型。

作者針對真實 gdp(rgdp)建立了乙個 arx **模型,其中 x 分別是就業(emp)和消費(cons)。由於外部變數的發布頻率為月度,模型中實際使用的資料為月度資料的季度平均。

在使用模型做**時,若只能獲得上個季度的部分月度資料,則先對月度資料建立單變數**模型(滾動建模,保持引數估計的樣本數一致),**剩餘月份的資料,再將已知資料和**資料放在一起計算季度平均,最後放進 arx 模型中。

「橋接等式」並未真正解決將高、低頻資料納入到乙個統一模型框架下的問題,資料的整合不可避免。 midas 巧妙地應用「集約引數化」的手段使得高頻資料在無需整合的前提下可以作為低頻資料的解釋變數。在某些情形下,若選擇的高頻資料是來自金融市場的交易資料,則可以實現對低頻資料的實時**。

符號約定:

提前 \(h_q\) 步的**模型:

\[y_ = y_ = \beta_0 + \beta_1 b(l_m;\theta)x_^ + \varepsilon_

\]\[y_ = y_ = \beta_0 + \sum_^n \beta_i b(l_m;\theta_i)x_^ + \varepsilon_

\]其中,\(h_q=h_m/m\),\(b(l_m;\theta) = \sum_^k c(k;\theta) l_m^k\),\(l_m^k x_^ = x_^\),\(x_^\) 是從高頻資料 \(x_\) 中的跳躍取樣。

**值為:

\[\hat y_ = \hat \beta_0 +

\hat \beta_1 b(l_m;\hat \theta)x_^ \\

\hat y_ = \hat \beta_0 +

\sum_^n \hat \beta_i b(l_m;\hat \theta_i)x_^

\]對 \(c(k;\theta)\) 的集約引數化(parameterization in a parsimonious way)是 midas 的關鍵,常用選擇有兩個:

exponential almon lag

\[c(k;\theta) = \frac

^k \exp(\theta_1 k + \cdots + \theta_q k^q)}

\]beta lag

\[c(k;\theta_1,\theta_2) = \frac

^k f(\frac kk;\theta_1,\theta_2)}

\]其中,\(f(x,a,b) = \frac(1-x)^\gamma (a+b)}\),\(\gamma(a) = \int_0^\infty e^x^dx\)

其他集約引數化

\[c(k;\theta) = \frac 1k

\]\[c(k;\theta) = \frac^k g(\frac kk, \theta)}

\]其中,\(g(k,\theta) = \frac\)

\[c(k;\theta) = \frac^\infty \theta^k}, \mid \theta \mid \le 1

\]ar-midas 中一階自回歸模型最為常見。

\[y_ = \beta_0 + \lambda y_ + \beta_1 b(l_m;\theta)(1-\lambda l_m^m)x_^ + \varepsilon_

\]\[y_ = \beta_0 + \lambda y_ + \beta_1 b(l_m;\theta)(1-\lambda l_m^)x_^ + \varepsilon_

\]遞迴式的引數估計

估計對應的基本 midas 模型,得到殘差估計 \(\hat \varepsilon_\);

並算出 \(\lambda\) 的初始值 \(\lambda_0\),\(\hat\lambda_0 = (\sum \hat \varepsilon^2_)^\sum \hat \varepsilon_ \hat\varepsilon_\);

構造新變數 \(y^*_ = y_ - \hat\lambda_0y_​\) 以及 \(x^_ = x^_ - \hat\lambda_0 x^_​\)

對 \(y^*_ = \beta_0 + \beta_1 b(l_m;\theta)x^_ + \varepsilon_\) 應用 nls,得到估計 \(\hat \theta_1\) 和 新的殘差;

重複 2、3、4 步,直到估計值 \(\hat \lambda\) 和 \(\hat \theta\) 穩定。

作者使用月度資料工業產值(ip)、就業(emp)和裝置開工率(cu)聯合產出增速(季度資料)建立乙個 ar-midas 模型,**下季度產出增速。

作者將大量來自金融市場的每日資料和許多月度統計資料(集成為季度資料)與 gdp 增長率(季度)聯合起來建立 ar-midas 模型,實施策略有兩種:

用 pca 提取每日資料和季度資料的主成分,將主成分和 gdp 增長率聯合建立 ar-midas 模型;

用若干每日資料分別和 gdp 增長率聯合建立 ar-midas 模型,得到若干**結果,再將**加權平均。

作者挑選了幾個來自金融市場的資料與其他若干經濟指標(月度資料)聯合歐元區 hicp(調和消費者物價指數)建立起 hicp 的 ar-midas 模型,並借助金融市場的資料實現了對 hicp 的實時**。

金融市場資料報括:

經濟指標包括:

a survey of econometric methods for mixed-frequency data

using monthly data to predict quarterly

macroeconomic forecasting with mixedfrequency data forecasting us output growth

should macroeconomic forecasters use daily financial data and how

real-time forecasts of inflation the role of financial variables

計量經濟學建模 計量經濟學tips

01 計量建模時一般考慮線性模型,why?我的答案很簡單 why not?反正模型的形式是未知的。既然未知,為何不選最簡單的線性模型?02 很多教科書一討論引數估計,就搬出幾大標準 無偏性 有效性和一致性。這幾個性質的地位是不一樣的。一致性是最重要的,而有效性在它面前微不足道。至於有偏無偏,即使有偏...

計量經濟學建模 計量經濟學tips

01 計量建模時一般考慮線性模型,why?我的答案很簡單 why not?反正模型的形式是未知的。既然未知,為何不選最簡單的線性模型?02 很多教科書一討論引數估計,就搬出幾大標準 無偏性 有效性和一致性。這幾個性質的地位是不一樣的。一致性是最重要的,而有效性在它面前微不足道。至於有偏無偏,即使有偏...

計量經濟學建模 計量經濟學的25個Tips

自用,也方便給有緣之人。在經典假設不滿足的情況下,fgls不比ols更有效。小樣本時,dw test比lm test更powerful,因為lm test是乙個漸進的檢測。遞迴殘差比ols殘差更有資訊量。實際操作中,如果存在異方差,仍然使用ols,但方差估計值要選擇robust variance.如...