「一方水土養一方人」,其實也就是地理加權回歸的核心和出發點——考慮空間關係的影響。當我們在做回歸分析的時候,如果樣本分佈在不同的區域,而不同區域之間某些對因變數產生影響的因素差異很大(稱之為:存在「空間異質性」),這個時候我們可能就需要考慮空間關係對模型的影響。引入地理加權回歸。
來自 這樣一來,對研究區域進行分割槽,然後在子區域裡面進行回歸分析的方法,似乎有點不完美了。因為:
一是因為在同乙個區域內的所有樣本點,無論它們之間是比較近還是比較遠,經典線性回歸模型都不會考慮距離對他們的相互影響,直接湊在一起進行計算,從全域性視角看,是分割槽了。但是從區域性視角看,依然難以避免經典線性回歸的通病——沒有體現地理學第一定律。
來自 具體計算的時候,我們用的是乙個函式來確定權重與距離的關係:距離是自變數,權重是因變數。多長的距離對應多大的權重。這個函式,我們一般叫做「核函式」。這是乙個下降的函式——距離越大,權重越小。這裡先不深入討論,知道就好。
每乙個樣點,都有自己的回歸方程——「個個都一樣」
上面說到,要「以一定距離為半徑的範圍內」那麼這個「範圍」怎樣確定呢?在地理加權回歸中,確定這個「範圍」的半徑,我們叫作「頻寬」bandwidth(這是乙個非常重要的引數,直接影響整個模型的擬合效果)。至於怎麼確定頻寬,主要有兩種方法:aic和cv。你問我是什麼?不急,我們以後再說,你只要知道確定頻寬這兩種方法就好了。
記住:是頻寬,不是寬頻
同時我們需要注意一點,頻寬和核函式,是緊密相關的。一般來說頻寬越大,核函式下降得越平緩,如果頻寬接近無限大,那核函式就接近於一條直線——無論什麼距離下,計算出來權重都是一樣的。相反,頻寬越小,核函式下降越陡峭。
來自 所以頻寬所確定的範圍,一般是小於研究區域的範圍。因為如果這個範圍大於研究區域的範圍,那就變成了對整個範圍的回歸分析,任何距離下計算出來的權重都是一樣的,也就變成了經典線性回歸。
來自
r語言 面板資料回歸 R語言 地理加權回歸分析
理論知識 地理加權回歸 geographically weighted regression,gwr 是一種空間分析技術,廣泛應用於地理學及涉及空間模式分析的相關學科。gwr通過建立空間範圍內每個點處的區域性回歸方程,來探索研究物件在某一尺度下的空間變化及相關驅動因素,並可用於對未來結果的 由於它考...
白話空間統計二十四 地理加權回歸(一)
二十四在人的生活中有舉足輕重的地位,一年有二十四個節氣,一天有二十四個小時。中國的正史稱之為 二十四史 有人說加清史就二十五了 但是正史這個詞,出自清乾隆欽定二十四史,所以一直 正史 這個詞,專指二十四史 白話空間統計寫到現在,歷時18個月,終於寫到這個一元復始的二十四章了。地理加權的回歸分析是空間...
白話空間統計二十四 地理加權回歸(四)
本來這一章準備直接寫 照抄 arcgis的幫助文件,寫地理加權回歸工具的使用 然後就直接結束地理加權回歸的,但是近來收到不少同學的郵件,很多都是掉在了當年蝦神挖出的大坑裡面,比如寫了方法,沒有列出公式,又比如寫了公式木有推導過程 作為高數戰五渣的蝦神,推導這種事,他認識我,我不認識他 所以這次寫gw...