粒子濾波(pf:particle filter) 與卡爾曼濾波(kalman filter)相比較
粒子濾波(pf: particle filter)的思想基於蒙特卡洛方法(monte carlo methods),它是利用粒子集來表示概率,可以用在任何形式的狀態空間模型上。其核心思想是通過從後驗概率中抽取的隨機狀態粒子來表達其分布,是一種順序重要性取樣法(sequential importance sampling)。簡單來說,粒子濾波法是指通過尋找一組在狀態空間傳播的隨機樣本對概率密度函式 進行近似,以樣本均值代替積分運算,從而獲得狀態最小方差分布的過程。這裡的樣本即指粒子,當樣本數量n→∝時可以逼近任何形式的概率密度分布。
儘管演算法中的概率分布只是真實分布的一種近似,但由於非引數化的特點,它擺脫了解決非線性濾波問題時隨機量必須滿足高斯分布的制約,能表達比高斯模型更廣泛的分布,也對變數引數的非線性特性有更強的建模能力。因此,粒子濾波能夠比較精確地表達基於觀測量和控制量的後驗概率分布,可以用於解決slam問題。
粒子濾波的應用
粒子濾波的缺點
雖然粒子濾波演算法可以作為解決slam問題的有效手段,但是該演算法仍然存在著一些問題。其中最主要的問題是需要用大量的樣本數量才能很好地近似系統的後驗概率密度。機械人面臨的環境越複雜,描述後驗概率分布所需要的樣本數量就越多,演算法的複雜度就越高。因此,能夠有效地減少樣本數量的自適應取樣策略是該演算法的重點。另外,重取樣階段會造成樣本有效性和多樣性的損失,導致樣本貧化現象。如何保持粒子的有效性和多樣性,克服樣本貧化,也是該演算法研究重點。
粒子濾波的發展
1.mcmc改進策略
馬爾可夫鏈蒙特卡洛(mcmc)方法通過構造markov鏈,產生來自目標分布的樣本,並且具有很好的收斂性。在sis的每次迭代中,結合mcmc使粒子能夠移動到不同地方,從而可以避免退化現象,而且markov鏈能將粒子推向更接近狀態概率密度函式(probability density function,(pdf))的地方,使樣本分佈更合理。基於mcmc改進策略的方法有許多,常用的有gibbs取樣器和metropolishasting方法。
2.unscented粒子濾波器(upf)
unscented kalman濾波器(ukf)是julier等人提出的。ekf(extended kalman filter)使用一階taylor展開式逼近非線性項,用高斯分布近似狀態分布。ukf類似於ekf,用高斯分布逼近狀態分布,但不需要線性化只使用少數幾個稱為sigma點的樣本。這些點通過非線性模型後,所得均值和方差能夠精確到非線性項taylor展開式的二階項,從而對非線性濾波精度更高。merwe等人提出使用ukf產生pf的重要性分布,稱為unscented粒子濾波器(upf),由ukf產生的重要性分布與真實狀態pdf的支集重疊部分更大,估計精度更高。
3.rao-blackwellised粒子濾波器(rbpf)
在高維狀態空間中取樣時,pf的效率很低。對某些狀態空間模型,狀態向量的一部分在其餘部分的條件下的後驗分布可以用解析方法求得,例如某些狀態是條件線性高斯模型,可用kalman濾波器得到條件後驗分布,對另外部分狀態用pf,從而得到一種混合濾波器,降低了pf取樣空間的維數,rbpf樣本的重要性權的方差遠遠低於sir方法的權的方差,為使用粒子濾波器解決 slam問題提供了理論基礎。而montemerlo等人在2023年首次將rao-blackwellised粒子濾波器應用到機械人slam中,並取名為fastslam演算法。該演算法將slam問題分解成機械人定位問題和基於位姿估計的環境特徵位置估計問題,用粒子濾波演算法做整個路徑的位姿估計,用ekf估計環境特徵的位置,每乙個ekf對應乙個環境特徵。該方法融合ekf和概率方法的優點,既降低了計算的複雜度,又具有較好的魯棒性。
最近幾年,粒子方法又出現了一些新的發展,一些領域用傳統的分析方法解決不了的問題,現在可以借助基於粒子**的方法來解決。在動態系統的模型選擇、故障檢測、診斷方面,出現了基於粒子的假設檢驗、粒子多模型、粒子似然度比檢測等方法。在引數估計方面,通常把靜止的引數作為擴充套件的狀態向量的一部分,但是由於引數是靜態的,粒子會很快退化成乙個樣本,為避免退化,常用的方法有給靜態引數人為增加動態雜訊以及kernel平滑方法,而doucet等提出的點估計方法避免對引數直接取樣,在粒子框架下使用最大似然估計(ml)以及期望值最大(em)演算法直接估計未知引數。
粒子濾波概述
粒子濾波器是貝葉斯濾波器的一種非引數執 況,且經常用於估計乙個動態系統的狀態。粒子濾波器的關鍵思想是採用一套假設 即粒子 來表示後驗概率,其中每乙個假設代表了這個系統可能存在的一種潛在狀態。狀態假設表示為乙個有 n 個加權隨機樣本的集合 s s left w i 1,2,n right 式中 s 是...
粒子濾波跟蹤方法
粒子濾波法是指通過尋找一組在狀態空間傳播的隨機樣本對概率密度函式進行近似,以樣本均值代替積分運算,從而獲得狀態最小方差分布的過程。對於粒子濾波跟蹤方法,這裡有一篇很淺顯易懂的部落格,我分享給大家他的工作也是參考rob hess的程式做的,感謝老外的開源精神,我看了他的程式,我也提出了我的幾點改進,作...
粒子濾波學習總結
粒子濾波是在貝葉斯濾波的基礎上,結合蒙特卡洛方法實現遞推後驗概率。對於一般的線性高斯系統有比較好的效果,但是對於一般的非線性非高斯系統,貝葉斯濾波效果並不好。所以引入蒙特卡洛方法,蒙特卡洛方法簡單來說就是通過大量的隨機樣本,去了解乙個系統,進而得到所要計算的值。再引入蒙特卡洛方法後相應也伴隨著一些問...