Rekurzivní Bayesův odhad

ikona
Tento článek potřebuje úpravy.
Můžete Wikipedii pomoci tím, že ho vylepšíte. Jak by měly články vypadat, popisují stránky Vzhled a styl, Encyklopedický styl a Odkazy.
ikona
Tento článek není dostatečně ozdrojován, a může tedy obsahovat informace, které je třeba ověřit.
Jste-li s popisovaným předmětem seznámeni, pomozte doložit uvedená tvrzení doplněním referencí na věrohodné zdroje.

Rekurzivní Bayesův odhad (též Bayesův filtr) je v informatice označení pro obecný pravděpodobnostní rekurzivní přístup v čase k odhadu neznámé funkce míry pravděpodobnosti využívající měření příchozích dat a matematického modelování tohoto procesu.

V robotice

Bayesův filtr je algoritmus využívaný v informatice pro výpočet možností na základě pravděpodobnosti, které dovolují robotu odvodit jeho polohu a orientaci. V podstatě umožňuje Bayesův filtr robotům neustále aktualizovat jejich nejpravděpodobnější pozici v systému souřadnic na základě nejaktuálnějších dat získaných ze senzorů. Je to rekurzivní algoritmus a sestává ze dvou částí: předpovědi a aktualizace. Pokud jsou hodnoty proměnných lineární a normálně rozděleny, je Bayesův filtr shodný s Kalmanovým filtrem.

Zjednodušeně řečeno, robot pohybující se po celé ploše (mřížce) může mít několik různých senzorů, které mu poskytují informace o jeho okolí. Robot tedy může začít s jistotou, že je na pozici (0, 0). Avšak se zvětšující se vzdáleností od jeho výchozí pozice má robot stále menší jistotu ohledně jeho polohy. Za pomoci Bayesova filtru se může robot rozhodnout o jeho pravděpodobné aktuální poloze a tato pravděpodobná pozice může být neustále aktualizována na základě dodatečných dat ze senzorů.

Model

Jako skutečný stav x {\displaystyle x} se předpokládá nepozorovaný Markovův proces, měřením z {\displaystyle z} jsou pozorovány stavy skrytého Markovova modelu (HMM). Následující obrázek znázorňuje Bayesovu síť skládající se z HMM.

Hidden Markov Model
Hidden Markov Model

Vzhledem k Markovovu předpokladu, je pravděpodobnost aktuálního skutečného stavu dána pouze bezprostředně předcházejícím stavem a není závislá na ostatních předešlých stavech.

p ( x k | x k 1 , x k 2 , , x 0 ) = p ( x k | x k 1 ) {\displaystyle p({\textbf {x}}_{k}|{\textbf {x}}_{k-1},{\textbf {x}}_{k-2},\dots ,{\textbf {x}}_{0})=p({\textbf {x}}_{k}|{\textbf {x}}_{k-1})}

Obdobně, měření v k-tém čase je závislé pouze na současném stavu a nikoli na ostatních předešlých stavech vzhledem k tomu současnému.

p ( z k | x k , x k 1 , , x 0 ) = p ( z k | x k ) {\displaystyle p({\textbf {z}}_{k}|{\textbf {x}}_{k},{\textbf {x}}_{k-1},\dots ,{\textbf {x}}_{0})=p({\textbf {z}}_{k}|{\textbf {x}}_{k})}

Pomocí těchto předpokladů lze rozdělení pravděpodobnosti pro všechny stavy zapsat jednoduše jako:

p ( x 0 , , x k , z 1 , , z k ) = p ( x 0 ) i = 1 k p ( z i | x i ) p ( x i | x i 1 ) . {\displaystyle p({\textbf {x}}_{0},\dots ,{\textbf {x}}_{k},{\textbf {z}}_{1},\dots ,{\textbf {z}}_{k})=p({\textbf {x}}_{0})\prod _{i=1}^{k}p({\textbf {z}}_{i}|{\textbf {x}}_{i})p({\textbf {x}}_{i}|{\textbf {x}}_{i-1}).}

Avšak při využití Kalmanova filtru k odhadu stavu x je rozložení pravděpodobnosti zájmu spojeno s aktuálními stavy, které jsou podmíněny měřeními v aktuálním čase (toho je dosaženo odsunutím předchozích stavů a vydělením pravděpodobnosti počtem měření).

Toto vede k předpovědi a změně kroků v Kalmanově filtru pravděpodobnostním zápisem. Rozdělení pravděpodobnosti spojené s předpokládaným stavem je součet (integrál) součinů rozdělení pravděpodobnosti spojené s přechodem z (k - 1)-tého stavu do k-tého a rozdělení pravděpodobnosti spojené s předchozím stavem pro všechna možná x k 1 {\displaystyle x_{k_{-}1}} .

p ( x k | z k 1 ) = p ( x k | x k 1 ) p ( x k 1 | z k 1 ) d x k 1 {\displaystyle p({\textbf {x}}_{k}|{\textbf {z}}_{k-1})=\int p({\textbf {x}}_{k}|{\textbf {x}}_{k-1})p({\textbf {x}}_{k-1}|{\textbf {z}}_{k-1})\,d{\textbf {x}}_{k-1}}

Změna rozložení pravděpodobnosti je úměrná součinu měření pravděpodobnosti a předpovídaného stavu.

p ( x k | z k ) = p ( z k | x k ) p ( x k | z k 1 ) p ( z k | z k 1 ) = α p ( z k | x k ) p ( x k | z k 1 ) {\displaystyle p({\textbf {x}}_{k}|{\textbf {z}}_{k})={\frac {p({\textbf {z}}_{k}|{\textbf {x}}_{k})p({\textbf {x}}_{k}|{\textbf {z}}_{k-1})}{p({\textbf {z}}_{k}|{\textbf {z}}_{k-1})}}=\alpha \,p({\textbf {z}}_{k}|{\textbf {x}}_{k})p({\textbf {x}}_{k}|{\textbf {z}}_{k-1})}

Jmenovatel

p ( z k | z k 1 ) = p ( z k | x k ) p ( x k | z k 1 ) d x k {\displaystyle p({\textbf {z}}_{k}|{\textbf {z}}_{k-1})=\int p({\textbf {z}}_{k}|{\textbf {x}}_{k})p({\textbf {x}}_{k}|{\textbf {z}}_{k-1})d{\textbf {x}}_{k}}

je konstantně relativní k x {\displaystyle x} , takže ho vždy můžeme nahradit koeficientem α {\displaystyle \alpha } , který může být obvykle v praxi ignorován. Čitatele je pak možné vypočítat a jednoduše normalizovat, jelikož jeho nedílnou součástí musí být jednotka.

Aplikace

  • Kalmanův filtr využívá rekurzivní Bayesiánský filtr pro multivariační normální rozdělení
  • Particle filter na základě sekvenční techniky Monte Carlo metody (SMC), která modeluje PDF za pomoci sady diskrétních bodů
  • Grid-based odhady, které rozdělí PDF do diskrétní mřížky

Sekvenční Bayesiánské filtrování

Sekvenční Bayesiánské filtrování je rozšíření Bayesianova odhadu v případě, kdy se pozorované hodnoty s časem mění. Je to způsob, jak odhadnout reálnou hodnotu pozorované proměnné, která se vyvíjí v čase.

Metoda se nazývá:

filtrování
když odhadujeme aktuální hodnotu danou předchozími měřeními,
vyhlazování
při odhadování minulých hodnot daných současnými a minulými měřeními,
předpovídání
při odhadu pravděpodobné budoucí hodnoty.

Pojem Sekvenční Bayesiánské filtrování je velmi využíván v řízení a robotice.

Reference

V tomto článku byl použit překlad textu z článku Recursive Bayesian estimation na anglické Wikipedii.

Externí odkazy

  • ARULAMPALAM, M. Sanjeev; MASKELL, Simon; GORDON, Neil. A Tutorial on Particle Filters for On-line Non-linear/Non-Gaussian Bayesian Tracking. IEEE Transactions on Signal Processing. 2002, s. 174–188. Dostupné online. Je zde použita šablona {{Cite journal}} označená jako k „pouze dočasnému použití“.
  • DIARD, Julien; BESSIÈRE, Pierre; MAZER, Emmanuel. A survey of probabilistic models, using the Bayesian Programming methodology as a unifying framework [online]. cogprints.org, 2003. Dostupné online. Je zde použita šablona {{Cite web}} označená jako k „pouze dočasnému použití“.
  • Feynman-Kac models and interacting particle algorithms (a.k.a. Particle Filtering) Theoretical aspects and a list of application domains of particle filters