Markovljev lanac

U matematici lanac Markova označava diskretni Markovljev slučajni proces. Ime je dobio po Markov Andreju, ruskom matematičaru, koji je glas stekao svojim istraživanjima u ovoj grani nauke. Imati svojstvo Markova znači, ukratko, da pored datog trenutnog stanja, buduće stanje sistema ne zavisi od prošlih. Drugim rečima, to znači, da opis sadašnjosti u potpunosti sadrži informaciju koja može uticati na buduće stanje procesa.

Dakle, pored date sadašnjosti, budućnost ne zavisi od prošlosti. Ništa što se dogodilo u prošlosti, ne utiče, ne daje prognozu u pogledu budućnosti, u budućnosti je sve moguće. Osnovni primer je bacanje novčića – ako prvi put dobijemo glavu, drugi put s podjednakim šansama možemo dobiti glavu ili pismo. Ako pak dobijamo glavu 100 puta zaredom, i tada je verovatnoća da ćemo 101. put dobiti glavu ista kao i da ćemo dobiti pismo – drugim rečima, prošlost ne predviđa budući rezultat. Trenutno stanje je da imamo novčić sa glavom i pismom na svoje dve strane. Pretpostavljajući pravilna izvođenja eksperimenta, ništa drugo ne može uticati na budući ishod.

Drugi primer može da bude slučajna šetnja po brojnoj osi, gde se, pri svakom koraku, pozicija menja za 1 (u jednom ili drugom smeru jednako verovatno). Sa svake pozicije postoje dva moguća prelaza: na sledeći ili na prethodni ceo broj. Verovatnoće prelaza tada zavise samo od trenutnog stanja, a ne od načina kako se do njega došlo. Na primer, ako je trenutna pozicija -3, prelaz u -2 ima verovatnoću 0,5, bez obzira na prethodne pozicije.

U svakom trenutku sistem, na osnovu date raspodele slučajne promenljive, može promeniti stanje, ili ostati u istom. Promene stanja nazivamo prelazima, a verovatnoće, koje se odnose na različite promene stanja, nazivamo verovatnoćama prelaza.

Formalna definicija

Lanci Markova predstavljaju značajnu klasu zavisnih slučajnih promenljivih. Niz slučajnih promenljivih X1, X2, X3, … nazivamo lancem Markova, ako važi svojstvo Markova, tj.:

Pr ( X n + 1 = x | X n = x n , , X 1 = x 1 ) = Pr ( X n + 1 = x | X n = x n ) . {\displaystyle \Pr(X_{n+1}=x|X_{n}=x_{n},\ldots ,X_{1}=x_{1})=\Pr(X_{n+1}=x|X_{n}=x_{n}).\,}

Moguće vrednosti Xi su iz prebrojivog skupa S. Ovaj skup naziva se skup stanja. Lance Markova možemo prikazati i usmerenim grafovima, gde su čvorovi pojedina stanja, a vrednosti napisane na granama predstavljaju verovatnoće prelaza (u odgovarajućem smeru).

Tipovi

Govorimo o lancu Markova sa stacionarnim verovatnoćama stanja (homogenom lancu Markova), ako verovatnoće prelaza ne zavise od vremena, to jest:

Pr ( X n + 1 = j X n = i ) = p i j {\displaystyle \Pr(X_{n+1}=j\mid X_{n}=i)=p_{ij}\,}

nezavisno od n.

Lanci Markova reda m (sa memorijom m) su oni za koje važi (za konačno m):

Pr ( X n = x n | X n 1 = x n 1 , X n 2 = x n 2 , , X 1 = x 1 ) {\displaystyle \Pr(X_{n}=x_{n}|X_{n-1}=x_{n-1},X_{n-2}=x_{n-2},\dots ,X_{1}=x_{1})}
= Pr ( X n = x n | X n 1 = x n 1 , X n 2 = x n 2 , , X n m = x n m ) {\displaystyle =\Pr(X_{n}=x_{n}|X_{n-1}=x_{n-1},X_{n-2}=x_{n-2},\dots ,X_{n-m}=x_{n-m})}

za svako n. Drugim rečima, buduće stanje zavisi od m pređašnjih. U slučaju m=1 radi se o prostom lancu Markova.


Osobine lanaca Markova

Prvo je potrebno da uvedemo pojam verovatnoće prelaza za jedan korak:

p i j = Pr ( X 1 = j X 0 = i ) . {\displaystyle p_{ij}=\Pr(X_{1}=j\mid X_{0}=i).\,}

i pojam verovatnoće prelaza za n koraka:

p i j ( n ) = Pr ( X n = j X 0 = i ) {\displaystyle p_{ij}^{(n)}=\Pr(X_{n}=j\mid X_{0}=i)\,}

Prvo označava verovatnoću prelaza iz stanja i u stanje j iz jednog koraka, a potonje iz n koraka, pod pretpostavkom da je P r ( X 0 = i ) > 0 {\displaystyle Pr(X_{0}=i)>0} .

Za homogene lance Markova:

p i j = Pr ( X k + 1 = j X k = i ) . {\displaystyle p_{ij}=\Pr(X_{k+1}=j\mid X_{k}=i).\,}

i

p i j ( n ) = Pr ( X n + k = j X k = i ) {\displaystyle p_{ij}^{(n)}=\Pr(X_{n+k}=j\mid X_{k}=i)\,}

pa prelazak iz n koraka zadovoljava jednačinu Čepman-Kolmogorova, da za svako k za koje važi 0 < k < n,

p i j ( n ) = r S p i r ( k ) p r j ( n k ) {\displaystyle p_{ij}^{(n)}=\sum _{r\in S}p_{ir}^{(k)}p_{rj}^{(n-k)}}

gde je S skup stanja lanca Markova.

Dokaz

Primenom svojstva Markova i uopštene formule totalne verovatnoće, važi sledeće:

p i j ( n ) = Pr ( X n = j X 0 = i ) = r S Pr ( X n = j X k = r , X 0 = i ) Pr ( X k = r X 0 = i ) = r S Pr ( X n = j X k = r ) Pr ( X k = r X 0 = i ) = r S p i r ( k ) p r j ( n k ) {\displaystyle {\begin{aligned}&{}\quad p_{ij}^{(n)}=\Pr(X_{n}=j\mid X_{0}=i)=\sum _{r\in S}\Pr(X_{n}=j\mid X_{k}=r,X_{0}=i)\Pr(X_{k}=r\mid X_{0}=i)\\&=\sum _{r\in S}\Pr(X_{n}=j\mid X_{k}=r)\Pr(X_{k}=r\mid X_{0}=i)=\sum _{r\in S}p_{ir}^{(k)}p_{rj}^{(n-k)}\end{aligned}}}

što je trebalo dokazati.

Marginalna raspodela Pr(Xn = x) je raspodela nad stanjima u trenutku n. Početna raspodela je Pr(X0 = x).

Ergodičnost

Lanac Markova se naziva ergodičan ako je moguće preći iz bilo kog stanja u bilo koje stanje (ne obavezno u jednom koraku).

Regularnost

Lanac Markova je regularan ako neki stepen matrice prelaza ima samo pozitivne elemente. Drugim rečima, za neko n, moguće je preći iz bilo kog stanja u bilo koje drugo stanje u tačno n koraka. Iz definicije se vidi da je svaki regularan lanac i ergodičan, obrnuto ne mora da važi.

Matrica prelaza je matrica čiji je (i, j)-ti element jednak

p i j = Pr ( X n + 1 = j X n = i ) . {\displaystyle p_{ij}=\Pr(X_{n+1}=j\mid X_{n}=i).\,}

i ona pokazuje kako su raspoređene verovatnoće prelaza.

Fundamentalna granična teorema za regularne lance Markova

Neka je P matrica prelaza za regularan lanac. Tada lim n P n = P {\displaystyle \lim _{n\rightarrow \infty }\mathbf {P} ^{n}=\mathbf {P} ^{*}} , gde je P* matrica čije su sve vrste jednake p*. Sve komponente vektora p* su pozitivne, i zbir im je 1.

Dokaz

Treba, u suštini, dokazati da elementi svake kolone matrice P n {\displaystyle \mathbf {P} ^{n}} teže da budu jednaki (tj. da su sve vrste te matrice jednake). Napomenimo da j-ta kolona od P n {\displaystyle \mathbf {P} ^{n}} je P n y {\displaystyle \mathbf {P} ^{n}\mathbf {y} } gde je y vektor kolona sa jedinicom na j-tom mestu, i nulama na ostalim mestima. Prema tome, praktično treba dokazati da za svaki vektor kolonu y, P n y {\displaystyle \mathbf {P} ^{n}\mathbf {y} } teži konstantnom vektoru kad n teži beskonačnosti. Kako je svaka vrsta matrice P vektor verovatnoća, P n y {\displaystyle \mathbf {P} ^{n}\mathbf {y} } zamenjuje y sa matematičkim očekivanjima njegovih komponenti (vrši neku vrstu uprosečavanja). Komponente vektora P n y {\displaystyle \mathbf {P} ^{n}\mathbf {y} } su bliže jedna drugoj nego komponente vektora y. Pokazaćemo da razlika između maksimalne i minimalne komponente teži nuli kad n teži beskonačnosti. To u suštini znači da verovatnoća da će se sistem naći u nekom stanju posle velikog broja koraka ne zavisi od početnog stanja. Neka je P matrica prelaza dimenzija r×r, bez nultih elemenata. Uzmimo da je l najmanja vrednost u toj matrici. Neka je y vektor kolona sa r elemenata, od kojih je najveći M0, a najmanji m0. Neka su M1 i m1 najveća i najmanja komponenta (respektivno) vektora P n y {\displaystyle \mathbf {P} ^{n}\mathbf {y} } . Pošto je svaki element matrice P n y {\displaystyle \mathbf {P} ^{n}\mathbf {y} } matematičko očekivanje elemenata iz y, najveće moguće očekivanje se može dobiti ako svi (osim jednog) elementi vektora y imaju vrednost M0, a jedan ima vrednost m0, i on se množi sa l, da bi najmanje doprinosio. U tom slučaju matematičko očekivanje iznosi

l m 0 + ( 1 l ) M 0 {\displaystyle lm_{0}+(1-l)M_{0}} .

Slično, najmanje moguće očekivanje je jednako

l M 0 + ( 1 l ) m 0 {\displaystyle lM_{0}+(1-l)m_{0}} .

Tako,

M 1 m 1 ( l m 0 + ( 1 l ) M 0 ) ( l M 0 + ( 1 l ) m 0 ) = ( 1 2 l ) ( M 0 m 0 ) {\displaystyle M_{1}-m_{1}\leq (lm_{0}+(1-l)M_{0})-(lM_{0}+(1-l)m_{0})=(1-2l)(M_{0}-m_{0})} .

Ovo će nam pomoći u dokazu fundamentalne granične teoreme za regularne lance Markova. Dokazaćemo teoremu za specijalan slučaj da je P bez elemenata koji su jednaki nuli, a posle ćemo uopštiti. Neka je y vektor kolona sa r elemenata, gde je r broj stanja u lancu. Pretpostavićemo da je r>1 (jer se inače svodi na trivijalno). Neka su Mn i mn, respektivno, maksimalna i minimalna komponenta vektora P n y {\displaystyle \mathbf {P} ^{n}\mathbf {y} } . Vektor P n y {\displaystyle \mathbf {P} ^{n}\mathbf {y} } se dobija množenjem (sleva) vektora P n 1 y {\displaystyle \mathbf {P} ^{n-1}\mathbf {y} } vektorom P. Prema tome, svaka komponenta vektora P n y {\displaystyle \mathbf {P} ^{n}\mathbf {y} } predstavlja srednju vrednost komponenti iz P n 1 y {\displaystyle \mathbf {P} ^{n-1}\mathbf {y} } . Tako je M 0 M 1 M 2 . . . {\displaystyle M_{0}\geq M_{1}\geq M_{2}...} i m 0 m 1 m 2 . . . {\displaystyle m_{0}\leq m_{1}\leq m_{2}...} . Oba ova niza su monotona i ograničena, m 0 m n M n M 0 {\displaystyle m_{0}\leq m_{n}\leq M_{n}\leq M_{0}} . Prema tome, oba niza će imati graničnu vrednost kad n teži beskonačnosti (nizovi su konvergentni). Neka je M granična vrednost od Mn, a m od mn. Znamo da je m M {\displaystyle m\leq M} . Treba da dokažemo da je M-m=0. Pokazali smo da važi M n m n ( 1 2 l ) ( M n 1 m n 1 ) {\displaystyle M_{n}-m_{n}\leq (1-2l)(M_{n-1}-m_{n-1})} . Iz ovoga je očigledno M n m n ( 1 2 l ) n ( M 0 m 0 ) {\displaystyle M_{n}-m_{n}\leq (1-2l)^{n}(M_{0}-m_{0})} . Kako je r 2 {\displaystyle r\geq 2} , tako mora biti i l 1 / 2 {\displaystyle l\leq 1/2} , tj. 0 1 2 l 1 {\displaystyle 0\leq 1-2l\leq 1} , a pošto se broj između 0 i 1 diže na eksponent koji teži beskonačnosti, jasno je da će razlika M n m n {\displaystyle M_{n}-m_{n}} težiti tada nuli. Prema tome, svi elementi P n y {\displaystyle \mathbf {P} ^{n}\mathbf {y} } će težiti nekom broju u. Neka je sada y vektor čija je j-ta komponenta jednaka 1, a sve ostale su jednake nuli. Tada je P n y {\displaystyle \mathbf {P} ^{n}\mathbf {y} } j-ta kolona od P n {\displaystyle \mathbf {P} ^{n}} . Ponavljajući postupak za svako j dokazuje se da kolone P n {\displaystyle \mathbf {P} ^{n}} teže konstantim vektorima kolonama. Može se reći da vrste matrice P n {\displaystyle \mathbf {P} ^{n}} teže zajedničkom vektoru vrsti p*, tj. lim n P n = P {\displaystyle \lim _{n\rightarrow \infty }\mathbf {P} ^{n}=\mathbf {P} ^{*}} . Ostalo je da se dokaže da su svi elementi matrice P* strogo pozitivni. Ako uzmemo isti vektor kolonu y (sa jednom jedinicom i svim nulama), Py je j-ta kolona od P, a svi njeni elementi su pozitivni (po našoj početnoj pretpostavci). Najmanji element vektora Py je definisan kao m1, pa je m1>0. Kako je m 1 m {\displaystyle m_{1}\leq m} , imamo da je i m>0, a ova vrednost m je zapravo j-ta komponenta od p*, pa su prema tome sve komponente p* strogo pozitivne.

Ovaj dokaz se, međutim, odnosio na slučaj da P nema nultih elemenata (nismo pretpostavili da je P regularna). Pretpostavimo da je P regularna. Tada, za neko N, P N y {\displaystyle \mathbf {P} ^{N}\mathbf {y} } nema nula. Dati dokaz pokazuje da MnN-mnN teži nuli kad n teži beskonačnosti. Ali, razlika MnN-mnN se ne može povećavati (kad je l=0, u najgorem slučaju razlika može ostati ista). Ako znamo da razlike koje se dobiju posmatranjem svakih N puta teže nuli, tada i ceo niz mora težiti nuli. Time je dokaz završen.