Stabilne distribucije. Statistička analiza numeričkih vrijednosti (neparametarska statistika)

Stabilne i beskonačno djeljive distribucije dobivaju veliku pozornost u literaturi posvećenoj modeliranju ponašanja tečajeva valuta i financijskih indeksa.

Stabilne i beskonačno djeljive distribucije proučavane su u radovima P. Levyja, J. Polya, A.Ya. Khinchin.

Zadržimo se na definiciji stabilnih distribucija. Postoje dvije ekvivalentne definicije. Dajmo jednu od njih

Definicija. Slučajna varijabla se naziva stabilnom ako za svaku postoje i takve da

gdje su nezavisne kopije slučajne varijable. Ako je u (81) =0, tj.

tada se slučajna varijabla naziva strogo stabilnom.

Zanimljivo je da je sljedeća činjenica dokazana

za neke. To se naziva indeksom održivosti.

Navedimo primjer. Razmotrimo normalni zakon, tada je zbroj raspodijeljen prema normalnom zakonu, a slučajna varijabla je raspodijeljena na isti način. Ovdje. Iz toga slijedi da je Gaussov zakon stabilan zakon s indeksom stabilnosti. Štoviše, strogo je stabilan ako.

Za potpunu sliku valja istaknuti činjenicu koja karakterizira stabilnu distribuciju kao distribuciju beskonačnih zbroja neovisnih i identično raspoređenih slučajnih varijabli.

Stabilna distribucija ima područje privlačnosti u smislu da postoji niz neovisnih identično raspodijeljenih slučajnih varijabli i nizovi pozitivnih brojeva i realnih brojeva tako da

Razmotrimo karakterističnu funkciju distribucije slučajne varijable

Karakteristična funkcija zbroja neovisnih kopija

Usporedimo (86) i (82) i dobijemo to za strogo stabilnu distribuciju

Dakle, u jeziku karakterističnih funkcija, distribucija se naziva strogo stabilnom ako za bilo koju postoji pozitivan broj takav da je (87) zadovoljeno. Budući da tada (87) ima oblik:

Razmotrimo Poissonovu distribuciju

Karakteristična funkcija Poissonove distribucije:

Stoga Poissonova distribucija nije stabilna distribucija. Svojstvo stroge stabilnosti povezano je s drugim svojstvom zakona raspodjele. Podsjetimo se da se konvolucija funkcija distribucije naziva funkcija distribucije. Ako funkcije distribucije imaju gustoću, tada funkcija distribucije također ima gustoću, i. Štoviše, ako su slučajne varijable i neovisne, tada. Uvedimo notaciju. U ovom zapisu, distribucijska funkcija zbroja je . Stoga distribucijska funkcija strogo stabilnog zakona mora imati svojstvo:

Ako postoji gustoća, onda

U tom smislu, razmotrite Cauchyjevu distribuciju:

Izravnom integracijom i indukcijom to je lako provjeriti

Slijedi da je Cauchyjeva distribucija strogo stabilna s indeksom stabilnosti.

Imajte na umu da izvanredan rezultat teorije vjerojatnosti (P. Levy, A.Ya. Khinchin) daje sljedeći prikaz karakteristične funkcije stabilne slučajne varijable:


Gdje. Značenje parametara je sljedeće:

Indeks održivosti

Parametar asimetrije gustoće distribucije,

Parametar skale

Parametar položaja.

Parametar određuje brzinu kojom se repovi distribucije smanjuju.

a je gama funkcija.

Razmotrimo slučaj. Iz (95) slijedi da

što je karakteristična funkcija normalnog zakona. Gore je već spomenuta stabilnost normalnog zakona s indeksom stabilnosti. Imajte na umu da proizvod stoga nije jednoznačno određen. Opće je prihvaćeno da.

Sa stajališta ponašanja repova distribucije, slučajevi i su bitno različiti. Doista, neka bude onda

Usporedba (98) s (95) i (96) omogućuje nam da zaključimo da repovi distribucije teže nuli u slučaju kada je ona sporija. Stoga se takve distribucije obično nazivaju distribucije teškog repa. Kao što statističke studije pokazuju, mnogi financijski instrumenti imaju logaritamske povrate, čije distribucije imaju teške repove. Ova statistička činjenica čini stabilne distribucije atraktivnim za opisivanje ponašanja logaritamskih povrata.

Imajte na umu da ako i samo ako. Doista, ako, onda iz (95) i (96) slijedi da. Ako, onda to slijedi iz nejednakosti. Neka onda iz nejednakosti slijedi da.

U vezi s eksponencijalnom asimptotikom usredotočit ćemo se na Pareto distribuciju čija je gustoća

Uz parametre (indeks stabilnosti) i. Grafikon gustoće Pareto distribucije prikazan je na slici 8.


Riža. 8.

Funkcija distribucije

i vjerojatnost. Usporedba s (95) pokazuje da se u beskonačnosti stabilne distribucije ponašaju na isti način kao Pareto distribucija. Dakle, repni dio stabilnih distribucija pripada Pareto tipu.

Možemo razmotriti simetričnu Pareto distribuciju:

što izgleda prirodnije pri modeliranju niza. Parametar asimetričnosti (skewness) određuje koliko je distribucija asimetrična. Ako, to jest

tada je raspodjela relativno simetrična. Što je bliže jedinici, to je asimetrija distribucije izraženija. Štoviše, ako, tada je distribucija više iskrivljena ulijevo i udesno.

Parametar je parametar mjerila.

Kada, slučaj normalne distribucije. Kada – nema disperzije. Stoga se parametar razlikuje od standardne devijacije.

Parametar je parametar položaja na, kao što je gore navedeno, i postoji matematičko očekivanje. Kada se očekivana vrijednost ne može definirati, ne treba je tumačiti kao očekivanu vrijednost.

Tradicionalna oznaka za stabilne distribucije je notacija. Imajte na umu da kada

Normalna razdioba (Gaussova razdioba) oduvijek je imala središnju ulogu u teoriji vjerojatnosti, budući da vrlo često nastaje kao rezultat utjecaja mnogih čimbenika od kojih je doprinos bilo kojeg od njih zanemariv. Centralni granični teorem (CLT) nalazi primjenu u gotovo svim primijenjenim znanostima, čineći statistički aparat univerzalnim. Međutim, vrlo su česti slučajevi kada je njegova uporaba nemoguća, a istraživači pokušavaju na sve moguće načine organizirati prilagođavanje rezultata Gaussovoj. Sada ću vam reći o alternativnom pristupu u slučaju više čimbenika koji utječu na distribuciju.

Kratka povijest CPT-a. Dok je Newton još bio živ, Abraham de Moivre dokazao je teorem o konvergenciji centriranog i normaliziranog broja opažanja događaja u nizu neovisnih testova prema normalnoj distribuciji. Tijekom 19. i ranog 20. stoljeća ovaj je teorem služio kao znanstveni model za generalizacije. Laplace je dokazao slučaj jednolike distribucije, Poisson je dokazao lokalni teorem za slučajeve s različitim vjerojatnostima. Poincaré, Legendre i Gauss razvili su bogatu teoriju pogrešaka opažanja i metodu najmanjih kvadrata, oslanjajući se na konvergenciju pogrešaka prema normalnoj distribuciji. Čebišev je dokazao još jači teorem za zbroj slučajnih varijabli, razvivši metodu momenata. Ljapunov je 1900. godine, oslanjajući se na Čebiševa i Markova, dokazao CLT u sadašnjem obliku, ali samo uz postojanje momenata trećeg reda. I tek 1934. Feller je tome stao na kraj, pokazujući da je postojanje momenata drugog reda i nužan i dovoljan uvjet.

CLT se može formulirati na sljedeći način: ako su slučajne varijable neovisne, identično raspoređene i imaju konačnu varijancu različitu od nule, tada zbrojevi (centrirani i normalizirani) tih varijabli konvergiraju prema normalnom zakonu. U tom se obliku ovaj teorem predaje na sveučilištima i često ga koriste promatrači i istraživači koji nisu profesionalni matematičari. Što ne valja s tim? Zapravo, teorem je savršeno primjenjiv u područjima na kojima su radili Gauss, Poincaré, Chebyshev i drugi geniji 19. stoljeća, naime: teorija pogrešaka opažanja, statistička fizika, najmanji kvadrati, demografske studije i možda još nešto. Ali znanstvenici kojima nedostaje originalnosti za otkrića bave se generalizacijama i žele primijeniti ovaj teorem na sve, ili jednostavno vuku normalnu distribuciju za uši, gdje ona jednostavno ne može postojati. Ako želite primjere, imam ih.

Kvocijent inteligencije IQ. U početku implicira da je inteligencija ljudi normalno raspoređena. Oni provode test koji je unaprijed pripremljen na način da se izvanredne sposobnosti ne uzimaju u obzir, već se uzimaju u obzir zasebno s istim faktorima udjela: logičko razmišljanje, mentalni dizajn, računalne sposobnosti, apstraktno mišljenje i nešto drugo. Sposobnost rješavanja problema koji su većini nedostupni, ili polaganje testa u superbrzom vremenu se ne uzima u obzir ni na koji način, a ranije polaganje testa povećava rezultat (ali ne i inteligenciju) u budućnosti. I onda filistri vjeruju da “nitko ne može biti dvaput pametniji od njih”, “uzmimo pametnima i podijelimo”.

Drugi primjer: promjene financijskih pokazatelja. Proučavanje promjena cijena dionica, valutnih kotacija i robnih opcija zahtijeva korištenje matematičke statistike, a posebno je ovdje važno ne pogriješiti s vrstom distribucije. Primjer: 1997. godine dodijeljena je Nobelova nagrada za ekonomiju za predlaganje Black-Scholesovog modela koji se temeljio na pretpostavci normalne distribucije rasta tržišta dionica (tzv. bijeli šum). U isto vrijeme, autori su jasno naveli da ovaj model treba razjasniti, ali sve što je većina daljnjih istraživača odlučila učiniti je jednostavno dodati Poissonovu distribuciju normalnoj distribuciji. Ovdje će očito biti netočnosti pri proučavanju dugih vremenskih serija, budući da Poissonova distribucija previše dobro zadovoljava CLT, a već s 20 članova ne razlikuje se od normalne distribucije. Pogledajte sliku ispod (i ona je iz vrlo ozbiljnog ekonomskog časopisa), ona pokazuje da se, unatoč prilično velikom broju zapažanja i očitih iskrivljenja, pretpostavlja normalnost distribucije.


Vrlo je očito da raspodjela plaća među stanovništvom grada, veličina datoteka na disku, stanovništvo gradova i država neće biti normalna.

Ono što je zajedničko distribucijama iz ovih primjera je prisutnost takozvanog “teškog repa”, odnosno vrijednosti koje su daleko od prosjeka, te uočljiva asimetrija, obično udesno. Razmotrimo koje bi druge distribucije, osim normalne, mogle biti. Počnimo s prethodno spomenutim Poissonom: ima rep, ali želimo da se zakon ponovi za skup grupa, u svakoj od kojih se promatra (izračunajte veličinu datoteka za poduzeće, plaće za nekoliko gradova) ili skalirano (proizvoljno povećavanje ili smanjenje modelnog intervala Black - Scholes), kao što opažanja pokazuju, repovi i asimetrija ne nestaju, ali bi Poissonova distribucija, prema CLP-u, trebala postati normalna. Iz istih razloga, Erlang, beta, lognormal i svi drugi s disperzijskim distribucijama nisu prikladni. Ostaje samo odrezati Pareto distribuciju, ali ona nije prikladna zbog podudarnosti moda s minimalnom vrijednošću, što se gotovo nikada ne događa pri analizi uzoraka podataka.

Distribucije koje imaju potrebna svojstva postoje i nazivaju se stabilne distribucije. Njihova je povijest također vrlo zanimljiva, a glavni teorem dokazan je godinu dana nakon Fellerovog rada, 1935., zajedničkim naporima francuskog matematičara Paula Levyja i sovjetskog matematičara A.Ya. Khinchin. CLT je generaliziran, iz njega je uklonjen uvjet postojanja disperzije. Za razliku od normalne, niti gustoća niti funkcija distribucije stabilnih slučajnih varijabli nisu izražene (uz rijetke iznimke, o kojima ćemo govoriti u nastavku), sve što se o njima zna je karakteristična funkcija (inverzna Fourierova transformacija gustoće distribucije, ali shvatiti bit ovo nije moguće znati).
Dakle, teorem: ako su slučajne varijable neovisne i identično raspoređene, tada sume tih varijabli konvergiraju prema stabilnom zakonu.

Sada definicija. Slučajna vrijednost x bit će stabilan ako i samo ako je logaritam njegove karakteristične funkcije predstavljen u obliku:

Gdje .

Zapravo, ovdje nema ništa komplicirano, samo trebate objasniti značenje četiri parametra. Parametri sigma i mu su uobičajeno mjerilo i pomak, kao u normalnoj distribuciji, mu će biti jednak matematičkom očekivanju ako postoji, a postoji kada je alfa veći od jedan. Beta parametar je asimetrija; ako je jednak nuli, distribucija je simetrična. Ali alfa je karakterističan parametar, on označava koji red veličine postoje momenti veličine, što je bliži dva, to je distribucija sličnija normalnoj, kada je jednaka dva, distribucija postaje normalna, i samo u ovom slučaju ima li momente velikih redova, također u slučaju normalne distribucije, asimetrija degenerira. U slučaju kada je alfa jednaka jedan, a beta nula, dobiva se Cauchyjeva distribucija, a u slučaju kada je alfa jednaka polovini, a beta jednaka jedan, dobiva se Lévyjeva distribucija, u ostalim slučajevima nema reprezentacije u kvadraturama za distribuciju gustoće takvih veličina.
U 20. stoljeću razvijena je bogata teorija stabilnih veličina i procesa (nazvanih Lévyjevim procesima), prikazana je njihova povezanost s frakcijskim integralima, uvedene su različite metode parametrizacije i modeliranja, parametri su ocijenjeni na više načina, a konzistentnost i pokazana je stabilnost procjena. Pogledajte sliku, prikazuje simuliranu putanju Levyjevog procesa s fragmentom uvećanim 15 puta.


Proučavajući takve procese i njihovu primjenu u financijama, Benoit Mandelbrot došao je do fraktala. Međutim, nije svugdje bilo tako dobro. Druga polovica 20. stoljeća prošla je pod općim trendom primijenjenih i kibernetičkih znanosti, a to je značilo krizu čiste matematike, svi su htjeli proizvoditi, ali nisu htjeli misliti, humanisti su sa svojom publicistikom okupirali matematičke sfere. Primjer: knjiga “Fifty Entertaining Probabilistic Problems with Solutions” američkog Mostellera, zadatak br. 11:


Autorovo rješenje ovog problema jednostavno je poraz zdravog razuma:

Ista je situacija i sa zadatkom 25, gdje su data TRI kontradiktorna odgovora.

No, vratimo se stabilnim distribucijama. U nastavku članka pokušat ću pokazati da ne bi trebalo biti dodatnih poteškoća pri radu s njima. Naime, postoje numeričke i statističke metode koje omogućuju procjenu parametara, izračunavanje funkcije razdiobe i njihovo modeliranje, odnosno rade na isti način kao i kod svake druge razdiobe.

Modeliranje stabilnih slučajnih varijabli. Budući da se sve uči usporedbom, prvo ću se prisjetiti najprikladnije, s računalne točke gledišta, metode generiranja normalne vrijednosti (Box–Mullerova metoda): ako su osnovne slučajne varijable (jednoliko raspoređene na )