Stabilné distribúcie. Štatistická analýza číselných hodnôt (neparametrické štatistiky)

Stabilným a nekonečne deliteľným distribúciám sa venuje veľká pozornosť v literatúre venovanej modelovaniu správania výmenných kurzov mien a finančných indexov.

Stabilné a nekonečne deliteľné distribúcie boli študované v prácach P. Levyho, J. Polya, A.Ya. Khinchin.

Zastavme sa pri definícii stabilných rozdelení. Existujú dve ekvivalentné definície. Dajme jeden z nich

Definícia. Náhodná premenná sa nazýva stabilná, ak pre každú existujú aj také, že

kde sú nezávislé kópie náhodnej premennej. Ak v (81) =0, t.j.

potom sa náhodná premenná nazýva prísne stabilná.

Je pozoruhodné, že je dokázaný nasledujúci fakt

pre niektoré. Toto sa nazýva index udržateľnosti.

Uveďme si príklad. Zoberme si normálny zákon, potom je súčet rozdelený podľa normálneho zákona a náhodná premenná je rozdelená rovnakým spôsobom. Tu. Z toho vyplýva, že Gaussov zákon je stabilný zákon s indexom stability. Navyše je prísne stabilný, ak.

Pre dokreslenie si treba všimnúť fakt, ktorý charakterizuje stabilné rozdelenie ako rozdelenie nekonečných súčtov nezávislých a identicky rozdelených náhodných premenných.

Stabilná distribúcia má doménu príťažlivosti v tom zmysle, že existuje postupnosť nezávislých identicky rozdelených náhodných premenných a postupnosti kladných čísel a reálnych čísel také, že

Zvážte charakteristickú distribučnú funkciu náhodnej premennej

Charakteristická funkcia súčtu nezávislých kópií

Porovnajme (86) a (82) a získajme to pre striktne stabilné rozdelenie

V jazyku charakteristických funkcií sa teda distribúcia nazýva striktne stabilná, ak pre ktorúkoľvek existuje kladné číslo také, že (87) je splnené. Od toho potom (87) má tvar:

Zvážte Poissonovo rozdelenie

Charakteristická funkcia Poissonovho rozdelenia:

Poissonovo rozdelenie teda nie je stabilné. S vlastnosťou prísnej stability sa spája ďalšia vlastnosť distribučného zákona. Pripomeňme, že konvolúcia distribučných funkcií sa nazýva distribučná funkcia. Ak distribučné funkcie majú hustoty, potom distribučná funkcia má tiež hustotu a. Navyše, ak sú náhodné premenné a nezávislé, potom. Predstavme si notáciu. V tomto zápise je distribučná funkcia súčtu . Preto distribučná funkcia prísne stabilného zákona musí mať vlastnosť:

Ak existuje hustota, potom

V tomto ohľade zvážte Cauchyho distribúciu:

Pomocou priamej integrácie a indukcie je ľahké to overiť

Z toho vyplýva, že Cauchyho rozdelenie je prísne stabilné s indexom stability.

Všimnite si, že pozoruhodný výsledok teórie pravdepodobnosti (P. Levy, A.Ya. Khinchin) poskytuje nasledujúcu reprezentáciu charakteristickej funkcie stabilnej náhodnej premennej:


Kde. Význam parametrov je nasledujúci:

Index udržateľnosti

Parameter skreslenia hustoty distribúcie,

Parameter mierky

Parameter polohy.

Parameter určuje rýchlosť, ktorou klesajú chvosty distribúcie.

a je funkcia gama.

Uvažujme o prípade. Z (95) vyplýva, že

čo je charakteristická funkcia normálneho zákona. Stabilita normálneho zákona s indexom stability už bola spomenutá vyššie. Upozorňujeme, že produkt preto nie je určený jednoznačne. Všeobecne sa uznáva, že.

Z hľadiska správania sa distribučných chvostov sú prípady a výrazne odlišné. Naozaj, nech je to tak

Porovnanie (98) s (95) a (96) nám umožňuje dospieť k záveru, že konce distribúcie majú tendenciu k nule v prípade, keď je pomalšie. Preto sa takéto distribúcie zvyčajne nazývajú distribúcie s ťažkým chvostom. Ako ukazujú štatistické štúdie, mnohé finančné nástroje majú logaritmické výnosy, ktorých distribúcie majú ťažké chvosty. Tento štatistický fakt robí stabilné distribúcie atraktívnymi na opis správania logaritmických výnosov.

Všimnite si, že vtedy a len vtedy. Skutočne, ak, potom z (95) a (96) to vyplýva. Ak, tak to vyplýva z nerovnosti. Nech to potom vyplýva z nerovnosti, že.

V súvislosti s exponenciálnou asymptotikou sa zameriame na Paretovo rozdelenie, ktorého hustota je

S parametrami (index udržateľnosti) a. Paretov graf hustoty rozdelenia je uvedený na obrázku 8.


Ryža. 8.

Distribučná funkcia

a pravdepodobnosť. Porovnanie s (95) ukazuje, že v nekonečne sa stabilné distribúcie správajú rovnako ako Paretovo rozdelenie. Preto chvostová časť stabilných distribúcií patrí k typu Pareto.

Môžeme zvážiť symetrické Paretovo rozdelenie:

čo pri modelovaní sekvencie vyzerá prirodzenejšie. Parameter šikmosť (skewness) určuje, aké asymetrické je rozdelenie. Ak, teda

potom je rozdelenie relatívne symetrické. Čím bližšie k jednote, tým výraznejšia je asymetria rozloženia. Navyše, ak, potom je distribúcia skosená viac doľava a doprava.

Parameter je parameter mierky.

Kedy, prípad normálnej distribúcie. Keď - nedochádza k rozptylu. Preto sa parameter líši od štandardnej odchýlky.

Parameter je parameter polohy, ako je uvedené vyššie, a existuje matematické očakávanie. Keď očakávaná hodnota nemusí byť definovaná, nemala by byť interpretovaná ako očakávaná hodnota.

Tradičná notácia pre stabilné distribúcie je notácia. Všimnite si, že kedy

Normálne rozdelenie (Gaussovo rozdelenie) vždy zohrávalo ústrednú úlohu v teórii pravdepodobnosti, pretože vzniká veľmi často ako výsledok vplyvu mnohých faktorov, z ktorých je príspevok ktoréhokoľvek z nich zanedbateľný. Centrálna limitná veta (CLT) nachádza uplatnenie prakticky vo všetkých aplikovaných vedách, vďaka čomu je štatistický aparát univerzálny. Existujú však veľmi časté prípady, keď je jeho použitie nemožné, a výskumníci sa snažia všetkými možnými spôsobmi organizovať prispôsobenie výsledkov Gaussovmu. Teraz vám poviem o alternatívnom prístupe v prípade viacerých faktorov ovplyvňujúcich distribúciu.

Stručná história CPT. Kým bol Newton ešte nažive, Abraham de Moivre dokázal teorém o konvergencii centrovaného a normalizovaného počtu pozorovaní udalosti v sérii nezávislých testov k normálnemu rozdeleniu. V priebehu 19. a začiatku 20. storočia slúžila táto veta ako vedecký model pre zovšeobecnenia. Laplace dokázal prípad rovnomerného rozdelenia, Poisson dokázal lokálnu vetu pre prípad s rôznymi pravdepodobnosťami. Poincaré, Legendre a Gauss vyvinuli bohatú teóriu pozorovacích chýb a metódu najmenších štvorcov, spoliehajúc sa na konvergenciu chýb k normálnemu rozdeleniu. Chebyshev dokázal ešte silnejšiu vetu pre súčet náhodných premenných, keď vyvinul metódu momentov. Ljapunov v roku 1900, opierajúc sa o Čebyševa a Markova, dokázal CLT v súčasnej podobe, ale len s existenciou momentov tretieho rádu. A až v roku 1934 to Feller ukončil a ukázal, že existencia momentov druhého rádu je nevyhnutnou aj dostatočnou podmienkou.

CLT možno formulovať nasledovne: ak sú náhodné premenné nezávislé, identicky rozdelené a majú konečný nenulový rozptyl, potom súčty (centrované a normalizované) týchto premenných konvergujú k normálnemu zákonu. Práve v tejto forme sa táto veta vyučuje na univerzitách a je tak často používaná pozorovateľmi a výskumníkmi, ktorí nie sú profesionálmi v matematike. Čo je s tým? V skutočnosti je teorém dokonale použiteľný v oblastiach, na ktorých pracoval Gauss, Poincaré, Čebyšev a ďalší géniovia 19. storočia, a to: teória pozorovacích chýb, štatistická fyzika, najmenšie štvorce, demografické štúdie a možno aj niečo iné. Ale vedci, ktorým chýba originalita pre objavy, sa zaoberajú zovšeobecňovaním a chcú túto vetu aplikovať na všetko, alebo jednoducho pretiahnuť normálne rozdelenie za uši, kde jednoducho nemôže existovať. Ak chcete príklady, mám ich.

Inteligenčný kvocient IQ. Spočiatku to znamená, že inteligencia ľudí je normálne rozložená. Vykonávajú test, ktorý je vopred pripravený tak, že sa neberú do úvahy mimoriadne schopnosti, ale sa berú do úvahy oddelene s rovnakými podielovými faktormi: logické myslenie, mentálny dizajn, výpočtové schopnosti, abstraktné myslenie a niečo iné. Schopnosť riešiť problémy, ktoré sú pre väčšinu nedostupné, či absolvovanie testu v superrýchlom čase sa nijako neberie do úvahy a skoršie absolvovanie testu zvyšuje výsledok (nie však inteligenciu) do budúcnosti. A potom filistí veria, že „nikto nemôže byť dvakrát múdrejší ako oni“, „zoberme to od šikovných ľudí a rozdeľme to“.

Druhý príklad: zmeny finančných ukazovateľov. Štúdium zmien cien akcií, kurzov mien a opcií komodít si vyžaduje použitie matematických štatistík a najmä tu je dôležité nepomýliť sa s typom distribúcie. Príklad: v roku 1997 bola udelená Nobelova cena za ekonómiu za návrh Black-Scholesovho modelu, ktorý bol založený na predpoklade normálneho rozdelenia rastu akciového trhu (tzv. biely šum). Autori zároveň jasne uviedli, že tento model potrebuje objasnenie, ale všetko, čo sa väčšina ďalších výskumníkov rozhodla urobiť, bolo jednoducho pridať Poissonovo rozdelenie k normálnemu rozdeleniu. Tu sa samozrejme vyskytnú nepresnosti pri štúdiu dlhých časových radov, keďže Poissonovo rozdelenie až príliš vyhovuje CLT a už pri 20 členoch je na nerozoznanie od normálneho rozdelenia. Pozrite sa na obrázok nižšie (a je z veľmi seriózneho ekonomického časopisu), ukazuje, že napriek pomerne veľkému počtu pozorovaní a zjavných skreslení existuje predpoklad o normálnosti rozdelenia.


Je veľmi zrejmé, že rozdelenie miezd medzi obyvateľstvo mesta, veľkosť súborov na disku, počet obyvateľov miest a krajín nebude normálne.

Čo majú distribúcie z týchto príkladov spoločné, je prítomnosť takzvaného „ťažkého chvosta“, teda hodnôt, ktoré ležia ďaleko od priemeru, a viditeľná asymetria, zvyčajne vpravo. Uvažujme, aké iné distribúcie by mohli byť okrem normálneho. Začnime s predtým spomínaným Poissonom: má chvost, ale chceme, aby sa zákon opakoval pre množinu skupín, v každej z nich sa dodržiava (vypočítajte veľkosť spisov pre podnik, platy pre viaceré mestá) resp. škálovaný (ľubovoľne zvýšiť alebo znížiť modelový interval Black - Scholes), ako ukazujú pozorovania, chvosty a asymetria nezmiznú, ale Poissonovo rozdelenie by sa podľa CLT malo stať normálnym. Z rovnakých dôvodov nie sú vhodné Erlang, beta, lognormal a všetky ostatné s disperznými distribúciami. Zostáva len odrezať Paretovo rozdelenie, ale to nie je vhodné kvôli zhode režimu s minimálnou hodnotou, ktorá sa pri analýze vzorových dát takmer nikdy nevyskytuje.

Existujú distribúcie, ktoré majú potrebné vlastnosti a nazývajú sa stabilné distribúcie. Ich história je tiež veľmi zaujímavá a hlavná veta bola dokázaná rok po Fellerovej práci, v roku 1935, spoločným úsilím francúzskeho matematika Paula Levyho a sovietskeho matematika A.Ya. Khinchin. CLT bola zovšeobecnená, bola z nej odstránená podmienka existencie disperzie. Na rozdiel od normálnej nie je vyjadrená ani hustota, ani distribučná funkcia stabilných náhodných premenných (až na ojedinelé výnimky, ktoré sú popísané nižšie), vie sa o nich len charakteristická funkcia (inverzná Fourierova transformácia hustoty rozdelenia, ale pochopiť podstatu to nie je možné vedieť).
Takže veta: ak sú náhodné premenné nezávislé a identicky rozdelené, potom súčty týchto premenných konvergujú k stabilnému zákonu.

Teraz definícia. Náhodná hodnota X bude stabilný vtedy a len vtedy, ak je logaritmus jeho charakteristickej funkcie reprezentovaný v tvare:

Kde .

V skutočnosti tu nie je nič zložité, stačí si vysvetliť význam štyroch parametrov. Parametre sigma a mu sú zvyčajnou mierkou a posunom, ako pri normálnom rozdelení, mu sa bude rovnať matematickému očakávaniu, ak existuje, a existuje, keď je alfa väčšie ako jedna. Parameter beta je asymetria, ak sa rovná nule, rozdelenie je symetrické. Alfa je však charakteristický parameter, označuje, o akú rádovú veľkosť existujú momenty veličiny, čím bližšie je k dvom, tým viac je rozdelenie podobné normálnemu, keď sa rovná dvom, rozdelenie sa stáva normálnym a iba v tomto prípade má momenty veľkých rádov, aj v prípade normálneho rozdelenia asymetria degeneruje. V prípade, že alfa sa rovná jednej a beta je nula, získa sa Cauchyho rozdelenie a v prípade, že sa alfa rovná polovici a beta sa rovná jednej, získa sa Lévyho rozdelenie, v ostatných prípadoch nie je znázornené žiadne v kvadratúre pre rozdelenie hustoty takýchto veličín.
V 20. storočí sa vypracovala bohatá teória stabilných veličín a procesov (označovaných ako Lévyho procesy), ukázala sa ich súvislosť s zlomkovými integrálmi, zaviedli sa rôzne metódy parametrizácie a modelovania, parametre sa odhadovali viacerými spôsobmi a konzistentnosť a ukázala sa stabilita odhadov. Pozrite sa na obrázok, ukazuje simulovanú trajektóriu Levyho procesu s 15-krát zväčšeným fragmentom.


Práve pri štúdiu takýchto procesov a ich aplikácie vo financiách prišiel Benoit Mandelbrot s fraktálmi. Nie všade to však bolo také dobré. Druhá polovica 20. storočia prešla pod všeobecný trend aplikovaných a kybernetických vied a to znamenalo krízu čistej matematiky, každý chcel produkovať, ale nechcel myslieť, humanisti svojou žurnalistikou obsadili matematické sféry. Príklad: kniha „Fifty Entertaining Probabilistic Problems with Solutions“ od American Mosteller, úloha č. 11:


Autorovo riešenie tohto problému je jednoducho porážka zdravého rozumu:

Rovnaká situácia je s problémom 25, kde sú uvedené TRI protichodné odpovede.

Vráťme sa však k stabilným distribúciám. Vo zvyšku článku sa pokúsim ukázať, že pri práci s nimi by nemali byť žiadne ďalšie ťažkosti. Totiž, existujú numerické a štatistické metódy, ktoré umožňujú odhadnúť parametre, vypočítať distribučnú funkciu a modelovať ich, čiže fungujú rovnako ako pri akomkoľvek inom rozdelení.

Modelovanie stabilných náhodných premenných. Keďže všetko sa učí porovnávaním, pripomeniem najskôr z výpočtového hľadiska najvhodnejší spôsob generovania normálnej hodnoty (Boxova–Mullerova metóda): ak sú základné náhodné premenné (rovnomerne rozdelené na)