Unabhängige, identisch verteilte Zufallsvariablen. Standardabweichung der Summe voneinander unabhängiger Zufallsvariablen

Es ist bereits bekannt, dass man nach dem Verteilungsgesetz die numerischen Eigenschaften einer Zufallsvariablen ermitteln kann. Daraus folgt, dass, wenn mehrere Zufallsvariablen identische Verteilungen aufweisen, ihre numerischen Eigenschaften gleich sind.

Lassen Sie uns überlegen N voneinander unabhängige Zufallsvariablen X 1 , X 2 , ...., X p, die die gleichen Verteilungen und daher die gleichen Eigenschaften haben (mathematischer Erwartungswert, Streuung usw.). Von größtem Interesse ist die Untersuchung der numerischen Eigenschaften des arithmetischen Mittels dieser Größen, was wir in diesem Abschnitt tun werden.

Bezeichnen wir das arithmetische Mittel der betrachteten Zufallsvariablen mit :

= (X 1 +X 2 +…+X n)/N.

Die folgenden drei Bestimmungen stellen einen Zusammenhang zwischen den numerischen Merkmalen des arithmetischen Mittels her X und die entsprechenden Eigenschaften jeder einzelnen Größe.

1. Der mathematische Erwartungswert des arithmetischen Mittels identisch verteilter, voneinander unabhängiger Zufallsvariablen ist gleich dem mathematischen Erwartungswert jedes der Werte:

M()=a

Nachweisen. Unter Verwendung der Eigenschaften der mathematischen Erwartung (der konstante Faktor kann aus dem Vorzeichen der mathematischen Erwartung entnommen werden; die mathematische Erwartung der Summe ist gleich der Summe der mathematischen Erwartungen der Terme) haben wir

M( )= M

Berücksichtigt man, dass der mathematische Erwartungswert jeder der Größen gemäß der Bedingung gleich ist A, wir bekommen

M()=na/n=a.

2. Die Streuung des arithmetischen Mittels von n identisch verteilten, voneinander unabhängigen Zufallsvariablen ist n-mal kleiner als die Streuung D jedes der Werte:

D()=D/n.(* )

Nachweisen. Unter Verwendung der Eigenschaften der Dispersion (der konstante Faktor kann durch Quadrieren aus dem Dispersionszeichen herausgenommen werden; die Dispersion der Summe unabhängiger Größen ist gleich der Summe der Dispersionen der Terme) haben wir

D( )=D

Berücksichtigt man, dass die Varianz jeder der Größen gemäß der Bedingung gleich ist D, wir bekommen

D( )= nD/n 2 =D/n.

3. Die Standardabweichung des arithmetischen Mittels von n identisch verteilten, voneinander unabhängigen Zufallsvariablen ist um ein Vielfaches kleiner als die Standardabweichung S jede der Mengen:

Nachweisen. Weil D()= D/n, dann ist die Standardabweichung gleich

S ( )= .

Die allgemeine Schlussfolgerung aus den Formeln (*) und (**): Wenn man bedenkt, dass Streuung und Standardabweichung als Maß für die Streuung einer Zufallsvariablen dienen, schließen wir, dass das arithmetische Mittel einer ausreichend großen Anzahl voneinander unabhängiger Zufallsvariablen deutlich weniger hat Streuung als jeder einzelne Wert.

Lassen Sie uns anhand eines Beispiels die Bedeutung dieser Schlussfolgerung für die Praxis erläutern.

Beispiel. Um eine bestimmte physikalische Größe zu messen, werden normalerweise mehrere Messungen durchgeführt und dann das arithmetische Mittel der erhaltenen Zahlen ermittelt, das als Näherungswert der gemessenen Größe verwendet wird. Unter der Annahme, dass die Messungen unter den gleichen Bedingungen durchgeführt wurden, beweisen Sie:

a) das arithmetische Mittel ergibt ein zuverlässigeres Ergebnis als Einzelmessungen;

b) Mit zunehmender Anzahl der Messungen steigt die Zuverlässigkeit dieses Ergebnisses.

Lösung. a) Es ist bekannt, dass einzelne Messungen unterschiedliche Werte der Messgröße ergeben. Das Ergebnis jeder Messung hängt von vielen zufälligen Gründen (Temperaturänderungen, Instrumentenschwankungen usw.) ab, die nicht vollständig im Voraus berücksichtigt werden können.

Daher haben wir das Recht, mögliche Ergebnisse zu berücksichtigen N Einzelmessungen als Zufallsvariablen X 1 , X 2 , ..., X p(Der Index gibt die Messnummer an). Diese Größen haben die gleiche Wahrscheinlichkeitsverteilung (Messungen werden mit der gleichen Methode und mit den gleichen Instrumenten durchgeführt) und daher die gleichen numerischen Eigenschaften; Darüber hinaus sind sie voneinander unabhängig (das Ergebnis jeder einzelnen Messung hängt nicht von anderen Messungen ab).

Wir wissen bereits, dass das arithmetische Mittel solcher Größen eine geringere Streuung aufweist als jede einzelne Größe. Mit anderen Worten: Es stellt sich heraus, dass das arithmetische Mittel näher am wahren Wert des Messwerts liegt als das Ergebnis einer separaten Messung. Das bedeutet, dass das arithmetische Mittel mehrerer Messungen ein zuverlässigeres Ergebnis liefert als eine Einzelmessung.

b) Wir wissen bereits, dass mit zunehmender Anzahl einzelner Zufallsvariablen die Streuung des arithmetischen Mittels abnimmt. Das bedeutet, dass mit zunehmender Anzahl der Messungen das arithmetische Mittel mehrerer Messungen immer weniger vom wahren Wert des Messwertes abweicht. Durch die Erhöhung der Anzahl der Messungen erhält man somit ein zuverlässigeres Ergebnis.

Wenn beispielsweise die Standardabweichung einer einzelnen Messung s= 6 m beträgt und insgesamt N= 36 Messungen, dann beträgt die Standardabweichung des arithmetischen Mittels dieser Messungen nur 1 m.

S ( )=

Wir sehen, dass das arithmetische Mittel mehrerer Messungen erwartungsgemäß näher am wahren Wert des Messwerts lag als das Ergebnis einer Einzelmessung.

Sie sagen, dass sie es sind unabhängig (und) identisch verteilt, wenn jede von ihnen die gleiche Verteilung wie die anderen hat und alle Größen im Aggregat unabhängig sind. Der Ausdruck „unabhängig identisch verteilt“ wird oft mit abgekürzt i.i.d.(aus dem Englischen unabhängig und gleichverteilt ), manchmal - „n.o.r“.

Anwendungen

Die Annahme, dass Zufallsvariablen unabhängig und identisch verteilt sind, wird in der Wahrscheinlichkeitstheorie und Statistik häufig verwendet, da sie es ermöglicht, theoretische Berechnungen erheblich zu vereinfachen und interessante Ergebnisse nachzuweisen.

Einer der Schlüsselsätze der Wahrscheinlichkeitstheorie – der zentrale Grenzwertsatz – besagt, dass, wenn es sich um eine Folge unabhängiger, identisch verteilter Zufallsvariablen handelt, die Verteilung ihrer durchschnittlichen Zufallsvariablen mit der Tendenz zur Unendlichkeit zur Normalverteilung konvergiert.

In der Statistik geht man allgemein davon aus, dass eine statistische Stichprobe eine Folge von i.i.d. ist. Realisierungen einer Zufallsvariablen (eine solche Stichprobe wird genannt). einfach).


Wikimedia-Stiftung.

  • 2010.
  • D.h.

Intel 8048

    Sehen Sie in anderen Wörterbüchern, was „unabhängige, identisch verteilte Zufallsvariablen“ sind: Problem mit der Ruine des Spielers

    - Das Problem des Spielerruins ist ein Problem aus dem Bereich der Wahrscheinlichkeitstheorie. Ausführlich betrachtet vom russischen Mathematiker A. N. Shiryaev in der Monographie „Wahrscheinlichkeit“ ... Wikipedia Nachhaltiger Vertrieb

    - In der Wahrscheinlichkeitstheorie ist dies eine Verteilung, die als Grenzwert für die Verteilung von Summen unabhängiger Zufallsvariablen erhalten werden kann. Inhalt 1 Definition 2 Anmerkungen ... Wikipedia Levy-Khinchin-Formel für stabile Verteilung

    - Eine stabile Verteilung in der Wahrscheinlichkeitstheorie ist eine Verteilung, die als Grenzwert für die Verteilung von Summen unabhängiger Zufallsvariablen erhalten werden kann. Inhalt 1 Definition 2 Bemerkungen 3 Eigenschaften stabiler Distributionen ... Wikipedia Unendlich teilbare Verteilung

    - In der Wahrscheinlichkeitstheorie ist dies die Verteilung einer Zufallsvariablen, so dass sie in Form einer beliebigen Anzahl unabhängiger, identisch verteilter Terme dargestellt werden kann. Inhalt 1 Definition ... Wikipedia- Das Cramer-Lundberg-Modell ist ein mathematisches Modell, mit dem Sie das Risiko des Ruins einer Versicherungsgesellschaft einschätzen können. Im Rahmen dieses Modells wird davon ausgegangen, dass die Versicherungsprämien gleichmäßig zu einem Satz von herkömmlichen Geldeinheiten pro Einheit eingehen... ... Wikipedia

    Levy-Khinchin-Formel für unendlich teilbare Verteilung- Eine unendlich teilbare Verteilung ist in der Wahrscheinlichkeitstheorie eine Verteilung einer Zufallsvariablen, so dass sie als beliebige Anzahl unabhängiger, identisch verteilter Terme dargestellt werden kann. Inhalt 1 Definition 2 ... ... Wikipedia

    Cramer-Modell- Dieser Artikel sollte Wikiified sein. Bitte formatieren Sie es gemäß den Formatierungsregeln des Artikels. Das Cramer-Lundberg-Modell ist ein mathematisches Modell, das es ermöglicht, die Insolvenzrisiken einer Versicherungsgesellschaft einzuschätzen... Wikipedia

    Statistische Akzeptanzkontrolle- eine Reihe statistischer Methoden zur Überwachung von Massenprodukten, um deren Übereinstimmung mit festgelegten Anforderungen festzustellen. P.S. j. ein wirksames Mittel zur Sicherstellung der guten Qualität von Massenprodukten. P.S. bis. wird durchgeführt am... ... Große sowjetische Enzyklopädie

    Multinomiale Verteilung- Multinomiale (Polynom-)Verteilung in der Wahrscheinlichkeitstheorie ist eine Verallgemeinerung der Binomialverteilung auf den Fall unabhängiger Tests eines Zufallsexperiments mit mehreren möglichen Ergebnissen. Definition Lassen Sie unabhängig... ... Wikipedia

    Polynomverteilung- Multinomiale (Polynom-)Verteilung in der Wahrscheinlichkeitstheorie ist eine Verallgemeinerung der Binomialverteilung auf den Fall unabhängiger Tests eines Zufallsexperiments mit mehreren möglichen Ergebnissen. Definition: Die Unabhängigen seien gleich... ... Wikipedia

Um viele praktische Probleme zu lösen, ist es notwendig, eine Reihe von Bedingungen zu kennen, aufgrund derer das Ergebnis des kombinierten Einflusses einer großen Anzahl zufälliger Faktoren nahezu unabhängig vom Zufall ist. Diese Bedingungen werden in mehreren Theoremen beschrieben, die zusammen als Gesetz der großen Zahlen bezeichnet werden. Dabei ist die Zufallsvariable k gleich 1 oder 0, je nachdem, ob das Ergebnis des k-ten Versuchs erfolgreich oder fehlschlägt. Somit ist Sn die Summe von n voneinander unabhängigen Zufallsvariablen, die jeweils die Werte 1 und 0 mit Wahrscheinlichkeiten p und q annehmen.

Die einfachste Form des Gesetzes der großen Zahlen ist der Satz von Bernoulli, der besagt, dass, wenn die Wahrscheinlichkeit eines Ereignisses in allen Versuchen gleich ist, die Häufigkeit des Ereignisses mit zunehmender Anzahl der Versuche tendenziell zur Wahrscheinlichkeit des Ereignisses tendiert und hört auf, zufällig zu sein.

Satz von Poisson besagt, dass die Häufigkeit eines Ereignisses in einer Reihe unabhängiger Versuche zum arithmetischen Mittel seiner Wahrscheinlichkeiten tendiert und nicht mehr zufällig ist.

Grenzwertsätze der Wahrscheinlichkeitstheorie, das Moivre-Laplace-Theorem, erklären die Art der Stabilität der Häufigkeit des Auftretens eines Ereignisses. Diese Natur liegt in der Tatsache, dass die Grenzverteilung der Anzahl des Auftretens eines Ereignisses bei unbegrenzter Zunahme der Anzahl von Versuchen (wenn die Wahrscheinlichkeit des Ereignisses in allen Versuchen gleich ist) eine Normalverteilung ist.

Zentraler Grenzwertsatz erklärt die weite Verbreitung des Normalverteilungsgesetzes. Der Satz besagt, dass immer dann, wenn eine Zufallsvariable durch Addition einer großen Anzahl unabhängiger Zufallsvariablen mit endlichen Varianzen entsteht, das Verteilungsgesetz dieser Zufallsvariablen ein nahezu normales Gesetz ist.

Satz von Lyapunov erklärt die weite Verbreitung des Normalverteilungsgesetzes und erläutert den Mechanismus seiner Entstehung. Mit dem Satz können wir sagen, dass sich das Verteilungsgesetz dieser Zufallsvariablen immer dann ändert, wenn eine Zufallsvariable durch Addition einer großen Anzahl unabhängiger Zufallsvariablen entsteht, deren Varianzen im Vergleich zur Streuung der Summe klein sind Es stellt sich heraus, dass es sich um ein fast normales Gesetz handelt. Und da Zufallsvariablen immer durch unendlich viele Ursachen erzeugt werden und meist keine von ihnen eine Streuung aufweist, die mit der Streuung der Zufallsvariablen selbst vergleichbar ist, unterliegen die meisten in der Praxis vorkommenden Zufallsvariablen dem Normalverteilungsgesetz.

Die qualitativen und quantitativen Aussagen des Gesetzes der großen Zahlen basieren auf Tschebyscheff-Ungleichung. Es bestimmt die Obergrenze der Wahrscheinlichkeit, dass die Abweichung des Werts einer Zufallsvariablen von ihrer mathematischen Erwartung größer als eine bestimmte Zahl ist. Es ist bemerkenswert, dass die Tschebyscheff-Ungleichung eine Schätzung der Wahrscheinlichkeit eines Ereignisses für eine Zufallsvariable liefert, deren Verteilung unbekannt ist; nur ihr mathematischer Erwartungswert und ihre Varianz sind bekannt.

Tschebyscheffs Ungleichung. Wenn eine Zufallsvariable x Varianz aufweist, dann ist die Ungleichung für jedes x > 0 wahr, wobei M x und D x – mathematischer Erwartungswert und Varianz der Zufallsvariablen x.

Satz von Bernoulli. Sei x n die Anzahl der Erfolge in n Bernoulli-Versuchen und p die Erfolgswahrscheinlichkeit in einem einzelnen Versuch. Dann ist es für jedes s > 0 wahr.

Satz von Lyapunov. Sei s 1, s 2, …, s n, … eine unbegrenzte Folge unabhängiger Zufallsvariablen mit mathematischen Erwartungen m 1, m 2, …, m n, … und Varianzen s 1 2, s 2 2, …, s n 2 …. Bezeichnen wir.

Dann = Ф(b) - Ф(a) für alle reellen Zahlen a und b, wobei Ф(x) die Normalverteilungsfunktion ist.

Gegeben sei eine diskrete Zufallsvariable. Betrachten wir die Abhängigkeit der Anzahl der Erfolge Sn von der Anzahl der Versuche n. Bei jedem Versuch erhöht sich Sn um 1 oder 0. Diese Aussage kann wie folgt geschrieben werden:

Sn = 1 +…+ n. (1.1)

Gesetz der großen Zahlen. Sei (k) eine Folge voneinander unabhängiger Zufallsvariablen mit identischen Verteilungen. Wenn der mathematische Erwartungswert = M(k) existiert, dann gilt für alle > 0 für n

Mit anderen Worten: Die Wahrscheinlichkeit, dass der durchschnittliche S n /n um weniger als einen willkürlich festgelegten Wert von der mathematischen Erwartung abweicht, tendiert gegen eins.

Zentraler Grenzwertsatz. Sei (k) eine Folge voneinander unabhängiger Zufallsvariablen mit identischen Verteilungen. Nehmen wir an, dass es sie gibt. Sei Sn = 1 +…+ n , dann für jeden festen

F () – F () (1.3)

Hier ist Ф(х) die Normalverteilungsfunktion. Dieser Satz wurde von Linlberg formuliert und bewiesen. Lyapunov und andere Autoren haben es früher unter restriktiveren Bedingungen bewiesen. Man muss sich vorstellen, dass der oben formulierte Satz nur ein ganz besonderer Fall eines viel allgemeineren Satzes ist, der wiederum eng mit vielen anderen Grenzwertsätzen verwandt ist. Beachten Sie, dass (1.3) viel stärker ist als (1.2), da (1.3) eine Schätzung für die Wahrscheinlichkeit liefert, dass die Differenz größer ist als. Andererseits gilt das Gesetz der großen Zahlen (1.2) auch dann, wenn die Zufallsvariablen k keine endliche Varianz haben, es gilt also für einen allgemeineren Fall als der zentrale Grenzwertsatz (1.3). Lassen Sie uns die letzten beiden Sätze anhand von Beispielen veranschaulichen.

Beispiele. a) Betrachten Sie eine Folge unabhängiger Würfe eines symmetrischen Würfels. Sei k die Anzahl der beim k-ten Wurf erzielten Punkte. Dann

M(k)=(1+2+3+4+5+6)/6=3,5,

a D(k)=(1 2 +2 2 +3 2 +4 2 +5 2 +6 2)/6-(3,5) 2 =35/12 und S n /n

ist die durchschnittliche Punktzahl aus n Würfen.

Das Gesetz der großen Zahlen besagt, dass es plausibel ist, dass dieser Durchschnitt für große n nahe bei 3,5 liegt. Der Zentrale Grenzwertsatz gibt die Wahrscheinlichkeit an, dass |Sn – 3,5n |< (35n/12) 1/2 близка к Ф() -- Ф(-). При n = 1000 и а=1 мы находим, что вероятность неравенства 3450 < Sn < 3550 равна примерно 0,68. Выбрав для а значение а 0 = 0,6744, удовлетворяющее соотношению Ф(0)-- Ф(-- 0)=1/2, мы получим, что для Sn шансы находиться внутри или вне интервала 3500 36 примерно одинаковы.

b) Probenahme. Nehmen wir an, dass in der Gesamtbevölkerung

Nk Familien bestehen aus N Familien und haben jeweils genau k Kinder

(k = 0, 1 ...; Nk = N). Wenn eine Familie zufällig ausgewählt wird, dann ist die Anzahl der Kinder darin eine Zufallsvariable, die einen Wert mit der Wahrscheinlichkeit p = N/N annimmt. Bei der aufeinanderfolgenden Auswahl kann man eine Stichprobe der Größe n als eine Sammlung von n unabhängigen Zufallsvariablen oder „Beobachtungen“ 1, ..., n betrachten, die alle die gleiche Verteilung haben; S n /n ist der Stichprobenmittelwert. Das Gesetz der großen Zahlen besagt, dass der Mittelwert einer Zufallsstichprobe, die groß genug ist, wahrscheinlich nahe am Mittelwert der Grundgesamtheit liegt. Der zentrale Grenzwertsatz ermöglicht es, die wahrscheinliche Größe der Diskrepanz zwischen diesen Mittelwerten abzuschätzen und die für eine zuverlässige Schätzung erforderliche Stichprobengröße zu bestimmen. In der Praxis sind und und meist unbekannt; In den meisten Fällen ist es jedoch einfach, eine vorläufige Schätzung zu erhalten, und diese kann immer innerhalb verlässlicher Grenzen gehalten werden. Wenn wir eine Wahrscheinlichkeit von 0,99 oder mehr wollen, dass der Stichprobenmittelwert S n /n um weniger als 1/10 vom unbekannten Grundgesamtheitsmittel abweicht, muss die Stichprobengröße so gewählt werden

Die x-Wurzel der Gleichung Ф(x) - Ф(-- x) = 0,99 ist gleich x = 2,57 ... und daher muss n so sein, dass 2,57 oder n > 660. Eine sorgfältige Vorabschätzung ermöglicht es, die erforderliche Stichprobengröße zu ermitteln.

c) Poisson-Verteilung.

Angenommen, die Zufallsvariablen k haben eine Poisson-Verteilung (p(k;)). Dann hat Sn eine Poisson-Verteilung mit Mittelwert und Varianz gleich n.

Indem wir anstelle von n schreiben, schließen wir, dass für n gilt

Die Summation erfolgt über alle k von 0 bis. Ph-la (1.5) gilt auch in willkürlicher Weise.

Es ist bereits bekannt, dass man nach dem Verteilungsgesetz die numerischen Eigenschaften einer Zufallsvariablen ermitteln kann. Daraus folgt, dass, wenn mehrere Zufallsvariablen identische Verteilungen aufweisen, ihre numerischen Eigenschaften gleich sind.

Lassen Sie uns überlegen N voneinander unabhängige Zufallsvariablen X 1 , X 2 , …,Xn, die die gleichen Verteilungen und daher die gleichen Eigenschaften haben (mathematischer Erwartungswert, Streuung usw.). Von größtem Interesse ist die Untersuchung der numerischen Eigenschaften des arithmetischen Mittels dieser Größen.

Bezeichnen wir das arithmetische Mittel der betrachteten Zufallsvariablen mit:

.

Die folgenden drei Bestimmungen stellen einen Zusammenhang zwischen den numerischen Merkmalen des arithmetischen Mittels und den entsprechenden Merkmalen jedes einzelnen Wertes her.

1. Der mathematische Erwartungswert des arithmetischen Mittels identisch verteilter, voneinander unabhängiger Zufallsvariablen ist gleich dem mathematischen Erwartungswert a jeder der Variablen:

Nachweisen. Unter Verwendung der Eigenschaften der mathematischen Erwartung (der konstante Faktor kann aus dem Vorzeichen der mathematischen Erwartung entnommen werden; die mathematische Erwartung der Summe ist gleich der Summe der mathematischen Erwartungen der Terme) haben wir

Berücksichtigt man, dass der mathematische Erwartungswert jeder der Größen gemäß der Bedingung gleich ist A, bekommen wir

.

2. Streuung des arithmetischen Mittels N identisch verteilte, voneinander unabhängige Zufallsvariablen in N mal weniger Varianz D jede der Mengen:

Nachweisen. Unter Verwendung der Eigenschaften der Dispersion (der konstante Faktor kann durch Quadrieren aus dem Dispersionszeichen herausgenommen werden; die Dispersion der Summe unabhängiger Größen ist gleich der Summe der Dispersionen der Terme) haben wir

Berücksichtigt man, dass die Varianz jeder der Größen gemäß der Bedingung gleich ist D, bekommen wir

.

3. Standardabweichung des arithmetischen Mittels N identisch verteilte, voneinander unabhängige Zufallsvariablen sind um ein Vielfaches kleiner als die Standardabweichung a jedes der Werte:

Nachweisen. Da ist die Standardabweichung gleich

.

Die allgemeine Schlussfolgerung aus den Formeln (7.3) und (7.4): Wenn man bedenkt, dass die Streuung und die Standardabweichung als Maß für die Streuung einer Zufallsvariablen dienen, schließen wir, dass das arithmetische Mittel einer ausreichend großen Anzahl voneinander unabhängiger Zufallsvariablen deutlich weniger hat Streuung als jeder einzelne Wert.

Lassen Sie uns anhand eines Beispiels die Bedeutung dieser Schlussfolgerung für die Praxis erläutern.

Beispiel. Um eine bestimmte physikalische Größe zu messen, werden normalerweise mehrere Messungen durchgeführt und dann das arithmetische Mittel der erhaltenen Zahlen ermittelt, das als Näherungswert der gemessenen Größe verwendet wird. Unter der Annahme, dass die Messungen unter den gleichen Bedingungen durchgeführt wurden, beweisen Sie:



a) das arithmetische Mittel ergibt ein zuverlässigeres Ergebnis als Einzelmessungen;

b) Mit zunehmender Anzahl der Messungen steigt die Zuverlässigkeit dieses Ergebnisses.

Lösung. a) Es ist bekannt, dass einzelne Messungen unterschiedliche Werte der Messgröße ergeben. Das Ergebnis jeder Messung hängt von vielen zufälligen Gründen (Temperaturänderungen, Instrumentenschwankungen usw.) ab, die nicht vollständig im Voraus berücksichtigt werden können.

Daher haben wir das Recht, mögliche Ergebnisse zu berücksichtigen N Einzelmessungen als Zufallsvariablen X 1 , X 2 , …,Xn(Der Index gibt die Messnummer an). Diese Größen haben die gleiche Wahrscheinlichkeitsverteilung (Messungen werden mit der gleichen Methode und mit den gleichen Instrumenten durchgeführt) und daher die gleichen numerischen Eigenschaften; Darüber hinaus sind sie voneinander unabhängig (das Ergebnis jeder einzelnen Messung hängt nicht von anderen Messungen ab).

Wie sich gezeigt hat, weist das arithmetische Mittel solcher Größen eine geringere Streuung auf als jede einzelne Größe. Mit anderen Worten: Es stellt sich heraus, dass das arithmetische Mittel näher am wahren Wert des Messwerts liegt als das Ergebnis einer separaten Messung. Das bedeutet, dass das arithmetische Mittel mehrerer Messungen ein zuverlässigeres Ergebnis liefert als eine Einzelmessung.

b) Es ist bekannt, dass mit zunehmender Anzahl einzelner Zufallsvariablen die Streuung des arithmetischen Mittels abnimmt. Das bedeutet, dass mit zunehmender Anzahl der Messungen das arithmetische Mittel mehrerer Messungen immer weniger vom wahren Wert des Messwertes abweicht. Durch die Erhöhung der Anzahl der Messungen erhält man somit ein zuverlässigeres Ergebnis.

Wenn beispielsweise die Standardabweichung einer Einzelmessung s = 6 m beträgt und insgesamt N= 36 Messungen, dann beträgt die Standardabweichung des arithmetischen Mittels dieser Messungen nur 1 m.

.

Offensichtlich lag das arithmetische Mittel mehrerer Messungen erwartungsgemäß näher am wahren Wert des Messwerts als das Ergebnis einer Einzelmessung.

Kursarbeit

zum Thema: „Gesetze der großen Zahlen“


Identisch verteilte Zufallsvariablen

Um viele praktische Probleme zu lösen, ist es notwendig, eine Reihe von Bedingungen zu kennen, aufgrund derer das Ergebnis des kombinierten Einflusses einer großen Anzahl zufälliger Faktoren nahezu unabhängig vom Zufall ist. Diese Bedingungen werden in mehreren Theoremen beschrieben, die zusammen als Gesetz der großen Zahlen bezeichnet werden. Dabei ist die Zufallsvariable k gleich 1 oder 0, je nachdem, ob das Ergebnis des k-ten Versuchs erfolgreich oder fehlschlägt. Somit ist Sn die Summe von n voneinander unabhängigen Zufallsvariablen, die jeweils die Werte 1 und 0 mit Wahrscheinlichkeiten p und q annehmen.

Die einfachste Form des Gesetzes der großen Zahlen ist der Satz von Bernoulli, der besagt, dass, wenn die Wahrscheinlichkeit eines Ereignisses in allen Versuchen gleich ist, die Häufigkeit des Ereignisses mit zunehmender Anzahl der Versuche tendenziell zur Wahrscheinlichkeit des Ereignisses tendiert und hört auf, zufällig zu sein.

Der Satz von Poisson besagt, dass die Häufigkeit eines Ereignisses in einer Reihe unabhängiger Versuche zum arithmetischen Mittel seiner Wahrscheinlichkeiten tendiert und nicht mehr zufällig ist.

Grenzwertsätze der Wahrscheinlichkeitstheorie, das Moivre-Laplace-Theorem, erklären die Art der Stabilität der Häufigkeit des Auftretens eines Ereignisses. Diese Natur liegt in der Tatsache, dass die Grenzverteilung der Anzahl des Auftretens eines Ereignisses bei unbegrenzter Zunahme der Anzahl von Versuchen (wenn die Wahrscheinlichkeit des Ereignisses in allen Versuchen gleich ist) eine Normalverteilung ist.

Der zentrale Grenzwertsatz erklärt die weite Verbreitung des Normalverteilungsgesetzes. Der Satz besagt, dass immer dann, wenn eine Zufallsvariable durch Addition einer großen Anzahl unabhängiger Zufallsvariablen mit endlichen Varianzen entsteht, das Verteilungsgesetz dieser Zufallsvariablen ein nahezu normales Gesetz ist.

Der Satz von Lyapunov erklärt die weit verbreitete Verteilung des Normalverteilungsgesetzes und erklärt den Mechanismus seiner Entstehung. Mit dem Satz können wir sagen, dass sich das Verteilungsgesetz dieser Zufallsvariablen immer dann ändert, wenn eine Zufallsvariable durch Addition einer großen Anzahl unabhängiger Zufallsvariablen entsteht, deren Varianzen im Vergleich zur Streuung der Summe klein sind Es stellt sich heraus, dass es sich um ein fast normales Gesetz handelt. Und da Zufallsvariablen immer durch unendlich viele Ursachen erzeugt werden und meist keine von ihnen eine Streuung aufweist, die mit der Streuung der Zufallsvariablen selbst vergleichbar ist, unterliegen die meisten in der Praxis vorkommenden Zufallsvariablen dem Normalverteilungsgesetz.

Die qualitativen und quantitativen Aussagen des Gesetzes der großen Zahlen basieren auf Tschebyscheff-Ungleichung. Es bestimmt die Obergrenze der Wahrscheinlichkeit, dass die Abweichung des Werts einer Zufallsvariablen von ihrer mathematischen Erwartung größer als eine bestimmte Zahl ist. Es ist bemerkenswert, dass die Tschebyscheff-Ungleichung eine Schätzung der Wahrscheinlichkeit eines Ereignisses für eine Zufallsvariable liefert, deren Verteilung unbekannt ist; nur ihr mathematischer Erwartungswert und ihre Varianz sind bekannt.

Tschebyscheffs Ungleichung. Wenn eine Zufallsvariable x Varianz aufweist, dann ist die Ungleichung für jedes x > 0 wahr, wobei M x und D x – mathematischer Erwartungswert und Varianz der Zufallsvariablen x.

Satz von Bernoulli. Sei x n die Anzahl der Erfolge in n Bernoulli-Versuchen und p die Erfolgswahrscheinlichkeit in einem einzelnen Versuch. Dann gilt für jedes s > 0, .

Satz von Lyapunov. Sei s 1 , s 2 , …, s n , … eine unbegrenzte Folge unabhängiger Zufallsvariablen mit mathematischen Erwartungen m 1 , m 2 , …, m n , … und Varianzen s 1 2 , s 2 2 , …, s n 2 … . Bezeichnen wir , , , .

Dann = Ф(b) - Ф(a) für alle reellen Zahlen a und b, wobei Ф(x) die Normalverteilungsfunktion ist.

Gegeben sei eine diskrete Zufallsvariable. Betrachten wir die Abhängigkeit der Anzahl der Erfolge Sn von der Anzahl der Versuche n. Bei jedem Versuch erhöht sich Sn um 1 oder 0. Diese Aussage kann wie folgt geschrieben werden:

Sn = 1 +…+ n. (1.1)

Gesetz der großen Zahlen. Sei (k) eine Folge voneinander unabhängiger Zufallsvariablen mit identischen Verteilungen. Wenn der mathematische Erwartungswert = M(k) existiert, dann gilt für alle > 0 für n

Mit anderen Worten: Die Wahrscheinlichkeit, dass der durchschnittliche S n /n um weniger als einen willkürlich gegebenen Wert von der mathematischen Erwartung abweicht, tendiert gegen eins.

Zentraler Grenzwertsatz. Sei (k) eine Folge voneinander unabhängiger Zufallsvariablen mit identischen Verteilungen. Nehmen wir an, dass es sie gibt. Sei Sn = 1 +…+ n , dann für jeden festen

F () - F () (1.3)

Hier ist Ф(х) die Normalverteilungsfunktion. Dieser Satz wurde von Linlberg formuliert und bewiesen. Lyapunov und andere Autoren haben es früher unter restriktiveren Bedingungen bewiesen. Man muss sich vorstellen, dass der oben formulierte Satz nur ein ganz besonderer Fall eines viel allgemeineren Satzes ist, der wiederum eng mit vielen anderen Grenzwertsätzen verwandt ist. Beachten Sie, dass (1.3) viel stärker ist als (1.2), da (1.3) eine Schätzung für die Wahrscheinlichkeit liefert, dass die Differenz größer als ist. Andererseits gilt das Gesetz der großen Zahlen (1.2) auch dann, wenn die Zufallsvariablen k keine endliche Varianz haben, es gilt also für einen allgemeineren Fall als der zentrale Grenzwertsatz (1.3). Lassen Sie uns die letzten beiden Sätze anhand von Beispielen veranschaulichen.

Beispiele. a) Betrachten Sie eine Folge unabhängiger Würfe eines symmetrischen Würfels. Sei k die Anzahl der beim k-ten Wurf erzielten Punkte. Dann

M( k)=(1+2+3+4+5+6)/6=3,5,

a D( k)=(1 2 +2 2 +3 2 +4 2 +5 2 +6 2)/6-(3,5) 2 =35/12 und S n /n

ist die durchschnittliche Punktzahl aus n Würfen.

Das Gesetz der großen Zahlen besagt, dass es plausibel ist, dass dieser Durchschnitt für große n nahe bei 3,5 liegt. Der zentrale Grenzwertsatz gibt die Wahrscheinlichkeit an, dass |Sn - 3,5n |< (35n/12) 1/2 близка к Ф() - Ф(- ). При n = 1000 и а=1 мы находим, что вероятность неравенства 3450 < Sn < 3550 равна примерно 0,68. Выбрав для а значение а 0 = 0,6744, удовлетворяющее соотношению Ф( 0)- Ф(- 0)=1/2, мы получим, что для Sn шансы находиться внутри или вне интервала 3500 36 примерно одинаковы.

b) Probenahme. Nehmen wir an, dass in der Gesamtbevölkerung

Nk Familien bestehen aus N Familien und haben jeweils genau k Kinder

(k = 0, 1 ...; Nk = N). Wenn eine Familie zufällig ausgewählt wird, dann ist die Anzahl der Kinder darin eine Zufallsvariable, die einen Wert mit der Wahrscheinlichkeit p = N/N annimmt. Bei der aufeinanderfolgenden Auswahl kann man eine Stichprobe der Größe n als eine Sammlung von n unabhängigen Zufallsvariablen oder „Beobachtungen“ 1, ..., n betrachten, die alle die gleiche Verteilung haben; S n /n ist der Stichprobenmittelwert. Das Gesetz der großen Zahlen besagt, dass bei einer ausreichend großen Zufallsstichprobe der Mittelwert wahrscheinlich nahe bei liegt, d. h. dem Mittelwert der Grundgesamtheit. Der zentrale Grenzwertsatz ermöglicht es, die wahrscheinliche Größe der Diskrepanz zwischen diesen Mittelwerten abzuschätzen und die für eine zuverlässige Schätzung erforderliche Stichprobengröße zu bestimmen. In der Praxis sind und und meist unbekannt; In den meisten Fällen ist es jedoch einfach, eine vorläufige Schätzung zu erhalten, und diese kann immer innerhalb verlässlicher Grenzen gehalten werden. Wenn wir eine Wahrscheinlichkeit von 0,99 oder mehr wollen, dass der Stichprobenmittelwert S n /n um weniger als 1/10 vom unbekannten Grundgesamtheitsmittel abweicht, muss die Stichprobengröße so gewählt werden

Die x-Wurzel der Gleichung F(x) - F(- x) = 0,99 ist x = 2,57... und daher muss n so sein, dass 2,57 oder n > 660 ist. Eine sorgfältige Vorabschätzung ermöglicht es, die erforderliche Stichprobengröße zu ermitteln.

c) Poisson-Verteilung.

Angenommen, die Zufallsvariablen k haben eine Poisson-Verteilung (p(k; )). Dann hat Sn eine Poisson-Verteilung mit Mittelwert und Varianz gleich n.

Wenn wir anstelle von n schreiben, schließen wir, dass für n gilt


Die Summation erfolgt über alle k von 0 bis . Ph-la (1.5) gilt auch in willkürlicher Weise.