Artikel

5.1: Der zentrale Grenzwertsatz für Stichprobenmittelwerte (Mittelwerte) - Mathematik


Angenommen (X) ist eine Zufallsvariable mit einer Verteilung, die bekannt oder unbekannt sein kann (es kann eine beliebige Verteilung sein). Angenommen, Sie verwenden einen Index, der der Zufallsvariablen entspricht:

  1. (mu_{x} =) der Mittelwert von (X)
  2. (sigma_{x} =) die Standardabweichung von (X)

Zieht man Zufallsstichproben der Größe (n), dann neigt die Zufallsvariable (ar{X}), die aus Stichprobenmitteln besteht, mit zunehmendem (n) dazu, normalverteilt zu sein und

[ar{X} sim N(mu_{x}), dfrac{sigma_{x}}{sqrt{n}}.]

Der zentrale Grenzwertsatz für Stichprobenmittelwerte besagt, dass, wenn Sie immer größere Stichproben ziehen (z. B. einen, zwei, fünf und schließlich zehn Würfel würfeln) und ihre Mittelwerte berechnen, die Stichprobenmittelwerte ihre eigenen bilden Normalverteilung (die Stichprobenverteilung). Die Normalverteilung hat denselben Mittelwert wie die ursprüngliche Verteilung und eine Varianz, die gleich der ursprünglichen Varianz dividiert durch den Stichprobenumfang ist. Die Variable (n) ist die Anzahl der Werte, die zusammen gemittelt werden, nicht die Anzahl der Experimente.

Formaler ausgedrückt, wenn Sie Zufallsstichproben der Größe (n) ziehen, heißt die Verteilung der Zufallsvariablen (ar{X}), die aus Stichprobenmitteln besteht, Stichprobenverteilung des Mittelwertes. Die Stichprobenverteilung des Mittelwerts nähert sich einer Normalverteilung an, wenn (n), der Stichprobenumfang, zunimmt.

Die Zufallsvariable (ar{X}) hat einen anderen (z)-Score als die Zufallsvariable (X). Der Mittelwert (ar{x}) ist der Wert von (ar{X}) in einer Stichprobe.

[z = dfrac{ar{x}-mu_{x}}{left(dfrac{sigma_{x}}{sqrt{n}} ight)}]

  • (mu_{x}) ist der Durchschnitt von (X) und (ar{X}).
  • (sigmaar{x} = dfrac{sigma_{x}}{sqrt{n}} = ) Standardabweichung von (ar{X}) und heißt Standardfehler des Mittelwerts .

Howto: Finden Sie Wahrscheinlichkeiten für Mittelwerte auf dem Taschenrechner

2nd VERTEILUNG

2:normalcdf

( ext{normalcdf} left( ext{unterer Wert der Fläche, oberer Wert der Fläche, Mittelwert}, dfrac{ ext{Standardabweichung}}{sqrt{ ext{Stichprobengröße}}} Recht))

wo:

  • bedeuten ist der Mittelwert der ursprünglichen Verteilung
  • Standardabweichung ist die Standardabweichung der ursprünglichen Verteilung
  • Stichprobengröße (= n)

Beispiel (PageIndex{1})

Eine unbekannte Verteilung hat einen Mittelwert von 90 und eine Standardabweichung von 15. Stichproben der Größe (n = 25) werden zufällig aus der Grundgesamtheit gezogen.

  1. Finden Sie die Wahrscheinlichkeit, dass der Stichprobenmittelwert zwischen 85 und 92 liegt.
  2. Ermitteln Sie den Wert, der zwei Standardabweichungen über dem erwarteten Wert 90 des Stichprobenmittelwerts liegt.

Antworten

ein.

Sei (X =) ein Wert aus der ursprünglichen unbekannten Grundgesamtheit. Die Wahrscheinlichkeitsfrage fordert Sie auf, eine Wahrscheinlichkeit für die Stichprobenmittelwert.

Sei (ar{X} =) der Mittelwert einer Stichprobe der Größe 25. Da (mu_{x} = 90, sigma_{x} = 15) und (n = 25),

[ar{X} sim N(90, dfrac{15}{sqrt{25}}). keine Nummer]

Finden Sie (P(85 < x < 92)). Zeichnen Sie eine Grafik.

[P(85 < x < 92) = 0,6997 onumber]

Die Wahrscheinlichkeit, dass der Stichprobenmittelwert zwischen 85 und 92 liegt, beträgt 0,6997.

Abbildung (PageIndex{1}).

normalcdf(unterer Wert, oberer Wert, Mittelwert, Standardfehler des Mittelwerts)

Die Parameterliste wird abgekürzt (unterer Wert, oberer Wert, (mu), (dfrac{sigma}{sqrt{n}}))

normalcdf((85,92,90,dfrac{15}{sqrt{25}}) = 0,6997)

b.

Um den Wert zu ermitteln, der zwei Standardabweichungen über dem erwarteten Wert 90 liegt, verwenden Sie die Formel:

[ egin{align*} ext{value} &= mu_{x} + (# ext{ofTSDEVs})left(dfrac{sigma_{x}}{sqrt{n}} rechts) [5pt] &= 90 + 2 left(dfrac{15}{sqrt{25}} ight) = 96 end{align*}]

Der Wert, der zwei Standardabweichungen über dem erwarteten Wert liegt, beträgt 96.

Der Standardfehler des Mittelwerts ist

[dfrac{sigma_{x}}{sqrt{n}} = dfrac{15}{sqrt{25}} = 3. onumber]

Denken Sie daran, dass der Standardfehler des Mittelwerts eine Beschreibung dafür ist, wie weit (im Durchschnitt) der Stichprobenmittelwert vom Grundgesamtheitsmittelwert in wiederholten einfachen Zufallsstichproben der Größe (n) entfernt ist.

Übung (PageIndex{1})

Eine unbekannte Verteilung hat einen Mittelwert von 45 und eine Standardabweichung von acht. Stichproben der Größe (n) = 30 werden zufällig aus der Grundgesamtheit gezogen. Finden Sie die Wahrscheinlichkeit, dass der Stichprobenmittelwert zwischen 42 und 50 liegt.

Antworten

(P(42 < ar{x} < 50) = left(42, 50, 45, dfrac{8}{sqrt{30}} ight) = 0,9797)

Beispiel (PageIndex{2})

Die Dauer in Stunden, die eine Gruppe von "über 40" Personen benötigt, um ein Fußballspiel zu spielen, wird normalerweise mit a Mittelwert von zwei Stunden und ein Standardabweichung von 0,5 Stunden. EIN Stichprobengröße (n = 50) wird zufällig aus der Bevölkerung gezogen. Finden Sie die Wahrscheinlichkeit, dass die Stichprobenmittelwert liegt zwischen 1,8 Stunden und 2,3 Stunden.

Antworten

Sei (X =) die Zeit in Stunden, die man braucht, um ein Fußballspiel zu spielen.

Die Wahrscheinlichkeitsfrage fordert Sie auf, eine Wahrscheinlichkeit für die Mittlere Stichprobenzeit, in Stunden, es dauert ein Fußballspiel zu spielen.

Sei (ar{X} =) die durchschnittliche Zeit in Stunden, die man braucht, um ein Fußballspiel zu spielen.

Wenn (mu_{x} =) _________, (sigma_{x} =) __________, und (n =) ___________, dann (X sim N)(______, ______) durch die Zentraler Grenzwertsatz für Mittel.

(mu_{x} = 2, sigma_{x} = 0.5, n = 50), und (X sim N left(2, dfrac{0.5}{sqrt{50}} ight ))

Finden Sie (P(1,8 < ar{x} < 2,3)). Zeichnen Sie eine Grafik.

(P(1,8 < ar{x} < 2,3) = 0,9977)

normalcdf(left(1.8,2.3,2,dfrac{.5}{sqrt{50}} ight) = 0.9977)

Die Wahrscheinlichkeit, dass die mittlere Zeit zwischen 1,8 Stunden und 2,3 Stunden liegt, beträgt 0,9977.

Übung (PageIndex{2})

Die Dauer des SAT für eine Gruppe von Studierenden ist normal verteilt mit einem Mittelwert von 2,5 Stunden und einer Standardabweichung von 0,25 Stunden. Eine Stichprobengröße von (n = 60) wird zufällig aus der Grundgesamtheit gezogen. Ermitteln Sie die Wahrscheinlichkeit, dass der Stichprobenmittelwert zwischen zwei Stunden und drei Stunden liegt.

Antworten

[P(2 < ar{x} < 3) = ext{normalcdf}left(2, 3, 2.5, dfrac{0,25}{sqrt{60}} ight) = 1 onumber]

Rechnerkenntnisse

Gehen Sie wie folgt vor, um Perzentile für Mittelwerte auf dem Rechner zu ermitteln.

  • 2nd VERTEILUNG
  • 3:invNorm

(k = ext{invNorm} left( ext{Fläche links von} k, ext{mean}, dfrac{ ext{Standardabweichung}}{sqrt{Stichprobengröße}} ight) )

wo:

  • (k) = die (k)das Perzentil
  • bedeuten ist der Mittelwert der ursprünglichen Verteilung
  • Standardabweichung ist die Standardabweichung der ursprünglichen Verteilung
  • Stichprobengröße = (n)

Beispiel (PageIndex{3})

In einer aktuellen Studie, die am 29. Oktober 2012 im Flurry Blog veröffentlicht wurde, liegt das Durchschnittsalter der Tablet-Nutzer bei 34 Jahren. Angenommen, die Standardabweichung beträgt 15 Jahre. Nehmen Sie eine Stichprobe der Größe (n = 100).

  1. Wie hoch sind der Mittelwert und die Standardabweichung für das Durchschnittsalter der Stichprobe der Tablet-Benutzer?
  2. Wie sieht die Verteilung aus?
  3. Ermitteln Sie die Wahrscheinlichkeit, dass das Durchschnittsalter der Stichprobe mehr als 30 Jahre beträgt (das gemeldete Durchschnittsalter der Tablet-Benutzer in dieser speziellen Studie).
  4. Finden Sie die 95das Perzentil für das Durchschnittsalter der Stichprobe (auf eine Dezimalstelle).

Antworten

  1. Da der Stichprobenmittelwert tendenziell auf den Populationsmittelwert abzielt, gilt (mu_{x} = mu = 34). Die Standardabweichung der Stichprobe ist gegeben durch: [sigma_{x} = dfrac{sigma}{sqrt{n}} = dfrac{15}{sqrt{100}} = dfrac{15}{10 } = 1,5 keineZahl]
  2. Der zentrale Grenzwertsatz besagt, dass für große Stichprobenumfänge ((n)) die Stichprobenverteilung annähernd normal ist.
  3. Die Wahrscheinlichkeit, dass das Durchschnittsalter der Stichprobe über 30 liegt, ergibt sich aus: [P(Χ > 30) = ext{normalcdf}(30,E99,34,1.5) = 0,9962 onumber]
  4. Sei (k) = die 95das Perzentil. [k = ext{invNorm}left(0.95, 34, dfrac{15}{sqrt{100}} ight) = 36.5 onumber]

Übung (PageIndex{3})

In einem Artikel auf Flurry Blog wird eine Gaming-Marketing-Lücke für Männer zwischen 30 und 40 Jahren identifiziert. Sie recherchieren ein Startup-Spiel, das sich an die 35-Jährige richtet. Deine Idee ist es, ein Strategiespiel zu entwickeln, das von Männern zwischen Ende 20 und Ende 30 gespielt werden kann. Basierend auf den Daten des Artikels zeigt eine Branchenforschung, dass der durchschnittliche Strategiespieler 28 Jahre alt ist mit einer Standardabweichung von 4,8 Jahren. Sie ziehen eine Stichprobe von 100 zufällig ausgewählten Spielern. Wenn Ihr Zielmarkt die 29- bis 35-Jährigen sind, sollten Sie Ihre Entwicklungsstrategie fortsetzen?

Antworten

Sie müssen die Wahrscheinlichkeit ermitteln, mit der Männer mit einem Durchschnittsalter zwischen 29 und 35 Jahren ein Strategiespiel spielen möchten.

[P(29 < ar{x} < 35) = ext{normalcdf} left(29, 35, 28,dfrac{4.8}{sqrt{100}} ight) = 0,0186]

Sie können daraus schließen, dass Ihr Spiel mit einer Wahrscheinlichkeit von etwa 1,9 % von Männern gespielt wird, deren Durchschnittsalter zwischen 29 und 35 Jahren liegt.

Beispiel (PageIndex{4})

Die durchschnittliche Anzahl der Minuten für die App-Interaktion durch einen Tablet-Benutzer beträgt 8,2 Minuten. Angenommen, die Standardabweichung beträgt eine Minute. Nehmen Sie eine Probe von 60.

  1. Wie hoch sind der Mittelwert und die Standardabweichung für die durchschnittliche Stichprobenanzahl der App-Interaktionen eines Tablet-Benutzers?
  2. Was ist der Standardfehler des Mittelwerts?
  3. Finden Sie die 90das Perzentil für die mittlere Stichprobenzeit für das App-Engagement eines Tablet-Benutzers. Interpretieren Sie diesen Wert in einem vollständigen Satz.
  4. Ermitteln Sie die Wahrscheinlichkeit, dass der Stichprobenmittelwert zwischen acht Minuten und 8,5 Minuten liegt.

Antworten

  1. (mu = mu = 8,2 sigma_{ar{x}} = dfrac{sigma}{sqrt{n}} = dfrac{1}{sqrt{60}} = 0,13)
  2. Dies ermöglicht es uns, die Wahrscheinlichkeit von Stichprobenmittelwerten einer bestimmten Entfernung vom Mittelwert in wiederholten Stichproben der Größe 60 zu berechnen.
  3. Sei (k) = die 90das Perzentil
    (k = ext{invNorm}left(0,90, 8,2, dfrac{1}{sqrt{60}} ight) = 8,37). Dieser Wert zeigt an, dass 90 Prozent der durchschnittlichen App-Interaktionszeit für Tabellenbenutzer weniger als 8,37 Minuten beträgt.
  4. (P(8 < ar{x} < 8.5) = ext{normalcdf}left(8, 8.5, 8.2, dfrac{1}{sqrt{60}} ight) = 0,9293)

Übung (PageIndex{4})

Dosen eines Cola-Getränkes behaupten, 16 Unzen zu enthalten. Die Mengen in einer Probe werden gemessen und die Statistik ist (n = 34), (ar{x} = 16,01) Unzen. Wenn die Dosen mit (mu = 16,00) Unzen (wie beschriftet) und (sigma = 0,143) Unzen gefüllt sind, ermitteln Sie die Wahrscheinlichkeit, dass eine Probe von 34 Dosen eine durchschnittliche Menge von mehr als 16,01 Unzen hat. Legen die Ergebnisse nahe, dass Dosen mit einer Menge von mehr als 16 Unzen gefüllt sind?

Antworten

Wir haben (P(ar{x} > 16.01) = ext{normalcdf} left(16.01,E99,16, dfrac{0.143}{sqrt{34}} ight) = 0.3417). Da das durchschnittliche Probengewicht mit einer Wahrscheinlichkeit von 34,17% größer als 16,01 Unzen ist, sollten wir dem vom Unternehmen angegebenen Volumen skeptisch gegenüberstehen. Wenn ich Konsument bin, sollte ich froh sein, dass ich wahrscheinlich kostenlose Cola erhalte. Wenn ich der Hersteller bin, muss ich feststellen, ob meine Abfüllprozesse außerhalb der akzeptablen Grenzen liegen.

Zusammenfassung

In einer Grundgesamtheit, deren Verteilung bekannt oder unbekannt sein kann, ist die Verteilung der Stichprobenmittelwerte ungefähr normal, wenn die Größe ((n)) der Stichproben ausreichend groß ist. Der Mittelwert der Stichprobenmittelwerte entspricht dem Grundgesamtheitsmittelwert. Die Standardabweichung der Verteilung der Stichprobenmittelwerte, auch Standardfehler des Mittelwerts genannt, ist gleich der Standardabweichung der Grundgesamtheit geteilt durch die Quadratwurzel des Stichprobenumfangs ((n)).

Formel-Überprüfung

  • Der zentrale Grenzwertsatz für Stichprobenmittelwerte: [ar{X} sim Nleft(mu_{x}, dfrac{sigma_{x}}{sqrt{n}} ight) onumber]
  • Der Mittelwert (ar{X}: sigma_{x})
  • Zentraler Grenzwertsatz für Stichprobenmittel z-Score und Standardfehler des Mittelwerts: [z = dfrac{ar{x}-mu_{x}}{left(dfrac{sigma_{x}}{ sqrt{n}} ight)} onumber]
  • Standardfehler des Mittelwerts (Standardabweichung ((ar{X}))): [dfrac{sigma_{x}}{sqrt{n}} onumber]

Glossar

Durchschnittlich
eine Zahl, die die zentrale Tendenz der Daten beschreibt; Es gibt eine Reihe spezialisierter Mittelwerte, einschließlich des arithmetischen Mittels, des gewichteten Mittels, des Medians, des Modus und des geometrischen Mittels.
Zentraler Grenzwertsatz
Bei einer gegebenen Zufallsvariablen (RV) mit bekanntem Mittelwert (mu) und bekannter Standardabweichung (sigma) nehmen wir Stichproben mit der Größe (n) und interessieren uns für zwei neue RVs: die Stichprobe Mittelwert (ar{X}) und die Stichprobensumme (sum X). Ist die Größe ((n)) der Stichprobe ausreichend groß, dann gilt (ar{X}sim Nleft(mu,dfrac{sigma}{sqrt{n}} ight) ) und (sum Xsim N(nmu, (sqrt{n})(sigma))). Wenn die Größe ((n)) der Stichprobe ausreichend groß ist, nähern sich die Verteilung der Stichprobenmittelwerte und die Verteilung der Stichprobensummen ungeachtet der Form der Grundgesamtheit einer Normalverteilung an. Der Mittelwert der Stichprobenmittelwerte entspricht dem Grundgesamtheitsmittelwert und der Mittelwert der Stichprobensummen entspricht (n) mal dem Grundgesamtheitsmittelwert. Die Standardabweichung der Verteilung der Stichprobenmittelwerte, (dfrac{sigma}{sqrt{n}}), wird als Standardfehler des Mittelwerts bezeichnet.
Normalverteilung
eine stetige Zufallsvariable (RV) mit pdf (f(x) = dfrac{1}{sigma sqrt{2 pi}}e^{dfrac{-(x-mu)^{2}} {2 sigma^{2}}}), wobei (mu) der Mittelwert der Verteilung und (sigma) die Standardabweichung ist; Notation: (X sim N(mu, sigma)). Für (mu = 0) und (sigma = 1) heißt die RV a Standard Normalverteilung.
Standardfehler des Mittelwerts
die Standardabweichung der Verteilung der Stichprobenmittelwerte oder (dfrac{sigma}{sqrt{n}}).


Schau das Video: Zentraler Grenzwertsatz1 (Januar 2022).