Unterschied zwischen Population und Standardabweichung der Probe

Anonim

Population vs Sample Standardabweichung

In der Statistik werden mehrere Indizes verwendet, um einen Datensatz zu beschreiben, seine zentrale Tendenz, Dispersion und Schiefe. Die Standardabweichung ist eine der häufigsten Maßstäbe für die Verteilung von Daten aus dem Zentrum des Datensatzes.

Aufgrund praktischer Schwierigkeiten wird es nicht möglich sein, Daten aus der gesamten Population zu verwenden, wenn eine Hypothese getestet wird. Deshalb verwenden wir Datenwerte aus Proben, um Rückschlüsse auf die Population zu ziehen. In einer solchen Situation werden diese Schätzer genannt, da sie die Populationsparameterwerte schätzen.

Es ist extrem wichtig, unvoreingenommen Schätzer in Inferenz zu verwenden. Ein Schätzer soll unvoreingenommen sein, wenn der erwartete Wert dieses Schätzers dem Populationsparameter entspricht. Zum Beispiel verwenden wir das Stichprobenmittel als unverzerrten Schätzer für den Populationswert. (Mathematisch kann gezeigt werden, dass der Erwartungswert des Stichprobenmittels dem Populationsmittel entspricht). Im Fall der Abschätzung der Populationsstandardabweichung ist die Standardabweichung der Probe auch ein unverzerrter Schätzer.

Was ist die Populationsstandardabweichung?

Wenn Daten aus der Gesamtbevölkerung berücksichtigt werden können (z. B. bei einer Volkszählung), ist es möglich, die Populationsstandardabweichung zu berechnen. Um die Standardabweichung der Population zu berechnen, werden zuerst die Abweichungen der Datenwerte vom Populationsmittel berechnet. Der quadratische Mittelwert der Abweichungen wird als Populationsstandardabweichung bezeichnet.

In einer Klasse von 10 Studenten können Daten über die Schüler leicht gesammelt werden. Wenn eine Hypothese an dieser Studentenpopulation getestet wird, müssen keine Stichprobenwerte verwendet werden. Zum Beispiel wird das Gewicht der 10 Schüler (in Kilogramm) mit 70, 62, 65, 72, 80, 70, 63, 72, 77 und 79 gemessen. (70 + 62 + 65 + 72 + 80 + 70 + 63 + 72 + 77 + 79) / 10, was 71 (in Kilogramm) ist. Dies ist der Populationswert.

Zur Berechnung der Populationsstandardabweichung berechnen wir Abweichungen vom Mittelwert. Die entsprechenden Abweichungen vom Mittelwert sind (70-71) = -1, (62-71) = -9, (65-71) = -6, (72-71) = 1, (77 - 71) = 6 und (79 - 71) = 8. Die Summe der Quadrate der Abweichung beträgt (70-71) = -1, -1 999 2 999 + 999 999 2 999 699 999 999 999 2 999 9 999 2 < + (-1) 2 + (-8) 2 + 1 2 + 6 2 + 8 2 = 366. Die Populationsstandardabweichung ist √ (366/10) = 6. 05 (in Kilogramm). 71 ist das genaue Durchschnittsgewicht der Schüler der Klasse und 6.05 ist die exakte Standardabweichung des Gewichts von 71. Was ist die Standardabweichung der Probe? Wenn Daten aus einer Stichprobe (der Größe n) zur Schätzung von Parametern der Population verwendet werden, wird die Standardabweichung der Stichprobe berechnet. Zunächst werden die Abweichungen der Datenwerte vom Stichprobenmittelwert berechnet. Da das Stichprobenmittel anstelle des Populationsmittels verwendet wird (was unbekannt ist), ist es nicht angemessen, den quadratischen Mittelwert zu verwenden. Um die Verwendung des Abtastmittelwerts zu kompensieren, wird die Summe der Quadrate der Abweichungen durch (n-1) anstelle von n geteilt. Die Standardabweichung der Probe ist die Quadratwurzel davon. In mathematischen Symbolen ist S = √ {Σ (x i -ẍ) 2 / (n - 1)}, wobei S die Stichprobenstandardabweichung ist, x i sind die Datenpunkte. Nehmen Sie nun an, dass im vorigen Beispiel die Bevölkerung die Schüler der ganzen Schule sind. Dann wird die Klasse nur ein Beispiel sein. Wenn diese Stichprobe für die Schätzung verwendet wird, beträgt die Stichprobenstandardabweichung √ (366/9) = 6. 38 (in Kilogramm), da 366 anstelle von 10 (Stichprobengröße) durch 9 geteilt wurde. Es ist zu beachten, dass dies nicht der exakte Wert der Populationsstandardabweichung ist. Es ist nur eine Schätzung dafür. Was ist der Unterschied zwischen Populationsstandardabweichung und Standardabweichung der Probe?

• Die Populationsstandardabweichung ist der exakte Parameterwert, der zur Messung der Dispersion aus dem Zentrum verwendet wird, während die Standardabweichung der Probe ein unvoreingenommener Schätzer dafür ist.

• Die Populationsstandardabweichung wird berechnet, wenn alle Daten bezüglich jedes einzelnen der Bevölkerung bekannt sind. Ansonsten wird die Standardabweichung der Probe berechnet. • Populationsstandardabweichung ist gegeben durch σ = √ {Σ (xi-μ) 2 / n} wobei μ der Populationswert ist und n die Populationsgröße ist, S = √ {Σ (xi - ẍ) 2 / (n - 1)} wobei ẍ der Stichprobenmittelwert ist und n die Stichprobengröße ist.