Differenz zwischen Standardabweichung und Standardfehler

Einführung

Standard D Räumung (SD) und S Standard > E rror (SE) sind scheinbar ähnliche Terminologien; sie sind jedoch konzeptionell so vielfältig, dass sie in der Literatur der Statistik fast austauschbar verwendet werden. Beiden Termen ist normalerweise ein Plus-Minus-Symbol (+/-) vorangestellt, das anzeigt, dass sie einen symmetrischen Wert definieren oder einen Bereich von Werten darstellen. Ausnahmslos erscheinen beide Begriffe mit einem Durchschnittswert einer Menge von gemessenen Werten.

Interessanterweise hat eine SE nichts zu tun mit Standards, mit Fehlern oder mit der Übermittlung von wissenschaftlichen Daten.

Ein detaillierter Blick auf den Ursprung und die Erklärung von SD und SE wird zeigen, warum professionelle Statistiker und diejenigen, die sie kursorisch benutzen, beide eher irren.

Standardabweichung (SD)

Ein SD ist eine

beschreibende Statistik, die die Verteilung einer Verteilung beschreibt. Als Metrik ist es nützlich, wenn die Daten normal verteilt sind. Es ist jedoch weniger nützlich, wenn Daten stark verzerrt oder bimodal sind, da sie die Form der Verteilung nicht sehr gut beschreiben. Normalerweise verwenden wir SD, wenn wir die Merkmale der Stichprobe melden, weil wir beschreiben , um wie viel die Daten um den Mittelwert variieren. Andere nützliche Statistiken zum Beschreiben der Ausbreitung der Daten sind der Interquartilsbereich, das 25. und 75. Perzentil und die Reichweite der Daten.

Abbildung 1. SD ist ein Maß für die Streuung der Daten. Wenn Daten eine Stichprobe aus einer normalverteilten Verteilung sind, erwartet man, dass zwei Drittel der Daten innerhalb einer Standardabweichung des Mittelwerts liegen.

Die Varianz ist auch eine

beschreibende Statistik und wird als Quadrat der Standardabweichung definiert. Es wird normalerweise nicht berichtet, wenn Ergebnisse beschrieben werden, aber es ist eine mathematisch leichter handhabbare Formel (a. K. A. Die Summe der quadrierten Abweichungen) und spielt eine Rolle bei der Berechnung von Statistiken.

Zum Beispiel, wenn wir zwei Statistiken haben

P & Q mit bekannten Abweichungen var (P) & < var (Q) , dann ist die Varianz der Summe P + Q gleich der Summe der Varianzen: var (P) + > var (Q) . Es ist jetzt offensichtlich, warum Statistiker gerne über Varianzen sprechen. Aber Standardabweichungen haben eine wichtige Bedeutung für die Spreizung, insbesondere wenn die Daten normalverteilt sind: Es ist zu erwarten, dass das Intervallmittel +/- 1 SD 2/3 der Stichprobe und das Intervall erfasst Es kann erwartet werden, dass

+ - 2 SD 95% der Probe erfasst. SD gibt an, wie weit die einzelnen Antworten auf eine Frage vom Mittelwert abweichen oder "abweichen".SD sagt dem Forscher, wie weit die Antworten verteilt sind - konzentrieren sie sich um den Mittelwert oder sind sie weit verstreut? Haben alle Ihre Befragten Ihr Produkt in der Mitte Ihrer Skala bewertet, oder hat es einige genehmigt und einige haben es abgelehnt? Betrachten Sie ein Experiment, bei dem die Befragten gebeten werden, ein Produkt anhand einer Reihe von Attributen auf einer 5-Punkte-Skala zu bewerten. Der Mittelwert für eine Gruppe von zehn Befragten (mit "A" bis "J" unten) für "ein gutes Preis-Leistungs-Verhältnis" war 3. 2 mit einer SD von 0, 4 und der Mittelwert für "Produktzuverlässigkeit" war 3. 4 mit einem SD von 2. 1. Auf den ersten Blick (wenn man nur die Mittel betrachtet) scheint die Zuverlässigkeit höher als der Wert zu sein. Aber die höhere SD für die Zuverlässigkeit könnte (wie in der nachstehenden Verteilung gezeigt) darauf hinweisen, dass die Antworten sehr polarisiert waren, wobei die meisten Befragten keine Zuverlässigkeitsprobleme hatten (bewertete das Attribut eine "5"), aber ein kleineres, aber wichtiges Segment der Befragten ein Zuverlässigkeitsproblem und bewertete das Attribut "1". Betrachtet man nur den Mittelwert, wird nur ein Teil der Geschichte erzählt, aber in den meisten Fällen konzentrieren sich die Forscher darauf. Die Verteilung der Antworten ist wichtig und der SD liefert eine wertvolle deskriptive Maßnahme dafür.

Befragter

Guter Wert für das Geld

Produktsicherheit

A 3 1
B 3 1
C 3 < 1 D
3 1 E
4 5 F
4 5 G
3 5 H
3 5 I
3 5 J
3 5 Mittelwert
3. 2 3. 4 Std. Entwickler
0. 4 2. 1 Erste Umfrage: Befragte, die ein Produkt auf einer 5-Punkte-Skala bewerten
Zwei sehr unterschiedliche Verteilungen von Antworten auf eine 5-Punkte-Bewertungsskala können denselben Mittelwert ergeben. Betrachten Sie das folgende Beispiel mit Antwortwerten für zwei verschiedene Bewertungen. Im ersten Beispiel (Bewertung "A") ist SD Null, weil ALLE Antworten genau der Mittelwert waren. Die einzelnen Antworten weichen nicht vom Mittelwert ab. In der Bewertung "B" ist die Standardabweichung höher, obwohl der Gruppenmittelwert gleich ist (3. 0) wie bei der ersten Verteilung. Die Standardabweichung von 1.15 zeigt, dass die einzelnen Antworten im Durchschnitt * etwas mehr als einen Punkt vom Mittelwert entfernt waren.

Befragter

Bewertung "A"

Bewertung "B"

A

3 1 B
3 2 C
3 2 D
3 3 E
3 3 F
3 3 G
3 > 3 H 3
4 I 3
4 J 3
5 Mittelwert 3. 0
3. 0 Std. Entwickler 0. 00
1. 15 Zweite Umfrage: Befragte, die ein Produkt auf einer 5-Punkte-Skala bewerten Eine andere Möglichkeit, SD zu betrachten, besteht darin, die Verteilung als ein Histogramm der Antworten aufzutragen. Eine Verteilung mit einer niedrigen SD würde als eine große schmale Form angezeigt werden, während eine große SD durch eine breitere Form angezeigt werden würde.
SD zeigt im Allgemeinen nicht "richtig oder falsch" oder "besser oder schlechter" an - eine niedrigere SD ist nicht unbedingt wünschenswerter. Es wird nur als beschreibende Statistik verwendet. Es beschreibt die Verteilung in Bezug auf den Mittelwert. T ___________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________________ Es wird jedoch nicht tatsächlich als Durchschnitt berechnet (wenn es so wäre, würden wir es die "durchschnittliche Abweichung" nennen). Stattdessen ist es "standardisiert", eine etwas komplexe Methode, um den Wert unter Verwendung der Summe der Quadrate zu berechnen.

Für praktische Zwecke ist die Berechnung nicht wichtig. Die meisten Tabellenprogramme, Tabellenkalkulationen oder andere Datenverwaltungstools berechnen den SD für Sie. Wichtiger ist es zu verstehen, was die Statistiken vermitteln.

Standardfehler

Ein Standardfehler ist eine

Inferenz Statistik, die verwendet wird, wenn Stichprobenmittel (Durchschnittswerte) über Populationen hinweg verglichen werden. Es ist ein Maß für

Genauigkeit

des Stichprobenmittels. Der Stichprobenmittelwert ist eine Statistik, die aus Daten mit einer zugrunde liegenden Verteilung abgeleitet wird. Wir können es nicht auf die gleiche Weise visualisieren wie die Daten, da wir ein einzelnes Experiment durchgeführt haben und nur einen einzigen Wert haben. Die statistische Theorie sagt uns, dass der Stichprobenmittelwert (für eine große "ausreichende" Stichprobe und unter einigen Regelmäßigkeitsbedingungen) ungefähr normal verteilt ist. Die Standardabweichung dieser Normalverteilung nennen wir den Standardfehler.

Abbildung 2.

Die Verteilung im unteren Bereich repräsentiert die Verteilung der Daten, während die Verteilung im oberen Bereich die theoretische Verteilung des Stichprobenmittelwerts ist. Der SD von 20 ist ein Maß für die Streuung der Daten, während der SE von 5 ein Maß für die Unsicherheit um den Stichprobenmittelwert ist. Wenn wir die Ergebnisse eines Zwei-Proben-Experiments von Behandlung A und Behandlung B vergleichen wollen, müssen wir abschätzen, wie genau wir die Mittel gemessen haben. Eigentlich interessiert es uns, wie genau wir den Unterschied zwischen den beiden Mitteln gemessen haben. Wir nennen dieses Maß den Standardfehler des Unterschieds. Sie werden nicht überrascht sein zu erfahren, dass der Standardfehler des Unterschieds in der Stichprobe eine Funktion der Standardfehler der Mittel ist: Nachdem Sie nun verstanden haben, dass der Standardfehler des Mittelwerts (SE) und der Standardabweichung der Verteilung (SD) sind zwei verschiedene Bestien, Sie wundern sich vielleicht, wie sie in erster Linie verwirrt wurden. Während sie sich konzeptionell unterscheiden, haben sie mathematisch eine einfache Beziehung:

, wobei n die Anzahl der Datenpunkte ist. Beachten Sie, dass der Standardfehler von zwei Komponenten abhängt: der Standardabweichung der Stichprobe und der Größe der Stichprobe n

. Dies macht einen intuitiven Sinn: Je größer die Standardabweichung der Stichprobe ist, desto weniger präzise können wir über unsere Schätzung des wahren Mittelwerts sein.

Je größer die Stichprobengröße ist, desto mehr Informationen haben wir über die Population und desto genauer können wir den wahren Mittelwert schätzen.

SE ist ein Hinweis auf die Zuverlässigkeit des Mittelwerts. Ein kleiner SE ist ein Hinweis darauf, dass der Stichprobenmittelwert das tatsächliche Bevölkerungsdurchschnittsmittel genauer wiedergibt.Eine größere Stichprobengröße führt normalerweise zu einem kleineren SE (während SD nicht direkt von der Stichprobengröße betroffen ist).

Die meisten Umfragen umfassen die Entnahme einer Stichprobe aus einer Population. Aus den Ergebnissen dieser Stichprobe ziehen wir dann Rückschlüsse auf die Population. Wenn eine zweite Probe gezeichnet wurde, stimmen die Ergebnisse wahrscheinlich nicht genau mit der ersten Probe überein. Wenn der Mittelwert für ein Bewertungsattribut bei einer Stichprobe 3,2 war, könnte es bei einer zweiten Stichprobe derselben Größe 3,4 sein. Wenn wir eine unendliche Anzahl von Proben (gleicher Größe) aus unserer Population zeichnen würden, könnten wir die beobachteten Mittel als eine Verteilung anzeigen. Wir könnten dann einen Durchschnitt aller unserer Stichprobenmittel berechnen. Dieser Mittelwert würde dem wahren Bevölkerungsdurchschnitt entsprechen. Wir können auch die SD der Verteilung der Stichprobenmittel berechnen. Die SD dieser Verteilung der Stichprobenmittel ist die SE jedes einzelnen Stichprobenmittels.

Wir haben also unsere bedeutendste Beobachtung: SE ist die SD des Bevölkerungsdurchschnitts. Probe

Mittelwert

1st

3. 2

2nd 3. 4

3. 3. 3
4. 3. 2
5. 3. 1
.... ....
.... ....
.... ....
.... ....
.... ....
Mittelwert 3. 3
Std. Entwickler 0. 13
Tabelle, die die Beziehung zwischen SD und SE zeigt Es ist jetzt klar, dass, wenn der SD dieser Verteilung uns hilft zu verstehen, wie weit ein Stichprobenmittel vom wahren Populationsmittelwert ist, können wir dies verwenden, um zu verstehen, wie genau jeder einzelne Stichprobenmittelwert ist in Relation zum wahren Mittelwert. Das ist die Essenz von SE.
Tatsächlich haben wir nur eine einzige Stichprobe aus unserer Population gezogen, aber wir können dieses Ergebnis verwenden, um eine Schätzung der Zuverlässigkeit unseres beobachteten Stichprobenmittelwerts zu liefern.
Tatsächlich sagt uns SE, dass wir zu 95% sicher sein können, dass unser beobachteter Stichprobenmittel plus oder minus ungefähr 2 (tatsächlich 1. 96) Standardfehler vom Bevölkerungsdurchschnitt ist. Die folgende Tabelle zeigt die Verteilung der Antworten von unserer ersten (und einzigen) Probe, die für unsere Forschung verwendet wurde. Die SE von 0,13, die relativ klein ist, gibt uns einen Hinweis darauf, dass unser Mittelwert relativ nahe am wahren Mittelwert unserer Gesamtbevölkerung liegt. Die Fehlermarge (bei 95% Konfidenz) für unseren Mittelwert ist (ungefähr) das Doppelte dieses Wertes (+/- 0. 26), was uns sagt, dass der wahre Mittelwert am wahrscheinlichsten zwischen 2. 94 und 3. 46 liegt.

Antwort

Bewertung

A

3

B

3
C 3
D 3
E 4
F 4
G 3
H 3
I 3
J 3
Mittelwert > 3. 2 Std. Err
0. 13
Zusammenfassung Viele Forscher verstehen die Unterscheidung zwischen Standardabweichung und Standardfehler nicht, obwohl sie üblicherweise in die Datenanalyse einbezogen werden. Während die tatsächlichen Berechnungen für Standardabweichung und Standardfehler sehr ähnlich aussehen, repräsentieren sie zwei sehr unterschiedliche, aber komplementäre Maßnahmen. SD sagt uns über die Form unserer Distribution, wie nah die einzelnen Datenwerte vom Mittelwert sind. SE sagt uns, wie nahe unsere Stichprobe dem wahren Mittelwert der Gesamtbevölkerung entspricht.Zusammen tragen sie dazu bei, ein vollständigeres Bild zu liefern, als uns der Durchschnitt sagen kann.