Differenz zwischen Stichprobenvarianz & Populationsvarianz

Erklärung

In Statistik der Begriff Stichproben bezieht sich auf die Auswahl eines Teils der aggregierten statistischen Daten, um relevante Informationen über das Ganze zu erhalten. Die Gesamtheit oder Gesamtheit statistischer Informationen über einen bestimmten Charakter aller von der Untersuchung erfassten Mitglieder wird "Bevölkerung" oder "Universum" genannt. (Das, N. G., 2010). Der ausgewählte Teil der Population, der verwendet wird, um die Merkmale der Population oder des Universums zu erhalten, wird als "Probe" bezeichnet. Man nimmt an, dass die Bevölkerung aus einzelnen Einheiten oder Mitgliedern besteht, und einige der Einheiten sind in der Stichprobe enthalten. Die Gesamtanzahl der Einheiten der Population wird Populationsgröße genannt, und die der Stichprobe wird Stichprobengröße genannt. Bevölkerung und Stichprobe können endlich oder unendlich sein und ähnlich können sie existent oder hypothetisch sein.

Varianz: Varianz ist ein numerischer Wert, der angibt, wie weit sich die einzelnen Zahlen in einem Datensatz über den Mittelwert verteilen. So weit ist jede Zahl vom Mittelwert und somit voneinander entfernt. Eine Abweichung von Null bedeutet, dass alle Daten identisch sind. Je mehr die Varianz, desto mehr verteilen sich die Werte um den Mittelwert, also voneinander. Je geringer die Varianz, desto weniger verteilen sich die Werte um den Mittelwert, also voneinander, und die Varianz kann nicht negativ sein.

Differenz zwischen Populationsvarianz und Stichprobenvarianz

Der Hauptunterschied zwischen Populationsvarianz und Stichprobenvarianz bezieht sich auf die Varianzberechnung. Die Varianz wird in fünf Schritten berechnet. Der erste Mittelwert wird berechnet, dann berechnen wir Abweichungen vom Mittelwert, und drittens werden die Abweichungen quadriert, viertens werden die quadrierten Abweichungen summiert und schließlich wird diese Summe durch die Anzahl der Punkte dividiert, für die die Varianz berechnet wird. Also Varianz = Σ (xi-x -) / n. Wo xi = i. Anzahl, x- = Mittelwert und n = Anzahl der Elemente ...

Wenn nun die Varianz aus Populationsdaten berechnet werden soll, ist n gleich der Anzahl der Items. Wenn also die Blutdruckschwankung aller 1000 Personen aus den Blutdruckdaten aller 1000 Personen berechnet werden soll, dann ist n = 1000. Wenn jedoch die Varianz aus den Probendaten berechnet wird, ist 1 von n abzuziehen, bevor dividiert wird Summe der quadrierten Abweichungen. Wenn im obigen Beispiel Beispieldaten 100 Elemente enthalten, wäre der Nenner 100 - 1 = 99.

Aus diesem Grund ist der aus den Stichprobendaten errechnete Varianzwert höher als der Wert, der bei Verwendung von Populationsdaten ermittelt werden konnte. Die Logik besteht darin, unseren Informationsmangel über die Bevölkerungsdaten auszugleichen. Es ist unmöglich, die Varianz der Höhen in den Menschen zu finden, für unseren absoluten Mangel an Informationen über Höhen aller lebenden Menschen, um nicht von der Zukunft zu sprechen.Selbst wenn wir ein gemäßigtes Beispiel nehmen, wie Bevölkerungsdaten über die Höhen aller lebenden Männer in den USA, ist es physisch möglich, aber die damit verbundenen Kosten und die Zeit würden den Zweck ihrer Berechnung zunichte machen. Dies ist der Grund dafür, dass Stichprobendaten für die meisten statistischen Zwecke verwendet werden, was mit einem Mangel an Informationen über die Mehrheit der Daten einhergeht. Um dies zu kompensieren, sind der Wert der Varianz und der Standardabweichung, der die Wurzel der Varianz im Quadrat ist, im Falle von Stichprobendaten höher als die Varianz von Populationsdaten.

Dies dient als automatischer Schutz für die Analysten und Entscheidungsträger. Die Logik gilt für Entscheidungen in den Bereichen Kapitalbudgetierung, persönliche und geschäftliche Finanzierung, Konstruktion, Verkehrsmanagement und viele anwendbare Bereiche. Dies hilft dem Stakeholder, bei Entscheidungen oder anderen Schlussfolgerungen auf der sicheren Seite zu sein.

Zusammenfassung: Die Populationsvarianz bezieht sich auf den Varianzwert, der aus Populationsdaten berechnet wird, und die Stichprobenvarianz ist die aus Stichprobendaten berechnete Varianz. Aufgrund dieses Wertes des Nenners in der Formel für die Varianz im Fall von Beispieldaten ist 'n-1', und es ist 'n' für Bevölkerungsdaten. Folglich sind sowohl die Varianz als auch die Standardabweichung, die aus Stichprobendaten abgeleitet werden, größer als diejenigen, die aus Populationsdaten ermittelt werden.