Unterschied zwischen Varianz und Kovarianz: Varianz vs Kovarianz

Anonim

Varianz vs. Kovarianz

Varianz und Kovarianz sind zwei in der Statistik verwendete Maße. Die Varianz ist ein Maß für die Streuung der Daten und die Kovarianz gibt den Grad der Änderung von zwei zufälligen Variablen zusammen an. Varianz ist eher ein intuitives Konzept, aber Kovarianz ist mathematisch zunächst nicht so intuitiv definiert.

Mehr über Varianz

Die Varianz ist ein Maß für die Streuung der Daten aus dem Mittelwert der Verteilung. Sie gibt an, wie weit die Datenpunkte vom Mittelwert der Verteilung entfernt sind. Es ist einer der primären Deskriptoren der Wahrscheinlichkeitsverteilung und eines der Momente der Verteilung. Varianz ist auch ein Parameter der Population, und die Varianz einer Probe aus der Population wirkt als Schätzer für die Varianz der Population. Aus einer Perspektive ist es definiert als das Quadrat der Standardabweichung.

Im Klartext kann es als Durchschnitt der Quadrate der Entfernung zwischen jedem Datenpunkt und dem Mittelwert der Verteilung beschrieben werden. Die folgende Formel wird verwendet, um die Varianz zu berechnen.

Var (X) = E [(X-x)

2] für eine Stichprobe Es kann weiter zu Var (X) = E [X 2

] - (E [X]) 2 vereinfacht werden.

Varianz hat einige Signatur-Eigenschaften und wird häufig in Statistiken verwendet, um die Verwendung einfacher zu machen. Die Varianz ist nicht negativ, weil sie das Quadrat der Entfernungen ist. Der Bereich der Varianz ist jedoch nicht beschränkt und hängt von der bestimmten Verteilung ab. Die Varianz einer konstanten Zufallsvariablen ist Null, und die Varianz ändert sich nicht in Bezug auf einen Ortsparameter. Kovarianz ist in der statistischen Theorie ein Maß dafür, wie sich zwei zufällige Variablen zusammen verändern. Mit anderen Worten, Kovarianz ist ein Maß für die Stärke der Korrelation zwischen zwei Zufallsvariablen. Es kann auch als Verallgemeinerung des Varianzbegriffs zweier Zufallsvariablen betrachtet werden. Die Kovarianz zweier Zufallsvariablen X und Y, die gemeinsam mit dem endlichen zweiten Impuls verteilt werden, ist als σ XY = E [(X-E [X]) (Y-E [Y])] bekannt. Daraus kann die Varianz als Spezialfall der Kovarianz betrachtet werden, wobei zwei Variablen gleich sind. Durch die Normalisierung der Kovarianz kann der lineare Korrelationskoeffizient oder der Pearson'sche Korrelationskoeffizient erhalten werden, der definiert ist als ρ = E [(XE [X]) (YE [Y (& sgr;

X

& sgr;

Y)

Grafisch kann Kovarianz zwischen einem Paar Datenpunkte als die Fläche des Rechtecks ​​mit den Datenpunkten an den gegenüberliegenden Ecken angesehen werden.Es kann als ein Maß der Größe der Trennung zwischen den zwei Datenpunkten interpretiert werden. In Anbetracht der Rechtecke für die gesamte Population kann die Überlappung der Rechtecke, die allen Datenpunkten entsprechen, als die Stärke der Trennung betrachtet werden; Varianz der beiden Variablen. Die Kovarianz ist in zwei Dimensionen aufgrund von zwei Variablen, aber die Vereinfachung zu einer Variablen gibt die Varianz eines Einfachs als die Trennung in einer Dimension an. Was ist der Unterschied zwischen Varianz und Kovarianz? • Varianz ist das Maß für Ausbreitung / Streuung in einer Population, während Kovarianz als Maß für die Variation zweier Zufallsvariablen oder die Stärke der Korrelation betrachtet wird.

• Varianz kann als Spezialfall der Kovarianz betrachtet werden. • Varianz und Kovarianz sind abhängig von der Größe der Datenwerte und können nicht verglichen werden; daher sind sie normalisiert. Die Kovarianz wird in den Korrelationskoeffizienten normiert (dividiert durch das Produkt der Standardabweichungen der beiden Zufallsvariablen), und die Varianz wird in die Standardabweichung (unter Verwendung der Quadratwurzel)