Unterschiede zwischen Korrelation und Regression

Sowohl Korrelation als auch Regression sind statistische Werkzeuge, die sich mit zwei oder mehr Variablen befassen. Obwohl beide den gleichen Gegenstand betreffen, gibt es Unterschiede zwischen den beiden. Die Unterschiede zwischen den beiden werden im Folgenden erläutert.

Bedeutung

Der Ausdruck Korrelation mit Bezug auf zwei oder mehr Variablen bedeutet, dass die Variablen in irgendeiner Weise verwandt sind. Korrelationsanalyse bestimmt, ob eine Beziehung zwischen zwei Variablen besteht, und die Stärke der Beziehung. Wenn zwei Variablen x (unabhängig) und y (abhängig) so in Beziehung stehen, dass die Variation der Größe der unabhängigen Variablen begleitet wird, dann werden die beiden Variablen durch Variation der Größe der abhängigen Variablen als korreliert bezeichnet.

Die Korrelation kann linear oder nichtlinear sein. Eine lineare Korrelation ist eine Korrelation, bei der die Variablen so miteinander verknüpft sind, dass eine Änderung des Werts einer Variablen eine Änderung des Werts der anderen Variablen konsistent verursacht. In einer linearen Korrelation würden sich die Streupunkte, die sich auf die jeweiligen Werte von abhängigen und unabhängigen Variablen beziehen, um eine nicht horizontale gerade Linie gruppieren, obwohl eine horizontale gerade Linie auch eine lineare Beziehung zwischen den Variablen anzeigen würde, wenn eine gerade Linie die darstellenden Punkte verbinden könnte die Variablen.

Die Regressionsanalyse dagegen verwendet die vorhandenen Daten, um eine mathematische Beziehung zwischen den Variablen zu bestimmen, die verwendet werden kann, um den Wert der abhängigen Variablen in Bezug auf einen beliebigen Wert der unabhängigen Variablen zu bestimmen .

Statistische Orientierung

Die Korrelation betrifft die Messung der Stärke der Assoziation oder Intensität der Beziehung, wobei es sich bei der Regression um die Vorhersage des Werts der abhängigen Variablen in Bezug auf einen bekannten Wert der unabhängigen Variablen handelt. Dies kann mit den folgenden Formeln erklärt werden.

Der Korrelationskoeffizient oder die Korrelationskoeffizient (r) zwischen x und y wird mit der folgenden Formel ermittelt;

r = Kovarianz (x, y) / σx. σy, cov (x, y) = Σxy / n - (Σx / n) (Σy / n), σx und σy sind Standardabweichungen von x bzw. y, und -1

Korrelationskoeffizient r ist eine reine Zahl und unabhängig von der Maßeinheit. Wenn also x die Höhe (Zoll) und y das Gewicht (lbs.) Der Menschen einer bestimmten Region ist, dann ist r weder in Zoll noch in lbs. , aber einfach eine Nummer.

Die Regressionsgleichung wird mit der folgenden Formel ermittelt;

Regressionsgleichung von y auf x (um die Schätzung von y herauszufinden) ist y - y '= byx (x-x~), byx heißt Regressionskoeffizient von y auf x.Die Regressionsgleichung von x auf y (um die Schätzung von x herauszufinden) ist x - x '= bxy (y - y ~), bxy heißt Regressionskoeffizient von x auf y.

Die Korrelationsanalyse geht nicht von der Abhängigkeit einer Variablen von einer anderen Variablen aus und versucht auch nicht, die Beziehung zwischen den beiden Variablen herauszufinden. Es schätzt einfach den Grad der Assoziation zwischen den Variablen. Mit anderen Worten, die Korrelationsanalyse testet die gegenseitige Abhängigkeit der Variablen. Die Regressionsanalyse beschreibt dagegen die Abhängigkeit der abhängigen Variablen oder der Antwortvariablen von der unabhängigen oder erklärenden Variablen. Die Regressionsanalyse geht davon aus, dass eine einseitige kausale Beziehung zwischen Erklärungs- und Antwortvariablen besteht, und berücksichtigt nicht, ob diese Kausalbeziehung positiv oder negativ ist. Für die Korrelation sind sowohl die Werte der abhängigen als auch der unabhängigen Variablen zufällig, aber für die Regression müssen die Werte der unabhängigen Variablen nicht zufällig sein.

Zusammenfassung

1. Korrelationsanalyse ist ein Test der gegenseitigen Abhängigkeit zwischen zwei Variablen. Die Regressionsanalyse gibt eine mathematische Formel an, um den Wert der abhängigen Variablen in Bezug auf einen Wert der unabhängigen Variablen / s zu bestimmen.

2. Der Korrelationskoeffizient ist unabhängig von der Wahl des Ursprungs und des Maßstabs, aber der Regressionskoeffizient ist nicht so.

Für die Korrelation müssen die Werte beider Variablen zufällig sein, dies gilt jedoch nicht für den Regressionskoeffizienten.

Bibliographie

1. Das, N. G., (1998), Statistische Methoden, Kalkutta

2. Korrelation und Regression, verfügbar unter www. le. ac. uk / bl / gat / virtualfc / Statistik / Regression

3. Regression und Korrelation, verfügbar unter www. Abgrund. Uoregon. edu