Unterschied zwischen linearer und logistischer Regression

Anonim

Identifizieren Sie die Beziehungen zwischen den betroffenen Variablen zur Studie. Manchmal kann es der einzige Zweck der Analyse selbst sein. Ein starkes Werkzeug, das verwendet wird, um die Existenz einer Beziehung festzustellen und die Beziehung zu identifizieren, ist die Regressionsanalyse.

Die einfachste Form der Regressionsanalyse ist die lineare Regression, wobei die Beziehung zwischen den Variablen eine lineare Beziehung ist. In statistischer Hinsicht wird die Beziehung zwischen der erklärenden Variablen und der Antwortvariablen hervorgehoben. Mithilfe der Regression können wir beispielsweise die Relation zwischen dem Rohstoffpreis und dem Verbrauch anhand von Daten aus einer Stichprobe ermitteln. Die Regressionsanalyse erzeugt eine Regressionsfunktion des Datensatzes, ein mathematisches Modell, das am besten zu den verfügbaren Daten passt. Dies kann leicht durch ein Streudiagramm dargestellt werden. Die grafische Regression entspricht der Suche nach der besten Anpassungskurve für den gegebenen Datensatz. Die Funktion der Kurve ist die Regressionsfunktion. Mit Hilfe des mathematischen Modells kann die Verwendung einer Ware für einen gegebenen Preis vorhergesagt werden.

Daher wird die Regressionsanalyse bei Vorhersagen und Vorhersagen häufig verwendet. Es wird auch verwendet, um die Beziehungen in experimentellen Daten in den Bereichen Physik, Chemie und in vielen Naturwissenschaften und Ingenieurwissenschaften zu etablieren. Wenn die Beziehung oder die Regressionsfunktion eine lineare Funktion ist, wird der Prozess als lineare Regression bezeichnet. Im Streudiagramm kann es als eine Gerade dargestellt werden. Wenn die Funktion keine lineare Kombination der Parameter ist, ist die Regression nicht linear.

Die logistische Regression ist mit der multivariaten Regression vergleichbar und erstellt ein Modell, um den Einfluss mehrerer Prädiktoren auf eine Antwortvariable zu erklären. Bei der logistischen Regression sollte die Endergebnisvariable jedoch kategorisch sein (üblicherweise geteilt, dh ein Paar erzielbarer Ergebnisse, wie Tod oder Überleben, obwohl spezielle Techniken mehr kategorisierte Informationen modellieren lassen). Eine kontinuierliche Ergebnisvariable kann in eine kategoriale Variable transformiert werden, die für die logistische Regression verwendet wird. Auf diese Weise wird das Zusammenbrechen von kontinuierlichen Variablen jedoch größtenteils entmutigt, da dies die Genauigkeit verringert.

Anders als bei der linearen Regression müssen die Prädiktorvariablen in der logistischen Regression zum Durchschnitt nicht gezwungen sein, linear verbunden, gemeinsam verteilt zu sein oder in jedem Cluster die gleiche Varianz zu haben.Infolgedessen ist die Beziehung zwischen den Prädiktor- und Ergebnisvariablen wahrscheinlich keine lineare Funktion.

Was ist der Unterschied zwischen logistischer und linearer Regression?

• Bei der linearen Regression wird eine lineare Beziehung zwischen der erklärenden Variablen und der Antwortvariablen angenommen und Parameter, die das Modell erfüllen, werden durch Analyse gefunden, um die genaue Beziehung zu erhalten.

• Die lineare Regression wird für quantitative Variablen durchgeführt und die resultierende Funktion ist quantitativ.

• In der logistischen Regression können die verwendeten Daten entweder kategorisch oder quantitativ sein, das Ergebnis ist jedoch immer kategorisch.