Differenz zwischen T-TEST und ANOVA

T-TEST vs. ANOVA

Häufig werden statistische Daten gesammelt und berechnet, um den Mittelwert zu erhalten ein langer und langwieriger Prozess. Der t-Test und die Einweganalyse der Varianz (ANOVA) sind die zwei am häufigsten verwendeten Tests, die für diesen Zweck verwendet werden.

Der t-Test ist ein statistischer Hypothesentest, bei dem die Teststatistik einer Student-t-Verteilung folgt, wenn die Nullhypothese unterstützt wird. Dieser Test wird angewendet, wenn die Teststatistik einer Normalverteilung folgt und der Wert eines Skalierungsausdrucks in der Teststatistik bekannt ist. Wenn der Skalierungsbegriff unbekannt ist, wird er dann durch eine Schätzung basierend auf den verfügbaren Daten ersetzt. Die Teststatistik folgt einer Studenten-T-Verteilung.

William Sealy Gosset führte die T-Statistik 1908 ein. Gosset war Chemiker für die Guinness-Brauerei in Dublin, Irland. Die Guinness-Brauerei hatte die Politik, die besten Absolventen aus Oxford und Cambridge zu rekrutieren und diejenigen auszuwählen, die Anwendungen der Biochemie und Statistik für die etablierten industriellen Prozesse des Unternehmens anbieten konnten. William Sealy Gosset war einer dieser Absolventen. William Sealy Gosset entwarf dabei den t-test, mit dem die Qualität des Stouts (das dunkle Bier, das die Brauerei produziert) auf kostengünstige Weise überwacht werden kann. Gosset veröffentlichte den Test unter dem Pseudonym "Student" in Biometrika, circa 1908. Der Grund für den Pseudonym war Guinness 'Beharrlichkeit, da die Firma ihre Politik bezüglich der Verwendung von Statistiken als Teil ihrer' Geschäftsgeheimnisse 'beibehalten wollte.

T-Test-Statistiken folgen im Allgemeinen der Form T = Z / s, wobei Z und s Funktionen der Daten sind. Die Z-Variable ist so entworfen, dass sie gegenüber der alternativen Hypothese empfindlich ist; effektiv ist die Größe der Z-Variablen größer, wenn die alternative Hypothese wahr ist. In der Zwischenzeit ist 's' ein Skalierungsparameter, der es ermöglicht, die Verteilung von T zu bestimmen. Die Annahmen, die einem t-Test zugrunde liegen, sind, dass a) Z einer Standardnormalverteilung unter der Nullhypothese folgt; b) ps2 folgt einer Ï ‡ 2-Verteilung mit p Freiheitsgraden unter der Nullhypothese (wobei p eine positive Konstante ist); und c) der Z-Wert und der s-Wert sind unabhängig voneinander. Bei einer bestimmten Art von t-Test sind diese Bedingungen Folgen der untersuchten Population sowie der Art und Weise, wie die Daten abgetastet werden.

Auf der anderen Seite ist die Varianzanalyse (ANOVA) eine Sammlung statistischer Modelle. Während die Prinzipien der ANOVA lange Zeit von Forschern und Statistikern verwendet wurden, machte Sir Ronald Fisher erst 1918 einen Vorschlag zur Formalisierung der Varianzanalyse in einem Artikel mit dem Titel "Die Korrelation zwischen Verwandten über die Annahme der Mendelschen Vererbung". .Seitdem wurde ANOVA in seinem Umfang und seiner Anwendung erweitert. ANOVA ist eigentlich eine falsche Bezeichnung, da sie nicht aus den Unterschieden der Varianzen, sondern aus den Unterschieden zwischen den Mittelwerten der Gruppen abgeleitet ist. Sie umfasst die zugehörigen Verfahren, bei denen die beobachtete Varianz in einer bestimmten Variablen in Komponenten aufgeteilt wird, die unterschiedlichen Quellen der Variation zuzuordnen sind.

Im Wesentlichen bietet eine ANOVA einen statistischen Test, um zu bestimmen, ob die Mittel mehrerer Gruppen gleich sind, und verallgemeinert den T-Test daher auf mehr als zwei Gruppen. Eine ANOVA kann nützlicher sein als ein t-Test mit zwei Stichproben, da sie eine geringere Wahrscheinlichkeit hat, einen Fehler vom Typ I zu begehen. Wenn beispielsweise mehrere t-Tests mit zwei Stichproben vorliegen, ist die Wahrscheinlichkeit, dass ein Fehler auftritt, größer als bei einer ANOVA mit denselben Variablen, die zum Ermitteln des Mittelwerts herangezogen werden. Das Modell ist das gleiche und die Teststatistik ist das F-Verhältnis. Einfacher ausgedrückt sind T-Tests nur ein Spezialfall von ANOVA: Die Durchführung einer ANOVA hat das gleiche Ergebnis von mehreren T-Tests. Es gibt drei Klassen von ANOVA-Modellen: a) Fixed-Effects-Modelle, die davon ausgehen, dass die Daten von normalen Populationen stammen, die sich nur in ihren Mitteln unterscheiden; b) Modelle für Zufallseffekte, die die Daten annehmen, beschreiben eine Hierarchie von unterschiedlichen Populationen, deren Unterschiede durch die Hierarchie eingeschränkt sind; und c) Mixed-Effekt-Modelle, bei denen sowohl die festen als auch die zufälligen Effekte vorhanden sind.

Zusammenfassung:

  1. Der t-Test wird verwendet, wenn festgestellt wird, ob zwei Durchschnittswerte oder Mittel gleich oder verschieden sind. Die ANOVA wird bevorzugt, wenn drei oder mehr Mittelwerte oder Mittelwerte verglichen werden.
  2. Ein t-Test hat mehr Chancen, einen Fehler zu begehen, je mehr Mittel verwendet werden, weshalb ANOVA verwendet wird, wenn zwei oder mehrere Mittelwerte verglichen werden.