Was ist Varianzanalyse?
Bei Recherchen ist es manchmal erforderlich, Daten zu analysieren, die mehr als zwei Proben oder Gruppen vergleichen. Eine Art Inferenzstatistik-Test, die Varianzanalyse (ANOVA), ermöglicht die gleichzeitige Untersuchung mehrerer Stichproben, um festzustellen, ob eine signifikante Beziehung zwischen ihnen besteht. Die Argumentation ist identisch mit t-Tests, nur die Varianzanalyse umfasst unabhängige Variablen von zwei oder mehr Stichproben. Unterschiede zwischen Proben sowie die Differenz innerhalb einer Probe werden bestimmt. Die ANOVA basiert auf vier Annahmen: dem Messniveau, der Probenahmemethode, der Verteilung der Population und der Homogenität der Varianz.
Um festzustellen, ob Unterschiede signifikant sind, befasst sich ANOVA mit Unterschieden zwischen und innerhalb der Stichproben, die als Varianz bezeichnet werden. Die ANOVA kann feststellen, ob die Varianz zwischen den Stichproben im Vergleich zu den Stichprobenmitgliedern größer ist. Wenn sich herausstellt, dass dies zutrifft, werden die Unterschiede als signifikant angesehen.
Bei der Durchführung eines ANOVA-Tests werden bestimmte Annahmen akzeptiert. Das erste ist, dass die unabhängige Zufallsstichprobenmethode verwendet wird und die Auswahl der Stichprobenmitglieder aus einer einzelnen Population keinen Einfluss auf die Auswahl der Mitglieder aus späteren Populationen hat. Abhängige Variablen werden hauptsächlich auf der Ebene des Intervallverhältnisses gemessen. Es ist jedoch möglich, die Varianzanalyse auf Messungen auf Ordinalebene anzuwenden. Man kann davon ausgehen, dass die Population normal verteilt ist, obwohl dies nicht nachweisbar ist und die Populationsabweichungen gleich sind, was bedeutet, dass die Populationen homogen sind.
Die Forschungshypothese geht davon aus, dass sich mindestens ein Mittelwert von den anderen unterscheidet, die verschiedenen Mittelwerte jedoch nicht als größer oder kleiner identifiziert werden. Nur die Tatsache, dass ein Unterschied besteht, wird vorhergesagt. Die ANOVA testet auf die Nullhypothese, was bedeutet, dass zwischen allen Mittelwerten kein Unterschied besteht, so dass A = B = C. Dies erfordert die Einstellung des Alphas unter Bezugnahme auf die Wahrscheinlichkeitsstufe, bei der die Nullhypothese verworfen wird.
F-Ratio ist eine Teststatistik, die speziell für die Varianzanalyse verwendet wird, da der F-Score zeigt, wo der Bereich der Zurückweisung für die Nullhypothese beginnt. Die vom Statistiker Ronald Fisher entwickelte Formel für F lautet wie folgt: F = zwischen Gruppenvarianzschätzung (MSB) geteilt durch die Gruppenvarianzschätzung (MSW), so dass F = MSB / MSW. Jede der Varianzschätzungen besteht aus zwei Teilen - der Summe der Quadrate (SSB und SSW) und der Freiheitsgrade (df). Anhand der statistischen Tabellen für die biologische, landwirtschaftliche und medizinische Forschung kann das Alpha festgelegt und darauf aufgebaut werden, und die Nullhypothese, dass kein Unterschied besteht, kann zurückgewiesen werden. Es kann der Schluss gezogen werden, dass zwischen allen Gruppen ein signifikanter Unterschied besteht, wenn dies der Fall ist.