Co to jest analiza wariancji?
Podczas przeprowadzania badań czasami konieczna jest analiza danych porównujących więcej niż dwie próbki lub grupy. Rodzaj testu wnioskowania statystycznego, analiza wariancji (ANOVA), pozwala na badanie kilku próbek jednocześnie w celu ustalenia, czy istnieje między nimi znaczący związek. Rozumowanie jest identyczne z testami t, tylko analiza wariancji obejmuje zmienne niezależne dwóch lub więcej próbek. Określono różnice między próbkami, a także różnice w obrębie jednej próbki. ANOVA opiera się na czterech założeniach: poziomie pomiaru, metodzie próbkowania, rozkładzie populacji i jednorodności wariancji.
Aby ustalić, czy różnice są znaczące, ANOVA zajmuje się różnicami między próbkami i wewnątrz nich, co określa się mianem wariancji. ANOVA może ustalić, czy wariancja jest większa między próbkami w porównaniu z różnicą między członkami próbki. Jeśli okaże się to prawdą, różnice uważa się za znaczące.
Przeprowadzenie testu ANOVA wymaga przyjęcia pewnych założeń. Po pierwsze, stosowana jest niezależna metoda losowego pobierania próbek, a wybór członków próby z jednej populacji nie wpływa na wybór członków z późniejszych populacji. Zmienne zależne mierzone są przede wszystkim na poziomie stosunku interwału; jednak możliwe jest zastosowanie analizy wariancji do pomiarów na poziomie porządkowym. Można założyć, że populacja jest normalnie rozmieszczona, chociaż nie jest to możliwe do zweryfikowania, a wariancje populacji są takie same, co oznacza, że populacje są jednorodne.
Hipoteza badawcza zakłada, że co najmniej jedna średnia różni się od innych, ale różne średnie nie są identyfikowane jako większe lub mniejsze. Przewiduje się tylko fakt, że istnieje różnica. Testy ANOVA dla hipotezy zerowej, co oznacza, że nie ma różnicy między wszystkimi wartościami średnimi, tak że A = B = C. Wymaga to ustawienia alfa, odnosząc się do poziomu prawdopodobieństwa, w którym hipoteza zerowa zostanie odrzucona.
Współczynnik F jest statystyką testową stosowaną specjalnie do analizy wariancji, ponieważ wynik F pokazuje, gdzie zaczyna się obszar odrzucenia dla hipotezy zerowej. Opracowany przez statystykę Ronalda Fishera wzór na F jest następujący: F = między oszacowaniem wariancji grupy (MSB) podzielonym przez oszacowanie wariancji wewnątrz grupy (MSW), tak że F = MSB / MSW. Każdy z oszacowań wariancji składa się z dwóch części - sumy kwadratów (SSB i SSW) i stopni swobody (df). Korzystając z tabel statystycznych dla badań biologicznych, rolniczych i medycznych , można ustalić i na tej podstawie ustalić alfa, a hipotezę zerową braku różnicy można odrzucić. Można stwierdzić, że istnieje znacząca różnica między wszystkimi grupami, jeśli tak jest.