Co je stupeň svobody?
Stupeň svobody (df) je koncept, který se nejvíce používá ve statistice a fyzice. V obou případech má sklon definovat limity systému a polohu nebo velikost toho, co je analyzováno, takže může být vizuálně znázorněno. Definice df v obou polích je příbuzná, ale ne úplně stejná.
Ve fyzice pozice stupně volnosti objekty nebo systémy a každý stupeň odkazuje na polohu v čase, prostoru nebo v jiných měřeních. Df lze použít synonymně s termínem souřadnice a obvykle to znamená nezávislé souřadnice nejmenšího čísla. Skutečný stupeň svobody je založen na systému popsaném ve fázovém prostoru nebo ve všech potenciálních typech prostoru, které systém obývá současně. Každá jednotlivá část fázového prostoru, kterou systém zabírá, může být považována za df, což pomáhá definovat plnou realitu uvažovaného systému.
Ze statistického hlediska stupeň svobody definuje rozdělení populací nebo vzorků a setkává se s nimi, když lidé začínají studovat inferenciální statistiky: testování hypotéz a intervaly spolehlivosti. Stejně jako u vědecké definice df ve statistice popisuje tvar nebo aspekty vzorku nebo populace v závislosti na datech. Ne všechny nakreslené reprezentace distribucí mají míru míry volnosti. Běžné standardní normální rozdělení není definováno stupni; místo toho bude ve všech případech stejná zvonovitá křivka.
Podobná distribuce jako standardní normální je student-t. Student-t je částečně definován stupněm volnosti ve vzorci n-1, kde n je velikost vzorku. To znamená, že byly proměnné z distribuce vybírány jeden po druhém, všechny kromě té poslední mohly být voleny libovolně. Neexistuje jiná možnost, než vzít tu poslední a svoboda zvolit si jinou proměnnou. Jedna proměnná proto není volná; Je to jako když si vyberete poslední dlaždici z tašky během hry Scrabble®, kde není na výběr, ale vybrat si ten dopis.
Různá rozdělení jako F a chi-square mají různé definice stupně svobody a některé dokonce používají více než jeden df v definici. Problém je matoucí, protože definice df je spojena s typem provedeného testu a není stejná u různých parametrických (založených na parametrech) a neparametrických (ne založených na parametrech) testech. V zásadě to nebude vždy n-1. Testování vhodnosti nebo kontingenční tabulky může použít distribuci chí-kvadrát s odlišným df, než které vyhodnocuje testování s jednou proměnnou hypotézou rozptylu nebo směrodatné odchylky.
Důležité je zapamatovat si, že pokaždé, když je stupeň svobody použit pro definici distribuce, mění ji. Stále může mít určité vlastnosti, které se nemění, ale velikost a vzhled se liší. Když lidé vykreslují reprezentace distribucí, zejména dvou stejných distribucí, které mají odlišnou df, doporučuje se, aby vypadaly odlišně, aby sdělovaly, že df není stejná.