Hva er frihetsgrad?
Grad av frihet (df) er et konsept som er mest brukt i statistikk og fysikk. I begge tilfeller har det en tendens til å definere grenser for et system og posisjon eller størrelse på hva som analyseres, slik at det kan være visuelt representert. Definisjon av df i begge felt er relatert, men ikke helt den samme.
I fysikk posisjonerer frihetsgrad objekter eller systemer, og hver grad refererer til en posisjon i tid, rom eller i andre målinger. Df kan brukes synonymt med begrepet koordinat, og det betyr vanligvis uavhengige koordinater med færrest antall. Den faktiske frihetsgraden er basert på at systemet er beskrevet i faserom eller i alle potensielle romtyper et system bebor samtidig. Hver eneste del av faseområdet systemet tar opp kan betraktes som en df, som hjelper til med å definere de fulle realitetene til systemet som blir vurdert.
Fra statistisk synspunkt definerer frihetsgrad fordelinger av populasjoner eller prøver og oppstår når folk begynner å studere inferensiell statistikk: hypotesetesting og konfidensintervaller. Som med den vitenskapelige definisjonen, beskriver df i statistikk form eller aspekter ved utvalg eller populasjon avhengig av data. Ikke alle tegnet representasjoner av distribusjoner har en grad av frihetsmåling. Den vanlige standard normalfordelingen er ikke definert av grader; i stedet vil det være den samme bjelleformede kurven i alle tilfeller.
En lignende distribusjon som standard normal er student-t. Studenten-t er delvis definert av frihetsgrad i formelen n-1, der n er prøvestørrelse. Dette betyr at det var variabler fra distribusjonen som ble valgt en etter en, alle unntatt den siste kunne velges fritt. Det er ikke noe annet valg enn å ta den aller siste og ingen frihet til å velge noen annen variabel på det tidspunktet. Derfor er ikke en variabel gratis; det er som å måtte plukke den siste flisen ut av en sekk under et Scrabble®-spill der det ikke er annet valg enn å velge den bokstaven.
Ulike fordelinger som F og chi-square har forskjellige definisjoner av frihetsgrad, og noen bruker til og med mer enn en df i definisjon. Problemet blir forvirrende fordi definisjon av df er knyttet til type utført test og ikke er det samme med de forskjellige parametriske (basert på parametere) og ikke-parametriske (ikke basert på parametere) tester. I hovedsak vil det ikke alltid være n-1. Godhet med testing av passform eller beredskapstabell kan bruke chi-square distribusjonen med annen df enn den som evaluerer en enkelt variabel hypotetesting av variansen eller standardavviket.
Det som er viktig å huske er at hver gang frihetsgrad brukes til å definere en fordeling, endrer den den. Det kan fremdeles ha visse egenskaper som er uforanderlige, men størrelse og utseende varierer. Når folk tegner representasjoner av distribusjoner, spesielt to av de samme distribusjonene som har en annen df, anbefales de å få dem til å se annerledes ut i størrelse for å formidle at df ikke er den samme.