Wat is vrijheidsgraad?
Vrijheidsgraad (df) is een concept dat het meest wordt gebruikt in statistiek en fysica. In beide gevallen heeft het de neiging om grenzen van een systeem en positie of grootte van wat wordt geanalyseerd te definiëren, zodat het visueel kan worden weergegeven. De definitie van df in beide velden is gerelateerd, maar niet helemaal hetzelfde.
In de natuurkunde positioneert de mate van vrijheid objecten of systemen, en elke graad verwijst naar een positie in tijd, ruimte of in andere metingen. Df zou synoniem kunnen worden gebruikt met de term coördinaat, en het betekent meestal onafhankelijke coördinaten van het minste aantal. De werkelijke mate van vrijheid is gebaseerd op het systeem dat wordt beschreven in de faseruimte of in alle mogelijke ruimtetypes die een systeem tegelijkertijd bewoont. Elk onderdeel van de faseruimte die het systeem inneemt, kan als een DF worden beschouwd, wat helpt om de volledige realiteit van het beschouwde systeem te definiëren.
Vanuit statistisch oogpunt definieert de mate van vrijheid de verdeling van populaties of steekproeven en wordt aangetroffen wanneer mensen beginnen met het bestuderen van inferentiële statistieken: hypothesetesten en betrouwbaarheidsintervallen. Net als bij de wetenschappelijke definitie, beschrijft df in statistieken de vorm of aspecten van steekproef of populatie afhankelijk van de gegevens. Niet alle getekende representaties van distributies hebben een mate van vrijheidsmeting. De gemeenschappelijke standaard normale verdeling wordt niet door graden gedefinieerd; in plaats daarvan zal het in alle gevallen dezelfde klokvormige curve zijn.
Een vergelijkbare verdeling als standaard normaal is student-t. De student-t wordt gedeeltelijk bepaald door de mate van vrijheid in de formule n-1, waarbij n steekproefgrootte is. Dit betekent dat variabelen uit de distributie één voor één konden worden gekozen, alles behalve de laatste kon vrij worden gekozen. Er is geen andere keuze dan de allerlaatste te nemen en geen vrijheid om op dat moment een andere variabele te kiezen. Daarom is een variabele niet gratis; het is alsof je de laatste steen uit een zak moet halen tijdens een Scrabble®-spel waarbij er geen andere keuze is dan die letter te kiezen.
Verschillende verdelingen zoals de F en het chikwadraat hebben verschillende definities van vrijheidsgraad, en sommige gebruiken zelfs meer dan één df in definitie. Het probleem wordt verwarrend omdat df-definitie is gekoppeld aan het type test dat is uitgevoerd en niet hetzelfde is met de verschillende parametrische (op basis van parameters) en niet-parametrische (niet op basis van parameters) tests. In wezen zal het niet altijd n-1 zijn. Goodness of fit of contingency table testing kan de chikwadraatverdeling gebruiken met een andere df dan die welke een enkele variabele hypothesetest van de variantie of standaarddeviatie evalueert.
Wat belangrijk is om te onthouden is dat elke keer de mate van vrijheid wordt gebruikt om een verdeling te definiëren, deze verandert. Het kan nog steeds bepaalde kenmerken hebben die onveranderd zijn, maar de grootte en het uiterlijk variëren. Wanneer mensen representaties van distributies tekenen, met name twee van dezelfde distributies die een verschillende df hebben, wordt hen geadviseerd om ze er in grootte anders uit te laten zien om aan te geven dat df niet hetzelfde is.