Wat is een foutterm?

In statistieken is een foutterm de som van de afwijkingen van elke feitelijke waarneming van een regressielijn. Regressieanalyse wordt gebruikt om de mate van correlatie tussen twee variabelen, een onafhankelijke en een afhankelijke, vast te stellen, waarvan het resultaat een lijn is die het best "past" bij de feitelijk waargenomen waarden van de afhankelijke waarde in relatie tot de onafhankelijke variabele of variabelen. Anders gezegd, een foutterm is de term in een modelregressievergelijking die overeenkomt met het onverklaarde verschil tussen de feitelijk waargenomen waarden van de onafhankelijke variabele en de door het model voorspelde resultaten. Daarom is de foutterm een ​​maat voor hoe nauwkeurig het regressiemodel de werkelijke relatie weergeeft tussen de onafhankelijke en afhankelijke variabele of variabelen. De foutterm kan aangeven dat het model kan worden verbeterd, bijvoorbeeld door een andere onafhankelijke variabele toe te voegen die het verschil geheel of gedeeltelijk verklaart, of door willekeurigheid, wat betekent dat de afhankelijke en onafhankelijke variabele of variabelen niet in grotere mate gecorreleerd zijn. .

Ook bekend als de resterende term of verstoringstermijn, volgens de wiskundige conventie, is de foutterm de laatste term in een modelregressievergelijking en wordt deze voorgesteld door de Griekse letter epsilon (ε). Economen en professionals uit de financiële sector maken regelmatig gebruik van regressiemodellen, of op zijn minst hun resultaten, om een ​​breed scala aan relaties beter te begrijpen en te voorspellen, zoals hoe veranderingen in de geldhoeveelheid gerelateerd zijn aan inflatie, hoe beurskoersen gerelateerd zijn aan werkloosheid tarieven of hoe veranderingen in grondstoffenprijzen van invloed zijn op specifieke bedrijven in een economische sector. Daarom is de foutterm een ​​belangrijke variabele om in gedachten te houden en bij te houden, omdat het de mate meet waarin een bepaald model de werkelijke relatie tussen de afhankelijke en onafhankelijke variabelen niet weerspiegelt of verklaart.

Er zijn eigenlijk twee soorten fouttermen die vaak worden gebruikt in regressieanalyse: absolute fout en relatieve fout. Absolute fout is de foutterm zoals eerder gedefinieerd, het verschil tussen de feitelijk waargenomen waarden van de onafhankelijke variabele en de door het model voorspelde resultaten. Hieruit afgeleid, wordt relatieve fout gedefinieerd als de absolute fout gedeeld door de exacte waarde voorspeld door het model. Uitgedrukt in procentuele termen, staat relatieve fout bekend als procentuele fout, wat handig is omdat het de foutterm in een groter perspectief plaatst. Een foutterm van 1 wanneer de voorspelde waarde 10 is, is bijvoorbeeld veel slechter dan een foutterm van 1 wanneer de voorspelde waarde 1 miljoen is wanneer wordt geprobeerd een regressiemodel te bedenken dat laat zien hoe goed twee of meer variabelen zijn gecorreleerd.

ANDERE TALEN

heeft dit artikel jou geholpen? bedankt voor de feedback bedankt voor de feedback

Hoe kunnen we helpen? Hoe kunnen we helpen?