Wat is exponentiële smoothing?
Exponentiële afvlakking is een techniek voor het manipuleren van gegevens uit een reeks chronologische waarnemingen om de effecten van willekeurige variatie te bagatelliseren. Wiskundige modellering, het creëren van een numerieke simulatie voor een gegevensset, behandelt waargenomen gegevens vaak als de som van twee of meer componenten, waarvan er één een willekeurige fout is, de verschillen tussen de waargenomen waarde en de onderliggende werkelijke waarde. Bij juiste toepassing minimaliseren afvlaktechnieken het effect van de willekeurige variatie, waardoor het onderliggende fenomeen gemakkelijker te zien is - een voordeel zowel bij het presenteren van de gegevens als bij het maken van voorspellingen van toekomstige waarden. Ze worden "afvlakkingstechnieken" genoemd omdat ze gekartelde ups en downs geassocieerd met willekeurige variatie verwijderen en een vloeiendere lijn of curve achterlaten wanneer de gegevens in een grafiek worden weergegeven. Het nadeel van afvlakkingstechnieken is dat ze bij oneigenlijk gebruik ook belangrijke trends of cyclische veranderingen in de gegevens en de willekeurige variatie kunnen wegwerken, en daardoor voorspellingen kunnen vervormen.
De eenvoudigste afvlakkingstechniek is om een gemiddelde van waarden uit het verleden te nemen. Helaas verdoezelt dit ook alle trends, veranderingen of cycli in de gegevens volledig. Meer gecompliceerde gemiddelden elimineren sommige maar niet al deze verduisteringen en blijven nog steeds achter als voorspellers, en reageren niet op veranderingen in trends tot verschillende waarnemingen nadat de trend is veranderd. Voorbeelden hiervan zijn een voortschrijdend gemiddelde dat alleen de meest recente waarnemingen gebruikt of een gewogen gemiddelde dat sommige waarnemingen meer waardeert dan andere. Exponentiële afvlakking is een poging om deze defecten te verbeteren.
Eenvoudig exponentieel vloeiend maken is de meest basale vorm, waarbij een eenvoudige recursieve formule wordt gebruikt om de gegevens te transformeren. S 1 , het eerste afgevlakte punt, is eenvoudigweg gelijk aan O, de eerste waargenomen gegevens. Voor elk volgend punt is het afgevlakte punt een interpolatie tussen de vorige afgevlakte gegevens en de huidige waarneming: S n = aO n + (1-a) S n-1 . De constante "a" staat bekend als de afvlakkingsconstante; het wordt gewaardeerd tussen nul en één en bepaalt hoeveel gewicht wordt gegeven aan de onbewerkte gegevens en hoeveel aan de afgevlakte gegevens. Statistische analyse om de willekeurige fout te minimaliseren, bepaalt in het algemeen de optimale waarde voor een gegeven reeks gegevens.
Als de recursieve formule voor S n alleen wordt herschreven in termen van de waargenomen gegevens, levert deze de formule S n = aO n + a (1-a) O n-1 + a (1-a) 2 O n-2 + . . . onthullend dat de afgevlakte gegevens een gewogen gemiddelde zijn van alle gegevens met de gewichten die exponentieel variëren in een geometrische reeks. Dit is de bron van het exponentiële in de uitdrukking "exponentiële afvlakking". Hoe dichter de waarde van "a" bij één ligt, des te gevoeliger voor veranderingen in de trend zullen de afgevlakte gegevens zijn, maar ten koste van ook meer onderworpen aan de willekeurige variatie in de gegevens.
Het voordeel van eenvoudige exponentiële afronding is dat het een trend mogelijk maakt in hoe de afgevlakte gegevens veranderen. Het doet het echter slecht bij het scheiden van veranderingen in de trend van de willekeurige variaties die inherent zijn aan de gegevens. Om die reden worden ook dubbele en drievoudige exponentiële afvlakking gebruikt, die extra constanten en meer gecompliceerde recursies introduceert om rekening te houden met trend- en cyclische veranderingen in de gegevens.
Werkloosheidsgegevens zijn een uitstekend voorbeeld van gegevens die profiteren van drievoudige exponentiële afvlakking. Dankzij de drievoudige afvlakking kunnen de werkloosheidsgegevens worden gezien als de som van vier factoren: de onvermijdelijke willekeurige fout bij het verzamelen van de gegevens, een basisniveau van werkloosheid, de cyclische seizoensvariatie die veel industrieën treft, en een veranderende trend die de gezondheid van de economie. Door vloeiende constanten toe te wijzen aan de basis, de trend en de seizoensgebonden variatie, maakt drievoudige afvlakking het voor een leek gemakkelijker om te zien hoe de werkloosheid in de loop van de tijd varieert. De keuze van verschillende constanten zal het uiterlijk van de gladgemaakte gegevens echter veranderen, wat een van de redenen is waarom economen soms sterk kunnen verschillen in hun voorspellingen.
Exponentiële afvlakking is een van de vele methoden om gegevens wiskundig te wijzigen om meer inzicht te krijgen in het fenomeen dat de gegevens heeft gegenereerd. De berekeningen kunnen worden uitgevoerd met algemeen beschikbare kantoorsoftware, dus het is ook een gemakkelijk beschikbare techniek. Goed gebruikt, het is een hulpmiddel van onschatbare waarde voor het presenteren van gegevens en voor het maken van voorspellingen. Onjuist uitgevoerd, kan het mogelijk belangrijke informatie samen met de willekeurige variaties verbergen, dus wees voorzichtig met vloeiende gegevens.