Co je to exponenciální vyhlazování?
Exponenciální vyhlazování je technika pro manipulaci s daty z řady chronologických pozorování pro potlačení účinků náhodné variace. Matematické modelování, vytvoření numerické simulace pro datový soubor, často zachází s pozorovanými daty jako se součtem dvou nebo více složek, z nichž jedna je náhodná chyba, rozdíly mezi pozorovanou hodnotou a základní skutečnou hodnotou. Při správném použití vyhlazovací techniky minimalizují účinek náhodné variace, což usnadňuje vidění základního fenoménu - přínos jak při prezentaci dat, tak při vytváření prognóz budoucích hodnot. Jsou označovány jako „vyhlazovací“ techniky, protože odstraňují zubaté pohyby nahoru a dolů spojené s náhodnými změnami a zanechávají za sebou plynulejší čáru nebo křivku, když jsou data grafována. Nevýhodou vyhlazovacích technik je to, že při nesprávném použití mohou také vyhladit důležité trendy nebo cyklické změny v datech, jakož i náhodné změny, a tím zkreslit jakékoli předpovědi, které nabízejí.
Nejjednodušší vyhlazovací technikou je vzít průměr z minulých hodnot. Bohužel to také zcela zakrývá všechny trendy, změny nebo cykly v datech. Složitější průměry vylučují některé, ale ne všechny, toto zatemnění a stále mají tendenci zaostávat jako prognostici, kteří nereagují na změny trendů, dokud se několik pozorování poté, co se trend změní. Příklady toho zahrnují klouzavý průměr, který používá pouze nejnovější pozorování, nebo vážený průměr, který hodnotí některá pozorování více než jiná. Exponenciální vyhlazování představuje pokus o zlepšení těchto defektů.
Jednoduché exponenciální vyhlazování je nejzákladnější formou, která používá jednoduchou rekurzivní rovnici k transformaci dat. S 1 , první vyhlazený bod, se jednoduše rovná O 1 , prvním pozorovaným datům. Pro každý následující bod je vyhlazený bod interpolací mezi předchozími vyhlazenými daty a současným pozorováním: S n = aO n + (1-a) S n-1 . Konstanta "a" je známá jako vyhlazovací konstanta; je oceněna mezi nulou a jednou a určuje, jak velká váha se dává surovým datům a kolik vyhlazeným datům. Statistická analýza k minimalizaci náhodné chyby obecně určuje optimální hodnotu pro danou řadu dat.
Pokud je rekurzivní vzorec pro Sn přepsán pouze na základě pozorovaných dat, získá se vzorec S n = aO n + a (1-a) O n-1 + a (1-a) 20 O n-2 + . . . odhalující, že vyhlazená data jsou váženým průměrem všech dat s hmotnostmi měnícími se exponenciálně v geometrické řadě. Toto je zdroj exponenciálu ve větě „exponenciální vyhlazování“. Čím je hodnota „a“ blíže jedné, tím lépe reagují na změny v trendu vyhlazená data, ale na úkor toho, že budou více podrobeny náhodné změně dat.
Výhodou jednoduchého exponenciálního vyhlazování je to, že umožňuje trend ve změně vyhlazených dat. Nedělá to však špatně, když odděluje změny trendu od náhodných variací vlastních datům. Z tohoto důvodu se také používá dvojité a trojité exponenciální vyhlazování, které zavádí další konstanty a komplikovanější rekurze, aby se zohlednila trendová a cyklická změna dat.
Údaje o nezaměstnanosti jsou vynikajícím příkladem údajů, které využívají trojnásobného exponenciálního vyhlazování. Trojnásobné vyhlazování umožňuje, aby údaje o nezaměstnanosti bylo možné chápat jako součet čtyř faktorů: nevyhnutelnou náhodnou chybu při shromažďování údajů, základní úroveň nezaměstnanosti, cyklickou sezónní změnu, která postihuje mnoho průmyslových odvětví, a měnící se trend, který odráží zdraví ekonomika. Přiřazením vyhlazovacích konstant k základně, trendu a sezónním výkyvům trojnásobné vyhlazování usnadňuje laikovi vidět, jak se v průběhu času mění nezaměstnanost. Volba různých konstant změní vzhled vyhlazených dat, což je jeden z důvodů, proč se ekonomové mohou ve svých předpovědích někdy velmi lišit.
Exponenciální vyhlazování je jednou z mnoha metod matematického pozměňování dat, aby bylo možné lépe pochopit jev, který data generovala. Výpočty mohou být prováděny na běžně dostupném kancelářském softwaru, takže je to také snadno dostupná technika. Při správném použití je neocenitelným nástrojem pro prezentaci dat a vytváření předpovědí. Nesprávné provedení může potenciálně zatemnit důležité informace spolu s náhodnými změnami, takže by se mělo postupovat opatrně s vyhlazenými údaji.