Co je to ekonometrie panelových dat?
Panelová ekonometrie dat je specifická forma statistické analýzy dat. Jedná se o vícerozměrná data, kde data měří více věcí pro stejný subjekt. To přirozeně umožňuje analytikům najít více informací a vzorce, včetně křížových odkazů. Nevýhodou ekonometrie dat panelu je, že může být mnohem složitější analyzovat.
Econometrics je činnost, která leží někde mezi ekonomikou a statistikou. Mnoho tradiční ekonomiky zahrnuje vývoj teorií, které vysvětlují a předpovídají činnosti, jako je tržní chování. Econometrics je více o tom, jak začít s výsledky a pokoušet se pracovat dozadu, aby nalezl možné příčiny a souvislosti.
Data panelu jsou někdy označována jako longitudinální data - jedná se o jakoukoli sadu dat, která pokrývají více faktorů pro stejné subjekty. Například seznam výšky každého dítěte ve třídě by byl obyčejná data. Seznam každého dítěte ve třídě, který uvádí jak výšku dítěte, tak jeho hmotnost, by byl velmi jednoduchou formou panelových dat. Některé formy panelových údajů jsou mnohem komplikovanější: například národní sčítání lidu může obsahovat desítky položek údajů o každé domácnosti.
V nejjednodušším případě lze k navázání vztahů použít ekonometriku dat panelu. Například soubor údajů může zobrazit výsledky přijímacích zkoušek na vysoké škole bývalých studentů a jejich platů deset let po ukončení školy. To by mohlo ukázat silný vztah mezi vysokým skóre a vysokým platem. To nemusí nutně prokázat, že jsou spojeny dva: běžně používaná věta je, že „korelace se nerovná příčinnosti“.
Složitější datová ekonometrie dat může pracovat s více faktory. Například výsledky testů a údaje o platech mohou také zahrnovat podrobnosti o průměrném skóre testu ve škole studenta. Pomocí křížového odkazu by analytici mohli zjistit, že platy jsou více závislé na tom, jak dobře si student vedl ve srovnání se svými spolužáky, než ve skutečném skóre studenta. To by mohlo vést k teorii, že studenti, kteří překonávají vrstevníky, jsou konkurenceschopnější nebo řízeni a to se promítá do úspěchu na pracovišti a získání propagačních akcí.
Použití více proměnných může usnadnit identifikaci potenciálních odkazů. Může také snížit šance, že konkrétní spojení bylo způsobeno čistě náhodou, nebo objasnit, kdy tomu tak je. Hlavním problémem je, že každá další proměnná způsobuje dramatický nárůst celkového počtu potenciálních odkazů, které se zkoumají. To nejen zvyšuje potřebnou analytickou práci, ale zvyšuje také šanci, že dojde k chybě.