Wat is Panel Data Econometrics?
Panel data econometrics is een specifieke vorm van statistische data-analyse. Het gaat om multidimensionale gegevens, waar de gegevens meerdere dingen voor hetzelfde onderwerp meten. Hierdoor kunnen analisten natuurlijk meer informatie en patronen vinden, waaronder gegevens waarnaar wordt verwezen. Het nadeel van panel data-econometrie is dat het veel ingewikkelder kan zijn om te analyseren.
Econometrie is een activiteit die ergens tussen economie en statistiek ligt. Veel van de traditionele economie omvat het ontwikkelen van theorieën om activiteiten zoals marktgedrag te verklaren en te voorspellen. Econometrie gaat meer over het beginnen met resultaten en proberen achteruit te werken om mogelijke oorzaken en verbindingen te vinden.
Paneelgegevens worden soms longitudinale gegevens genoemd - het is een set gegevens die meerdere factoren voor dezelfde onderwerpen omvat. Een lijst met de lengte van elk kind in een klas zou bijvoorbeeld gewone gegevens zijn. Een lijst van elk kind in een klas met zowel de lengte als het gewicht van het kind zou een zeer eenvoudige vorm van paneldata zijn. Sommige vormen van paneldata zijn veel gecompliceerder: een nationale volkstelling kan bijvoorbeeld tientallen gegevens over elk huishouden bevatten.
In zijn eenvoudigste vorm kunnen panel data-econometrie worden gebruikt om relaties tot stand te brengen. Een reeks gegevens kan bijvoorbeeld de scores voor de toelatingstest van het college van voormalige studenten en hun salarissen tien jaar na het verlaten van school tonen. Dit kan een sterke relatie aantonen tussen een hoge score en een hoog salaris. Dit bewijst niet noodzakelijkerwijs dat de twee met elkaar verbonden zijn: een veelgebruikte uitdrukking is dat "correlatie niet gelijk is aan oorzakelijk verband".
Complexere panel data-econometrie kan met meerdere factoren werken. De testscores en salarisgegevens kunnen bijvoorbeeld ook details bevatten van de gemiddelde testscore op de school van de student. Door kruisverwijzingen te vinden, konden analisten ontdekken dat de salarissen meer afhankelijk zijn van hoe goed een student presteerde in vergelijking met zijn of haar klasgenoten dan in de feitelijke score van de student. Dit zou kunnen leiden tot een theorie dat studenten die beter presteren dan collega's concurrerender of gedreven zijn en dat dit zich vertaalt in het vooruitgaan op de werkplek en het winnen van promoties.
Het gebruik van meerdere variabelen kan het gemakkelijker maken om potentiële links te identificeren. Het kan ook de kans verkleinen dat een bepaalde link puur door toeval werd veroorzaakt, of duidelijker maken wanneer dat het geval is. Het grootste probleem is dat elke extra variabele een dramatische toename van het totale aantal potentiële koppelingen veroorzaakt. Dit verhoogt niet alleen het vereiste analysewerk, maar verhoogt ook de kans dat een fout doorglipt.