Vad är paneldataekonometrik?
Paneldataekonometrik är en specifik form för statistisk dataanalys. Det involverar flerdimensionell data, och det är där data mäter flera saker för samma ämne. Detta gör naturligtvis att analytiker kan hitta mer information och mönster, inklusive korsreferenser. Nackdelen med paneldataekonometriken är att det kan vara mycket mer komplicerat att analysera.
Econometrics är en aktivitet som ligger någonstans mellan ekonomi och statistik. Mycket av traditionell ekonomi innebär att utveckla teorier för att förklara och förutsäga aktiviteter som marknadsbeteende. Econometrics handlar mer om att börja med resultat och försöka arbeta bakåt för att hitta möjliga orsaker och kopplingar.
Paneldata kallas ibland longitudinell data - det är vilken uppsättning data som täcker flera faktorer för samma försökspersoner. En lista över höjden för varje barn i en klass skulle till exempel vara vanliga uppgifter. En lista över varje barn i en klass som ger både barnets höjd och barnets vikt skulle vara en mycket enkel form för paneldata. Vissa former av paneldata är mycket mer komplicerade: till exempel kan en nationell folkräkning innehålla dussintals data om varje hushåll.
På det enklaste kan paneldataekonometrik användas för att skapa relationer. Till exempel kan en uppsättning data visa poäng för antalet studenter och deras löner tio år efter att ha lämnat skolan. Detta kan visa en stark relation mellan att ha en hög poäng och att ha en hög lön. Detta bevisar inte nödvändigtvis att de två är kopplade: en vanligt förekommande fras är att "korrelation inte liknar orsakssamband."
Mer komplex paneldataekonometrik kan fungera med flera faktorer. Till exempel kan testresultaten och lönedata också innehålla detaljer om den genomsnittliga testresultatet i studentens skola. Genom korsreferenser kan analytiker finna att lönerna är mer beroende av hur bra en student presterade jämfört med sina klasskamrater än i studentens faktiska poäng. Detta kan leda till en teori om att studenter som överträffar kamrater är mer konkurrenskraftiga eller drivna och att detta leder till att komma vidare på arbetsplatsen och vinna kampanjer.
Att använda flera variabler kan göra det lättare att identifiera potentiella länkar. Det kan också minska chansen att en viss länk orsakades enbart av en slump, eller göra det tydligare när så är fallet. Det huvudsakliga problemet är att varje ytterligare variabel orsakar en dramatisk ökning av det totala antalet potentiella länkar som utforskas. Detta ökar inte bara det analysarbete som krävs, utan ökar risken för att ett misstag glider igenom.