Hvad er paneldataøkonometrik?
Paneldataøkonometrik er en specifik form for statistisk dataanalyse. Det involverer flerdimensionelle data, og det er her dataene måler flere ting for det samme emne. Dette giver naturligvis analytikere mulighed for at finde mere information og mønstre, herunder krydshenvisende data. Ulempen med paneldataøkonometrik er, at det kan være meget mere kompliceret at analysere.
Econometrics er en aktivitet, der ligger et sted mellem økonomi og statistik. Meget af traditionel økonomi involverer udvikling af teorier til at forklare og forudsige aktiviteter som markedsadfærd. Econometrics handler mere om at starte med resultater og forsøge at arbejde baglæns for at finde mulige årsager og forbindelser.
Paneldata er undertiden kendt som langsgående data - det er ethvert datasæt, der dækker flere faktorer for de samme forsøgspersoner. For eksempel er en liste over højden for hvert barn i en klasse almindelige data. En liste over hvert barn i en klasse, der giver både barnets højde og barnets vægt, ville være en meget enkel form for paneldata. Nogle former for paneldata er langt mere komplicerede: for eksempel kan en national folketælling indeholde snesevis af dataoplysninger om hver husstand.
På det enkleste kan paneldataøkonometrik bruges til at etablere relationer. For eksempel kan et sæt af data vise antallet af tidligere studerende og deres løn ti år efter, at de har forladt skolen. Dette kunne vise et stærkt forhold mellem at have en høj score og at have en høj løn. Dette beviser ikke nødvendigvis, at de to er forbundet: en almindeligt anvendt sætning er, at "korrelation ikke er ens årsagssammenhæng."
Mere komplekse paneldataøkonometrikker kan arbejde med flere faktorer. For eksempel kan testresultaterne og lønningsdata også indeholde detaljer om det gennemsnitlige testresultat i den studerendes skole. Ved krydshenvisning kunne analytikere finde ud af, at lønningerne er mere afhængige af, hvor godt en studerende har fungeret sammenlignet med hans eller hendes klassekammerater end i den studerendes faktiske score. Dette kan føre til en teori om, at studerende, der overgår peers, er mere konkurrencedygtige eller drevet, og at dette betyder, at man kommer foran på arbejdspladsen og vinder forfremmelser.
Brug af flere variabler kan gøre det lettere at identificere potentielle links. Det kan også mindske chancerne for, at et bestemt link blev forårsaget rent tilfældigt, eller gøre det klarere, når det er tilfældet. Hovedproblemet er, at hver yderligere variabel medfører en dramatisk stigning i det samlede antal potentielle links, der undersøges. Dette øger ikke kun det nødvendige analysearbejde, men øger chancen for, at en fejl glider igennem.