Hva er paneldataøkonometrikk?
Paneldataøkonometrikk er en spesifikk form for statistisk dataanalyse. Det innebærer flerdimensjonale data, og det er her dataene måler flere ting for samme emne. Dette lar naturligvis analytikere finne mer informasjon og mønstre, inkludert krysshenvisende data. Ulempen med paneldataøkonometrikk er at det kan være mye mer komplisert å analysere.
Econometrics er en aktivitet som ligger et sted mellom økonomi og statistikk. Mye av tradisjonell økonomi innebærer å utvikle teorier for å forklare og forutsi aktiviteter som markedsatferd. Econometrics handler mer om å starte med resultater og forsøke å jobbe bakover for å finne mulige årsaker og sammenhenger.
Paneldata er noen ganger kjent som langsgående data - det er ethvert sett med data som dekker flere faktorer for de samme forsøkspersonene. For eksempel vil en liste over høyden til hvert barn i en klasse være vanlige data. En liste over hvert barn i en klasse som gir både barnets høyde og barnets vekt, ville være en veldig enkel form for paneldata. Noen former for paneldata er langt mer kompliserte: For eksempel kan en nasjonal folketelling inneholde dusinvis av data om hver husstand.
På det enkleste kan paneldataøkonometrikk brukes til å etablere relasjoner. For eksempel kan et sett med data vise poengsummene for tidligere studenter og lønnene deres ti år etter at de gikk ut av skolen. Dette kan vise til et sterkt forhold mellom å ha en høy score og å ha en høy lønn. Dette beviser ikke nødvendigvis at de to er koblet sammen: en ofte brukt frase er at "korrelasjon ikke tilsvarer årsakssammenheng."
Mer kompleks paneldataøkonometrikk kan fungere med flere faktorer. For eksempel kan testresultatene og lønnsdata også inneholde detaljer om gjennomsnittlig testpoeng på elevens skole. Ved å henvise til analytikere, kan analytikerne finne at lønningene er mer avhengig av hvor bra en student presterte sammenlignet med klassekameratene enn i studentens faktiske poengsum. Dette kan føre til en teori om at studenter som utkonkurrerer jevnaldrende er mer konkurransedyktige eller drevet, og at dette medfører å komme foran på arbeidsplassen og vinne kampanjer.
Å bruke flere variabler kan gjøre det lettere å identifisere potensielle lenker. Det kan også redusere sjansene for at en bestemt kobling ble forårsaket rent ved en tilfeldighet, eller gjøre det tydeligere når det er tilfelle. Hovedproblemet er at hver ekstra variabel medfører en dramatisk økning i det totale antallet potensielle lenker som blir utforsket. Dette øker ikke bare det nødvendige analysearbeidet, men øker sjansen for at en feil glir gjennom.