Hva er dataanalyse?
Dataanalyse er en praksis der rå data blir ordnet og organisert slik at nyttig informasjon kan hentes ut fra den. Prosessen med å organisere og tenke på data er nøkkelen til å forstå hva dataene gjør og ikke inneholder. Det er mange måter mennesker kan tilnærme seg dataanalyse, og det er notorisk lett å manipulere data i analysefasen for å presse visse konklusjoner eller agendaer. Av denne grunn er det viktig å være oppmerksom når dataanalyse blir presentert, og å tenke kritisk på dataene og konklusjonene som ble trukket.
Rå data kan ha en rekke former, inkludert målinger, undersøkelser og observasjoner. I sin rå form kan denne informasjonen være utrolig nyttig, men også overveldende. I løpet av dataanalyseprosessen bestilles rådataene på en måte som vil være nyttig. For eksempel kan undersøkelsesresultatene bli samlet, slik at folk på et øyeblikk kan se hvor mange som svarte på undersøkelsen, og hvordan folk svarte på spesifikke spørsmål.
I løpet av organisering av dataene dukker det ofte opp trender, og disse trendene kan fremheves i skrivingen av dataene for å sikre at leserne tar merknad. I en tilfeldig undersøkelse av iskrem-preferanser, for eksempel, kan flere kvinner enn menn uttrykke en forkjærlighet for sjokolade, og dette kan være et interessepunkt for forskeren. Modellering av dataene med bruk av matematikk og andre verktøy kan noen ganger overdrive slike interessepunkter i dataene, noe som gjør dem lettere for forskeren å se.
Diagrammer, grafer og tekstoppskrifter av data er alle former for dataanalyse. Disse metodene er designet for å avgrense og destillere dataene slik at leserne kan hente interessant informasjon uten å behøve å sortere gjennom alle dataene på egen hånd. Oppsummering av data er ofte avgjørende for å støtte argumenter fremsatt med disse dataene, som det er å presentere dataene på en tydelig og forståelig måte. Rå dataene kan også inkluderes i form av et vedlegg slik at folk kan slå opp spesifikasjoner for seg selv.
Når folk møter oppsummerte data og konklusjoner, bør de se dem kritisk. Det er viktig å spørre hvor dataene er fra, og det er å spørre om prøvetakingsmetoden som er brukt for å samle inn dataene, og størrelsen på prøven. Hvis kilden til dataene ser ut til å ha en interessekonflikt med typen data som samles inn, kan dette stille spørsmål ved resultatene. På samme måte kan data samlet inn fra en liten prøve eller en prøve som ikke virkelig er tilfeldig, være av tvilsom nytte. Anerkjente forskere vil alltid gi informasjon om datainnsamlingsteknikkene som brukes, finansieringskilde og poenget med datainnsamlingen i begynnelsen av analysen slik at leserne kan tenke på denne informasjonen mens de gjennomgår analysen.