Wat zijn de verschillende technieken voor gegevensanalyse?
Met gegevensanalysetechnieken kunnen onderzoekers verzamelde gegevens beoordelen en conclusies trekken of de informatie bepalen. De meeste technieken zijn gericht op de toepassing van kwantitatieve technieken om de gegevens te beoordelen. Enkele van de meer populaire technieken voor kwantitatieve gegevensanalyse omvatten beschrijvende statistieken, verkennende gegevensanalyse en bevestigende gegevensanalyse. De laatste twee impliceren het gebruik van het ondersteunen of niet ondersteunen van een vooraf bepaalde hypothese. Groepen die deze technieken kunnen gebruiken omvatten individuele onderzoekers, studenten, bedrijven, overheidsinstellingen en actuarissen, onder andere partijen die informatie en gegevens nodig hebben.
Kwantitatieve gegevensanalyse probeert bias van onderzoekers uit verzamelde gegevens te verwijderen. Veel gebruik van statistieken, waarschijnlijkheden of andere wiskundige technieken stelt individuen in staat om standaardmethoden te gebruiken voor het interpreteren van gegevens. Wanneer onderzoekers proberen kwalitatieve gegevensanalysetechnieken te gebruiken - vaak gebaseerd op de persoonlijke achtergrond, voorkeuren of basisonderzoeks- en redeneerprincipes van het individu - kunnen de verzamelde gegevens verkeerd worden gelezen of onjuist worden geïnterpreteerd. Daarom zijn wiskundige technieken minder vatbaar voor deze fouten en worden ze vaak meer geaccepteerd door andere personen of onderzoekers.
Beschrijvende statistische analyse scheidt gegevens of vat ze samen in specifieke groepen. Demografieën zijn een gemeenschappelijke set van beschrijvende statistieken. Onderzoekers verzamelen informatie met betrekking tot de leeftijd, het geslacht, de grootte van het huishouden, het inkomen, het type baan en andere informatie. Een ander type beschrijvende statistische analyse is het voltooiingspercentage van een quarterback bij het spelen in een voetbalspel. Als de quarterback zes van de acht passpogingen voltooit, heeft hij een voltooiingspercentage van 75 procent. Een fout in deze techniek is het onvermogen van de statistieken om aanvullende informatie te verstrekken, zoals de lengte van elke doorgang.
Exploratieve gegevensanalysetechnieken omvatten vaak het gebruik van boxplots, histogrammen, Pareto-diagrammen, spreidingsplots of een stengel-en-bladplot. Het hoofddoel van deze techniek is het ondersteunen van een gestelde hypothese van een onderzoeker. Een onderzoeker kan bijvoorbeeld een hypothese willen bewijzen over de leeftijdscategorie van eigenaren die een bepaald type auto besturen, zoals een minibus. Om deze hypothese te testen en te ondersteunen, zal de onderzoeker informatie verzamelen en een boxplot maken om het aantal eigenaren binnen zijn aangegeven bereik te bepalen. De statistieken zullen informatie verschaffen om de hypothese al dan niet te ondersteunen en laten zien hoeveel uitbijters er in de verzamelde gegevens zijn.
Bevestigende data-analysetechnieken zijn het tegenovergestelde van verkennende technieken. In deze tests probeert de onderzoeker de nulhypothese te weerleggen, een verklaring die door de meeste personen als algemeen wordt aanvaard. Om de nulhypothese te weerleggen, verzamelt de onderzoeker specifieke informatie met betrekking tot de hypothese en test hij het gemiddelde, de variantie, p-waarden en betrouwbaarheidsintervallen. Het betrouwbaarheidsinterval dat door de bevestigende gegevensanalyse wordt bewezen, geeft informatie over hoe zeker de onderzoeker moet zijn over de vraag of de nulhypothese waar of onwaar is.