Wat is een statistisch analysesysteem?
De term "statistisch analysesysteem" wordt gebruikt om te verwijzen naar software waarmee de gebruiker statistische analyses op gegevenssets kan uitvoeren. Een andere veel gebruikte term voor dit type software is de statistische programmeertaal. In hoofdletters is het Statistical Analysis System (SAS) ook de juiste naam voor een van de meest bekende softwarepakketten van dit type.
Een statistisch analysesysteem biedt de automatiserings- en verwerkingskracht die nodig is om de manipulatie en analyse van gegevenssets te vergemakkelijken. Deze pakketten vergemakkelijken de berekening van zowel beschrijvende als inductieve statistieken. Veelgebruikte beschrijvende statistische berekeningen omvatten de berekening van de centrale neiging, frequentieverdeling en associatie. Inductieve statistische analyse die kan worden uitgevoerd met een statistisch analysesysteem omvat statistische hypothesetests, zoals de t-test, de z-test en de chikwadraat-test. Veel statistische analysesystemen ondersteunen ook andere tests, zoals variantieanalyse (ANOVA) en zijn verwanten, en verschillende soorten regressietests.
Statistische analysesystemen worden in een breed scala aan instellingen gebruikt. Natuurlijke en sociale wetenschappers in academische en commerciële onderzoeksinstellingen zijn de meest frequente gebruikers van dit soort softwarepakketten. Bedrijven kunnen ook een statistisch analysesysteem gebruiken voor operationeel onderzoek, projectbeheer en andere business intelligence-toepassingen.
Bij sommige softwarepakketten wordt de opdrachtregelinterface (CLI) vaker gebruikt, terwijl andere voornamelijk een grafische gebruikersinterface (GUI) hebben, vaak met vervolgkeuzemenu's. De meeste softwarepakketten bieden zowel CLI- als GUI-mogelijkheden, hoewel de gebruiker mogelijk niet alle functies van beide interfaces kan gebruiken. Hoewel een GUI bekender is voor niet-technische gebruikers, maakt het gebruik van een CLI voor het maken van programma's eenvoudiger replicatie van analyses mogelijk.
Veel statistische softwarepakketten maken gebruik van programmeertalen van de vierde generatie (4GL). Vanwege hun hogere abstractieniveau en meer natuurlijke syntaxis, zijn gegevensmanipulatie en analyse in 4GL sneller en eenvoudiger dan in programmeertalen op lager niveau. Vóór de ontwikkeling van 4GL was computerondersteunde statistische analyse omslachtig en vereiste meer expertise op het gebied van programmeren.
Er is een groot aantal softwaretoepassingen voor statistische analyse met verschillende interfaces, mogelijkheden en uitbreidingen beschikbaar. Eigen softwareapplicaties blijven populair, maar veel open-source softwareapplicaties worden ook veel gebruikt. Vrijwel alle statistische softwarepakketten werken op Windows®-besturingssystemen en de meeste hebben ook Macintosh®- en Linux®-versies. Een paar toepassingen zijn ook compatibel met Unix®-besturingssystemen.