Che cos'è un sistema di analisi statistica?
Il termine "sistema di analisi statistica" viene utilizzato per indicare il software che consente all'utente di eseguire analisi statistiche su set di dati. Un altro termine comunemente usato per questo tipo di software è il linguaggio di programmazione statistica. Quando maiuscolo, Statistical Analysis System (SAS) è anche il nome proprio di uno dei pacchetti software più noti di questo tipo.
Un sistema di analisi statistica fornisce l'automazione e la potenza di elaborazione necessarie per facilitare la manipolazione e l'analisi dei set di dati. Questi pacchetti facilitano il calcolo delle statistiche descrittive e induttive. I calcoli statistici descrittivi comunemente usati includono il calcolo della tendenza centrale, la distribuzione delle frequenze e l'associazione. L'analisi statistica induttiva che può essere eseguita con un sistema di analisi statistica comprende il test delle ipotesi statistiche, come il test t, il test z e il test chi-quadrato. Molti sistemi di analisi statistica supportano anche altri test, come l'analisi della varianza (ANOVA) e i suoi parenti, e vari tipi di test di regressione.
I sistemi di analisi statistica sono utilizzati in un'ampia varietà di impostazioni. Gli scienziati naturali e sociali in contesti di ricerca accademica e commerciale sono gli utenti più frequenti di questi tipi di pacchetti software. Le aziende possono inoltre utilizzare un sistema di analisi statistica per la ricerca operativa, la gestione dei progetti e altre applicazioni di business intelligence.
Con alcuni pacchetti software, l'interfaccia della riga di comando (CLI) viene utilizzata più spesso, mentre altri presentano principalmente un'interfaccia utente grafica (GUI), spesso con menu a discesa. La maggior parte dei pacchetti software fornisce funzionalità di CLI e GUI, anche se l'utente potrebbe non essere in grado di accedere a tutte le funzionalità da entrambe le interfacce. Mentre una GUI è più familiare per utenti non tecnici, l'uso di una CLI per creare programmi consente una più facile replica delle analisi.
Molti pacchetti software statistici utilizzano linguaggi di programmazione di quarta generazione (4GL). A causa del loro più alto livello di astrazione e sintassi più naturale, la manipolazione e l'analisi dei dati in 4GL è più rapida e semplice rispetto ai linguaggi di programmazione di livello inferiore. Prima dello sviluppo di 4GL, l'analisi statistica assistita da computer era macchinosa e richiedeva maggiori competenze di programmazione.
Sono disponibili numerose applicazioni software di analisi statistica con diverse interfacce, capacità ed estensioni. Le applicazioni software proprietarie rimangono popolari, ma molte applicazioni software open source sono anche ampiamente utilizzate. Praticamente tutti i pacchetti software statistici funzioneranno su sistemi operativi Windows® e la maggior parte ha anche versioni Macintosh® e Linux®. Alcune applicazioni sono compatibili anche con i sistemi operativi Unix®.