Co to jest system analizy statystycznej?
Termin „system analizy statystycznej” jest używany w odniesieniu do oprogramowania, które pozwala użytkownikowi przeprowadzać analizę statystyczną zbiorów danych. Innym często używanym terminem dla tego typu oprogramowania jest statystyczny język programowania. Po kapitalizacji, system analizy statystycznej (SAS) jest również właściwą nazwą jednego z najbardziej znanych pakietów oprogramowania tego typu.
System analizy statystycznej zapewnia moc automatyzacji i przetwarzania potrzebną do ułatwienia manipulacji i analizy zbiorów danych. Pakiety te ułatwiają obliczanie statystyki opisowej i indukcyjnej. Powszechnie stosowane opisowe obliczenia statystyczne obejmują obliczanie tendencji centralnej, rozkładu częstotliwości i asocjacji. Indukcyjna analiza statystyczna, którą można przeprowadzić za pomocą systemu analizy statystycznej, obejmuje statystyczne testowanie hipotez, takie jak test t, test z i test chi-kwadrat. Wiele systemów analizy statystycznej obsługuje również inne testy, takie jak analiza wariancji (ANOVA) i jej krewnych oraz różne rodzaje testów regresji.
Systemy analizy statystycznej są używane w wielu różnych ustawieniach. Naukowcy z dziedziny nauk przyrodniczych i społecznych w środowisku badań akademickich i komercyjnych są najczęstszymi użytkownikami tego rodzaju pakietów oprogramowania. Firmy mogą również korzystać z systemu analizy statystycznej do badań operacyjnych, zarządzania projektami i innych aplikacji analizy biznesowej.
W niektórych pakietach oprogramowania częściej używany jest interfejs wiersza polecenia (CLI), podczas gdy inne mają przede wszystkim graficzny interfejs użytkownika (GUI), często z rozwijanymi menu. Większość pakietów oprogramowania zapewnia zarówno interfejs CLI, jak i GUI, chociaż użytkownik może nie mieć dostępu do wszystkich funkcji z obu interfejsów. Chociaż GUI jest bardziej znany użytkownikom nietechnicznym, użycie CLI do tworzenia programów umożliwia łatwiejszą replikację analiz.
Wiele statystycznych pakietów oprogramowania korzysta z języków programowania czwartej generacji (4GL). Ze względu na wyższy poziom abstrakcji i bardziej naturalną składnię manipulowanie danymi i ich analiza w 4GL jest szybsza i łatwiejsza niż w językach programowania niższego poziomu. Przed opracowaniem 4GL wspomagana komputerowo analiza statystyczna była uciążliwa i wymagała większej wiedzy programistycznej.
Dostępnych jest wiele aplikacji do analizy statystycznej o różnych interfejsach, możliwościach i rozszerzeniach. Aplikacje własnościowe pozostają popularne, ale wiele aplikacji typu open source jest również szeroko używanych. Praktycznie wszystkie pakiety oprogramowania statystycznego będą działały w systemach operacyjnych Windows®, a większość ma także wersje Macintosh® i Linux®. Kilka aplikacji jest również zgodnych z systemami operacyjnymi Unix®.