Co to jest system analizy statystycznej?
Termin „System analizy statystyczny” służy do odwołania się do oprogramowania, które pozwala użytkownikowi przeprowadzić analizę statystyczną zestawów danych. Kolejnym powszechnie używanym terminem dla tego rodzaju oprogramowania jest język programowania statystycznego. Po kapitalizacji system analizy statystycznej (SAS) jest również właściwą nazwą jednego z najbardziej znanych pakietów oprogramowania tego typu.
System analizy statystycznej zapewnia automatyzację i moc przetwarzania potrzebną do ułatwienia manipulacji i analizy zestawów danych. Pakiety te ułatwiają obliczenie zarówno statystyki opisowej, jak i indukcyjnej. Powszechnie używane opisowe obliczenia statystyczne obejmują obliczanie tendencji centralnej, rozkładu częstotliwości i asocjacji. Indukcyjna analiza statystyczna, którą można przeprowadzić za pomocą systemu analizy statystycznej, obejmuje testy hipotezy statystyczne, takie jak test t, test Z i test chi-kwadrat. Wiele systemów analizy statystycznej obsługuje również inne testy, takie jak analiza VariANCE (ANOVA) i jego krewni oraz różne rodzaje testów regresji.
Systemy analizy statystycznej są używane w wielu różnych ustawieniach. Naukowcy naturalni i społeczni w środowisku badań akademickich i komercyjnych są najczęstszymi użytkownikami tego rodzaju pakietów oprogramowania. Firmy mogą również korzystać z systemu analizy statystycznej do badań operacyjnych, zarządzania projektami i innych aplikacji wywiadu biznesowego.
W przypadku niektórych pakietów oprogramowania interfejs wiersza poleceń (CLI) jest częściej używany, podczas gdy inne przede wszystkim zawierają graficzny interfejs użytkownika (GUI), często z rozwijanymi menu. Większość pakietów oprogramowania zapewnia zarówno funkcje CLI, jak i GUI, chociaż użytkownik może nie mieć dostępu do wszystkich funkcji z obu interfejsów. Podczas gdy GUI jest bardziej znany dla użytkowników nietechnicznych, użycie CLI do tworzenia programów umożliwia łatwiejszą replikację analiz.
Wiele statystycznych oprogramowaniaCzy pakiety korzystają z języków programowania czwartej generacji (4GL). Ze względu na wyższy poziom abstrakcji i bardziej naturalną składnię, manipulacja danymi i analiza w 4GL jest szybsza i łatwiejsza niż w językach programowania niższego poziomu. Przed opracowaniem 4GL analiza statystyczna wspomagana komputerowo i wymagała większej wiedzy specjalistycznej programowania.
Dostępna jest duża liczba aplikacji do analizy statystycznej o różnorodnych interfejsach, możliwościach i rozszerzeniach. Zastrzeżone aplikacje pozostają popularne, ale wiele aplikacji typu open source jest również szeroko stosowanych. Praktycznie wszystkie pakiety oprogramowania statystycznego będą działać w systemach operacyjnych Windows®, a większość ma również wersje Macintosh® i Linux®. Kilka aplikacji jest również kompatybilnych z systemami operacyjnymi UNIX®.