Jakie są różne techniki analizy danych?
Techniki analizy danych pozwalają badaczom przeglądać zebrane dane i wyciągać wnioski lub ustalać na podstawie informacji. Większość technik koncentruje się na zastosowaniu technik ilościowych do przeglądu danych. Kilka bardziej popularnych technik analizy danych ilościowych obejmuje statystyki opisowe, eksploracyjną analizę danych i analizę danych potwierdzających. Te dwa ostatnie obejmują użycie poparcia lub braku poparcia wcześniej ustalonej hipotezy. Grupy, które mogą korzystać z tych technik, obejmują indywidualnych badaczy, studentów, firmy, agencje rządowe i aktuariuszy, a także inne podmioty potrzebujące informacji i danych.
Ilościowa analiza danych próbuje usunąć uprzedzenia badaczy z zebranych danych. Częste korzystanie ze statystyk, prawdopodobieństw lub innych technik matematycznych pozwala osobom na stosowanie standardowych metod interpretacji danych. Gdy badacze próbują zastosować jakościowe techniki analizy danych - często oparte na osobistym pochodzeniu, preferencjach lub podstawowych badaniach i zasadach rozumowania - zgromadzone dane mogą zostać źle odczytane lub nieprawidłowo zinterpretowane. Dlatego techniki matematyczne są mniej podatne na te błędy i często bardziej akceptowane przez inne osoby lub badaczy.
Opisowa analiza statystyczna dzieli lub podsumowuje dane na określone grupy. Dane demograficzne to wspólny zestaw statystyk opisowych. Naukowcy będą zbierać informacje dotyczące wieku populacji, płci, wielkości gospodarstwa domowego, dochodów, rodzaju pracy i innych informacji. Innym rodzajem opisowej analizy statystycznej jest procent ukończenia rozgrywającego podczas gry w piłkę nożną. Jeśli rozgrywający wykona sześć z ośmiu prób podania, ma 75 procent ukończenia. Wadą tej techniki jest niemożność dostarczenia przez statystyki dodatkowych informacji, takich jak długość każdego przejścia.
Techniki analizy danych eksploracyjnych często wymagają użycia wykresów pudełkowych, histogramów, wykresów Pareto, wykresów punktowych lub wykresu łodygi i liści. Głównym celem tej techniki jest poparcie określonej hipotezy badacza. Na przykład badacz może chcieć udowodnić hipotezę dotyczącą przedziału wiekowego właścicieli, którzy prowadzą określony typ samochodu, na przykład minivana. Aby przetestować i poprzeć tę hipotezę, badacz zgromadzi informacje i utworzy wykres pudełkowy, aby określić liczbę właścicieli w podanym zakresie. Statystyki dostarczą informacji na poparcie lub nie na poparcie hipotezy i pokażą, jak wiele wartości odstających znajduje się w zebranych danych.
Techniki analizy danych potwierdzających są przeciwieństwem technik eksploracyjnych. W tych testach badacz próbuje obalić hipotezę zerową, która jest stwierdzeniem ogólnie akceptowanym przez większość osób. Aby obalić hipotezę zerową, badacz zgromadzi określone informacje związane z hipotezą i przetestuje średnią, wariancję, wartości p i przedziały ufności. Przedział ufności potwierdzony przez potwierdzającą analizę danych dostarczy informacji o tym, jak pewny powinien być badacz, czy hipoteza zerowa jest prawdziwa czy fałszywa.