Hva er en boksplott?

Et boksdiagram eller rute-og-visp-diagram er en metode for å organisere numeriske data langs en enkelt talllinje, som kan være enten horisontal eller vertikal. Selve boksen, når plottet er horisontalt, sitter litt over tallinjen og består av tre vertikale linjer, forbundet med horisontale linjer. De horisontale grensene for boksen representerer det første og tredje kvartil (25. og 75. prosentil), atskilt med midtlinjen, som er dataens median eller 50. prosentil. På hver side av boksen strekker man seg fra midten av de horisontale linjene, strekker vertikale linjer, noen ganger kalt vispere. Når disse når minimums- og maksimumstall for datasettet, ender de i mindre horisontale linjer, selv om dette kan variere litt avhengig av dataspredning.

Det er noen viktige elementer som utgjør en god boksplott, og noen tall som folk trenger å vite når de lager disse hitlistene. Den første av disse kalles femnummer sammendraget, ofte forkortet til fem num. sum. Dette er en liste over første og tredje kvartil, median, og minimum og maksimum antall data. I noen applikasjoner vil folk trenge å liste opp disse i nærheten av plottet, selv om analyse av et plott med en god tallinje også kan utlede disse tallene ved å se på de tre horisontale linjene og de avsluttende vispene. Det er ikke et kylling / egg-spørsmål for personen som tegner et tomt fordi de fem num. sum. må brukes til å lage plottet.

Folk trenger også å kjenne et nummer som heter interquartile range (IQR). Å trekke fra den første kvartilen fra den tredje kvartilen stammer fra IQR, og ved bruk av annen programvare eller vitenskapelige kalkulatorer kan du også få dette nummeret og sammendraget av fem tall ved å legge inn alle data. IQR er viktig fordi linjer som strekker seg fra boksen vanligvis bare strekker seg til 1,5 ganger IQR. Data utover dette punktet indikeres med prikker i stedet for en kontinuerlig linje. Disse prikkene antyder ofte at dataene har outliers.

Det finnes en rekke bruksområder for boksen. Flere plott kan tegnes over en tallelinje, og kan sammenligne lignende datasett differensiert med en eller annen viktig faktor. For eksempel kan forskere eller statistikere registrere hjertefrekvensen for menn og kvinner, og deretter konstruere to stablede bokseplott for å se etter betydelige forskjeller i rekkevidde og kvartiler.

Kartplotter adresserer ikke datafrekvens. Mangelen på en ekstra skala (vertikal eller horisontal) utelater informasjon om repetisjon av tall, datasettstørrelse og de fleste individuelle tall. Personen som ser på en rute-plot vil mest forstå femsummeringssammendraget, rekkevidden og om dataene har noen avvikere. Boksestørrelse, forhold mellom median og kvartiler og lengde på kinnskjegg kan vise om data er skjevt, men det kan ikke snakke med ting som middel, modus eller standardavvik. Andre diagrammer som histogrammer kan være mer nyttige når folk ønsker å representere ting som frekvens eller utlede bedre visuelt om datadistribusjon.

ANDRE SPRÅK

Hjalp denne artikkelen deg? Takk for tilbakemeldingen Takk for tilbakemeldingen

Hvordan kan vi hjelpe? Hvordan kan vi hjelpe?