Vad är en lådplott?

En lådplot eller en box-and-whisker-diagram är en metod för att organisera numeriska data längs en enda nummerrad, som kan vara antingen horisontell eller vertikal. Den faktiska rutan, när plottet är horisontellt, sitter något över antalet och består av tre vertikala linjer, anslutna samman med horisontella linjer. De horisontella gränserna för lådan representerar de första och tredje kvartilerna (25: e och 75: e percentilerna), åtskilda av mittlinjen, som är datas median eller 50: e percentil. På vardera sidan av lådan sträcker sig tomten från mitten av de horisontella linjerna, vertikala linjer, ibland kallade whiskers. När dessa når minimum och maximalt antal datauppsättningar slutar de i mindre horisontella linjer, även om detta kan variera något beroende på dataspridning.

Det finns några viktiga element som utgör en bra lådplott, och vissa siffror som människor behöver veta när de skapar dessa diagram. Den första av dessa kallas femtalsöversikten, ofta förkortat as fem num. belopp. Detta är en lista över första och tredje kvartiler, median och minsta och maximala antal av data. I vissa applikationer kommer människor att behöva lista dessa nära tomten, även om analys av en tomt med en bra antal linje också kan härleda dessa siffror genom att titta på de tre horisontella linjerna och de slutande whiskers. Det är inte en kyckling/äggfråga för personen som drar en tomt eftersom de fem numret. belopp. Måste användas för att skapa handlingen.

Människor måste också veta ett nummer som kallas interkvartilområdet (IQR). Att subtrahera den första kvartilen från den tredje kvartilen härstammar IQR, och att använda olika programvara eller vetenskapliga kalkylatorer kan också få detta nummer och de fem nummeröversikten genom att mata in all data. IQR är viktigt eftersom linjer som sträcker sig från lådan vanligtvis endast sträcker sig till 1,5 gånger IQR. Data utöver den punkten indikeras av prickar istället för en kontinuerliglinje. Dessa prickar föreslår ofta att data har outliers.

En mängd olika användningsområden finns för rutan. Flera tomter kan dras över en sifferrad och kan jämföra liknande uppsättningar av data som differentieras med någon viktig faktor. Till exempel kan forskare eller statistiker spela in hjärtfrekvens för män och kvinnor och sedan konstruera två staplade lådor för att leta efter betydande skillnader inom räckvidd och kvartiler.

Boxplottar adresserar inte datafrekvensen. Avsaknaden av en ytterligare skala (vertikal eller horisontell) utelämnar information om upprepande siffror, datauppsättningstorlek och de flesta individuella siffror. Personen som tittar på en lådplott kommer mest att förstå den femtalsöversikt, intervallet och om uppgifterna har några outliers. Boxstorlek, medianförhållande till kvartiler och längd på whiskers kan visa om data är sned, men det kan inte tala med saker som medelvärde, läge eller standardavvikelse. Andra diagram som histogram kan vara mer användbara när människor vill representera saker somfrekvens eller erhåller bättre bilder om datadistribution.

ANDRA SPRÅK

Hjälpte den här artikeln dig? Tack för feedbacken Tack för feedbacken

Hur kan vi hjälpa? Hur kan vi hjälpa?