Hur fungerar ett lådagram
•
Kvartiler och lådagram
I det förra avsnittet om lägesmått använde vi oss av ett exempel med en släktmiddag som familjen Mattecentrum anordnade. Åldrarna på de närvarande personerna vid släktmiddagen var
$$1,\, 4,\, 3,\, 15,\, 72,\, 41,\, 30,\, 27,\, 72,\, 8,\, 42,\, 36,\, 33,\, 46,\, 44$$
En person som inte var med på släktmiddagen var Mattias, som istället var på middag med ett antal vänner. Åldern på de 15 personer som var med vid Mattias middag var som följer:
$$30,\, 31,\, 33,\, 34,\, 35,\, 34,\, 28,\, 34,\, 33,\, 34,\, 36,\, 35,\, 32,\, 31,\, 32$$
Vi jämför lägesmåtten vad gäller åldern på personerna i dessa båda grupper. Då ser vi att medelvärdet och medianen för släktmiddagen är
$$medel=31,6 \,år$$
$$median=33 \,år$$
För personerna som deltog vid kompismiddagen blir lägesmåtten följande:
$$medel=32,8\,år$$
$$median=33\,år$$
Tittar vi bara på dessa lägesmått så ser det inte ut som att det var så stor skillnad mellan åldrarna vid de två tillställningarna, utom m
•
Standardavvikelse
I det förra avsnittet tittade vi med hjälp av variationsbredd och kvartiler på observationsvärdenas spridning runt medianen, men man kan även vara intresserad av spridningsmått vad gäller spridning runt medelvärdet. Det vanligaste måttet på spridning runt medelvärdet är standardavvikelse, vilket vi ska bekanta oss med i detta avsnitt.
Definition av standardavvikelse
Med standardavvikelsen menar vi ett mått på den genomsnittliga avvikelsen från medelvärdet i en serie observationsvärden. Ju större standardavvikelsen är, desto större är spridningen bland våra observationsvärden.
När vi ska beräkna standardavvikelsen börjar vi med att beräkna medelvärdet för observationsvärdena (vilket vi här betecknar med m) och sedan beräknar vi hur mycket varje enskilt observationsvärde (här betecknat med x) avviker från detta medelvärde.
Avvikelsen från medelvärde för ett observationsvärde kan vi därför skriva som
$$x-m$$
där x är observationsvärdet och m är medelvärdet för
•
Lådagram
Lådagram eller låddiagram (engelska: box plot) är ett diagram där ett statistiskt material åskådliggörs i form av en låda, som rymmer den mittersta hälften av materialet. Den vanligaste varianten av lådagrammet kallas på engelska box-and-whiskers plot och sammanfattar materialet med hjälp av fem värden: medianvärdet, undre och övre kvartilen samt minimum och maximum. Eventuella extremvärden betraktas som utliggare (outliers) och med egna symboler. Kvartilavståndet kallas avståndet mellan övre och undre kvartilen, det vill säga längden på lådan. Den undre kvartilen markerar det 25% värdet (I exemplets fall det tredje), och den övre kvartilen markerar det 75% (i ex. nionde) värdet. Lådan innehåller alltså 50% av värdena.
Exempel
[redigera | redigera wikitext]Exempel på ett lådagram, som visar åldern på tolv personer som är 10, 12, 15, 15, 17, 18, 20, 21, 21, 23, 30 och 39 år gamla:
+---+--+ ----| + |-------- * +---+--+ -+----+----+----+----+----+----+-