Onderstaande afbeelding toont 4 grafieken met elk 11 data punten. Je ziet duidelijk dat de 11 punten in deze 4 gevallen zeer verschillend zijn. En toch hebben ze hetzelfde gemiddelde, dezelfde mediaan en dezelfde onderlinge samenhang (correlatie)… Lees deze pagina en je begrijpt precies hoe dat kan!
Het gemiddelde is een getal dat het resultaat is van de som van een groep getallen gedeeld door het aantal getallen in de groep. De eindtoets scores per schooljaar op de pagina’s per basisschool zijn hier een voorbeeld van. Hierbij zijn de scores per leerling opgesteld en is de som gedeeld door het aantal leerlingen. Aan ander heel simpel voorbeeld: Jens heeft 1 knikker, Julia heeft 2 knikkers en Wiebe heeft 3 knikkers. Gemiddeld hebben Jens, Julia en Wiebe 2 knikkers. De som is immers 6 knikkers, gedeeld door 3 betekent 2 knikkers gemiddeld.
Een gewogen gemiddelde houdt ook rekening met het “gewicht” van de getallen. Een voorbeeld hiervan zijn de slagingspercentages op de pagina’s met informatie per middelbare school. Het gewogen gemiddelde voor alle type opleidingen is hierbij berekend door rekening te houden met het aantal leerlingen per opleiding. Bijvoorbeeld: 50 leerlingen doen VMBO en hiervan is 100% geslaagd. En 100 leerlingen doen HAVO waarvan 90% geslaagd is. Het gemiddelde slagingspercentage over beide opleidingen zou dan 95% zijn. Het gewogen gemiddelde houdt echter rekening met het aantal leerlingen per type opleiding en wordt berekend door dit aantal als gewicht / weging in de cijfers mee te nemen. Je krijgt dan: (50 * 100%) + (100 * 90%) gedeeld door 150 (het totaal aantal leerlingen) = 93,33% als gewogen gemiddelde. Het gewicht kan ook andere factoren uitdrukken, bijvoorbeeld de betrouwbaarheid of in het voorbeeld met de knikkers: hoe groot een knikker is… Misschien heeft Jens een reuze knikker terwijl Julia knikkers met een normaal formaat heeft en Wiebe zijn knikkers heel klein zijn. Dit verschil kun in het gewogen gemiddelde uitdrukken. Je krijgt dan bijvoorbeeld (1 * 3) + (2 * 2) + (3 * 1) = 3 + 4 + 3 = 10. Om het gewogen gemiddelde te krijgen moet je delen door het totaal van de gewichten (3 + 2 + 1 = 6). Dus: 10 / 6 = 1,67.
Een gemiddelde kan een handig uitgangspunt zijn om mee te rekenen. Als je een auto koopt, geeft het gemiddelde verbruik je een idee wat je aan brandstof kwijt zult zijn. Maar soms zegt een gemiddelde niet zo veel. Dan kan het een vertekend beeld geven. Een aantal uitschieters naar boven of beneden kan een gemiddelde enorm beinvloeden. Als multimiljonair Donald Trump in een vliegtuig stapt, is het gemiddelde vermogen van de reizigers in een klap een stuk hoger. Als de gemiddelde huizenprijs met 5 procent gedaald is, dan kan dat betekenen dat alle huizen minder waard geworden zijn, maar ook dat alleen de dure huizen een flink stuk in prijs zijn gezakt.
Daarom wordt bij statistieken vaak de mediaan gebruikt als alternatief. Bij het bepalen van de mediaan zet je alle getallen uit de verzameling op een rijtje en dan neem je vervolgens de middelste: “de mediaan is de middelste waarde in een rij getallen die op volgorde van grootte gesorteerd zijn”. Dat wil zeggen dat 50% van de getallen boven de mediaan ligt en 50% van de getallen onder de mediaan. Het voordeel van een mediaan is dat deze minder gevoelig is voor uitbijters dan het gemiddelde.
De grafieken met cumulatieve verdelingen op de ranglijst pagina’s tonen het percentieel heel duidelijk. De rode diamantjes in deze grafieken tonen de ‘percentiel punten’ van 2,5%, 25%, 50% (de mediaan), 75% en 97,5%. Ook de analyse pagina’s zoals bijvoorbeeld bij de analyse van het aantal leerlingen per instelling in het primair onderwijs en bij de analyse van het slagingspercentage in het voortgezet onderwijs laten dit principe duidelijk zien. Hier zijn alle waarnemingen gerangschikt van laag naar hoog. Zo is bijvoorbeeld te zien dat 50 procent (de mediaan) van de vestigingen in het primair onderwijs minder dan 200 leerlingen. Eigenlijk is de mediaan een veel gebruikt “percentiel”: De mediaan is een percentiel bij 50% (een percentiel is een punt in een geordende reeks dat een honderdste deel aangeeft). In het analyse voorbeeld met aantal leerlingen komt het eerste percentiel overeen met het aantal scholen waarbij 1% minder leerlingen heeft en 99% meer. Het 80 procents percentiel toont dat 80% van de scholen minder dan 300 leerlingen heeft.
Een ander voorbeeld: de meters met het “Gemiddeld inkomen per inwoner” op de pagina’s met informatie per gemeente tonen het gemiddelde ten opzichte van het 10% percentiel (rood), 25% percentiel (oranje) en 75% percentiel (groen): De wijzer van de meter toont het gemiddeld inkomen voor de gemeente (of wijk of buurt die je kunt selecteren). De schaal van de meter toont de variatie in inkomen met het minimum en maximum gemiddeld inkomen per regio. De laagste 10% en 25% regio’s komen in het rode en oranje gebied (dit kan soms overlappen). De hoogste 25% regio’s vallen in het groene gebied.
De inkomenscijfers voor Nederland zijn: minimum gemiddeld € 7.700 tot € 19.000 voor de laagste 10% regio’s en tot € 21.000 voor de laagste 25% regio’s. Gemiddeld: € 24.000. Hoogste 24% regio’s: € 25.900 tot € 44.400, hoogste 1%: € 44.400 tot het maximum van € 84.400 gemiddeld inkomen per inwoner per jaar in een regio.
De modus is de meest genoemde waarde in een reeks getallen. De modus wordt bijvoorbeeld vaak gebruikt bij het vergelijken van inkomens of levensverwachting: dit is het getal dat het vaakst voorkomt in het rijtje. Voor inkomen wordt vaak het modale inkomen gebruikt. Dit is relevant omdat dit het meest voorkomende inkomen is. Een gemiddeld inkomen kan door uitschieters een vertekend beeld geven (zoals in het voorbeeld hierboven met Donald Trump). Ook bij de levensverwachting is de modus relevant: Rond 1860 was de gemiddelde levensverwachting in Nederland 37 jaar. Tegenwoordig is dat ongeveer 78 jaar. Je zou denken dat er rond 1860 nauwelijks bejaarde mensen rondliepen. Maar ook toen al waren er veel mensen die 70 werden of ouder. De leeftijd waarop de meeste mensen overleden (de modus!) was 73 jaar (tegenwoordig is dat 85). De kindersterfte was alleen erg hoog en dat verlaagde de gemiddelde levensverwachting.
Advertentie:
Ontvang een e-mail als de informatie is bijgewerkt. Maximaal 2 per jaar en niets anders dan dat.
InschrijvenJouw steun in de vorm van een donatie (bijvoorbeeld voor een kopje koffie) of het verder bekend maken van AlleCijfers door deze pagina met anderen te delen is van harte welkom!