Onderwijs als jurysport
Tijdens het voorbereiden van een teambijeenkomst (in een mooi vorig leven op het IJburg College) over toetsing drong het volgende beeld zich aan mij op. Er bestaat in de sport een verschil tussen sporten waarbij een jury een doorslaggevende stem heeft en sporten die beslist worden op basis van goed objectiveerbare maten als afstand, tijd, eerst aankomende e.d. Ook bij die laatste sporten zal een jury aanwezig zijn, maar die is er alleen om een besluit te nemen als sporters ogenschijnlijk gelijk eindigen of als er een onregelmatigheid lijkt te zijn begaan.
Wat zijn zoal jurysporten? Dressuur bij paarden, schoonspringen, turnen, schoonzwemmen, kunstrijden op de schaats, … Allemaal sporten waarbij de prestatie zich niet zuiver objectief laat bepalen, er is steeds sprake van een esthetische component die zich daar niet voor leent. Vreemd genoeg is er vervolgens bij al die sporten voor gekozen om een absolute schaal te gebruiken waarbij we de prestatie toch in een getal uitdrukken. Door meer juryleden te gebruiken en meer aspecten van het vertoonde gedrag te onderscheiden, trachten we tot een betrouwbaar oordeel te komen.
Dat lijkt sterk op hoe wij leerlingen moeten (willen?) beoordelen, in ieder geval in de bovenbouw van het VO (die 'traditie' is op brede schaal ook in het HO overgenomen). Immers, leerlingen moeten cijfers krijgen op een decimaal nauwkeurig. De schaal heeft een absoluut nulpunt en het betreft dus een ratio-schaal. We weten niet beter en vinden dat dus waarschijnlijk normaal. Maar dat is het niet. Wat gebeurt er namelijk? We formuleren vooraf leerdoelen van ons onderwijs en gaan met behulp van een toets bepalen of die leerdoelen behaald zijn. Tot zover niets aan de hand, maar waarom de stap naar een cijfer? Je zou kunnen stellen: een leerdoel wordt wel of niet behaald. De leerling toont al dan niet aan het gewenste gedrag te kunnen vertonen (een goed leerdoel is immers in waarneembaar gedrag geformuleerd). Dus dat levert een ja of een nee op, dat is een nominale schaal. Je zou kunnen argumenteren dat het gedrag meer of minder goed het beoogde gedrag laat zien en daarom de schaal wat verfijnen aan de bovenkant. Dat helpt om te differentiëren en beter presterende leerlingen/studenten te belonen. Let wel: het doel is niet om leerlingen met elkaar te vergelijken. Als er meer dan een leerdoel wordt gemeten zouden we het aantal ja’tjes en nee’tjes nog kunnen tellen en ergens een slaaggrens bepalen, al is die arbitrair. Je zou ook kunnen zeggen: de leerling gaat door tot alle leerdoelen zijn behaald. Wel zo duidelijk en de mogelijkheid om slecht vergelijkbare leerdoelen met elkaar te compenseren, komt daarmee te vervallen.
Ik ga het nu niet hebben over de schijn van nauwkeurigheid die het geven van cijfers in decimalen in zich draagt en begrippen als validiteit en betrouwbaarheid, al zouden die mijn pleidooi voor een andere manier van feedback geven en beoordelen alleen maar ondersteunen. Een simpel beeld lijkt mij in dit geval genoeg voer voor discussie.