Consistentie van de scholenlijst

Het stuk over de lijst van Dronkers is met afstand het best gelezen stuk op deze blog. Ik gaf daarin kritiek op diverse aspecten van de wijze waarop Dronkers tot zijn cijfers komt. Een van de dingen die mij – en anderen, Dirk van der Wateren en OogTV– opvielen is dat de scores tussen dit jaar en vorig jaar nogal kunnen verschillen, met een extreem geval dat een school van 9 naar 3.5 gaat. Dronkers zelf rapporteert correlaties tussen de scores van vorig jaar en dit jaar (variërend van 0.22 tot 0.49) constateert dat die significant zijn (p<0.01) schrijft hierover:

„De samenhang tussen de schoolexamencijfers van beide jaren is substantieel; blijkbaar zijn ze niet het resultaat van toevallige goede of slechte jaren.”  (pagina 8).

Hoe zit dat nu? Om het beeld compleet te krijgen heb ik voor het VWO de cijfers van dit jaar geplot tegen de cijfers van vorig jaar. Die cijfers zijn te downloaden van schoolcijferlijst.nl. Het resultaat zie je hieronder:

2013-2012

Elk blauw puntje staat voor 1 of meerdere scholen. Als alle scores dit jaar hetzelfde zouden zijn als vorig jaar, zouden alle punten op de groene lijn liggen. Dat is niet zo, scholen kunnen natuurlijk beter of slechter gaan scoren dan vorig jaar. Bovendien heeft Dronkers zijn rekenmethode iets gewijzigd, hetgeen ook kan leiden tot verschillen. Op het oog is de spreiding wel erg groot, de school rechtsonder die van 9 naar 3,5 gaat ligt wel erg buiten de puntenwolk, maar grote verschillen zijn geen uitzondering.

Interessant is de rode lijn. Dat een regressielijn, de lijn die het beste het verband weergeeft tussen de cijfers op de horizontale en verticale as. Je verwacht dat die min of meer samenvalt met de groene. Scholen veranderen niet heel snel. Dat doet hij duidelijk niet. De vergelijking van de lijn is:

y = 0.37x+4.96.

terwijl y=x het ideale verband is. Concreet betekent dat dat scholen die in 2012 laag scoorden (7.5 of lager) gemiddeld hoger gingen scoren terwijl hoger scorende scholen dat lager gingen doen. Een geval van regressie naar het gemiddelde: Omdat je moeilijk hoger kunt is de kans dat je volgend jaar lager scoort groter. En belangrijker, het getal 0.37 geeft aan dat het verband tussen beide jaren helemaal niet zo sterk is. Een significant verband geeft nog niet aan dat het verband ook heel sterk is.

Op basis van deze grafiek kun je dus de nodige vraagtekens zetten bij Dronkers’ bewering dat toevallige goede of slechte jaren geen rol lijken te spelen.

Lijstjes van scholen

Afgelopen week publiceerde de volkskrant de schoolcijferlijst. Op basis van onderzoek van Jaap Dronkers en zijn groep worden in die lijst cijfers toegekend aan scholen. Zo’n lijst geeft altijd gedoe. De vraag is altijd of ranglijsten van scholen überhaupt een goed idee zijn en of zo’n lijst wel meet wat hij pretendeert te meten. Achter scores zit altijd een model waarmee de score totstandkomt. Om een antwoord op de tweede vraag te krijgen is het goed dit model te onderzoeken. Dat doe ik hier, op basis van Dronkers’ beschrijving die hier te downloaden is (PDF).

Alleen cijfers tellen. 

De waardering die Dronkers toekent aan de scholen hangt alleen van de cijfers af die leerlingen op hun examen behalen, althans dat is de enige maat die Dronkers gebruikt voor de waardering van de opbrengst van de school. Hij houdt wel rekening met de „instroom” van de school, bij de beoordeling daarvan, en kijkt kijkt in lichte mate naar het rendement (zeg het aantal leerlingen dat zonder zittenblijven slaagt) maar uiteindelijk zijn de examencijfers de gulden maat. Zelf zegt hij daarover:

„In wezen zijn loopbaanoriëntatie, zorg, leerlingenbegeleiding en de kwaliteit van docenten vooral middelen om het doel te bereiken en geen kwaliteitsindicatoren. Wie deze indicatoren interpreteert als kwaliteitsmaten, verwart doelen en middelen.” (pagina 1).

Ik ben dat niet met hem eens. Met deze bewering lijkt Dronkers te zeggen dat het enige doel van een school is om zoveel mogelijk leerlingen met zo hoog mogelijke cijfers te laten slagen. Dat is belangrijk, maar niet het enige doel van een school. Een school is vormend. Een goede leraar is er niet alleen op gericht dat leerlingen goede cijfers voor zijn of haar vak halen, maar maakt ook de interesse in dat vak wakker en enthousiasmeert. Of een leerling goed is in bepaalde aspecten van een vak is te meten op een examen. Of die leerling enthousiast is voor een vak en heeft nagedacht of dat vak iets is voor zijn of haar toekomst wordt daarin niet gemeten maar is wel een belangrijke opbrengst. Daarnaast zijn er sociale vaardigheden, organisatievaardigheden en meer, die gezien kunnen worden als een opbrengst van de school. Dat zijn niet alleen middelen om het doel van de hogere cijfers te bereiken, het zijn echte opbrengsten van een school.

De focus op cijfers is een keuze van Dronkers. Bij de interpretatie van zijn resultaten moet je daarmee rekening houden.

Vooral onvoldoendes tellen

Nu komen we op de details van het model. Je zou denken dat een simpele maat het gemiddelde eindexamencijfer is – eventueel gescheiden per vak. Dronkers kiest daar niet voor: hij berekent voor iedere school het aantal vakken waarvan het gemiddelde cijfer op het centraal schriftelijk van de geslaagde kandidaten onvoldoende is, dat wil zeggen lager dan 5.899. Daarbij kent hij een zwaarder gewicht toe aan de kernvakken: Nederlands, Engels en Wiskunde. Het resultaat is een cijfer tussen 4 en 8: een vier voor scholen die meer dan drie vakken onvoldoende scoren, een 8 voor scholen met geen enkel vak onvoldoende. Het cijfer wordt lager als de onvoldoende vakken ook nog eens kernvakken zijn. Het volgende tabelletje, overgenomen van de site schoolcijferlijst.nl, laat deze cijfertoekenning zien:

Het model van Dronkers is dus zeer gevoelig voor cijfers die rond de grens van 5,899 liggen. En omdat gemiddelde examencijfers rond de 6,5 liggen is de kans dat vakken door het ijs zakken vrij groot. Het verschil tussen 5,8 en 5,9 voor een vak kan een heel punt schelen in het model van Dronkers. In sommige gevallen zelfs twee. Belangrijk om hiervan te onthouden is dat, ook al gebruikt Dronkers „schoolcijfers” op de schaal van 1 tot 10, het niet zo is dat dat betekent dat een 8 twee keer zo goed is als een 4. De cijfers vormen geen nette continue schaal, een 6- of 7,3 zijn niet mogelijk. Dronkers deelt wel halve bonuspunten uit, zoals hieronder beschreven.

De „toegevoegde waarde”

Hierna gaat Dronkers bonuspunten toekennen voor twee dingen: de „toegevoegde waarde” en het verschil tussen Schoolexamen en Centraal examen. Maximaal kunnen scholen twee bonuspunten verdienen of twee minpunten krijgen. Voor de „toegevoegde waarde” kijkt Dronkers naar het „bovenbouwrendement”, een score gebaseerd op de cijfers voor schoolexamen en centraal examen, percentage gezakten en het percentage leerlingen dat zonder vertraging het eindexamen haalt. Dat rendement relateert Dronkers aan factoren die mogelijkerwijs het resultaat beïnvloeden: het basisschooladvies, de sociaal-economische status van de ouders, of de leerlingen uit een armoedegebied komen (op basis van postcode). Hij berekent een model dat het rendement „voorspelt”. Vervolgens berekent hij voor iedere school het verschil tussen deze voorspelling en noemt dat de „Toegevoegde Waarde”. Daarvan maakt hij een ranglijst. Als je bij de bovenste 10% van die ranglijst hoort krijg je een bonuspunt, de scholen die daar niet bijhoren maar wel in de bovenste 20% staan krijgen een halve bonuspunt. Aan de onderkant van de lijst krijg je minpunten: de laagste 10% krijgt een hele punt aftrek, de 10% daarboven een halve.

Er is kritiek mogelijk op deze aanpak: weer is het zo dat een klein verschil in score op de „Toegevoegde Waarde” een halve punt kan schelen op de Dronkers-schaal. Daarnaast is het zo dat het model van Dronkers voor de relatie tussen de invoer van de school en het bovenbouwrendement grote onzekerheid bevat. Een aantal factoren draagt wel significant bij, maar een groot gedeelte van de verschillen in bovenbouwrendement wordt niet verklaard door de meegenomen factoren. Daardoor speelt toeval een grote rol in de bepaling of een school wel of niet een bonus- of minpunt krijgt toebedeeld.

Het verschil tussen CE en SE

Het eindcijfer van een leerling bestaat voor veel (niet alle) vakken uit het gemiddelde van het schoolexamen, dat de school zelf afneemt, en het centraal examen, dat wordt gemaakt door het CITO. Vaak ligt het schoolexamencijfer wat hoger dan het cijfer van het centraal schriftelijk. Een school met een groot verschil laadt de verdenking op zich te makkelijke examens te geven waarmee de resultaten van de leerlingen worden opgepoetst. De inspectie vindt dat beide cijfers met niet meer dan een half punt mogen verschillen. Nu kun je daarover van mening verschillen. Bijvoorbeeld wordt bij Engels spreek- en schrijfvaardigheid in het schoolexamen getoetst en leesvaardigheid en tekstbegrip in het centraal schriftelijk. Scores op die vaardigheden zouden best verschillend kunnen zijn. Dronkers pikt het advies van de inspectie op en telt per school het aantal vakken waarvoor het verschil groter is dan 0,5. En ook hier past hij de 10% truc toe: de 10% scholen met de meeste vakken met verschil krijgen een punt aftrek, de scholen met de minste vakken met een verschil krijgen er een punt bij. Het is hierbij merkwaardig dat de grootte van het verschil verder geen rol speelt. Een verschil van 0.51 wordt net zo zwaar bestraft als een verschil van 2.

Alles bij elkaar levert dit een score op tussen de 2 en 10. Niet toevallig lijkt dit op een schoolcijfer, maar het is het niet. Waar een 10 doorgaans betekent dat alles goed is, is het hier een afspiegeling van een combinatie van het aantal onvoldoendes en de plaats op twee ranglijsten, waar hierboven wat kanttekeningen zijn geplaatst. Het is maar de vraag of een school met een 10 in werkelijkheid echt veel verschilt van een school met een 4.

De vraag is nu natuurlijk of de scores van Dronkers iets zeggen over de kwaliteit van de scholen. Ten eerste: kwaliteit is volgens Dronkers gelijk aan examencijfers. Dat is een keuze. Als je die keuze accepteert is er nog veel aan te merken. Het rekenen met rapportcijfers in plaats van de examencijfers zelf en het systeem van bonuspunten maakt het geheel niet helder. Scores zijn in bepaalde gevallen gevoelig voor kleine verschillen en ander verschillen (de absolute hoogte van examencijfers) worden juist niet meegenomen. Een groot verschil in Dronkers-score hoeft niet te staan voor een groot verschil in cijfers. Zo is het verschil in gemiddeld cijfer tussen de hoogste VWO-school (met een 10) en de laagste (met een 2,5) 1,3 punt. Een belangrijk verschil, maar de vraag is of het een verschil tussen een 2,5 en een 10 rechtvaardigt is de vraag. Dat verklaart ook dat de scores van jaar tot jaar fors kunnen verschillen zoals Dick van der Wateren in zijn blog constateert. Overigens was ook het systeem waarmee de scores vorig jaar bepaald werden anders. Een school zakte van een 9 naar een 3.5.

Alles bij elkaar nemend vind ik de functie van deze ranglijst twijfelachtig. De relatie tussen cijfer en examencijfers is arbitrair. En het feit dat alleen cijfers en niet andere vormen van opbrengst worden meegenomen is discutabel. De vraag is of een score gebaseerd op deze methode de opwinding en de discussie die het uitbrengen van de lijst genereert waard is. Ranglijsten zijn sowieso niet zo nuttig, scholen hebben meer aan een genuanceerd beeld van de ontwikkeling van hun leerlingen, tijdens en na hun schoolcarriere. Daarbij zijn cijfers belangrijk maar niet het enige aspect waar op gelet moet worden.

Update: Ik attendeerde Jaap Dronkers op deze blogpost en hij schreef een reactie. Die is hier te lezen.

Genetische algoritmen

Het was een beetje stil op deze blog. Ondertussen ben ik aan de gang gegaan met Coffeescript, een taal die het mogelijk maakt je programma’s voor webpagina’s heel compact en toch leesbaar op te schrijven. Als je geïnteresseerd bent kun je de broncode van het programma hieronder bekijken. In dat geval weet je vast ook hoe.

Ik heb coffeescript gebruikt om inzichtelijk te maken hoe genetische algoritmen werken. Dit zijn algoritmen die gebruikt worden om oplossingen te vinden voor problemen waarbij het aantal mogelijke oplossingen zeer groot is. Denk bijvoorbeeld aan het maken van een rooster voor een school. Als je -zeg- twintig klassen hebt, die elk les moeten krijgen in twaalf vakken verdeeld over achttien lokalen, in veertig mogelijke lesuren per week is het aantal mogelijkheden enorm groot. Wel kun je eenvoudig uitrekenen of een bepaalde oplossing aan alle voorwaarden voldoet, zoals geen lokaal of docent dubbel geboekt. Ook is het mogelijk iets te zeggen over de kwaliteit van een oplossing. Je kunt zo de voorkeur geven aan zo min mogelijk tussenuren voor klassen en docenten. Door het enorme aantal mogelijkheden is het vinden van de beste oplossing vrijwel onmogelijk, daarvoor zou je alle mogelijkheden moeten doorrekenen. Met genetische algoritmen kun je goede oplossingen vinden, hoewel die dus niet noodzakelijk de beste zijn.

Het werkt als volgt:

  1. Genereer een aantal willekeurige oplossingen
  2. Gebruik die oplossingen om nieuwe oplossingen te maken. Dat kan op twee manieren: combineer twee oplossingen tot één nieuwe (seksuele reproductie) of kopieer een oplossing en breng er een kleine wijziging in aan (aseksuele reproductie met mutatie)
  3. Bereken voor elke oplossing de kwaliteit.
  4. Houd de beste oplossingen (b.v. de beste 25%) en ga terug naar stap 2

Stappen 2-4 worden herhaald totdat je tevreden bent over de beste oplossing uit je verzameling oplossingen.

Screenshot 2013-10-22 14.42.42

Ik heb dit algoritme toegepast op het handelsreizigersprobleem. (Daar ben ik overigens niet origineel in). Dit probleem vraagt naar de kortste route voor een handelsreiziger die N steden precies één keer moet bezoeken en terugkeren naar zijn beginpunt. Het aantal mogelijke routes is N!, een aantal dat zeer snel oploopt met N, waardoor het onmogelijk wordt alle routes door te rekenen.

Hieronder kun je zien hoe een genetisch algoritme probeert een goede route te vinden. Klik in het witte vlak om steden te plaatsen. Als je minimaal twee steden hebt geplaatst kun je op start drukken om een route te vinden. Na elke generatie pauzeert het algoritme even en laat de tot dan toe beste oplossing zien. Als een generatie geen verbetering geeft stopt het. Als je nog niet tevreden bent, kun je met “Verder” het algoritme nog een schop geven om het nog wat langer te proberen. Soms helpt meerdere keren schoppen.

Voortplanting gebeurt op twee manieren: seksuele voortplanting gebeurt door het eerste deel van een oplossing te knippen, uit een andere de in dit deel al bezocht steden te verwijderen en de rest aan de nieuwe oplossing te plakken. Bij aseksuele voortplanting met mutatie wordt in de kopie één stad van plaats veranderd of worden twee steden verwisseld.

Mijn implementatie is niet ideaal, en stopt vaak te snel. Dat komt doordat ik relatief weinig “kinderen” laat genereren en doordat mijn mutaties misschien te conservatief zijn. Dat merk je vooral in situaties met veel steden. In onderstaand plaatje kreeg ik het algoritme niet meer verder ondanks het feit dat er op het oog zeker verbeteringen mogelijk zijn. Deze relatief zwakke implementatie laat denk ik juist goed de principes en beperkingen van genetische algoritmes zien.

Screenshot 2013-10-22 12.43.56

Ik hoop binnenkort een versie hier te plaatsen waarmee je met de parameters (aantal generaties, wijze van voortplanting) van het algoritme kunt stoeien en de effecten op het resultaat kunt zien.

 

20 jaar doctor

Gisteren (22 juni) was het exact 20 jaar geleden dat ik mijn proefschrift verdedigde: “Understanding and facilitating discovery learning in computer-based simulation environments”. Het proefschrift gaat over het toepassen van computersimulaties als middel om leerlingen te leren door experimenteren. Het was in de tijd dat het constructivisme opkwam. In die visie is het belangrijk de leerling te zien als een actieve deelnemer aan het leerproces. Informatie wordt niet ‘gekopieerd’ in de hersenen maar actief verwerkt. Als gevolg daarvan moet de leerling ook actief informatie verzamelen en verwerken. Ontdekkend leren (tegenwoordig spreken we liever van onderzoekend leren) is een manier om dat expliciet te doen: leerlingen experimenteren zelf en (her) ontdekken de onderliggende regels en wetten.

De oppositie
De oppositie

In mijn proefschrift gebruikte ik simulaties als een middel waarbinnen leerlingen veilig in een gecontroleerde omgeving konden experimenteren. Ik deed mijn studies met eerstejaars scheikundestudenten die iets moesten leren over meetfouten. Ik vond (en vind) het idee ze helemaal los te laten zonder enige verdere ondersteuning niet goed en bedacht ter ondersteuning een “hypothesekladblok” (hypothesis scratchpad). Hierop konden de studenten invullen welke hypothese ze wilden toetsen, al dan niet geholpen door een aangeboden structuur. Die structuur bestond er uit dat ze in de zin “Als … … dan geldt dat … …”, op de stippeltjes gegeven namen variabelen en relaties konden invullen zodat de hypothesen een correcte vorm kregen zoals: “Als de hoeveelheid stof toeneemt, dan geldt dat de relatieve meetfout afneemt”. Het idee was dat leerlingen dat vervolgens met de simulatie (van een titratie-experiment) gingen toetsen. Idealistisch als ik was dacht ik dat het kladblok enorm zou helpen.

Dat pakte anders uit. Hoewel ik in mijn proefschrift probeer een en ander positief uit te leggen is er eigenlijk geen enkele aanwijzing dat het kladblok werkt. Integendeel, studenten gebruikten het niet spontaan, en als ze gedwongen werden formuleerden ze vooral heel algemene en daardoor niet toetsbare hypothesen. De reden waarom bedacht ik later: studenten doen vooral dingen om verder te komen met de opdracht. Het kladblok liet zich makkelijk invullen en de studenten kregen de indruk dat ze opschoten. Waar ik dacht dat het zou leiden tot dieper nadenken bereikte ik het tegenovergestelde.

Met paranimfen
Met mijn paranimfen, Melanie Njoo en Erica de Vries

Leuk is dat ik in het proefschrift een methode heb ontworpen om automatisch hypothesen en experimenten van de leerlingen met de simulatie te kunnen interpreteren. Een soort learning analytics avant-la-lettre (hoofdstuk 9). En mijn laatste stelling had een voorspellende waarde, die gaat over leraren. Sinds een jaar ben ik directeur van een lerarenopleiding.

Het onderzoek heeft een vervolg gekregen in een aantal mooie projecten die leidden tot het auteurssysteem SimQuest, een systeem waar ik nog alijd trots op ben. Met SimQuest is het eenvoudig om een computersimulatie te maken en daaromheen vervolgens instructie te ontwerpen in de vorm van opdrachten, uitleg, en het geleidelijk moeilijker maken van het simulatiemodel. SimQuest hebben we nog lang gebruikt, en het is ook opgepikt door groepen in binnen- en buitenland – zo kregen we op een bepaald moment het verzoek om het in het Vietnamees te vertalen.

Promotie 9

Het hypothesekladblok is een eigen leven gaan leiden. Het is door anderen gekopieerd en/of heruitgevonden en in veel systemen gebruikt, vaak met als doel om er achter te komen wat de leerling denkt. Natuurlijk zijn onder invloed van de snelle ontwikkelingen in de technologie de versies steeds fraaier geworden, aan het basisprincipe is weinig veranderd. Dat is jammer, want als mijn proefschrift één ding aantoont is dat er een fundamentele ontwerpfout in zit. Door in het programma een invulformulier aan te bieden wordt dat automatisch onderdeel van de taak en haalt de aandacht weg van het werkelijke doel: leren over het onderwerp van de simulatie. Op een conferentie heb ik niet zo lang geleden eens gezegd dat we het hypothesis scratchpad ritueel moeten verbranden. Recent zag ik het echter – zelfs dicht bij huis – weer opduiken. In de loop der tijd heb ik geleerd dat het het belangrijkst is de leerling te motiveren. Je kunt nog zulke mooie modellen maken van de leertaak, die wordt pas effectief als de leerling zelf daadwerkelijk wil leren. En gedachteloos inzetten van invulformulieren als ondersteuning van hypothesevorming, experimentontwerp of planning zit die motivatie vaak alleen maar in de weg.

Simulaties ben ik blijven maken, de laatste tijd post ik ze op deze blog.

Het 100-veld – in vele afmetingen

Leren rekenen is een hele uitdaging, zeker wanneer je met optellen of aftrekken over tientallen heen moet. Ook het automatiseren van de tafels van vermenigvuldiging gaat niet bij alle kinderen vanzelf. Om goed te leren rekenen is het nodig een goed begrip te hebben van hoe het getalstelsel in elkaar zit, en hoe je daar op een snelle manier de weg in vindt. Het helpt daarbij om een goede voorstelling te hebben van de getallen en hun samenhang, zodat je de verschillende stappen van de rekenkundige operaties kunt visualiseren. Een voorbeeld is de getallenlijn. Optellen en aftrekken kun je zien als stappen naar rechts of naar links op deze lijn. Met deze visualisatie kun je leren inzien hoe die elementaire rekenhandelingen werken. Dit werkt voor getallen die niet te groot zijn. Voor getallen tot honderd kwam ik via @ionicasmeets een getallenpijl tegen. Ik zag niet het precieze voordeel van die pijl (Ionica ook niet trouwens), maar misschien begrijp ik het niet helemaal. Op dezelfde pagina staat een ‘number map’, en die lijkt weer veel op het aloude honderdveld, dat wel een geweldige representatie is van getallen in het tientallig stelsel. Het veld staat hieronder.

Rekenoperaties tot 100 kunnen in dit veld worden gezien als stappen in het veld. Voor bijvoorbeeld 15+23 ga je naar het veld 15, dan 2 omlaag en 3 naar rechts. Als je aan het eind van de rij bent tel je op de volgende rij verder. Gaat – tot 100 – altijd goed. Op de lagere school heb ik alle tafels op het vel ingekleurd. Als je alle veelvouden van 3 inkleurt krijg je een patroon van diagonale lijnen, en zo heeft elke tafel een patroon. En, zoals Ionica opmerkte, het honderdveld is een mooie visualisatie om met de zeef van Eratosthenes de priemgetallen tot 100 te bepalen. Het bovenstaande 100-veld is interactief: als je op een getal klikt kleurt het alle veelvouden van dat getal in. En het knopje ‘Priemgetallen’ laat een animatie zien hoe je met de zeef alle niet-priemgetallen weg kunt strepen.

Om echt te waarderen hoe handig het 100-veld is, is het leuk om het te gebruiken om te proberen snel te leren rekenen in een ander talstelsel. Je kunt het getallenvierkant groter maken door een getal in het vakje erboven in te vullen. Als je bovendien het vakje eronder aanvinkt worden de getallen genoteerd in het talstelsel met als grondtal de breedte van het vierkant. Dat laatste werkt voor getalstelsels van 2 tot en met 37. Als symbolen voor cijfers groter dan 10 worden de letters van het alfabet gebruikt en het teken #. Speel maar eens met de patronen in een 16-tallig stelsel, of bedenk wanneer het zo is dat een getal deelbaar is door een cijfer als de som van de cijfers dat ook is (zoals bij 3 en 9 in het tientallig stelsel). Wat als de basis een priemgetal is? En hoe ziet de verdeling van de priemgetallen er uit voor grotere vierkanten? Zoals je ziet blijft het vierkant altijd een 100-vel, waarbij 100 natuurlijk in elk getalstelsel een ander getal verbeeldt.

Als je met grotere vierkanten wilt spelen past het vierkant niet meer op deze blogpagina. Klik dan hier voor een pagina met alleen het vierkant. Op dat moment is alleen de grootte van je scherm de beperkende factor. En als je ideeën hebt voor interessante toepassingen   of inkleuringen kan ik die misschien aan het veld toevoegen.

Update: Naar aanleiding van de reactie van Ionica heb ik het veld een beetje aangepast: de priemgetallen bouwen nu wat langzamer op, en elke tafel die je wegstreept heeft zijn eigen kleur. De witte, vetgedrukte cellen getallen die overblijven zijn de priemgetallen. Voor  grotere vierkanten neemt het programma grotere stappen en streept het hele tafels in één keer weg, omdat het anders heel lang gaat duren.

 

Kun je met gokken geld verdienen?

Als je met gokken geld wilt verdienen kun je het beste een casino beginnen. Alle gokspelen zijn zo ingericht dat het casino op de lange duur altijd met winst eindigt. Op de roulette kun je bijvoorbeeld inzetten op 36 nummers. Als het balletje op jouw nummer valt krijg je 35 keer plus je inzet terug. Er zijn echter 37 mogelijke uitkomsten: 0 tot en met 36. Dat betekent dat op de lange duur 1/37 van je totale inzet bij het casino terecht komt.

Of toch niet? Er zijn spelers die beweren dat ze door systematisch in te zetten toch winst kunnen maken. Het bekendste systeem hiervan is de martingaal, of verdubbelingsstrategie. Het idee er achter is in te zetten op de helft van de nummers (rood of zwart, even of oneven) waarmee bij winst de inzet wordt verdubbeld. De winkans is 18/37. Als je wint neem je de winst, als je verliest zet je opnieuw in met een verdubbelde inzet. Als je stopt direct nadat je een keer hebt gewonnen zul je altijd met winst eindigen. Het probleem is echter dat je inzetten steeds groter moeten worden als je blijft verliezen, en dat op een zeker moment het casino dicht gaat. Het kan dus zijn dat je met een groot verlies blijft zitten aan het eind van de avond.

Recent schreef Ionica Smeets een artikel in NWT magazine over een speelster die beweerde dat ze een winnend systeem had gevonden. Het bleek dat zij een variant van de martingaal had bedacht. In plaats van op 18 getallen zette zij in op dozijnen (b.v. 1-12, 13-24 of 24-36) en verhoogde de inzet volgens een zelfberekend schema dat er voor zorgt dat de totale balans direct na een winst positief eindigt. In het artikel werd ook duidelijk dat de strategie gevaarlijk is: ondanks haar voornemen vooraf liep de speelster toen het even tegen leek te zitten al bijna naar de pinautomaat.

Voor dat artikel maakte ik een simulatie van deze strategie. De plaatjes die deze simulatie maakt staan bij het artikel afgedrukt. Het spelen met de simulatie geeft inzicht in hoe de strategie werkt – en dat hij op de lange duur altijd tot verlies leidt. Die simulatie staat hieronder.

Je kunt spelen volgens de klassieke martingaal (met verdubbelen) en met het systeem van Ingrid Flieger, zoals uitgelegd in het artikel van Ionica. De inzet is altijd 5 euro of een veelvoud daarvan. Je kunt instellen hoeveel ronden je maximaal op een avond kunt spelen en met hoeveel geld je begint. De simulatie stopt als je de inzet die het systeem van je vraagt groter is dan de hoeveelheid geld die je in je zak hebt, of als het aantal ronden is bereikt. In het grafiekje geeft de blauwe lijn aan hoeveel geld je bezit, de gele wat je totaal hebt ingezet en de rode wat de inzet is voor de huidige ronde. Als rood blauw kruist ben je blut.

Met de simulatie kun je ook een aantal avonden achter elkaar simuleren. De grafiek laat dan een staafdiagram zien van je kapitaal aan het eind van elke avond. De meeste laten een bescheiden winst zien, maar op de avonden dat je verliest is het verlies meteen erg groot. Onder de grafiek verschijnt de eindbalans. Trek zelf je conclusies….

Mondriaan meets Fractals.

Via twitter kwam ik deze wedstrijd tegen: http://elegant.setup.nl/, en ik voelde me uitgedaagd om een algoritme te schrijven om een Mondriaan te genereren. Hier is mijn inzending:

Hoe vang je een Mondriaan in een algoritme? Een mooie uitdaging. Ik besloot om niet te proberen de Victory Boogie-Woogie na te maken, maar te proberen vlakverdelingen te genereren die van Mondriaan zouden kunnen zijn. Daarnaast is het interessant om een kleine eigen touch aan het w erk te geven.  Niet om de meester te willen verbeteren, maar omdat het interessant en leuk is. Ik ben geen kenner, wel een liefhebber, en had geen tijd me te verdiepen in de literatuur. Ik ben dus puur op eigen indrukken van de schilderijen afgegaan.

Een Mondriaan, tenminste zijn latere werk, is in essentie een verdeling van het vlak in rechthoeken. In veel werk worden die vlakken gescheiden door duidelijke zwarte lijnen, in VBW niet, daar onderscheidt een vlak zich alleen door zijn kleur.

Belangrijk in een Mondriaan is de verhouding tussen de grootte van de vlakken. Vaak zijn de grotere vlakken excentrisch maar wel dicht bij het midden geplaatst, als een soort centrale pleinen. Naar de randen toe worden de vierkanten vaak kleiner en soms langwerpiger. Bij Victory Boogie-Woogie zijn er bovendien twee verdelingen die in andere schilderijen niet voorkomen. De eerste noem ik strips, geblokte banden die de functie van een grens lijken te hebben. De tweede zijn vlakken met een zwevend, kleiner, contrasterend vlak er in. Die rechthoeken zijn altijd dicht bij een vierkant. Lengte en breedte verschillen niet veel van elkaar.

i6

Op basis hiervan kwam ik tot een algoritme:

  1. Verdeel het vlak in negen delen. De centrale rechthoek plaats je excentrisch en wordt niet verder verdeeld.
  2. Voeg de 8 vakken rond de centrale vak samen tot vier rechthoeken. Dit kan op meerdere manieren, gebruik een toevalsgenerator om te kiezen hoe.
  3. Verdeel deze vier rechthoeken opnieuw op deze wijze, met de volgende uitzonderingen:
    1. Op basis van toeval wordt een deel van de rechthoeken niet verder verdeeld.
    2. Een langgerekte driehoek kan een strip worden
    3. Een kleine rechthoek die bijna vierkant is kan een vierkant worden met een kleiner zwevend vierkant er in.
  4. In een Mondriaan wordt meestal na 1 stap niet verder onderverdeeld, maar in principe kun je oneindig lang doorgaan. Het schilderij wordt dan een fractal, een figuur waarin je oneindig lang kunt inzoomen en steeds nieuwe structuren te zien. Omdat algoritmebouwers van recursie houden is dit een mooie twist voor deze opdracht.

i4Ik heb voor zowel de Mondriaans met lijnen en primaire kleuren, als voor de wat zachtere kleuren van de Victory Boogie-Woogie een aantal “schilderijen” gemaakt met dit algoritme. De resultaten staan verspreid op deze pagina. Hieronder staat de generator zelf:  Door op ‘go’ te klikken maak je een nieuw schilderij. Als het niet bevalt maak je gewoon een nieuwe. Je kunt kiezen voor het kleurenpallet, of er lijnen moeten worden getekend en voor de diepte: hoe vaak wil je dat het algoritme rechthoeken blijft opdelen? Als je op ‘save’ drukt opent een nieuw venster met daarin een PNG-afbeelding van het schilderij dat je kunt opslaan vanuit je browser.

De broncode van het algoritme is hier te downloaden. De afbeelding hieronder is een ‘diepere’ uitvoering en in groot formaat te downloaden. En oja, als je dit leuk vindt, stem dan op me bij de wedstrijd.

VBW groot

 

 

 

Quantumtheorie getest

Quantummechanica wordt vaak gezien als een beetje raadselachtig. Toen in de eerste decennia van de twintigste eeuw de nieuwe natuurkunde werd ontwikkeld werd duidelijk dat de wereld van de allerkleinste deeltjes er totaal anders uitziet als de werkelijkheid die we direct waarnemen. Materie blijkt zich soms als een golf en soms als een deeltje te gedragen, en kan zich zelfs in meerdere toestanden tegelijk bevinden, waardoor we nog steeds niet weten of de kat van Schrödinger nu wel of niet leeft.

Dit alles komt door een belangrijk principe in de quantummechanica. Sommige grootheden, zoals plaats en snelheid van een deeltje kun je niet tegelijkertijd meten. Als je de snelheid van een deeltje meet weet je de plaats niet en andersom. Dit is het onzekerheidsprincipe van Heisenberg. In de berekeningen voor plaats en snelheid zit altijd een minimale onzekerheid. Een quantummechanische toestand voorspelt daarom alleen de kans op een bepaalde uitkomst van een experiment. En door te meten verander je ook de toestand: een meting van plaats levert een toestand op met een zekere plaats en een onzekere snelheid en omgekeerd.

Einstein vond dit maar niets. Hij vond dat een theorie die niet alles kon voorspellen niet af is. In een jarenlange discussie met Niels Bohr probeerde hij de natuurkundige gemeenschap daarvan te overtuigen. In 1935 kwam hij, samen met twee anderen, tot een ultiem argument. Stel, je hebt een atoom, dat in twee delen uit elkaar valt, en die twee delen bewegen van elkaar weg. Dan kan ik uit een meting van het ene deeltje de eigenschappen van het andere berekenen. Dus, als ik van deeltje A de plaats meet weet ik de plaats plaats van deeltje B. En voor de snelheid is dat ook zo. Maar, als deeltje B inmiddels ver weg is, kan deeltje B niet weten wat ik meet, en moeten plaats en snelheid al bekend zijn. Anders zou deeltje B op het moment dat ik deeltje A meet moeten weten wat er gemeten wordt. Er zou dus een signaal met oneindige snelheid van A naar B moeten gaan, en dat kan niet volgens Einsteins relativiteitstheorie.

Bohr liet zien dat dit geen probleem hoeft te zijn met de theorie. De quantumtheorie geeft een bovengrens aan wat we kunnen weten, en in de redenering van Einstein hoeft er toch geen informatie te worden verzonden om de metingen toch kloppend te krijgen.

De discussie werd in de jaren 60 nieuw leven ingeblazen door John Bell. Hij was het met Einstein eens beide deeltjes alle eigenschappen moesten dragen, dus meer informatie bevatten dan de quantumtheorie toestaat. Hij richtte zich op een eigenschap van deeltjes die aangeeft hoe snel ze om hun as tollen, en in welke richting: de spin. Quantummechanisch geldt voor de spin in twee verschillende richtingen hetzelfde als voor plaats en snelheid: je kunt ze niet tegelijkertijd meten. Als je de spin in de verticale richting meet, blijf je in het ongewisse over de spin in de horizontale richting en andersom.

Bell bedacht een experiment waarbij een deeltje zonder spin uiteenvalt in twee deeltjes elk met spin. De totale spin van beide deeltjes moet dan wel nul zijn. Als je van beide deeltjes de spin meet in dezelfde richting, vind je bij elke positieve spin bij deeltje A een negatieve spin voor deeltje B. De correlatie, een maat voor de samenhang tussen de twee metingen, tussen beide spins is dan -1. Maar als je van deeltje A in de verticale richting meet, en bij B in de horizontale richting vind je een correlatie van nul, de metingen hangen totaal niet samen. De meting aan de ene kant zegt niets over wat je aan de andere kant vindt. Zowel de quantummechanica als de klassieke natuurkunde voorspellen dat en op die manier kun je dus niet bepalen welke theorie klopt. Bell kwam op het idee om ook te kijken naar situaties waarin de spin niet in dezelfde richting of loodrecht op elkaar wordt gemeten, maar bijvoorbeeld onder een hoek van 60 graden. Hij vond dat dan de quantummechanica en klassieke theorie dan wel verschillende uitkomsten geven. In een klassieke theorie splitst het deeltje en ligt de spin van beide brokstukken vast. In de quantumtheorie splitst het deeltje en ligt er nog niets vast over de spin van beide deeltjes. Pas op het moment van meten aan deeltje A verandert de quantumtoestand van beide deeltjes in een toestand waarin deeltje A een positieve of negatieve spin in de gemeten richting heeft. Als dan deeltje B wordt gemeten hangt de uitkomst mede af van die op deeltje A. Daardoor is de correlatie tussen de uitkomsten van de metingen volgens de quantummechanica sterker dan volgens de klassieke mechanica. In de simulatie hieronder kun je dit uitproberen.

Boven zie je een simulatie van het spin-experiment volgens de quantumtheorie, daaronder hetzelfde experiment berekend volgens een klassieke theorie. Je kunt de hoeken waaronder de spin wordt gemeten aanpassen voor beide deeltjes, A en B. Je kunt met Run 1 deeltje laten splitsen. Je ziet dan aan beide kanten een detector opflitsen en het deeltje registreren. Als de detectoren onder dezelfde hoek meten zie je dat steeds tegengestelde detectors opflitsen. Als ze een hoek maken van 90 graden is er geen verband tussen de flitsen links en rechts.

Met “Run 1000” kun je duizend experimenten achter elkaar doen. Je kunt aflezen wat de correlatie tussen de metingen aan deeltje A en B is. Hoe dichter bij 1 of -1 hoe sterker de correlatie. Bij nul is er geen verband. Probeer eens een verschil tussen a en b van 60. Je ziet dat de quantumtheoretische en de klassieke correlaties verschillen. De stelling die Bell bewees is dat er geen klassieke theorie mogelijk is die voor alle combinaties van a en b dezelfde voorspellingen als de quantumtheorie kan geven.

Welke instelling je ook maakt voor beide deeltjes is de kans op een meting van + of – 50%.  Voor een waarnemer die maar 1 van de deeltjes ziet is er niets bijzonders aan de hand, pas met de kennis over het andere deeltje valt de correlatie op. Dat betekent dat, hoewel er een correlatie is, er geen informatie tussen de deeltjes wordt uitgewisseld. Op die manier blijven we nog net binnen de regels van de relativiteitstheorie.

In het begin van de jaren 1980 voerde Alain Aspect een reeks experimenten uit met fotonen in een opstelling zoals hierboven getoond. Die experimenten toonden overtuigend aan dat de quantummechanische voorspellingen kloppen.

Onderzoeksfinanciering is geen loterij

Ik heb dit jaar de eer te mogen dienen als referent voor de  de PROO, de “Programmaraad voor Onderwijsonderzoek”, een onderdeel van NWO dat onderzoeksgelden verdeelt voor – niet verrassend – onderzoek aan het onderwijs. De PROO heeft een call uitgezet voor “Reviewstudies”. Een reviewstudie verzamelt zoveel mogelijk artikelen die in een bepaalde tijd over een bepaald onderwerp zijn geschreven. Ik heb zelf recent zo’n studie gedaan samen met promovendus Nico Rutten naar de effecten van het leren met computersimulaties. Zo’n review is heel nuttig om een breed overzicht over een onderzoeksgebied te krijgen.

De PROO wil graag een aantal van deze studies laten uitvoeren. In de call wordt een breed gebied beschreven. Belangstellenden kunnen intekenen met een voorstel waarin uiteengezet wordt welk deelgebied gereviewd gaat worden, waarom dat belangrijk is, hoe ze het gaan doen, en op welke wijze de resultaten van de review bekend gemaakt gaan worden. Een aanvraag beslaat zo’n zeven pagina’s tekst.

Voor deze call is een half miljoen euro beschikbaar. Per project kan €50000 worden aangevraagd (en de meeste aanvragen komen precies op dat bedrag uit). Er kunnen dus tien projecten worden gehonoreerd.

Toen ik de lijst met 43 aanvragen zag bekroop me het gevoel dat dit wel eens veel werk zou kunnen zijn. Ik kreeg de taak om negen van de 43 aanvragen van redelijk gedetailleerd commentaar te voorzien. Twee van mijn collega’s doen dat ook. Daarna werden de commentaren weer over de commissie verdeeld en geeft ieder commissielid zijn of haar persoonlijke top tien. Daarvoor moet je dus ook de andere aanvragen lezen, en de commentaren daarop. Tot slot vergadert de commissie (veertien man en vrouw sterk) een dag lang om tot een definitieve aanbeveling te komen. Dat alles overigens zonder vergoeding van NWO.

Ik sloeg aan het rekenen: voor een gedetailleerd commentaar ben ik per aanvraag 2 tot 3 uur bezig. Keer drie omdat elke aanvraag drie commentaren krijgt. Keer 43. De eerste reviewronde kost de reviewers dus zo’n 320 uur. De tweede ronde kostte me een dag. Acht uur keer veertien reviewers is 112 uur. Nog een dag vergaderen is nog eens 112. Totaal voor de reviewers dus 544 uur. Dat is dan nog zonder de uren die de PROO aan de administratie en organisatie besteedt.

Nu hebben 43 onderzoekers natuurlijk ook tijd besteed aan het schrijven van de aanvragen. Uit eigen ervaring weet ik dat zo’n aanvraag een paar dagen werk is. Je moet wat vooronderzoek doen, literatuur raadplegen, een mooie overtuigende tekst componeren en een begroting maken. Al gauw kost deze aanvraag iemand die redelijk ervaren is in projectaanvragen vier dagen vaak overigens verdeeld over twee personen. Vier keer acht uur is 32 uur. Keer 43 = 1376 uur.

Zowel aanvragers als referenten zijn in de meeste gevallen hoogleraar of universitair hoofddocent. Een uurtarief van 120 euro is dan laag geschat. Maar laten we het er mee doen. De totale kosten van de aanvraagronde zijn dus (544+1376) x €120 = €230400. Dat is bijna de helft van het te verdelen budget dat verdeeld kan worden. Uiteraard moet dit getal met de nodige slagen om de arm worden genomen, het is gebaseerd op ruwe schattingen.

We kunnen nu twee dingen zeggen. De bewering die je wel eens hoort dat de verdeling van onderzoeksgeld via NWO een loterij is klopt niet. Bij een loterij is de uitbetaling lager dan de inleg, hier is hij hoger. Het is echter wel de vraag of onderzoeksgeld op deze manier effectief wordt besteed. Veel van dat geld wordt uitgegeven aan de relatief kleine kans (1/4) om een niet eens zo grote hoeveelheid onderzoeksgeld te verwerven. Ik heb voor iets grotere projecten (promotieplaatsen voor vier jaar, ongeveer €200000 per project) ook eens zo’n berekening gedaan. Er konden minder projecten worden toegekend, aantal aanvragen was groter en de aanvragen zelf uitgebreider, en het beeld wat nog ongunstiger.

Onderzoeksgeld wordt op deze manier verdeeld zodat de overheid kan sturen op kwaliteit en bepaalde wetenschapsgebieden kan stimuleren. De vraag of financieren van kleine projecten met daarbij een uitgebreide reviewprocedure zoals deze wel een efficiënte manier is.

Negatieve temperatuur

Onderzoekers hebben een systeem in een toestand gebracht met een temperatuur lager dan 0 Kelvin, dus lager dan het absolute nulpunt. Een absoluut nulpunt dat kennelijk niet absoluut is. In eerste instantie denk je dan meteen aan neutrino’s die eerst wel en later toch niet sneller dan licht gingen. Op school leer je dat bij het absolute nulpunt “alle moleculen stilstaan”. Negatieve temperatuur zou dus betekenen dat ze stiller staan dan stil. En dat slaat natuurlijk nergens op.

Toch is dit geen fout, negatieve temperaturen zijn mogelijk. Om dat te begrijpen moet je wel iets meer weten wat temperatuur eigenlijk is. Een ander begrip dat een rol speelt is entropie, een begrip dat iets zegt over de mate van wanorde in een systeem.

Traditioneel is temperatuur een maat voor de kinetische energie van de deeltjes van een systeem. Hoe meer energie de deeltjes (gemiddeld) hebben, dat wil zeggen hoe sneller ze bewegen,  hoe hoger de temperatuur.

Als je weet wat de totale energie van een systeem is weet je nog niet precies wat de energie van ieder deeltje is. Bij eenzelfde energie en temperatuur kun je je voorstellen dat een deel van de gasdeeltjes langzaam beweegt, en een ander deel snel, of dat alle deeltjes allemaal ongeveer even snel gaan. Zolang de gemiddelde energie per deeltje hetzelfde is, zijn die twee mogelijkheden gelijkwaardig en kunnen we ze niet onderscheiden.

De entropie van een systeem is een maat voor het aantal manieren waarop een systeem met een bepaalde energie zou kunnen bestaan. Kan dat maar op één manier, dan is de entropie gelijk aan nul. Kan dat op veel manieren dan is de entropie groter. Het lijkt een beetje op dobbelstenen: Je kunt maar op één manier 2 gooien met twee dobbelstenen en op zes manieren 7. De entropie van 7 is in dit geval dus groter.

Entropie is een belangrijk begrip in de natuurkunde. Een natuurkundige hoofdwet zegt dat de entropie van het universum altijd moet toenemen.

Energie, temperatuur en entropie hangen samen. Bij een hele lage temperatuur moet de energie van alle deeltjes wel heel laag zijn en zijn er weinig mogelijkheden waarop het systeem met die energie kan bestaan. Hoe hoger de energie, hoe meer mogelijkheden er komen. Als je energie toevoert aan een systeem neemt de entropie in de regel dus toe. Het blijkt dat die toename afhangt van de temperatuur. In formule, met S de entropie en Q de energie.

ΔQ = TΔS

De Griekse letter Δ staat hier voor de verandering. ΔQ is dus de verandering in de energie van het systeem. T bepaalt het verband tussen de toename in entropie wanneer je energie toevoert aan een systeem. En als T groter is dan 0 neemt de entropie dus toe met de temperatuur. Natuurkundigen nemen de T in deze formule als de definitie van temperatuur.

Denk nu weer eens aan die dobbelstenen. Stel dat het gegooide aantal ogen de energie is van het systeem. Bij een energie van twee is er een lage entropie (zelfs 0). Als je meer ogen gooit neemt de entropie toe, tot 7 ogen. Daarna neemt het aantal mogelijkheden waarop je het totaal aantal ogen kunt maken weer af, tot de entropie bij 12 weer gelijk is aan nul. Als je meer dobbelstenen gebruikt gebeurt er steeds iets soortgelijks. Eerst neemt het aantal mogelijkheden om een bepaald aantal ogen te maken toe, tot een maximum waarna het weer afneemt.

Nu hebben de onderzoekers van de Ludwig-Maximilians-Universität een systeem gemaakt dat hier op lijkt. In een vaste stof zijn kaliumatomen in een conditie gebracht waarin ze een eindig aantal energietoestanden hebben. De totale energie van het systeem is gelijk aan de som van de energieën van de aparte deeltjes. En de entropie neemt eerst toe met de energie, en daarna weer af, net als bij de dobbelstenen.

Hoe zit het dan met de temperatuur? Daarvoor kijken we naar de formule. Als bij lage energie een beetje energie (ΔQ) wordt toegevoerd (van 2 naar 3 ogen) neemt de entropie (ΔS) toe. Dus T is dan groter dan nul. Maar bij hoge energie (van 9 naar 10 ogen) levert een kleine toename van de energie juist een afname van de entropie op! Dat betekent dat de temperatuur negatief moet zijn!

Vreemd is het wel. Negatieve temperatuur is dus niet een toestand met negatieve energie. Het is juist een toestand met relatief veel energie: dus eigenlijk warmer dan de toestanden met positieve temperatuur. Dat verklaart ook wat in het stuk staat dat deeltjes die door een negatief temperatuursysteem bewegen kunnen worden versneld: er zijn immers veel deeltjes die wat energie kunnen afgeven aan een passerend deeltje. De entropie van het systeem wordt dan groter, keurig volgens de natuurwetten.

Het experiment is ontworpen naar een idee van de Twentse onderzoeker Allard Mosk, zijn idee en het prachtige experimentele werk van de Duitse onderzoekers laten zien hoe mooi en ook vreemd de natuur zich in extreme gevallen kan gedragen.