Categorie archief: Onderwijs

Modelleren in het natuurkunde-examen

Afgelopen vrijdag maakten de 6 VWOers het eindexamen Natuurkunde. Zoals de laatste jaren gebruikelijk is zat er een vraag in over modelleren. De kandidaten moesten een model maken van een lift die met behulp van een motor omhoogklimt langs een kabel die gespannen is tussen het aardoppervlak en een satelliet. Na twee inleidende vragen over die satelliet en de kabel werden de leerlingen geconfronteerd met dit model (Bron: examenblad.nl, het volledige examen is hier te downloaden):

Screenshot 2016-05-20 21.34.48

Een diagram met veel pijlen waarvan  ik zelf ook moeite heb om te snappen wat er staat. Als tekst wordt het model zo weergegeven:

Screenshot 2016-05-20 21.36.43

Als je goed oplet zie je dat deze regels ook in de grafische vorm worden weergegeven. Leerlingen moeten over dit model vragen beantwoorden, maar voordat ik die bespreek eerst een korte uitleg over dit model, regel voor regel.

Het draait allemaal rond de variabele x, de hoogte van de lift rond het aardoppervlak. Tenminste, dat nemen we aan uit de context, want de namen van de variabelen (rx, Ma, x, etc. worden niet verklaard). Aan het begin van een stap in het model bevindt de lift zich op een hoogte x. Dan gaan we regel voor regel kijken wat er wordt berekend:

1.     rx = Ra + x De afstand van de lift tot het middelpunt der aarde wordt berekend door de straal van de aardbol bij x op te tellen
2.     mtot = m_lift+m_brandstof  De massa van lift en brandstof wordt opgeteld tot een totale massa
3.     Fg = G * Ma * mtot/rx^2 Gebruikmakend van de zwaartekrachtwet van newton wordt de zwaartekracht op de lift uitgerekend
4.     Fmpz = mtot * 4π^2*rx/(24*3600)^2 Omdat de aarde draait moet op de lift een middelpuntzoekende kracht worden uitgeoefend. Die is gelijk aan mω2r, waarbij ω de hoeksnelheid is. Die reken je uit door 2π te delen door de omlooptijd, in dit geval het aantal seconden in een dag. De formule klopt niet helemaal, in plaats van 24*3600 seconden in een dag moet eigenlijk uitgegaan worden van een siderische dag: iets meer dan 86164 seconden.
5.     Fmotor = Fg – Fmpz De motor levert een kracht naar boven die precies gelijk is aan de netto kracht op de lift – zwaartekracht min de middelpuntzoekende kracht – op die manier gaat hij met een constante snelheid omhoog, dat staat ook in de opgave.
6.     dx = v * dt7.     x = x + dx Dit zijn regels om het model te laten “lopen”, de verplaatsing binnen een tijdstap wordt uitgerekend en die wordt bij de plaats opgeteld.
8.     dW = Fmotor * dx De arbeid die de motor verricht is gelijk aan de kracht keer de verplaatsing
9.     dm_brandstof = … Het verbruik van de brandstof wordt gevraagd.
10.  m_brandstof = m_brandstof – dm_brandstof De verbruikte brandstof wordt van het totaal afgetrokken
11.  als x>4.0E7 dan stop eindals Als de lift op de gewenste hoogte is aangekomen, dan stopt het model
12.  t = t+dt De tijd wordt opgehoogd met een tijdstap.

En dan nu de vragen over dit model. De eerste vraag is te omschrijven wat in regel 8 wordt berekend. Het antwoord staat hierboven al. Het is het herkennen van de definitie van arbeid in de modelregel. Daarbij word je geholpen door het feit dat W (Work) normaalgesproken wordt gebruikt als symbool van arbeid.

De volgende vraag is regel 9 aan te vullen. Dit is typisch een trucjesvraag. dW wordt nog nergens aan de rechterkant van een =-teken gebruikt. Hetzelfde geldt voor verbrandingswarmte, dus die zal er ook wel in moeten. De eenheid van verbrandingswarmte is Joule/kg, de massa aan de linkerkant gaat in kg, dW gaat in Joule dus: dm_brandstof = dW/verbrandingswarmte. Waaraan voorbij wordt gegaan is dat er een rare aanname in de formule zit, namelijk dat alle energie die bij de verbranding vrij komt, wordt omgezet in arbeid om de lift omhoog te krijgen. Een rendement dat nooit kan. De formule zou dus eigenlijk moeten zijn: dm_brandstof = dW/(verbrandingswarmte*rendement). Maar rendement is geen variabele. De derde vraag is hoe je kunt zien dat v constant is is een inkoppertje: er is geen modelregel die begint met v = …. Dus v kan niet veranderen.

In de vraag die hierop volgt moeten leerlingen beredeneren dat je met minder brandstof ook boven kan komen, omdat je dan ook minder brandstof op hoeft te tillen. Een vraag waar je modelregels bij moet noemen, maar die ook op basis van eenvoudige principes los van het model is te beantwoorden.

Ik ben een groot voorstander van modelleren in het onderwijs, maar ik ben niet blij met deze opgave. Ten eerste gaat deze opgave alleen over de technische kant van het modelleren: een regeltje aanvullen, inzien dat een variabele niet verandert als er geen regel voor is, etc. Inzicht in waarom modellen eigenlijk worden gebruikt en wat ze betekenen wordt niet getoetst. Ook is er geen aandacht voor de aannames over het model, zoals het 100% rendement en de aanname dat de snelheid constant moet zijn. Vragen over wat er voor nodig zou zijn om dat te realiseren, waarom je in het model de relatie tussen kracht, versnelling en snelheid mag negeren, wat de stijgende lift met de kabel doet, etc worden niet gesteld. Binnen de context van zo’n examen is dat ook onmogelijk, maar de vraag is of je dat ook moet willen.

Naast dit alles vind ik de gekozen modelleertaal niet fijn. De grafische representatie is al snel onoverzichtelijk en de modelregels zijn in een quasi-programmeertaal geschreven. Raar vind ik dat getallen in de grafische representatie anders worden geschreven dan in de tekst (4,0.107 grafisch vs. 4,0E7 in de tekst). En als een super- en subscript mogelijk is waarom schrijf je dan niet Fmotor in plaats van Fmotor. En in de tekst duikt opeens een π op, wat betekent dat het ook weer geen echte programmeertaal is, die dit soort symbolen niet kent. Bovendien staat er 4π en niet 4 * π wat een programmeertaal zou eisen. Ik geef toe dat dat een beetje een zeurpunt is – ik verwacht niet dat leerlingen hier de mist op ingaan – maar als je modellen in een programmeertaal wil geven doe het dan goed.

Het resultaat is een vraag waarin leerlingen wordt gevraagd wat trucjes toe te passen op een wat slordig geformuleerd model in plaats van echt na te denken over wat modelleren is. Mijn voorstel zou zijn om modelleren in een praktische opdracht te verwerken, waarin leerlingen echt modellen zelf moeten bouwen, in een taal naar hun keuze. Modelleren is als vaardigheid te waardevol om op deze manier te toetsen.

Waarom Wiskunde?

Afgelopen maand mocht ik op het 2e fasecongres wiskunde van Noordhof een lezing houden voor ongeveer 500 leraren wiskunde. De aanleiding daarvoor was het nieuwe examenprogramma voor wiskunde en de daarmee samenhangende presentatie van de nieuwe edities van de twee grootste wiskundemethodes, allebei uitgegeven door Noordhof: Getal en Ruimte en Moderne Wiskunde. De kans is groot dat u in uw schooltijd wiskunde heeft geleerd uit één van deze methodes. In die lezing heb ik een uitspraak gedaan die een klein stofwolkje deed opwaaien, ik pleitte voor afschaffing van de grafische rekenmachine bij de examens wiskunde. Daarbij merkte ik dat er op me wordt gelet, in mijn rol als wetenschappelijk directeur van het Freudenthal Instituut. De gezworen vijanden van het FI, Beter Onderwijs Nederland, publiceren zelfs dat mijn uitspraken hoopvol zijn. Omdat mijn slides niet alles zeggen, en ik de interpretatie daarvan niet graag aan anderen over laat geef ik hier een kleine samenvatting van mijn lezing.

De centrale vraag die ik mezelf stelde is waarom we eigenlijk wiskunde doen op school. De aanleiding is enige onvrede met de methodes, waarin veel aandacht is voor wiskunde als instrument: handig om dingen uit te rekenen, nuttig voor een studie of carrière maar meer ook niet. Ik denk zelf dat wiskunde meer is dan dat, en begon mijn lezing met aan de mensen in de zaal te vragen wat zij daarvan vonden. Daarnaast had ik een paar mensen gevraagd een korte video in te spreken waarin zij hun visie gaven op de vraag waarom je wiskunde moet leren. Mijn Collega Dolly van Eerde had het aan leerlingen gevraagd. Hogeschooldocent Sander Claassen noemde een aantal redenen maar benadrukte vooral dat wiskunde leuk is: kinderen vinden het leuk om puzzels op te lossen en dingen uit te zoeken. Dat moet je koesteren en ze niet afleren. Ionica Smeets pleit ervoor om leerlingen begrip van getallen bij te brengen omdat je dan veel meer begrijpt in het dagelijks leven. Tot slot spreekt Erik van den Ban, een wiskundige aan de universiteit Utrecht zijn fascinatie uit voor de schoonheid van het bouwwerk van de wiskunde.

Ik heb uit de video’s zes beweegredenen gehaald die ik in bovenstaande figuur samenvatte en daar weer drie perspectieven uitgehaald (wetenschap is ordenen tenslotte): De instrumentele blik, waarin wiskunde vooral wordt gezien als een nuttig gereedschap, het inzichtsperspectief, waarin wiskunde vooral helpt om dingen te begrijpen en het culturele en persoonlijke perspectief. Bij die laatste is mijn stelling dat wiskunde net zo goed een uiting van menselijke cultuur is als de toneelstukken van Shakespeare en de schilderijen van Van Gogh. Wiskunde kan daarom ook een levensvervulling bieden, los van concrete directe toepassing. Ik pleit daarom ook voor onderwijs in de geschiedenis van de wiskunde en dat helden in de wiskunde net zo goed geleerd mogen worden als die in schilderkunst en literatuur.

WhyMath

In mijn betoog had ik twee kritische opmerkingen over elementen in het wiskunde-onderwijs en de methoden. De ene betreft het gebruik van contexten. Wanneer je wiskunde ziet als instrument is het nuttig om daarbij een context aan te bieden waarin dat instrument wordt toegepast. Bijvoorbeeld kan het zinnig zijn om te laten zien dat wiskunde wordt toegepast in andere vakgebieden zoals economie of natuurkunde. Het verdient de voorkeur dat die contexten ook daadwerkelijk iets betekenen voor de leerling. De wens voor die contexten is echter doorgeslagen. In de wiskundemethoden kom je veel sommen tegen waar een verhaaltje tegenaan is geplakt als context, zonder dat dit echt betekenis heeft. Sterker nog, soms zijn die verhaaltjes onzinnig, zoals onderstaand voorbeeld uit Getal en Ruimte:

Motorfiets

Ten eerste komt de functie voor de afgelegde weg volkomen uit de lucht vallen. Als je een natuurkundig verschijnsel analyseert zal je op zijn minst moeten zeggen waar het model dat je gebruikt vandaan komt. Bovendien is de functie vreemd. Dat is het beste te zien als je de versnelling berekent die bij deze functie hoort: a = 6*t. Dus op t=2, het tijdstip waarover vragen worden gesteld is de versnelling al 12 m/s^2. Dat is meer dan de valversnelling. De motorrijder hangt dus aan zijn stuur als Epke Zonderland aan zijn rekstok: de horizontale kracht die hij voelt is meer dan de zwaartekracht. Mijn punt hierbij is dat de context niets zinnigs toevoegt, natuurkundig fout is en dat leerlingen op deze manier niet serieus genomen worden.

Mijn andere punt betreft de grafische rekenmachine. Deze apparaten mogen worden gebruikt bij het wiskunde-examen. Ik heb niets tegen ICT-gebruik bij de wiskundeles, maar dit apparaat is een bizar geval. Het wordt alleen op school gebruikt, is onhandig en is volkomen verouderd. Als leerlingen ICT gebruiken gebruik dan goede tools, zoals Wolfram Alpha of Geogebra. Ik zou willen dat leerlingen leren dergelijke tools op een goede manier te gebruiken, in plaats van een apparaat dat ze na school nooit meer tegen komen. Ik zou dan ook de commissie die daar over gaat willen oproepen de grafische rekenmachine op zo kort mogelijke termijn af te schaffen. On-line tools zijn misschien niet praktisch tijdens een centraal schriftelijk examen, maar dat hoeft niet erg te zijn, dat kan ook met behulp van een werkstuk tijdens het schoolexamen bijvoorbeeld.

Ik hoop met mijn lezing de wiskunde-onderwijswereld aan het denken te hebben gezet: Waarom geven we dat mooie vak, en hoe doen we dat zo goed mogelijk. Met daarbij vooral ook aandacht voor de mooie kanten van wiskunde als discipline: haar geschiedenis, als middel om de wereld om ons heen te begrijpen en als iets dat gewoon mooi, leuk en interessant is.

Lijstjes van scholen

Afgelopen week publiceerde de volkskrant de schoolcijferlijst. Op basis van onderzoek van Jaap Dronkers en zijn groep worden in die lijst cijfers toegekend aan scholen. Zo’n lijst geeft altijd gedoe. De vraag is altijd of ranglijsten van scholen überhaupt een goed idee zijn en of zo’n lijst wel meet wat hij pretendeert te meten. Achter scores zit altijd een model waarmee de score totstandkomt. Om een antwoord op de tweede vraag te krijgen is het goed dit model te onderzoeken. Dat doe ik hier, op basis van Dronkers’ beschrijving die hier te downloaden is (PDF).

Alleen cijfers tellen. 

De waardering die Dronkers toekent aan de scholen hangt alleen van de cijfers af die leerlingen op hun examen behalen, althans dat is de enige maat die Dronkers gebruikt voor de waardering van de opbrengst van de school. Hij houdt wel rekening met de „instroom” van de school, bij de beoordeling daarvan, en kijkt kijkt in lichte mate naar het rendement (zeg het aantal leerlingen dat zonder zittenblijven slaagt) maar uiteindelijk zijn de examencijfers de gulden maat. Zelf zegt hij daarover:

„In wezen zijn loopbaanoriëntatie, zorg, leerlingenbegeleiding en de kwaliteit van docenten vooral middelen om het doel te bereiken en geen kwaliteitsindicatoren. Wie deze indicatoren interpreteert als kwaliteitsmaten, verwart doelen en middelen.” (pagina 1).

Ik ben dat niet met hem eens. Met deze bewering lijkt Dronkers te zeggen dat het enige doel van een school is om zoveel mogelijk leerlingen met zo hoog mogelijke cijfers te laten slagen. Dat is belangrijk, maar niet het enige doel van een school. Een school is vormend. Een goede leraar is er niet alleen op gericht dat leerlingen goede cijfers voor zijn of haar vak halen, maar maakt ook de interesse in dat vak wakker en enthousiasmeert. Of een leerling goed is in bepaalde aspecten van een vak is te meten op een examen. Of die leerling enthousiast is voor een vak en heeft nagedacht of dat vak iets is voor zijn of haar toekomst wordt daarin niet gemeten maar is wel een belangrijke opbrengst. Daarnaast zijn er sociale vaardigheden, organisatievaardigheden en meer, die gezien kunnen worden als een opbrengst van de school. Dat zijn niet alleen middelen om het doel van de hogere cijfers te bereiken, het zijn echte opbrengsten van een school.

De focus op cijfers is een keuze van Dronkers. Bij de interpretatie van zijn resultaten moet je daarmee rekening houden.

Vooral onvoldoendes tellen

Nu komen we op de details van het model. Je zou denken dat een simpele maat het gemiddelde eindexamencijfer is – eventueel gescheiden per vak. Dronkers kiest daar niet voor: hij berekent voor iedere school het aantal vakken waarvan het gemiddelde cijfer op het centraal schriftelijk van de geslaagde kandidaten onvoldoende is, dat wil zeggen lager dan 5.899. Daarbij kent hij een zwaarder gewicht toe aan de kernvakken: Nederlands, Engels en Wiskunde. Het resultaat is een cijfer tussen 4 en 8: een vier voor scholen die meer dan drie vakken onvoldoende scoren, een 8 voor scholen met geen enkel vak onvoldoende. Het cijfer wordt lager als de onvoldoende vakken ook nog eens kernvakken zijn. Het volgende tabelletje, overgenomen van de site schoolcijferlijst.nl, laat deze cijfertoekenning zien:

Het model van Dronkers is dus zeer gevoelig voor cijfers die rond de grens van 5,899 liggen. En omdat gemiddelde examencijfers rond de 6,5 liggen is de kans dat vakken door het ijs zakken vrij groot. Het verschil tussen 5,8 en 5,9 voor een vak kan een heel punt schelen in het model van Dronkers. In sommige gevallen zelfs twee. Belangrijk om hiervan te onthouden is dat, ook al gebruikt Dronkers „schoolcijfers” op de schaal van 1 tot 10, het niet zo is dat dat betekent dat een 8 twee keer zo goed is als een 4. De cijfers vormen geen nette continue schaal, een 6- of 7,3 zijn niet mogelijk. Dronkers deelt wel halve bonuspunten uit, zoals hieronder beschreven.

De „toegevoegde waarde”

Hierna gaat Dronkers bonuspunten toekennen voor twee dingen: de „toegevoegde waarde” en het verschil tussen Schoolexamen en Centraal examen. Maximaal kunnen scholen twee bonuspunten verdienen of twee minpunten krijgen. Voor de „toegevoegde waarde” kijkt Dronkers naar het „bovenbouwrendement”, een score gebaseerd op de cijfers voor schoolexamen en centraal examen, percentage gezakten en het percentage leerlingen dat zonder vertraging het eindexamen haalt. Dat rendement relateert Dronkers aan factoren die mogelijkerwijs het resultaat beïnvloeden: het basisschooladvies, de sociaal-economische status van de ouders, of de leerlingen uit een armoedegebied komen (op basis van postcode). Hij berekent een model dat het rendement „voorspelt”. Vervolgens berekent hij voor iedere school het verschil tussen deze voorspelling en noemt dat de „Toegevoegde Waarde”. Daarvan maakt hij een ranglijst. Als je bij de bovenste 10% van die ranglijst hoort krijg je een bonuspunt, de scholen die daar niet bijhoren maar wel in de bovenste 20% staan krijgen een halve bonuspunt. Aan de onderkant van de lijst krijg je minpunten: de laagste 10% krijgt een hele punt aftrek, de 10% daarboven een halve.

Er is kritiek mogelijk op deze aanpak: weer is het zo dat een klein verschil in score op de „Toegevoegde Waarde” een halve punt kan schelen op de Dronkers-schaal. Daarnaast is het zo dat het model van Dronkers voor de relatie tussen de invoer van de school en het bovenbouwrendement grote onzekerheid bevat. Een aantal factoren draagt wel significant bij, maar een groot gedeelte van de verschillen in bovenbouwrendement wordt niet verklaard door de meegenomen factoren. Daardoor speelt toeval een grote rol in de bepaling of een school wel of niet een bonus- of minpunt krijgt toebedeeld.

Het verschil tussen CE en SE

Het eindcijfer van een leerling bestaat voor veel (niet alle) vakken uit het gemiddelde van het schoolexamen, dat de school zelf afneemt, en het centraal examen, dat wordt gemaakt door het CITO. Vaak ligt het schoolexamencijfer wat hoger dan het cijfer van het centraal schriftelijk. Een school met een groot verschil laadt de verdenking op zich te makkelijke examens te geven waarmee de resultaten van de leerlingen worden opgepoetst. De inspectie vindt dat beide cijfers met niet meer dan een half punt mogen verschillen. Nu kun je daarover van mening verschillen. Bijvoorbeeld wordt bij Engels spreek- en schrijfvaardigheid in het schoolexamen getoetst en leesvaardigheid en tekstbegrip in het centraal schriftelijk. Scores op die vaardigheden zouden best verschillend kunnen zijn. Dronkers pikt het advies van de inspectie op en telt per school het aantal vakken waarvoor het verschil groter is dan 0,5. En ook hier past hij de 10% truc toe: de 10% scholen met de meeste vakken met verschil krijgen een punt aftrek, de scholen met de minste vakken met een verschil krijgen er een punt bij. Het is hierbij merkwaardig dat de grootte van het verschil verder geen rol speelt. Een verschil van 0.51 wordt net zo zwaar bestraft als een verschil van 2.

Alles bij elkaar levert dit een score op tussen de 2 en 10. Niet toevallig lijkt dit op een schoolcijfer, maar het is het niet. Waar een 10 doorgaans betekent dat alles goed is, is het hier een afspiegeling van een combinatie van het aantal onvoldoendes en de plaats op twee ranglijsten, waar hierboven wat kanttekeningen zijn geplaatst. Het is maar de vraag of een school met een 10 in werkelijkheid echt veel verschilt van een school met een 4.

De vraag is nu natuurlijk of de scores van Dronkers iets zeggen over de kwaliteit van de scholen. Ten eerste: kwaliteit is volgens Dronkers gelijk aan examencijfers. Dat is een keuze. Als je die keuze accepteert is er nog veel aan te merken. Het rekenen met rapportcijfers in plaats van de examencijfers zelf en het systeem van bonuspunten maakt het geheel niet helder. Scores zijn in bepaalde gevallen gevoelig voor kleine verschillen en ander verschillen (de absolute hoogte van examencijfers) worden juist niet meegenomen. Een groot verschil in Dronkers-score hoeft niet te staan voor een groot verschil in cijfers. Zo is het verschil in gemiddeld cijfer tussen de hoogste VWO-school (met een 10) en de laagste (met een 2,5) 1,3 punt. Een belangrijk verschil, maar de vraag is of het een verschil tussen een 2,5 en een 10 rechtvaardigt is de vraag. Dat verklaart ook dat de scores van jaar tot jaar fors kunnen verschillen zoals Dick van der Wateren in zijn blog constateert. Overigens was ook het systeem waarmee de scores vorig jaar bepaald werden anders. Een school zakte van een 9 naar een 3.5.

Alles bij elkaar nemend vind ik de functie van deze ranglijst twijfelachtig. De relatie tussen cijfer en examencijfers is arbitrair. En het feit dat alleen cijfers en niet andere vormen van opbrengst worden meegenomen is discutabel. De vraag is of een score gebaseerd op deze methode de opwinding en de discussie die het uitbrengen van de lijst genereert waard is. Ranglijsten zijn sowieso niet zo nuttig, scholen hebben meer aan een genuanceerd beeld van de ontwikkeling van hun leerlingen, tijdens en na hun schoolcarriere. Daarbij zijn cijfers belangrijk maar niet het enige aspect waar op gelet moet worden.

Update: Ik attendeerde Jaap Dronkers op deze blogpost en hij schreef een reactie. Die is hier te lezen.

20 jaar doctor

Gisteren (22 juni) was het exact 20 jaar geleden dat ik mijn proefschrift verdedigde: “Understanding and facilitating discovery learning in computer-based simulation environments”. Het proefschrift gaat over het toepassen van computersimulaties als middel om leerlingen te leren door experimenteren. Het was in de tijd dat het constructivisme opkwam. In die visie is het belangrijk de leerling te zien als een actieve deelnemer aan het leerproces. Informatie wordt niet ‘gekopieerd’ in de hersenen maar actief verwerkt. Als gevolg daarvan moet de leerling ook actief informatie verzamelen en verwerken. Ontdekkend leren (tegenwoordig spreken we liever van onderzoekend leren) is een manier om dat expliciet te doen: leerlingen experimenteren zelf en (her) ontdekken de onderliggende regels en wetten.

De oppositie
De oppositie

In mijn proefschrift gebruikte ik simulaties als een middel waarbinnen leerlingen veilig in een gecontroleerde omgeving konden experimenteren. Ik deed mijn studies met eerstejaars scheikundestudenten die iets moesten leren over meetfouten. Ik vond (en vind) het idee ze helemaal los te laten zonder enige verdere ondersteuning niet goed en bedacht ter ondersteuning een “hypothesekladblok” (hypothesis scratchpad). Hierop konden de studenten invullen welke hypothese ze wilden toetsen, al dan niet geholpen door een aangeboden structuur. Die structuur bestond er uit dat ze in de zin “Als … … dan geldt dat … …”, op de stippeltjes gegeven namen variabelen en relaties konden invullen zodat de hypothesen een correcte vorm kregen zoals: “Als de hoeveelheid stof toeneemt, dan geldt dat de relatieve meetfout afneemt”. Het idee was dat leerlingen dat vervolgens met de simulatie (van een titratie-experiment) gingen toetsen. Idealistisch als ik was dacht ik dat het kladblok enorm zou helpen.

Dat pakte anders uit. Hoewel ik in mijn proefschrift probeer een en ander positief uit te leggen is er eigenlijk geen enkele aanwijzing dat het kladblok werkt. Integendeel, studenten gebruikten het niet spontaan, en als ze gedwongen werden formuleerden ze vooral heel algemene en daardoor niet toetsbare hypothesen. De reden waarom bedacht ik later: studenten doen vooral dingen om verder te komen met de opdracht. Het kladblok liet zich makkelijk invullen en de studenten kregen de indruk dat ze opschoten. Waar ik dacht dat het zou leiden tot dieper nadenken bereikte ik het tegenovergestelde.

Met paranimfen
Met mijn paranimfen, Melanie Njoo en Erica de Vries

Leuk is dat ik in het proefschrift een methode heb ontworpen om automatisch hypothesen en experimenten van de leerlingen met de simulatie te kunnen interpreteren. Een soort learning analytics avant-la-lettre (hoofdstuk 9). En mijn laatste stelling had een voorspellende waarde, die gaat over leraren. Sinds een jaar ben ik directeur van een lerarenopleiding.

Het onderzoek heeft een vervolg gekregen in een aantal mooie projecten die leidden tot het auteurssysteem SimQuest, een systeem waar ik nog alijd trots op ben. Met SimQuest is het eenvoudig om een computersimulatie te maken en daaromheen vervolgens instructie te ontwerpen in de vorm van opdrachten, uitleg, en het geleidelijk moeilijker maken van het simulatiemodel. SimQuest hebben we nog lang gebruikt, en het is ook opgepikt door groepen in binnen- en buitenland – zo kregen we op een bepaald moment het verzoek om het in het Vietnamees te vertalen.

Promotie 9

Het hypothesekladblok is een eigen leven gaan leiden. Het is door anderen gekopieerd en/of heruitgevonden en in veel systemen gebruikt, vaak met als doel om er achter te komen wat de leerling denkt. Natuurlijk zijn onder invloed van de snelle ontwikkelingen in de technologie de versies steeds fraaier geworden, aan het basisprincipe is weinig veranderd. Dat is jammer, want als mijn proefschrift één ding aantoont is dat er een fundamentele ontwerpfout in zit. Door in het programma een invulformulier aan te bieden wordt dat automatisch onderdeel van de taak en haalt de aandacht weg van het werkelijke doel: leren over het onderwerp van de simulatie. Op een conferentie heb ik niet zo lang geleden eens gezegd dat we het hypothesis scratchpad ritueel moeten verbranden. Recent zag ik het echter – zelfs dicht bij huis – weer opduiken. In de loop der tijd heb ik geleerd dat het het belangrijkst is de leerling te motiveren. Je kunt nog zulke mooie modellen maken van de leertaak, die wordt pas effectief als de leerling zelf daadwerkelijk wil leren. En gedachteloos inzetten van invulformulieren als ondersteuning van hypothesevorming, experimentontwerp of planning zit die motivatie vaak alleen maar in de weg.

Simulaties ben ik blijven maken, de laatste tijd post ik ze op deze blog.

Quantumtheorie getest

Quantummechanica wordt vaak gezien als een beetje raadselachtig. Toen in de eerste decennia van de twintigste eeuw de nieuwe natuurkunde werd ontwikkeld werd duidelijk dat de wereld van de allerkleinste deeltjes er totaal anders uitziet als de werkelijkheid die we direct waarnemen. Materie blijkt zich soms als een golf en soms als een deeltje te gedragen, en kan zich zelfs in meerdere toestanden tegelijk bevinden, waardoor we nog steeds niet weten of de kat van Schrödinger nu wel of niet leeft.

Dit alles komt door een belangrijk principe in de quantummechanica. Sommige grootheden, zoals plaats en snelheid van een deeltje kun je niet tegelijkertijd meten. Als je de snelheid van een deeltje meet weet je de plaats niet en andersom. Dit is het onzekerheidsprincipe van Heisenberg. In de berekeningen voor plaats en snelheid zit altijd een minimale onzekerheid. Een quantummechanische toestand voorspelt daarom alleen de kans op een bepaalde uitkomst van een experiment. En door te meten verander je ook de toestand: een meting van plaats levert een toestand op met een zekere plaats en een onzekere snelheid en omgekeerd.

Einstein vond dit maar niets. Hij vond dat een theorie die niet alles kon voorspellen niet af is. In een jarenlange discussie met Niels Bohr probeerde hij de natuurkundige gemeenschap daarvan te overtuigen. In 1935 kwam hij, samen met twee anderen, tot een ultiem argument. Stel, je hebt een atoom, dat in twee delen uit elkaar valt, en die twee delen bewegen van elkaar weg. Dan kan ik uit een meting van het ene deeltje de eigenschappen van het andere berekenen. Dus, als ik van deeltje A de plaats meet weet ik de plaats plaats van deeltje B. En voor de snelheid is dat ook zo. Maar, als deeltje B inmiddels ver weg is, kan deeltje B niet weten wat ik meet, en moeten plaats en snelheid al bekend zijn. Anders zou deeltje B op het moment dat ik deeltje A meet moeten weten wat er gemeten wordt. Er zou dus een signaal met oneindige snelheid van A naar B moeten gaan, en dat kan niet volgens Einsteins relativiteitstheorie.

Bohr liet zien dat dit geen probleem hoeft te zijn met de theorie. De quantumtheorie geeft een bovengrens aan wat we kunnen weten, en in de redenering van Einstein hoeft er toch geen informatie te worden verzonden om de metingen toch kloppend te krijgen.

De discussie werd in de jaren 60 nieuw leven ingeblazen door John Bell. Hij was het met Einstein eens beide deeltjes alle eigenschappen moesten dragen, dus meer informatie bevatten dan de quantumtheorie toestaat. Hij richtte zich op een eigenschap van deeltjes die aangeeft hoe snel ze om hun as tollen, en in welke richting: de spin. Quantummechanisch geldt voor de spin in twee verschillende richtingen hetzelfde als voor plaats en snelheid: je kunt ze niet tegelijkertijd meten. Als je de spin in de verticale richting meet, blijf je in het ongewisse over de spin in de horizontale richting en andersom.

Bell bedacht een experiment waarbij een deeltje zonder spin uiteenvalt in twee deeltjes elk met spin. De totale spin van beide deeltjes moet dan wel nul zijn. Als je van beide deeltjes de spin meet in dezelfde richting, vind je bij elke positieve spin bij deeltje A een negatieve spin voor deeltje B. De correlatie, een maat voor de samenhang tussen de twee metingen, tussen beide spins is dan -1. Maar als je van deeltje A in de verticale richting meet, en bij B in de horizontale richting vind je een correlatie van nul, de metingen hangen totaal niet samen. De meting aan de ene kant zegt niets over wat je aan de andere kant vindt. Zowel de quantummechanica als de klassieke natuurkunde voorspellen dat en op die manier kun je dus niet bepalen welke theorie klopt. Bell kwam op het idee om ook te kijken naar situaties waarin de spin niet in dezelfde richting of loodrecht op elkaar wordt gemeten, maar bijvoorbeeld onder een hoek van 60 graden. Hij vond dat dan de quantummechanica en klassieke theorie dan wel verschillende uitkomsten geven. In een klassieke theorie splitst het deeltje en ligt de spin van beide brokstukken vast. In de quantumtheorie splitst het deeltje en ligt er nog niets vast over de spin van beide deeltjes. Pas op het moment van meten aan deeltje A verandert de quantumtoestand van beide deeltjes in een toestand waarin deeltje A een positieve of negatieve spin in de gemeten richting heeft. Als dan deeltje B wordt gemeten hangt de uitkomst mede af van die op deeltje A. Daardoor is de correlatie tussen de uitkomsten van de metingen volgens de quantummechanica sterker dan volgens de klassieke mechanica. In de simulatie hieronder kun je dit uitproberen.

Boven zie je een simulatie van het spin-experiment volgens de quantumtheorie, daaronder hetzelfde experiment berekend volgens een klassieke theorie. Je kunt de hoeken waaronder de spin wordt gemeten aanpassen voor beide deeltjes, A en B. Je kunt met Run 1 deeltje laten splitsen. Je ziet dan aan beide kanten een detector opflitsen en het deeltje registreren. Als de detectoren onder dezelfde hoek meten zie je dat steeds tegengestelde detectors opflitsen. Als ze een hoek maken van 90 graden is er geen verband tussen de flitsen links en rechts.

Met “Run 1000” kun je duizend experimenten achter elkaar doen. Je kunt aflezen wat de correlatie tussen de metingen aan deeltje A en B is. Hoe dichter bij 1 of -1 hoe sterker de correlatie. Bij nul is er geen verband. Probeer eens een verschil tussen a en b van 60. Je ziet dat de quantumtheoretische en de klassieke correlaties verschillen. De stelling die Bell bewees is dat er geen klassieke theorie mogelijk is die voor alle combinaties van a en b dezelfde voorspellingen als de quantumtheorie kan geven.

Welke instelling je ook maakt voor beide deeltjes is de kans op een meting van + of – 50%.  Voor een waarnemer die maar 1 van de deeltjes ziet is er niets bijzonders aan de hand, pas met de kennis over het andere deeltje valt de correlatie op. Dat betekent dat, hoewel er een correlatie is, er geen informatie tussen de deeltjes wordt uitgewisseld. Op die manier blijven we nog net binnen de regels van de relativiteitstheorie.

In het begin van de jaren 1980 voerde Alain Aspect een reeks experimenten uit met fotonen in een opstelling zoals hierboven getoond. Die experimenten toonden overtuigend aan dat de quantummechanische voorspellingen kloppen.

Onderwijsonderzoek

Ik was vandaag op een symposium bij NEMO. Aanleiding van het symposium was de presentatie van een nieuw boek van Rooske Franse: “Reizen door het Landschap van Informeel Leren”, dat een achtergrond biedt over het opzetten van educatieve tentoonstellingen. Mooi boek – en ik ga het zeker lezen. Bij die presentatie waren lezingen van Maartje Raijmakers, van de UvA, en Josh Gutwill, van het Exploratorium in San Francisco. Met name die laatste zette me aan het denken.

Hij noemde een voorbeeld van ontwerponderzoek dat ze bij het exploratorium doen. Ontwerponderzoek noemde hij als de meest praktijkgerichte vorm van onderzoek. Niet gedreven uit theorie maar gewoon om een opstelling op de museumvloer zo goed mogelijk te maken. Daarbij gaan ze heel praktisch te werk. Een ontwerper bouwt een eerste versie van een opstelling en die wordt op de museumvloer gezet. Het publiek loopt er langs en gebruikt de opstelling. Dat wordt geobserveerd – met camera’s en microfoons wordt vastgelegd wat er met en rond de opstelling gebeurt. Op basis daarvan wordt een nieuwe versie gemaakt. Ook die wordt op dezelfde manier getest en weer herzien. Net zolang tot er geen verbetering mogelijk is.

Gutwill noemde een voorbeeld van een opstelling waarin bezoekers schijven van een helling kunnen laten rollen, en kijken welke sneller gaat. Hoe snel een schijf rolt hangt af van hoe de massa verdeeld is over de schijf. Hoe dichter de massa bij het centrum van de schijf is geconcentreerd, hoe sneller de schijf gaat lopen – er gaat minder energie in de rotatie van de schijf zitten.

Er zijn verschillende soorten schijven: lichte aluminium en zware koperen schijven. Ook zijn er massieve en schijven die er meer uitzien als een wiel met spaken. Uit de observaties bleek dat mensen wel met de schijven speelden maar niet doorhadden dat het om de rotatie-energie ging. Veel dachten aan luchtweerstand. In het nieuwe ontwerp waren de schijven van hout met koperen gewichtjes er in, met een duidelijk zichtbare grootte en verdeling. Bezoekers hadden snel door dat het om massa en massaverdeling ging en probeerden dat uit. Een effect was wel dat ze veel korter bij de opstelling bleven.

De helling zoals gebruikt bij het exploratorium. Aan de onderkant zijn de schijven met gewichtjes te zien. Foto is van exploratorium.

In de volgende versie van de opstelling waren de schijven op dezelfde manier gemaakt, maar waren twee schijven toegevoegd waarvan de bezoekers zelf de massaverdeling konden bepalen door gewichtjes langs sleuven te verplaatsen. Nu bleven bezoekers weer veel langer bij de opstelling en kon uit hun gesprekken nog steeds worden opgemaakt dat de verdeling van de massa over de schijf essentieel is.

Wat mij vooral aan het denken zette is dat, hoewel de inhoud van de proef door de verschillende gebruikte schijven niet veranderde, het gedrag van de bezoekers dat wel deed, en vrij essentieel. Vooral omdat ik eerder op de dag een artikel reviewde waarin twee versies van een online leeromgeving werden gebruikt. In één versie kregen leerlingen vragen, in een andere niet. Ik heb het artikel afgewezen omdat de statistiek niet klopte, maar daarnaast zat de leeromgeving over celbiologie liefdeloos in elkaar. Fraaie animaties, maar de interactie met de leerling was weinig doordacht. Als je dit legt naast de wetenschap dan een relatief klein detail in het ontwerp veel uitmaakt, kun je je afvragen wat de zin van dergelijk onderzoek is.

Ik realiseerde me dat bij veel onderzoek naar instructievormen de eerste fase van zorgvuldig, iteratief ontwerp wordt overgeslagen of maar beperkt wordt gedaan. We grijpen meteen naar vergelijkend onderzoek, en vinden soms wel en soms geen verschil. Het probleem hiermee is dat doordat kleine verschillen in het ontwerp van de ervaring van de gebruiker grote gevolgen hebben voor gedrag, het geen zin heeft om verschillen in instructie te gaan vergelijken. Het effect van de details van de opstelling zelf kan vele malen groter zijn dan dat van wel of niet een bepaald soort vragen stellen. Onderzoek is gelaagd: eerst een goed ontworpen basisomgeving, dan pas uitproberen of verschillende vormen van instructie effect hebben. Die les kreeg ik vandaag weer een keer ingepeperd.

Schurend onderwijs

Deze week mocht ik de UT onderwijsdag over het Masteronderwijs afsluiten. Het was de bedoeling dat ik luisterde en mijn indrukken zou geven. Oorspronkelijk was het de bedoeling dat Bas Haring dat zou doen, maar die kon uiteindelijk niet komen. Het is niet makkelijk om met acht parallelle workshops, die wel elk twee keer werden gegeven, te luisteren en daar indrukken van te geven. Maar met wat indrukken en een voorgesprek was het te doen. Op andere plaatsen is verslag gedaan van wat ik te zeggen had en dat ga ik niet herhalen. UT-nieuws wijdde er dit artikel aan, dat op verschillende plaatsen niet de kern raakte van wat ik probeerde te zeggen, maar wel gelukkig op de foto de goede slide laat zien: “Schuurt het wel genoeg”. De kern van mijn verhaal was dat we het studenten niet te makkelijk moeten maken. Dat falen een optie en en dat je van fouten kunt leren. Petra de Weerd-Nederhof, die de dag organiseerde gaf me de gelegenheid om op haar blog een gastbijdrage te schrijven om dit punt nog eens uit te werken.

Schuren kan creativiteit opwekken. De dag zelf was voor mij een goed voorbeeld. Op die manier een dag samenvatten was voor mij spannend. Ik ben in het diepe gesprongen en gelukkig kwam ik weer boven. Met een paar inzichten die helderder waren dan voor die dag. Een ander voorbeeld kwam vandaag. Toevallig werd ik deze dagen gevraagd om voor een project van een bevriend bedrijf als adviseur op te treden. In het pakket moeten naast een CV ook kopieën van mijn diploma’s worden bijgevoegd. Ik heb dus mijn diploma’s opgezocht en ontdekte dat mijn drs. bul in het latijn was – wat ik eigenlijk vergeten was:

Wat me meer verbaasde en waar ik van schrok is dat tussen een reeks redelijk tot goede cijfers (7 tot 9, met achten voor scriptie en experimenteel werk), een 6- stond voor quantumtheorie 1. De herinnering kwam boven dat ik daar destijds echt gefrustreerd door was, omdat ik de quantummechanica echt wilde begrijpen en dat grote moeite kostte, blijkend uit dat cijfer. Gelukkig heb ik doorgepakt en is ergens het kwartje gevallen: quantumtheorie 2 was een 9, en mijn these ging ook over de fundamenten van de quantummechanica. Voor mij was dit echt een lastig moment in mijn studie – en volgens mij heeft het ook tijd gekost. Achteraf een productief schuurmoment.