AI-robuuste summatieve toetsing

Thema 5. AI-robuuste summatieve toetsing

Introductie

In een tijd waarin studenten gemakkelijk gebruik kunnen maken van generatieve AI, wordt summatief toetsen opnieuw een fundamentele vraag naar bewijs. Het gaat dan niet alleen om de kwaliteit van het ingeleverde product, maar vooral om de vraag of een docent voldoende kan onderbouwen dat de student het leerdoel daadwerkelijk zelf beheerst. Juist daar ontstaat spanning. Veel traditionele summatieve toetsvormen, zoals onbegeleide thuisopdrachten, verslagen of generieke analyses, leveren minder sterk bewijs op dan voorheen, omdat AI een groot deel van het denk- en schrijfwerk kan overnemen zonder dat dit altijd zichtbaar is. Recente handreikingen benadrukken daarom dat toetsing in een AI-rijke context opnieuw moet worden ontworpen vanuit bewijs van leren, zicht op individuele beheersing en passende toetscondities (Beekman et al., 2025; Npuls, 2025). (npuls.nl)

De kern van dit thema is eenvoudig, maar belangrijk: als je niet kunt zien wat de student doet, en je hebt ook geen ander sterk bewijs van het leerproces, dan heb je minder zekerheid dat de student het werk zelf heeft gedaan. Dat betekent niet dat iedere summatieve toets voortaan alleen nog onder streng toezicht moet plaatsvinden. Het betekent wel dat docenten bewuster moeten nadenken over de momenten waarop zij echt bewijs verzamelen. Soms is een kennistoets onder toezicht daarvoor passend. Soms werkt een casustoets beter. In andere gevallen zijn simulaties, praktijktoetsen of een combinatie van meerdere toetsvormen sterker dan één los eindproduct. Die beweging sluit aan bij de bredere lijn in recente publicaties: minder vertrouwen op één thuis gemaakt product, meer aandacht voor toetsvormen die zicht geven op kennis, toepassing, redenering en handelen (Attewell, 2024; TEQSA, 2025). (jisc.ac.uk)

Tegelijk vraagt dit thema ook om nuance. Mondeling toetsen wordt vaak genoemd als antwoord op AI-risico’s, maar dat is niet altijd de beste oplossing. Mondelinge toetsen kunnen veel zichtbaar maken, maar kosten ook veel tijd, zijn niet altijd even betrouwbaar en passen niet bij elk leerdoel. Ook voorwaarden zoals verplichte aanwezigheid en actieve participatie vragen zorgvuldige afweging. Aanwezig zijn is op zichzelf nog geen bewijs van leren, maar kan wel een logische voorwaarde zijn wanneer belangrijke onderdelen van het leerproces of de beoordeling alleen in begeleide bijeenkomsten zichtbaar worden. In dit thema leren deelnemers daarom hoe zij summatieve toetsing zo kunnen ontwerpen dat die sterker, eerlijker en beter verdedigbaar wordt in een tijd van AI. (iier.org.au)

Leerresultaten

Na afloop van dit thema kan de deelnemer uitleggen wat in een AI-rijke context telt als sterk summatief bewijs van leren. De deelnemer kan beschrijven waarom een onbegeleide thuisopdracht vaak te weinig zekerheid geeft over individuele beheersing en kan onderbouwen wanneer kennistoetsen, casustoetsen, simulaties of praktijktoetsen passender zijn. Daarnaast kan de deelnemer uitleggen wanneer toezicht tijdens toetsen zinvol is, wanneer aanwezigheid of actieve deelname als voorwaarde verdedigbaar is, en waarom mondeling toetsen niet automatisch de beste oplossing is. Tot slot kan de deelnemer een bestaande summatieve toets herontwerpen tot een vorm die sterker bewijs geeft van wat de student zelf kent en kan (Beekman et al., 2025; TEQSA, 2025). (teqsa.gov.au)

Prestatie

De deelnemer herontwerpt één bestaande summatieve toets uit de eigen onderwijspraktijk tot een AI-robuuste summatieve toets. In dit herontwerp maakt de deelnemer duidelijk welk leerdoel centraal staat, welk bewijs nodig is om dat leerdoel aan te tonen, welke onderdelen onder toezicht of in een observeerbare setting plaatsvinden, en waarom de gekozen toetsvorm beter past bij een tijd waarin studenten toegang hebben tot AI.

Prestatie-indicatoren

De prestatie is voldoende wanneer de deelnemer helder maakt welk leerdoel wordt getoetst en welk bewijs daarvoor nodig is. De deelnemer laat zien welke onderdelen van de toets sterker bewijs geven dan het oorspronkelijke ontwerp en kan uitleggen waarom. Ook is zichtbaar of een kennistoets, casustoets, simulatie, praktijktoets of andere vorm passend is gekozen. Verder wordt duidelijk beargumenteerd of aanwezigheid, actieve deelname of een mondeling onderdeel nodig is, en hoe de toets uitvoerbaar en zorgvuldig beoordeeld kan worden.

Inhoud

1. Wat is sterke summatieve toetsing in een tijd van AI?

Sterke summatieve toetsing geeft een docent voldoende vertrouwen dat een student het leerdoel daadwerkelijk zelf beheerst. Dat vertrouwen ontstaat niet vanzelf uit een mooi ingeleverd product. In een tijd van AI is het juist nodig om beter te kijken naar de vraag welk bewijs een toets werkelijk oplevert. Een thuis geschreven tekst kan verzorgd, logisch en overtuigend ogen, maar toch weinig zeggen over wat de student zelf weet, begrijpt of kan toepassen. Daarom wordt het steeds belangrijker om toetsen zo te ontwerpen dat niet alleen het eindresultaat telt, maar ook de omstandigheden waaronder dat resultaat tot stand komt en de mate waarin de docent zicht heeft op de prestatie van de student. Npuls benadrukt dat toetsing en examinering in een AI-tijdperk opnieuw doordacht moeten worden vanuit betrouwbaarheid, validiteit en zicht op individueel leren (Beekman et al., 2025). (npuls.nl)

Dat betekent concreet dat een docent sterker bewijs heeft wanneer een student iets laat zien in een setting waarin de prestatie observeerbaar is, of wanneer er onderweg voldoende procesbewijs wordt verzameld. Juist dat onderscheid is belangrijk. Niet iedere toets hoeft volledig onder toezicht plaats te vinden, maar een losse thuisopdracht zonder zicht op proces of uitvoering is meestal zwakker als summatief bewijs dan een toets waarbij de docent kan zien wat de student zelf doet.

2. Het belang van kennis en kennistoetsen

In discussies over AI ontstaat soms de indruk dat kennis minder belangrijk wordt, omdat AI snel informatie kan geven. In de onderwijspraktijk blijkt juist het tegenovergestelde. Hoe beter een student de basis kent, hoe beter die student AI-uitvoer kan beoordelen, fouten kan herkennen en kan beslissen wat bruikbaar is en wat niet. Zonder kennis wordt de student sneller afhankelijk van AI en neemt de kans toe dat antwoorden worden overgenomen zonder echt begrip. Daarom blijft kennis een onmisbare basis voor goed leren, professioneel handelen en verantwoord AI-gebruik (Beekman et al., 2025). (npuls.nl)

Kennistoetsen houden daarom een belangrijke plaats in summatieve toetsing. Zeker wanneer begrippen, regels, protocollen, modellen of procedures essentieel zijn voor vervolgleren of beroepstoepassing, is het logisch om die kennis ook expliciet te toetsen. Voor mbo-opleidingen kan dat bijvoorbeeld gaan over veiligheidsregels, vaktermen, materialen of werkwijzen. Voor hbo-opleidingen kan het gaan over kernbegrippen, methoden, beslisregels, theoretische kaders of toepassingskennis. Een kennistoets is niet voor elk leerdoel voldoende, maar wel vaak noodzakelijk als basis onder sterkere toepassings- of praktijktoetsen.

3. Kennistoetsen en andere toetsen onder toezicht

Kennistoetsen worden sterker wanneer ze onder toezicht worden afgenomen. Met toezicht wordt hier bedoeld dat de docent of instelling kan controleren dat de student de toets zelf maakt. Dat kan in een toetslokaal zijn, maar soms ook in een online omgeving waarin controle mogelijk is. De reden om toezicht te gebruiken is niet alleen controle, maar vooral het verzamelen van sterker bewijs. Als een student op een bepaald moment zelf laat zien wat hij of zij weet, heeft de docent meer zekerheid over de uitkomst dan bij een onbegeleid product dat thuis is gemaakt.

Hetzelfde geldt voor andere toetsvormen. Ook een casustoets, simulatie of praktijktoets wordt sterker wanneer de prestatie plaatsvindt in een situatie waarin de student daadwerkelijk zelf moet handelen, kiezen of redeneren. Juist in een tijd van AI is dat belangrijk, omdat een docent dan minder afhankelijk wordt van achteraf interpreteren en meer kan steunen op wat zichtbaar is gebeurd. Online toezicht kan daar soms bij helpen, maar is geen perfecte oplossing. Het kan de kans verkleinen dat een student ongeoorloofde hulp gebruikt, maar het geeft nooit volledige zekerheid en vraagt ook om zorgvuldige afweging van praktische en studentgerichte aspecten (Dawson, 2022). (teqsa.gov.au)

4. Casustoetsen als sterk alternatief

Casustoetsen zijn in veel opleidingen een sterke vorm van summatieve toetsing, omdat zij niet alleen vragen om kennis, maar vooral om toepassing. Een student krijgt een concrete situatie voorgelegd en moet laten zien hoe hij of zij analyseert, afweegt, kiest en onderbouwt. Daarmee geven casustoetsen vaak meer zicht op denken en professioneel handelen dan een generieke schrijfopdracht. Dat maakt ze bijzonder bruikbaar in een AI-rijke context. Een AI-systeem kan wel helpen om een algemene tekst te maken, maar een goed ontworpen casustoets vraagt om gerichte keuzes in een afgebakende situatie en wordt nog sterker wanneer de toets onder toezicht wordt afgenomen (TEQSA, 2025). (teqsa.gov.au)

Voor mbo kan een casustoets bijvoorbeeld draaien om een zorgsituatie, een storing, een klantgesprek of een veiligheidsvraag. Voor hbo kan het gaan om een beleidsprobleem, een beroepsethisch dilemma, een analyse van dossierinformatie of een adviesvraag waarbij meerdere oplossingen denkbaar zijn. De kwaliteit van de casus is daarbij wel belangrijk. Een te algemene casus nodigt uit tot standaardantwoorden. Een sterke casus dwingt de student om echt te kiezen en te verantwoorden.

5. Simulaties en praktijktoetsen

Sommige leerdoelen vragen niet alleen om weten of uitleggen, maar om doen. In dat soort situaties zijn simulaties en praktijktoetsen vaak sterker dan schriftelijke opdrachten. In een simulatie werkt de student in een nagebootste beroepssituatie. In een praktijktoets voert de student een handeling uit in een echte of realistische context. De docent of beoordelaar kan dan direct zien hoe de student handelt, reageert, prioriteiten stelt of communiceert. Dat levert vaak rijker en overtuigender bewijs op dan een verslag achteraf.

Voor mbo-opleidingen kan dit bijvoorbeeld gaan om zorghandelingen, handelingen in een werkplaats, klantcontact of veiligheidsprocedures. Voor hbo-opleidingen kan het gaan om intakegesprekken, adviesgesprekken, overlegsituaties, presentaties met verdediging of live uitgewerkte analyses. Belangrijk is wel dat zulke toetsvormen alleen sterk zijn wanneer vooraf duidelijk is waarop gelet wordt. Zonder heldere criteria wordt beoordelen snel te afhankelijk van indrukken. Juist daarom moeten observatiepunten en beoordelingscriteria vooraf goed zijn uitgewerkt.

6. Verplichte aanwezigheid en actieve participatie

Aanwezigheid alleen is geen bewijs van leren. Een student kan aanwezig zijn zonder werkelijk iets te laten zien. Toch kan verplichte aanwezigheid soms een logische en verdedigbare voorwaarde zijn. Dat is vooral het geval wanneer belangrijke onderdelen van het leren of de beoordeling alleen zichtbaar kunnen worden in begeleide bijeenkomsten. Denk aan lessen waarin geoefend wordt met een beroepshandeling, simulatiesessies, casusbesprekingen of werkvormen waarin studenten directe feedback krijgen en daarop moeten reageren. In zulke gevallen gaat het niet om aanwezigheid als administratieve eis, maar om aanwezigheid als noodzakelijke voorwaarde om bepaald leren en bepaald bewijs mogelijk te maken.

Hetzelfde geldt voor actieve participatie. Ook dat begrip is op zichzelf te vaag om te beoordelen. Het wordt pas bruikbaar wanneer duidelijk is wat de student concreet moet laten zien. Bijvoorbeeld het bijdragen aan een casusbespreking, het beargumenteren van keuzes, het uitvoeren van een handeling of het zichtbaar verwerken van feedback. Zodra dat concreet gemaakt wordt, kan actieve deelname wel degelijk betekenis krijgen binnen een summatief ontwerp. Dan is het niet zomaar “meedoen”, maar een observeerbaar onderdeel van het leerdoel.

7. Waarom mondeling toetsen niet altijd de beste oplossing is

Sinds de opkomst van generatieve AI wordt mondeling toetsen vaak snel genoemd als oplossing. Dat is begrijpelijk, want in een gesprek kun je als docent snel merken of een student iets begrijpt, kan uitleggen en kan redeneren. Toch is mondeling toetsen niet automatisch de beste keuze. Een belangrijk probleem is de tijdsinvestering. Zeker in grotere groepen is het moeilijk om mondelinge toetsen op een zorgvuldige manier te organiseren. Daarnaast speelt betrouwbaarheid een rol. Niet iedere student krijgt precies dezelfde vragen of dezelfde omstandigheden, en beoordelaars kunnen onbedoeld van elkaar verschillen in strengheid of interpretatie. Ook spanning speelt mee: sommige studenten presteren in een mondeling gesprek minder goed, terwijl zij de inhoud wel beheersen (Nallaya et al., 2024). (iier.org.au)

Dat betekent niet dat mondeling toetsen geen plaats heeft. Een mondeling onderdeel kan heel passend zijn wanneer mondeling professioneel handelen zelf een leerdoel is, of wanneer een korte toelichting of verificatie helpt om een product beter te begrijpen. Maar als algemene oplossing voor alle AI-vraagstukken is mondeling toetsen te beperkt. In veel situaties is een combinatie van kennistoetsen, casustoetsen, simulaties en gerichte observatie sterker én beter uitvoerbaar.

8. Voorbeelden van sterkere summatieve toetsing

In een mbo-opleiding Zorg is een thuis geschreven reflectie op een stage-ervaring vaak een zwakke summatieve toets, omdat de docent weinig zicht heeft op de totstandkoming. Een sterker ontwerp combineert een kennistoets onder toezicht over protocollen en risico’s met een casustoets over een zorgsituatie en een simulatie waarin de student een handeling uitvoert en kort toelicht. Daarmee worden kennis, toepassing en handelen alle drie zichtbaar.

In een mbo-opleiding Techniek kan een thuis gemaakt rapport over een storing eveneens zwak bewijs geven. Sterker is een ontwerp waarin studenten eerst onder toezicht laten zien dat zij de basiskennis over veiligheid en diagnose beheersen, en daarna in een simulatie of praktijktoets werken aan een storing. De toets laat dan niet alleen zien wat de student kan opschrijven, maar ook wat de student werkelijk doet.

In een hbo-opleiding Social Work of Verpleegkunde kan een generieke thuisanalyse van een casus te weinig zekerheid geven over individuele beheersing. Een sterkere vorm is een casustoets onder toezicht met dossierinformatie, waarin de student prioriteiten stelt, keuzes onderbouwt en eventueel kort toelicht waarom een bepaalde aanpak passend is.

In een hbo-opleiding Bedrijfskunde of ICT kan een volledig thuis gemaakt adviesrapport zonder zicht op het proces eveneens te zwak zijn. Dan is het sterker om eerst een kennistoets onder toezicht af te nemen over kernbegrippen en analysemethoden, vervolgens een casustoets waarin de student een probleem analyseert, en pas daarna een groter beroepsproduct te vragen. Het eindproduct staat dan niet op zichzelf, maar rust op al verzameld bewijs van kennis en toepassing.

9. Wat betekent dit voor de eigen praktijk?

Voor de eigen praktijk betekent dit thema dat docenten opnieuw kijken naar hun summatieve toetsing, niet vanuit de vraag hoe zij AI volledig kunnen uitsluiten, maar vanuit de vraag waar zij werkelijk bewijs verzamelen van wat de student zelf beheerst. Die manier van kijken leidt vaak tot andere keuzes. Kennistoetsen worden weer belangrijker waar basiskennis nodig is. Casustoetsen onder toezicht worden aantrekkelijker waar toepassing en afweging centraal staan. Simulaties en praktijktoetsen worden logischer waar handelen zichtbaar moet zijn. Mondelinge onderdelen worden gerichter ingezet, in plaats van als algemene oplossing.

De rode draad blijft daarbij eenvoudig: als je niet kunt zien wat de student doet, en je hebt ook geen ander sterk bewijs van het leerproces, dan heb je minder zekerheid dat de student het zelf heeft gedaan. Goed summatief toetsen in een tijd van AI vraagt daarom niet om één nieuwe wonderoplossing, maar om bewuste keuzes in toetsvorm, toezicht, observatie en bewijs (Beekman et al., 2025; TEQSA, 2025). (teqsa.gov.au)

Toetsing

Formatieve opdracht

De deelnemer herontwerpt één bestaande summatieve toets uit de eigen onderwijspraktijk tot een sterkere toets voor een tijd van AI. In deze opdracht beschrijft de deelnemer welk leerdoel centraal staat, welk bewijs nodig is, welk deel van de toets onder toezicht of in een begeleide setting plaatsvindt, welke rol kennis speelt, of een casustoets, simulatie of praktijktoets beter past dan het huidige ontwerp, en hoe de beoordeling duidelijk en uitvoerbaar blijft.

Ontwikkelingsgerichte feedbackcriteria

De feedback op deze opdracht richt zich op de vraag of het nieuwe ontwerp daadwerkelijk sterker bewijs geeft van wat de student zelf kent en kan. Daarnaast wordt gekeken of de gekozen toetsvorm past bij het leerdoel, of duidelijk is waar en waarom toezicht nodig is, of kennis een passende plaats krijgt in het ontwerp, en of de toets uitvoerbaar en zorgvuldig beoordeelbaar blijft binnen de eigen mbo- of hbo-context.

Concrete prompts voor het uitvoeren van de prestatie

Hieronder staan voorbeeldprompts die deelnemers kunnen gebruiken om hun herontwerp te ondersteunen.

Prompt 1 – huidige toets analyseren

Ik geef les in [mbo/hbo], opleiding [naam]. Dit is mijn huidige summatieve toets: [beschrijving]. Analyseer in eenvoudige taal welk bewijs ik nu heb dat de student het werk zelf heeft gedaan en waar dat bewijs te zwak is.

Prompt 2 – kennisbasis bepalen

Voor deze leerdoelen [plak leerdoelen] wil ik bepalen welke kennis studenten echt zelf moeten beheersen. Leg uit waarom die kennis belangrijk is en hoe ik die in een summatieve toets zichtbaar kan maken.

Prompt 3 – casustoets ontwerpen

Ontwerp een casustoets voor [mbo/hbo, opleiding] passend bij dit leerdoel: [plak leerdoel]. Maak de casus concreet en zorg dat de student moet analyseren, kiezen en onderbouwen.

Prompt 4 – simulatie of praktijktoets ontwerpen

Ontwerp een summatieve simulatie of praktijktoets voor [opleiding]. Beschrijf wat de student moet doen, wat ik als docent observeer en welke beoordelingspunten belangrijk zijn.

Prompt 5 – mondeling onderdeel afwegen

Ik overweeg een mondeling onderdeel in mijn toets. Zet in eenvoudige taal de voordelen en nadelen op een rij voor mijn context: [beschrijf context].

Prompt 6 – aanwezigheid en deelname formuleren

Help mij formuleren wanneer verplichte aanwezigheid en actieve deelname logisch en verdedigbaar zijn voor deze summatieve toets: [beschrijving toets]. Gebruik eenvoudige taal zonder jargon.

Prompt 7 – bewijsketen zichtbaar maken

Maak voor mijn toetsontwerp een overzicht van waar ik bewijs verzamel: wat zie ik onder toezicht, wat zie ik tijdens het proces en wat zie ik pas in het eindproduct? Hier is mijn ontwerp: [plak ontwerp].

Prompt 8 – toets verbeteren

Geef twee kleine en drie grotere aanpassingen waardoor mijn summatieve toets sterker bewijs geeft dat de student het zelf kan. Dit is mijn huidige toets: [beschrijving].

Bronnen

Attewell, S. (2024, April 22). Exploring AI and assessment – avoid, outrun or embrace. Jisc.
Beekman, K., Draaijer, S., Beckers, J., Schagen, E., & Hofman, I. (2025). Toetsing en examinering in het tijdperk van AI (Handreiking 1). Npuls.
Dawson, P. (2022). Strategies for using online invigilated exams. TEQSA.
Nallaya, S., Gentili, S., Weeks, S., & Baldock, K. (2024). The validity, reliability, academic integrity and integration of oral assessments in higher education: A systematic review. Issues in Educational Research, 34(2), 629–646.
Npuls. (2025, May 27). Visie op toetsing, examinering en AI + handreikingen. Npuls.
Tertiary Education Quality and Standards Agency. (2025). Enacting assessment reform in a time of artificial intelligence. TEQSA.

COLOFON en disclaimer

Deze website is ontwikkelt door Allard Strijker. Zie www.allardstrijker.nl voor meer infomatie en achtergrond. De website is ontwikkelt als showcase AI. De teksten zijn dus ook hoofdzakelijk gegenereerd door AI, de inhoud is gecontroleerd op fouten en hersteld waar nodig. Gebruik is volledig op eigen risico.

Promptverantwoording

De prompt om de inhoud te genereren is als volgt, persoonlijke instellingen en eerdere resultaten daargelaten. Resultaten in het verleden geven dus geen garantie voor de toekomst en mijn resultaten zullen niet overeenkomen met gebruikers van anderen. Zie ook basis AI kennis.

Prompt

Werk Thema [nummer en titel] uit voor een online cursus over AI en toetsing voor mbo- en hbo-docenten met minimale AI-kennis.

Gebruik exact deze structuur:

- Introductie

- Leerresultaten

- Prestatie

- Prestatie-indicatoren

- Inhoud

- Toetsing

- Concrete prompts voor het uitvoeren van de prestatie

- Bronnenlijst in APA 7

Eisen:

- eenvoudige, concrete taal

- geen abstracte beleidstaal

- expliciete koppeling tussen thema en prestatie

- voorbeelden uit mbo en hbo

- APA-verwijzingen in de lopende tekst

- volledige APA-bronnenlijst achteraf

- direct bruikbaar in een online cursus of LMS

- concrete voorbeeldprompts voor Copilot

Page updated

Google Sites

Report abuse