Veel docenten merken dat sommige vertrouwde opdrachten door generatieve AI minder bruikbaar zijn geworden als enig bewijs van wat een student zelf kent en kan. Dat betekent niet dat alles “niet meer kan”, maar wel dat een aantal toetsvormen niet meer vanzelfsprekend sterk genoeg is. Vooral opdrachten die generiek, voorspelbaar en volledig thuis uitvoerbaar zijn, kunnen nu vaak met AI behoorlijk worden ingevuld zonder dat duidelijk wordt hoeveel begrip of vaardigheid de student zelf heeft opgebouwd. Recente handreikingen van Npuls benadrukken daarom dat toetsing opnieuw moet worden bekeken vanuit leerdoelen, toetskwaliteit en zichtbaar leren, in plaats van alleen vanuit controle achteraf (Beekman et al., 2025b; Npuls, 2025). (Npuls)
Tegelijk is het beeld niet somber. Er zijn nog steeds veel toetsvormen die goed werken, zeker wanneer een docent bewust kiest voor een passende combinatie van opdracht, context, begeleiding en verificatie. Jisc beschrijft daarbij drie bruikbare richtingen: AI vermijden in bepaalde toetsmomenten, toetsvormen ontwerpen die minder gemakkelijk door AI zijn over te nemen, of AI juist bewust integreren als onderdeel van het leren. Npuls sluit daarbij aan en maakt duidelijk dat het doel niet is om toetsing “AI-proof” te maken, maar om toetsing eerlijk, valide en leerdoelgericht te houden in een onderwijspraktijk waarin AI normaal is geworden (Attewell, 2024; Beekman et al., 2025a). (Jisc)
In dit thema leren deelnemers dus niet alleen welke toetsvormen kwetsbaar zijn, maar vooral waarom dat zo is en hoe zij sterkere alternatieven kunnen ontwerpen voor mbo en hbo. Het thema helpt docenten om realistische keuzes te maken in hun eigen praktijk, zonder te vervallen in simplistische oplossingen zoals “alles mondeling” of “alles verbieden” (Attewell, 2024; Beekman et al., 2025b). (Jisc)
Na afloop van dit thema kan de deelnemer:
uitleggen waarom sommige bestaande toetsvormen door generatieve AI kwetsbaarder zijn geworden;
benoemen welke kenmerken een toets kwetsbaar maken;
voorbeelden geven van toetsvormen die in een AI-rijke context sterker blijven werken;
onderscheid maken tussen AI vermijden, AI begrenzen en AI integreren;
een bestaande toets uit de eigen praktijk analyseren op kwetsbaarheid en verbetermogelijkheden.
De deelnemer maakt een AI-kwetsbaarheidsanalyse van één bestaande toets uit de eigen onderwijspraktijk.
De AI-kwetsbaarheidsanalyse is voldoende wanneer de deelnemer:
één bestaande toets duidelijk beschrijft;
benoemt welke onderdelen van die toets kwetsbaar zijn voor generatieve AI;
uitlegt waarom die onderdelen kwetsbaar zijn;
minimaal twee onderdelen aanwijst die bruikbaar kunnen blijven;
per onderdeel een beargumenteerde keuze maakt: behouden, aanpassen of vervangen;
ten minste twee concrete verbeteringen formuleert die passen bij de eigen mbo- of hbo-context.
Niet elke toets is ineens onbruikbaar geworden, maar sommige vormen zijn wel minder sterk als ze volledig leunen op een product dat thuis, individueel en zonder zicht op het proces wordt gemaakt. Denk aan een generiek essay, een standaard reflectieverslag, een samenvatting van theorie of een thuisopdracht met voorspelbare vragen. Zulke opdrachten zijn vaak relatief gemakkelijk door AI te ondersteunen of zelfs grotendeels te genereren. Het probleem is dan niet alleen dat een student AI kan gebruiken, maar vooral dat de docent onvoldoende kan zien welk deel van de prestatie echt van de student zelf komt. Npuls beschrijft daarom dat AI het leren van studenten niet volledig mag overnemen en dat onderwijskwaliteit en toetsintegriteit behouden moeten blijven (Beekman et al., 2025b). (Npuls)
Voor mbo-docenten kan dit bijvoorbeeld spelen bij een standaard reflectieverslag over stage-ervaringen, zeker als de opdracht algemeen geformuleerd is. Voor hbo-docenten speelt hetzelfde bij een generieke analyseopdracht of thuisessay over een bekend onderwerp. In beide gevallen kan de tekst overtuigend ogen, terwijl niet goed zichtbaar is of de student echt begrijpt wat hij of zij inlevert. Dat is precies waarom “een nette tekst” niet meer automatisch gelijkstaat aan een sterke toetsprestatie (Beekman et al., 2025b; Npuls, 2025). (Npuls)
Sterker blijven toetsvormen waarin de student iets moet laten zien dat moeilijker los te koppelen is van de eigen denkwijze, context of uitvoering. Dat kan bijvoorbeeld een praktijksimulatie zijn, een beroepshandeling met observatie, een mondelinge toelichting, een product met tussentijdse feedbackmomenten, een lokale casus of een opdracht waarin de student keuzes moet verantwoorden op basis van eigen waarnemingen, actuele context of concreet verzamelde gegevens. Jisc noemt hierbij onder meer gecontroleerde afnames, video-inzendingen en mondelinge vormen wanneer AI juist even niet beschikbaar moet zijn, maar ook authentieke taken waarin AI bewust een rol kan krijgen (Attewell, 2024). (Jisc)
Voor mbo kan een sterk alternatief bijvoorbeeld zijn: een student voert een handeling uit in een gesimuleerde praktijksituatie en licht daarna mondeling toe waarom bepaalde keuzes zijn gemaakt. Voor hbo kan dat een beroepsproduct zijn met een korte verdediging, een lokaal praktijkonderzoek met eigen data, of een ontwerpopdracht in meerdere fasen. Zulke toetsvormen geven niet automatisch volledige zekerheid, maar ze maken het wel veel makkelijker om individuele beheersing zichtbaar te krijgen dan een enkel thuis geschreven document (Beekman et al., 2025a, 2025b). (Npuls)
Een bruikbare manier om naar toetsing te kijken is de driedeling van Jisc: avoid, outrun, embrace. In deze cursus vertalen we dat naar drie eenvoudige docentkeuzes. De eerste keuze is AI vermijden: je kiest dan voor een toetsmoment waarbij AI niet beschikbaar is of geen rol speelt, bijvoorbeeld in een begeleide setting, een mondeling gesprek of een live uitvoering. De tweede keuze is AI begrenzen: je ontwerpt de taak zo dat generatieve AI minder makkelijk het kernwerk kan overnemen, bijvoorbeeld door te werken met lokale context, fysieke uitvoering, tussenproducten of actuele gegevens. De derde keuze is AI integreren: je laat AI bewust toe als hulpmiddel of gesprekspartner en maakt vervolgens deel van de beoordeling hoe kritisch en verantwoord de student daarmee omgaat (Attewell, 2024). (Jisc)
Geen van deze drie keuzes is altijd de beste. Jisc benadrukt juist dat er geen oplossing is die voor alle vakken en opleidingen werkt. De keuze hangt af van het leerdoel, het niveau van de student, de beroepscontext en de vraag welk bewijs je echt nodig hebt. Npuls sluit daarbij aan: AI-integratie mag nooit een doel op zich zijn, maar moet altijd ten dienste staan van het leerdoel en de kwaliteit van toetsing (Attewell, 2024; Beekman et al., 2025a). (Jisc)
Voor de eigen praktijk betekent dit dat docenten niet moeten vragen: “Welke toets is nog helemaal veilig voor AI?” Een sterkere vraag is: “Welk bewijs wil ik van mijn student zien, en onder welke AI-condities moet dat gebeuren?” Dat is een kleine verschuiving in formulering, maar een grote verschuiving in denken. De focus gaat dan niet meer alleen naar de tool, maar naar het soort leren en het soort bewijs dat telt (Beekman et al., 2025a, 2025b). (Npuls)
In mbo-onderwijs zal dat vaak betekenen dat sterker wordt aangesloten bij beroepshandelingen, werkprocessen, observaties en korte toelichtingen. In hbo-onderwijs zal vaker gekeken worden naar beroepsproducten, professionele afwegingen, ontwerpprocessen en mondelinge verdediging. In beide sectoren helpt het om toetsen minder generiek, minder voorspelbaar en minder volledig “eindproductgericht” te maken. Ook helpt het om studenten vooraf duidelijk te vertellen wat wel en niet mag met AI, zodat toetsing niet alleen eerlijker wordt, maar ook transparanter (Beekman et al., 2025b; Npuls, 2025). (Npuls)
Maak een AI-kwetsbaarheidsanalyse van één bestaande toets uit jouw eigen onderwijscontext van ongeveer 1 tot 2 pagina’s.
Beantwoord daarin deze vijf vragen:
Welke toets analyseer je?
Welke onderdelen van deze toets zijn kwetsbaar voor generatieve AI?
Welke onderdelen zijn nog bruikbaar of sterk?
Welke keuze maak je per onderdeel: behouden, aanpassen of vervangen?
Welke twee concrete verbeteringen zou jij als eerste doorvoeren?
De feedback op deze opdracht richt zich op:
helderheid: beschrijf je de toets en de kwetsbaarheden begrijpelijk en concreet;
onderbouwing: leg je uit waarom iets kwetsbaar of juist sterk is;
passendheid: sluiten je verbetervoorstellen aan op jouw mbo- of hbo-context;
realiteitszin: zijn je verbeteringen uitvoerbaar voor docent en student;
toetskundig inzicht: laat je zien dat je denkt vanuit leerdoel en bewijs van beheersing.
Hieronder staan voorbeeldprompts die deelnemers kunnen gebruiken. Het doel is niet om de AI de analyse te laten overnemen, maar om het eigen denken te structureren en aan te scherpen.
Ik ben docent in het [mbo/hbo] en gebruik deze toets: [beschrijf de toets]. Analyseer welke onderdelen van deze toets kwetsbaar zijn voor generatieve AI. Leg per onderdeel in eenvoudige taal uit waarom.
Geef mij een praktische checklist met kenmerken van een toets die kwetsbaar is voor generatieve AI. Schrijf de checklist voor docenten met weinig AI-kennis.
Ik geef les in [opleiding/vak]. Noem 8 toetsvormen die in mijn context sterker kunnen werken dan een generieke thuisopdracht. Licht per vorm kort toe waarom.
Ik geef les in het mbo binnen [opleiding]. Geef drie voorbeelden van kwetsbare toetsvormen en zet daar drie sterkere alternatieven tegenover die beter passen in een AI-rijke onderwijscontext.
Ik geef les in het hbo binnen [opleiding]. Geef drie voorbeelden van kwetsbare toetsvormen en zet daar drie sterkere alternatieven tegenover die beter passen in een AI-rijke onderwijscontext.
Hier is mijn bestaande toets: [beschrijving]. Maak een tabel met drie kolommen: behouden, aanpassen en vervangen. Plaats de onderdelen van mijn toets in één van die kolommen en geef per onderdeel een korte reden.
Herschrijf deze toets niet volledig, maar geef mij twee kleine en twee grotere verbeteringen om deze toets minder kwetsbaar te maken voor generatieve AI: [beschrijving toets].
Maak een korte conceptinstructie voor studenten bij deze toets: wat mogen zij wel doen met AI, wat niet, en wat moeten zij vermelden? Houd de taal eenvoudig en duidelijk.
Attewell, S. (2024, April 22). Exploring AI and assessment – avoid, outrun or embrace. Jisc.
Beekman, K., Draaijer, S., Beckers, J., Schagen, E., & Hofman, I. (2025a). Aanpakken voor het ontwerpen van AI-gedreven toetstaken (Handreiking 3). Npuls.
Beekman, K., Draaijer, S., Beckers, J., Schagen, E., & Hofman, I. (2025b). Toetsing en examinering in het tijdperk van AI (Handreiking 1). Npuls.
Npuls. (2025, May 27). Visie op toetsing, examinering en AI + handreikingen. Npuls.
Deze website is ontwikkelt door Allard Strijker. Zie www.allardstrijker.nl voor meer infomatie en achtergrond. De website is ontwikkelt als showcase AI. De teksten zijn dus ook hoofdzakelijk gegenereerd door AI, de inhoud is gecontroleerd op fouten en hersteld waar nodig. Gebruik is volledig op eigen risico.
De prompt om de inhoud te genereren is als volgt, persoonlijke instellingen en eerdere resultaten daargelaten. Resultaten in het verleden geven dus geen garantie voor de toekomst en mijn resultaten zullen niet overeenkomen met gebruikers van anderen. Zie ook basis AI kennis.
Werk Thema [nummer en titel] uit voor een online cursus over AI en toetsing voor mbo- en hbo-docenten met minimale AI-kennis.
Gebruik exact deze structuur:
- Introductie
- Leerresultaten
- Prestatie
- Prestatie-indicatoren
- Inhoud
- Toetsing
- Concrete prompts voor het uitvoeren van de prestatie
- Bronnenlijst in APA 7
Eisen:
- eenvoudige, concrete taal
- geen abstracte beleidstaal
- expliciete koppeling tussen thema en prestatie
- voorbeelden uit mbo en hbo
- APA-verwijzingen in de lopende tekst
- volledige APA-bronnenlijst achteraf
- direct bruikbaar in een online cursus of LMS
- concrete voorbeeldprompts voor Copilot