Bitverslag
Hoofstuk 10.1 tm 10.12
10.1
B
Paragraaf 10.1 gaat in op het belang van evaluatie met betrekking tot het leergedrag van ll. Het hoofdstuk beperkt zich tot de cognitieve doeldomeinen. In het bijzonder wordt gekeken naar objectieve evaluatie middelen. Een interessant punt vind ik dat het beoordelen van scripties moeilijk subjectief te beoordelen is.
I
Wiskunde is in mijn ogen een vak wat over het algemeen goed subjectief is te beoordelen. Afgezien van het feit dat ll. tegenwoordig ook Gwa’S en praktische opdrachten moeten uitvoeren. Nu is mij gebleken, na de opdracht een proefwerk nakijken dat zelfs bij een ogenschijnlijk objectieve toets er toch veel ruimte overblijft voor discussie.
T
Wat betreft gwa’s en praktische opdrachten zou ik deze laten beoordelen door een collega. Net als bij dit project is het een goed idee om leerlingen hun resultaten te plaatsen op een blog. Bovendien is het in mijn ogen belangrijk om een goede rubric op te stellen, zodat ll. weten of er beoordeeld wordt en op welke punten.
10.2
B
Vier aspecten van beoordelen worden besproken zijnde, meten, normeren, waarderen en beslissen. Bij het meten is de precisie en validiteit van groot belang. Een belangrijk punt in normering is de grens tussen voldoende en onvoldoende. Stel je deze grens vooraf of achteraf? Een goede beslissing die voortkomt uit de normering en waardering moet betrouwbaar en nauwkeurig zijn.
I
De validiteit vind ik een lastig punt, hoe meet je deze? De precisie staat of valt met een goed correctie voorschrift. Beslissingsregels zijn niet alleen van toepassing op een toets maar ook op de totale prestaties die uitmonden in een rapportcijfer of beslissing over overgaan of blijven zitten.
T
Op het punt van normeren geef ikzelf de voorkeur aan absoluut normeren. Bij relatief normeren bestaat het gevaar voor niveau daling. Verwachtingen worden naar beneden bijgesteld, dat heeft invloed op het leergedrag van de ll. Van belang is natuurlijk dat de toets valide is dus betrekking heeft op hetgeen geleerd moest worden.
10.3
B
De gebruikswijzen van beoordelingsresultaten wordt onderscheiden in”tussentijdse feedback op leerprestaties” en “selectief gebruik”. Bij tussentijdse feedback wordt gesproken over formatieve evaluatie, bedoeld om lacunes op te sporen en het leerproces dientengevolge te sturen. De selectieve normering wordt summatief genoemd.
I
Beoordeling die formatief is zou niet mogen meetellen bij het vaststellen van rapportcijfers .Het spreekt voor zich dat selectieve beoordeling een hoge graad van objectiviteit en nauwkeurigheid moet hebben. In toenemende mate naarmate de beslissing meer consequenties heeft. Er is een belangrijk verschil tussen een toets resultaat en een eindexamen beoordeling
T
Het begrip formatieve beoordeling is nieuw voor mij. In de praktijk zou dit toepasbaar kunnen zijn door ll. tussen toetsen en overhoringen. Te testen op hun kennis gedurende een les zou je een proeftoets kunnen geven en vervolgens ll elkaars werk laten nakijken aan de hand van een klassikale bespreking. Dit kan door de docent gebruikt worden voor de onderwijsevaluatie.
10.4
Er zijn een aantal middelen om leerprestaties te evalueren, mondelinge toets, schriftelijke toets, schriftelijke opdrachten, presentaties, spelvormen, actie opdrachten en rapportage van verrichte activiteiten.
I
De schrijvers concluderen dat de meeste van deze beoordelingsvormen moeilik of niet objectief zijn te beoordelen.
T
Aansluitend op de conclusie zijn een aantal van de evaluatievormen niet bruikbaar voor wiskunde. Zo vind ik de actieopdrachten weinig geschikt. In mijn ogen moet je proberen wiskunde zo objectief mogelijk te beoordelen, wiskunde is immers een exact vak. Met de invoering van praktische opdrachten vindt er in mijn ogen al genoeg subjectieve normering plaats.
10.5.1
B
Validiteit en betrouwbaarheid zijn de belangrijkste kwaliteitseisen voor de normering. Valide is een toets wanneer hetgeen getoetst wordt betrekking heeft tot de leerdoelen. De validiteit onderscheid zich in inhouds- en vorm validiteit.
I
Bijna vanzelfsprekend lijkt de inhoudsvaliditeit. Je stelt geen vragen over stof die niet geleerd is. De vormvaliditeit vind ik een belangrijk aandachtspunt. Zeker bij wiskunde moet hier goed op gelet worden. Het gevaar bestaat bij contextrijke opgaven dat je niet zozeer de wiskunde dan wel de taalvaardigheid test.
T
Met betrekking tot de inhoudsvaliditeit is het van belang ll. vooraf de leerdoelen kenbaar te maken. Dit zou ik ieder les doen door deze op het bord te schrijven. LL zijn verplicht deze op te schrijven. De vormvaliditeit is lastiger maar niet onbelangrijk.. Zorg dat je in context opgaven je zoveel mogelijk beperkt tot het geven van relevante informatie. De toetsmatrijs is een handig middel voor de docent om vast te stellen of hij daadwerkelijk alle of zoveel mogelijk leerdoelen toets.
10.5.2
B
“Met betrouwbaarheid van een evaluatiemiddel wordt bedoeld de mate van nauwkeurigheid, waarmee het leerresultaten meet”(citaat blz 326). Van invloed op de kwaliteit zijn hierbij de kwaliteit van het evaluatie middel, de afname situatie en de nakijkprocedure.
I
Ten aanzien van de kwaliteit is het van belang dat zoveel mogelijk getoetst wordt en niet slechts een van de leerdoelen genoeg vragen is hierbij het credo. Bovendien is een eenduidige formulering van vragen noodzakelijk. De afname situatie is vanzelfsprekend van belang. Een ll moet niet afgeleid worden tijdens het maken van toetsen of bij het krijgen van een overhoring of beurt. De leerling moet ook voldoende tijd hebben. De nakijk procedure verdient speciale aandacht, omdat er nogal wat factoren zijn die dit beïnvloeden . De volgende paragraaf gaat hier wat dieper op in.
T
Het stellen van voldoende vragen komt de betrouwbaarheid ten goede, het is echter wel van belang om rekening te houden met de beschikbare tijd omdat anders de afname situatie negatief wordt beïnvloed. Frequent toetsen verhoogt de betrouwbaarheid, hierbij is een aandachtpunt dat je niet alleen maar moet toetsen maar ook doceren. Ik zie formatieve toetsing als een belangrijk hulpmiddel
10.5.2.1
B
Er worden 5 beoordelingseffecten benoemd. Norminstabiliteit en persoonlijke beoordelingstendentie, uitstralingseffect, opvattingeffect, volorde effect, contaminatie effect.
I
De norminstabiliteit heeft betrekking het verschuiven van het beoordelingeffect.. Dit kan worden veroorzaakt door bv vermoeidheid maar heeft ook betrekking tot verschil in normen tussen verschillende beoordelers. Het uitstralingseffect heeft betrekking tot bijzaken zoals handschrift, netheid reputatie van de leerling en eventuele gevoelens van sympathie of antipathie jegens de ll. Het opvattingeffect bestaat uit het verschil van belang wat wordt gehecht aan de verschillende aspecten van de prestatie. Het volgorde effect is van negatieve invloed als gekeken wordt naar voorgaande prestaties en die mee worden gewogen in de beoordeling. Het contaminatie effect is in mijn ogen een vorm van bedrog die een docent hanteert om prestaties te flatteren of overwaarderen ten behoeve van zijn eigen prestatie.
T
Een aantal maatregelen die ik zelf zou nemen om genoemde effecten zoveel mogelijk te elimineren zijn: Het daar waar mogelijk zoveel mogelijk een absolute normering hanteren. Proefwerken per opgave nakijken en de volgorde van ll. tijdens het nakijken te variëren. Verder is een goed overleg met collega’s noodzakelijk om de leerdoelen en evaluatie vormen zoveel mogelijk op elkaar af te stemmen. Dit zou de negatieve invloed van het contaminatie effect moeten beheersen.
10.5.2.2
B
Bij wenken om de betrouwbaarheid te evalueren worden onderscheiden, de kwaliteit van het evaluatiemiddel, de afnamesituatie en de beoordeling
I
De kwaliteit bestaat uit voldoende vragen die per onderwerp zijn gerangschikt. Bovendien moeten de vragen geen antwoord geven op eerdere of latere vragen. De afname situatie moet niet nieuw zijn, hiermee wordt bedoeld dat ll. Vertrouwd moeten zijn met de manier van vragen. Er moet voldoende tijd zijn en ll hebben er baat bij om op gezette tijden te weten hoe lang ze nog hebben Met betrekking tot de beoordeling is een gedetailleerd scoringsvoorschrift op voorhand op te stellen. Het verdient de voorkeur werk door twee personen te laten beoordelen.
T
Een belangrijk aandachtspunt is de hoeveelheid vragen versus de beschikbare tijd. Het laten nakijken door een tweede persoon zou plaats kunnen vinden tijdens de klassikale bespreking van een toets. Ik heb dit zelf altijd als positief ervaren. De leerling kijkt nl nogmaals zorgvuldig naar het gemaakte en nagekeken werk. De leerling zal zijn aandacht erbij houden er zijn immers eventueel punten te behalen. De docent op zijn beurt zal bij het corrigeren nauwkeurig te werk moeten gaan, zijn werk wordt immers beoordeeld.
10.6
B
Welk evaluatie middel gekozen wordt hangt af van een aantal factoren subjectieve of objectieve beoordeling, wie beoordeelt het werk, hoeveel beoordelers, is de beoordeling globaal of analytisch en is de beoordeling individueel of is het een groepsbeoordeling.
I/T
Bij repetities is het van belang vooraf een gedetailleerd correctie voorschrift op te stellen om de objectiviteit te vergroten. Multiple choice lijkt mij overigens geen geschikte toetsvorm voor wiskunde. Bij een groepsopdracht zou ik een groepscijfer toekennen en de leerlingen onderling de punten laten verdelen. De zelfevaluatie vind ik interessant en zou ik toepassen door in de les voorafgaand aan de toets , ll. te vragen wat ze denken voor een cijfer ze denken te halen. Of je analytisch of globaal beoordeelt hangt af van de evaluatievorm. Groepsopdrachten kunnen meer globaal worden beoordeeld. Repetities/ overhoringen moeten in mijn ogen zoveel mogelijk analytisch worden beoordeeld.
10.7
B
Mondelinge toetsing is doorgaans minder objectief dan een toetsing met gesloten vragen. Verschillende factoren zijn hier de oorzaak van de in 10.5.2.1 factoren spelen hierbij een rol.
I
Om tot een goed mondelinge toetsing te komen verdienen een aantal punten aandacht. Het begint vanzelfsprekend bij het op het gemak stellen van de ll. Je kunt beginnen met en algemene vraag waarvan e nagenoeg zeker bent dat de ll. hem goed beantwoordt. Stel een lijst op met kernbegrippen en stel hieruit de vragen. Noteer de beoordeling van de beantwoorde vragen gedurende de overhoring. Zorg voor heldere ondubbelzinnige formulering van de vragen. Hou de vragen kort en kernachtig. Stel vooraf goed vast wat je wilt toetsen en laat je niet afleiden door de antwoorden.
T
Mondelinge toetsing bij wiskunde zou plaats kunnen vinden met betrekking tot gebruik van hulpmiddelen. Demonstreer hoe je met behulp van een passer de bissectrice van een hoek bepaalt is hier een voorbeeld van. Ik zie overigens niet vel mogelijkheden voor het toepassen van mondelinge toetsing bij wiskunde. Wellicht wat suggesties van medestudent.
10.8
B
Open vragen met als tegenhanger gesloten vragen
I
Open vragen verdienen de voorkeur. Open vragen zijn er in de vorm van korte vagen en lange vragen
T
Gesloten vragen kun je een open karakter kunnen geven door ll het antoord te laten motiveren. “ Jan zegt dat…” klopt dit zoniet geef dan aan waar Jan fout zit. Verder is wiskunde bij uitstek een vak voor open vragen.
10.8.1
B
Richtlijnen voor open vragenondubbelzinnige vraagstelling, waarbij je aangeeft hoe lang het antwoord ongeveer moet zijn. Stel onafhankelijke vragen. Splits complexe vragen op. Van belang hierbij is zijn de vormvaliditeit en de inhoudsvaliditeit
I/T
Ll meten zich goed bewust zijn van het feit dat in de wiskunde het antwoord van ondergeschikt belang is ten aanzien van de manier waarop je tot het antwoord komt. Voor de docent is het belangrijk een complexe vraag warbij verschillende berekeningen/redeneringen moeten worden gemaakt op te splitsen. Zodanig dat de voorgaande stap een aanwijzing geeft hoe tot het volgende antwoord gekomen moet worden, zonder het antwoord hierbij te verraden.
10.8.2
B/I
Bij het nakijken een een gedetailleerde antwoord sleutel van belang. Een scoringsvoorschrift opstellen, hoeveel punten per vraag. Hoe waardeer/ bestraf je fouten die niet rechtstreeks tot de leerdoelen behoren zoals netheid en spellingfouten.
T
Bij de toets aangeven hoeveel punten er per onderdeel zijn te verdienen . Spellingfouten tel ik, al zou ik het wel aangeven. Dit alleen ter lering niet ter beoordeling. Bij twijfel hulp inroepen van een collega.
10.8.3
B/I
Open vragen verdienen over het algemeen de voorkeur. Niet in de laatste plaats omdat dit het construerend leren bevordert. Een nadeel is dat een antwoord verschillend kan worden gegeven. Hierbij komt de objectiviteit van de beoordeling in gevaar.
T
Het opstellen van een gedetailleerde antwoordsleutel is van essentieel belang
10.9
B
Gesloten vragen hebben een aantal verschijningsvormen, rangschikvragenSorteervragen, meerkeuzvragen en juist of onjuist vragen
I/T
Bij het stellen van gesloten vragen zal ik altijd om een motivatie vragen om te kunnen zien of het niet een zuivere gok is
10.9.1
B/I
Gesloten vragen zijn met betrekking tot de correctie objectief, mits er niet om motivatie van het antwoord wordt gevraagd. De vragen dienen vooraf wel aan een goede kwaliteitsbeoordeling worden onderworpen.
T
Hoewel de objectiviteit bij gesloten vragen in het gedrang komt bij het motiveren van het antwoord vind ik wel dat het plaats moet vinden.
10.9.2
B
Meerkeuzevragen hebben een grote vlucht genomen sinds de jaren 70Dit om maatstaven te uniformeren.
I/T
Een nobel doel maar persoonlijk vind ik meerkeuze vragen niet geschikt voor wiskunde en zal dit dus ook zoveel mogelijk nalaten
10.9.2.(1,2,3)
B
De analyse van gegeven antwoorden vind plaats met zgn. p waarden en a waarden. De P waarde vertegenwoordigt het percentage ll. Dat de vraag goed het beantwoord. De a waarde geeft aan hoe aantrekkelijk de andere antwoorden (afleiders) waren.
I/T
Opmerkelijk vond ik de conclusie dat acceptabele a waarden tussen de .1 en .4 liggen.
Volgens mij kun je dit niet zo eenvoudig stellen bij een meerkeuze vraag waarbij 4 opties zijn zou een antwoord met a waarde .4 resulteren in .6 te verdelen over de resterende a waardes en P waarde. Dit zal resulteert in een P waarde die waarschijnlijk onder de hoogste a waarde ligt. .4 voor een a waarde lijkt mij daarom te hoog.
10.10
B
Het objectief beoordelen van een werkstuk is geen eenvoudige opgave. Zoals terrecht gesteld is de gevarieerde uitwerking van de opdracht hier debet aan. Het gevaar van subjectiviteit is levensgroot aanwezig, zo kunnen er verschillen in pvatting zijn, de uitstraling van het geleverde werk kan verstorend werken en niet in de laatste plaats verschil in strengheid van aangelegde normen. Voorts kan een werkstuk analystisch of globaal worden beoordeeld. Waarbij de analytische beoordeling veel tijd vergt. Natuurlijk kan er ook gekozn worden voor een tussenvorm. Als hoofddimensies voor een werkstuk beoordeling worden genoemd, Qua vorm, vormtechnische en communicatieve aspecten, qua inhoud, correspondentie tussen vormaspecten en inhoud, probleemstelling , argumentatie,en tot slot vakinhoudelijke aspecten.
I/T
Gwa’s/werkstukken komen ook bij wiskunde voor. Ik zie dit als zeer nuttig omdat hierbij vakoverstijgend wordt opgetreden, iets dat wiskunde extra zingeving geeft. Terecht wordt opgemerkt dat de objectiviteit hierbij onder druk komt te staan. Het is daarom van belang een gedetailleerde rubric te maken, zodat leerlingen weten waar het werk aan moet voldoen. Het laten beoordelen door een collega zie ik als nuttig al heb je hier natuurlijk wel medewerking bij nodig. Persoonlijk zou ik in de beoordeling zoveel mogelijk analytisch te werk willen gaan. De lijst met beoordelingsaspecten is hierbij bijzonder praktisch. Hoef je in ieder geval het wiel niet helemaal uit te vinden. Deze lijst is zeer bruikbaar bij het maken van een goede rubric.
10.11
B
De vraag die aan bod komt is normeer je relatief of absoluut. Absoluut betekent dat er genormeerd wordt aan de hand van een vooraf opgestelde norm.Relatief betekend dat je vooraf een beeld vormt van het gemiddelde resultaat. De behaalde resultaten worden aangepast aan de verwachting.
I/T
Beide vormen hebben nadelen. Zo kan een absolute normering leiden tot een onaangename verassing als blijkt dat er ruim onder of boven je verwachting wordt gescoord. Een relatieve normering kan zelfbedrog (zowel leraar als leerling) in de hand werken. Een ander gevaar dat op zou kunnen treden is dat leerlingen uit maken wat de leerdoelen zijn, als iedereen beslist iets niet te leren stelt de docent de eisen wel bij. Een te rigide houding bij absolute normering brengt echter het gevaar met zich me dat de afstand tussen docent en ll. Te groot wordt.” Het maakt niet uit wat ik zeg, de docent luistert toch niet”. Hoewel mijn persoonlijke voorkeur uitgaat naar een absolute waardering, zal ik als beginnend docent de relatieve waardering vaker toepassen. De derde vorm van normering zal ik in de praktijk dan ook toepassen waarbij gebruikmakend van het overzicht op pagina 363 een goede afweging gemaakt kan worden.
10.12
B
Het toekennn van cijfers is geen exacte wetenschap hoewel bijvoorbeeld gesloten vragen objectief beoordeeld kunnen worden, hoeft het toegekende cijfer dat nog niet te zijn. Verschillen ontstaan door, een verschil in het percentage van toegekende voldoendes, de spreiding van cjifers hoe vaak telt iets mee, het contaminatie effect en tot slot de berekening van het raportcijfer.
I/T
Het toekennen van cijfers is dus geen wet van meden en perzen. Er moet binnen de secties daarom ook een zekere overeenstemming zijn van hoe er wordt beoordeeld. De 10 puntenschaal heeft mijn voorkeur, sterker nog de toekenning van voldoendes, ruim voldoendes, goed, etc.. vind ik gerommel in de marge. Tot mijn spijt wordt dit kleutersysteem ook op onze opleiding gehanteerd. Zeker bij een vak als wiskunde vind ik dat schandalig. De aanbevelingen om tot betere cijfering te komen zijn deels bruikbaar, maar de opmerking wie het verschil tussen zeer onvoldoende cijfer 3, slecht cijfer 2 en zeer slecht cijfer 1 kan aangeven mag de vinger opsteken. Bij deze dien ik van repliek als je het verschil niet kent tussen 1,2,of 3 moet je leren tellen. Ik vind dat er gewoon gecijferd moet worden tussen 1 en 10. Dat rapportage over schoolvorderingen omzichtig moet worden omgegaan vind ik een bruikbare tipveel van dit soort boodschappen zijn vaak onuitvoerbare opdrachten. Doe beter je best is hier een mooi voorbeeld van. Het lijkt duidelijk maar geeft geen invulling aan hoe dat gedaan moet worden. Laat de cijfers maar spreken hieruit kan de leerling zelf de connclussies trekken.