De wereldwijde protesten na de dood van George Floyd, Riah Milton en Dominique Fells hebben inclusiviteit, gendergelijkheid en het uitbannen van racisme stevig op vele agenda’s gezet. De arbeidsmarkt is van oudsher een plek waar bewust en onbewust veel discriminatie plaatsvindt. Ook in Nederland. Vaak wordt geroepen: laat sollicitanten capaciteitentesten doen, daarmee voorkom je bias! Maar dat is wellicht te gemakkelijk. Want: zijn deze testen zelf wel zo objectief?
Een manager kiest bijvoorbeeld ‘per ongeluk’ voor de kandidaat die aan dezelfde hogeschool heeft gestudeerd, dezelfde interesses heeft, of dezelfde etniciteit heeft als hij- of zijzelf. Zoals Michelle Stratemeyer, een diversiteit- en inclusieonderzoeker aan de Universiteit van Melbourne het zegt: “We geven de voorkeur aan mensen die op een of andere manier op ons lijken en waar we onszelf in zien.”
Mensen geven (deels onbewust) de voorkeur aan anderen waar ze zichzelf op een of andere manier in terug zien
- Michelle Stratemeyer, onderzoeker Universiteit van Melbourne
Een assessment met capaciteitentesten wordt regelmatig genoemd als bewijs dat een organisatie niet oneerlijk discrimineert op factoren zoals etniciteit, geslacht, gender of leeftijd. Daarmee zouden assessments bijdragen aan een diverser personeelsbestand en een eerlijkere arbeidsmarkt.
Klinkt heel positief natuurlijk. Die relatie is echter niet een-op-een: assessmenttesten kunnen zelf ook bevooroordeeld zijn, bijvoorbeeld gericht op het Nederlandse perspectief. Zo kunnen de taken in een test een culturele component bevatten of school-capaciteiten en werkwijzen toetsen die hier op school gangbaar zijn, maar elders in de wereld niet.
Bij assessments gaat het om het voorspellen van functioneren. Als een test vragen bevat die door kandidaten met een andere (culturele) achtergrond anders opgevat of minder goed begrepen worden, dan beïnvloedt dat de resultaten. Voorspellen de resultaten daardoor een bepaald criterium minder goed, dan benadeelt de test dus die groep. Deze verschillen in resultaten worden dan veroorzaakt door de test. Er zijn overigens ook verschillen in testresultaten die echt veroorzaakt worden door cultuur. Cultuur beïnvloedt bijvoorbeeld persoonlijkheid en wat men ziet als sociaal wenselijk gedrag.
Ook goed om te weten is dat bepaalde testen verschillen per land of wereldregio, bijvoorbeeld IQ-testen. De IQ-score wordt door velen gezien als DE meetlat om intelligentie te meten. Maar iemands IQ-score is niet per definitie gelijk aan iemands intelligentie. Om maar bij de meetlat-metafoor te blijven: op de liniaal (test) in het ene land valt de IQ-centimeter net wat groter uit dan op de liniaal in het andere land. Dat zorgt er dus voor dat je IQ-score kan verschillen per test en per land.
Maar met alleen het kiezen van een faire test voor de juiste wereldregio zijn we er nog niet. Om iemands niveau van werken te voorspellen, worden scores op assessmenttesten altijd vergeleken met een normgroep. Dus je IQ of de mate waarin je een bepaalde persoonlijkheidstrek hebt, wordt altijd bekeken ten opzichte van een grote groep anderen. Als het gaat om eerlijkheid in de interpretatie van een test is dus ook de normgroep waar je iemand mee vergelijkt van belang.
Zoek je een kandidaat met gemiddeld academisch werk- en denkniveau, gebruik dan capaciteitentesten die een normgroep hebben die alleen uit Wo’ers bestaat. Er bestaan ook testen met aparte normgroepen voor mensen met een niet-westerse achtergrond. En testen die in de instructie en in hun woordgebruik rekening houden met mensen uit een andere cultuur (verminderd cultuurgevoelig).
Het is echter niet zo we bij een assessment-kandidaat met een niet-Nederlandse achtergrond steevast een andere normgroep gebruiken. Welke normgroep je kiest, is ook afhankelijk van het doel van de test/het assessment. Stel dat een Nederlands bedrijf mensen wil testen van het zusterbedrijf in Dubai. Gebruiken ze hiervoor dan wel of niet dezelfde test en normgroep? Als het doel is de medewerkers van de verschillende vestigingen met elkaar te vergelijken, is het juist goed om voor beide groepen dezelfde – in dit geval de Nederlandse – normgroep te gebruiken. Zo worden de verschillen inzichtelijk.
Het ligt anders als het doel is om een minimale aftestgrens of opleidingsniveau te bepalen die nieuwe medewerkers moeten scoren om het werk- en denkniveau van een bepaalde functie aan te kunnen. Dan is het natuurlijk wél van belang dat het opleidingsniveau van de normgroep ook representatief is voor de opleidingen in het land in kwestie.
Het wetenschappelijk onderzoek naar de invloed van geslacht, leeftijd, opleidingsniveau, sociaaleconomische status, etc. op testscores loopt al sinds de jaren 50 van de vorige eeuw. In Nederland houden NOA (o.a. ontwikkeling van testen) en de Commissie Testaangelegenheden Nederland (COTAN), onderdeel van het Nederlands Instituut van Psychologen (NIP), zich hiermee bezig.
Deze laatste commissie beoordeelt de kwaliteit van assessmenttesten op de Nederlandse markt. Ook op ‘fairness’: COTAN toetst daarbij of de testresultaten beïnvloed worden door niet-relevante factoren zoals cultuurspecifieke vragen.
Wil je een eerlijke arbeidsmarkt, dan is het essentieel om bij werving en selectie faire selectie-instrumenten in te zetten
- Paul Kop, voorzitter van de sectie Arbeid en Organisatie NIP
Het is een complex onderwerp: naar veel punten wordt nog onderzoek gedaan en wetenschappers zijn het nog flink oneens. Desondanks zijn assessmenttesten heel goed praktisch toe te passen, mits je een aantal belangrijke voorwaarden in acht neemt, namelijk:
Op die manier gebruikt, zijn assessmenttesten een valide, betrouwbare en bovendien eerlijke voorspeller van iemands functioneren en niveau van werken. En kunnen ze bijdragen aan een inclusievere arbeidsmarkt. We eindigen graag met een disclaimer: op weg naar een eerlijke arbeidsmarkt is het aannemen van mensen met een grotere diversiteit aan achtergronden natuurlijk nog maar het begin. Zoals corporate antropoloog Jitske Kramer schrijft in een artikel over het onderwerp: “Diversiteit gaat over aantallen en percentages. Inclusie gaat over gedrag, waarden en spelregels.”
Wil je meer weten over dit onderwerp? Collega Aimen selecteerde een aantal artikelen en een audiofragment (tevens bronmateriaal voor dit blog):