Veel musea en bibliotheken willen hun collectieomschrijvingen ontdoen van omstreden woorden als ‘slaaf’, ‘primitief’ en ‘ras’. Maar hoe vis je die uit kolossale hoeveelheden tekst? In opdracht van het KNAW Humanities Cluster bedacht onderzoeker Ryan Brate een methode waarin een belangrijke rol is weggelegd voor artificiële intelligentie (AI).
Brate, die onlangs promoveerde aan de Universiteit Utrecht, benaderde de kwestie vanuit de datawetenschap. ‘Het doel,’ zo legt hij uit, ‘was om onderzoekers te helpen problematisch taalgebruik op te sporen. Dat gebeurt nu al wel, maar doorgaans ad hoc, en rond specifieke termen die in de aandacht staan. Dat kan systematischer en daarvoor kunnen computermodellen zoals generatieve AI suggesties geven aan onderzoekers.’ Die kunnen vervolgens zelf bepalen of ze woorden bijvoorbeeld willen schrappen van hun websites of museumbordjes, of nadere uitleg willen geven.
Centraal in Brates onderzoek stond de taalcontext waarin termen worden gebruikt. ‘Neem het woord “migrant”. Disproportioneel vaak staat dat in teksten in de buurt van het woord “overstromen”. Daarom hebben we woordcombinaties als “overstromen en migranten” voorgelegd aan proefpersonen met de vraag of ze het woord “migrant” in die context problematisch vonden. Dat vroegen we aan geesteswetenschappers en aan leken. Die waren het nooit honderd procent eens, maar over veel woordcombinaties vonden we wel een duidelijke consensus.’
Dit voorbeeld is redelijk rechttoe rechtaan, maar in andere gevallen moest Brate dieper in de taalkundige context duiken om grip te krijgen op problematisch woordgebruik. ‘Op die manier hebben we als het ware een taalkundige vingerafdruk in kaart gebracht voor omstreden termen. Onderzoekers kunnen ons werk gebruiken om nieuwe teksten te laten doorzoeken op die vingerafdrukken, en vervolgens zelf na te gaan of die wijzen op dubieuze woorden die ze nog niet in het vizier hadden.’ De laatste stap is mensenwerk, benadrukt Brate. Want een taalmodel kan patronen herkennen, maar niet bepalen hoe we moeten omgaan met de lading van woorden.
Foto bovenaan: Kunstvoorwerpen in Wereldmuseum Leiden. Officiële overhandiging van 113 kunstvoorwerpen aan Nigeria, 19 februari 2025.
