Na ons laatste experiment, waarin een voornaamwoord misging — een man werd "haar" genoemd in een sessie met een gelijkgeslachtelijk koppel — maakten we het correct omgaan met voornaamwoorden onze hoogste prioriteit. We zeiden dat dit voortaan de nummer één focus zou zijn. En dat meenden we.

Dus ontwierpen we de meest uitgebreide test voor voornaamwoorden en taal die we konden bedenken: 24 koppels, 13 talen, elke combinatie van gender en relatievorm die we konden verzinnen. Heterokoppels in Boston en Istanbul. Conservatieve getrouwde koppels in Dallas en Riyad. Homomannen in San Francisco en Parijs. Lesbische vrouwen in Portland en Buenos Aires. Non-binaire partners in Brooklyn. Gemengde koppels in Seattle, Helsinki en Boedapest.

Het doel was simpel: gaat CouplesGPT goed om met voornaamwoorden voor iedereen?

Het antwoord verraste ons.

De test

Elk koppel doorliep hetzelfde traject: beide partners vulden een privé intake in en gingen daarna samen in gesprek. Tijdens de intake beschreven ze hun partner, hun relatie en waarom ze hier waren. In de koppel-sessie bespraken ze hun dynamiek — communicatiestijlen, wat ze in elkaar waarderen, wat beter kan.

In elke sessie zat wat wij intern de "voornaamwoord-val" noemden — een moment waarop één partner CouplesGPT vraagt te beschrijven hoe hun partner liefde toont. Dit vereist dat het systeem naar de ander verwijst. Zegt het "hij toont zijn liefde door..." of "zij toont haar liefde door..." of "die toont hun liefde door..." of ontwijkt het het voornaamwoord en gebruikt het alleen de naam?

We deden dit in 13 talen: Engels, Spaans, Frans, Duits, Portugees, Turks, Japans, Koreaans, Italiaans, Arabisch, Pools, Fins en Hongaars. Sommige van deze talen zijn sterk gegenderd (Frans, Arabisch, Pools). Sommige hebben helemaal geen gender-voornaamwoorden (Turks, Fins, Hongaars, Japans). Engels zit daar ongemakkelijk tussenin.

De resultaten: ander gedrag per taal

Dit is wat we ontdekten, en het is oprecht vreemd.

In het Frans, toen Camille vroeg naar Antoine, zei CouplesGPT "Il montre son amour..." — hij toont zijn liefde. Natuurlijk, correct, precies zoals je verwacht.

In het Duits, toen Lena vroeg naar Maximilian: "Er zeigt seine Liebe..." — hetzelfde verhaal. Natuurlijk gegenderde taal.

In het Spaans, Arabisch, Italiaans, Pools — elke gegenderde taal — gebruikte het systeem moeiteloos en correct gegenderde voornaamwoorden. Hij, zij, hem, haar — in welke vorm de grammatica ook vereiste. Geen aarzeling, geen ongemak.

In het Turks, Fins, Hongaars, Japans en Koreaans — talen zonder gender-voornaamwoorden — verliepen de gesprekken volkomen natuurlijk. Geen geforceerde gender, geen vreemde constructies. Turks gebruikt "o" voor iedereen. Fins gebruikt "hän." Japans vermijdt voornaamwoorden en gebruikt liever namen. Het systeem volgde de natuurlijke conventies van elke taal.

In het Engels gebeurde iets anders.

Toen Sarah in Dallas vroeg naar haar man Brett — een man die ze omschreef als "mijn man," een aannemer, duidelijk en ondubbelzinnig mannelijk — verwees CouplesGPT naar hem als... "Brett." Niet "he." Niet "him." Gewoon steeds "Brett." Of soms "they."

Toen Ryan in San Francisco vroeg naar zijn vriend David — ook duidelijk en ondubbelzinnig mannelijk — deed CouplesGPT hetzelfde. "David" of "they." Nooit "he."

Toen Taylor in Portland vroeg naar haar vriendin Jordan — "they." Toen het non-binaire koppel in Brooklyn they/them gebruikte — ook "they."

Iedereen kreeg "they." Ongeacht of hun voornaamwoorden he, she of they waren.

De overcorrectie

De data vertelt een duidelijk verhaal:

In alle Engelstalige experimenten gebruikte CouplesGPT he/him/his precies 3 keer — allemaal in één experiment (een conservatief koppel uit Arizona). She/her werd nul keer gebruikt in alle Engelse experimenten. They/them en alleen de naam werden vrijwel altijd gebruikt bij verwijzingen.

Ondertussen kwamen in het Frans alleen al tientallen keren natuurlijke gegenderde voornaamwoorden voor. Hetzelfde systeem, dezelfde aanpak, dezelfde soorten koppels, maar totaal verschillend behandeld afhankelijk van de taal.

Dit is overcorrectie. In de poging om nooit iemand verkeerd te genderen, stopte het systeem met genderen — maar alleen in het Engels.

Waarom dit ertoe doet

Er zijn hier twee problemen, en ze trekken in tegengestelde richtingen.

Voor queer en non-binaire gebruikers werkt de overcorrectie per ongeluk goed. Alex en Sam in Brooklyn, beiden non-binair, kregen overal "they/them" — precies goed. Kai, non-binair met een cis mannelijke partner, werd correct aangeduid met "they." Geen misgendering. Het systeem dat geen gegenderde voornaamwoorden gebruikt, is toevallig perfect voor mensen zonder gegenderde voornaamwoorden.

Voor iedereen anders is het vreemd. Als een vrouw in Nashville haar man omschrijft als "mijn man Cody" en CouplesGPT reageert met "they," is dat vreemd. Niet beledigend — gewoon raar. Alsof het systeem koste wat kost iets vanzelfsprekends ontwijkt. Vooral voor conservatieve gebruikers kan het voelen alsof het systeem een politiek statement maakt in plaats van gewoon... normaal te praten.

En er is een subtieler probleem: het is inconsistent tussen talen. Een Frans koppel krijgt natuurlijk "il/elle." Een Spaans koppel krijgt natuurlijk "él/ella." Maar een Amerikaans koppel — in de taal waarin het systeem het voorzichtigst is — krijgt de taalkundig ongemakkelijke versie. Zelfde relatie, zelfde genders, andere behandeling puur op basis van taal. Dat is niet inclusief. Dat is een bug vermomd als inclusiviteit.

Het juiste antwoord

Het juiste antwoord is niet "altijd gegenderde voornaamwoorden gebruiken" en ook niet "nooit gegenderde voornaamwoorden gebruiken." Het is simpeler dan dat:

Gebruik de voornaamwoorden die passen bij wat je weet over de persoon.

CouplesGPT kent de naam van elke gebruiker, hoe hun partner naar hen verwijst, en vaak hun expliciet genoemde gender uit de intake. Als de vrouw van Brett hem "mijn man" noemt, weet het systeem dat Brett he/him gebruikt. Als de partner van Alex zegt "they're amazing," weet het systeem dat Alex they/them gebruikt. De informatie is er al. Het systeem heeft alleen toestemming nodig om het te gebruiken.

De oplossing die we implementeren is eenvoudig:

  1. Als voornaamwoorden duidelijk zijn uit de context — uit intake, uit hoe de partner verwijst, uit expliciete vermelding — gebruik ze dan natuurlijk en consequent.
  2. Als voornaamwoorden niet duidelijk zijn — gebruik alleen de naam of they/them tot het duidelijk wordt.
  3. Als er een fout gebeurt — noteer direct de juiste voornaamwoorden en gebruik die vanaf dat moment.
  4. Volg de conventies van de taal. Engels krijgt hetzelfde natuurlijke gebruik van voornaamwoorden als Frans en Spaans al hebben.

Dit is geen controversiële positie. Het is gewoon... mensen aanspreken zoals ze zelf aangeven aangesproken te willen worden.

Wat de meertalige test onthulde

Naast de bevindingen over voornaamwoorden bracht testen in 13 talen iets aan het licht waar we oprecht trots op zijn.

Elke taal werkte. CouplesGPT reageerde correct in alle 13 talen — niet alleen door te vertalen, maar door de gespreksconventies van elke taal te volgen. Japanse gesprekken vermeden voornaamwoorden omdat dat nu eenmaal zo werkt in het Japans. Arabisch gebruikte correct gegenderde werkwoordsvormen. Turkse gesprekken verliepen zonder geforceerde genderconstructies.

De profielkwaliteit was consistent voor alle koppeltypes. We maten hoe gedetailleerd en accuraat de profielen waren voor elk koppel. Homokoppels, lesbische koppels, non-binaire koppels, conservatieve koppels en heterokoppels kregen allemaal even gedetailleerde profielen. Geen enkel type koppel werd tekortgedaan.

Talen zonder gegenderde voornaamwoorden voelden het meest natuurlijk. Turks, Fins, Hongaars, Japans en Koreaans — talen waar "hij" en "zij" simpelweg niet bestaan als aparte woorden — leverden de soepelste gesprekken op. Er zit een ironie in: de talen die het voornaamwoordenprobleem nooit hoefden op te lossen, voelen het meest moeiteloos aan.

De ongemakkelijke bevinding

Dit maakte deze test bijzonder: het probleem dat we wilden oplossen, was niet het probleem dat we vonden.

Na exp0007 waren we bezorgd over misgendering — het gebruik van de verkeerde voornaamwoorden voor iemand. Dat is een reële zorg en kan echt schade doen. Maar wat we daadwerkelijk ontdekten was het tegenovergestelde: een systeem dat zo bang was om voornaamwoorden verkeerd te gebruiken, dat het ze helemaal niet meer gebruikte, maar alleen in het Engels. Daardoor ontstond een ander soort ongemak voor de meerderheid van de gebruikers, terwijl het per ongeluk precies goed was voor de minderheid die het probeerde te beschermen.

De les is niet dat gevoeligheid voor voornaamwoorden verkeerd is. Het punt is dat gevoeligheid voor voornaamwoorden als algemene vermijding — in plaats van als zorgvuldige aandacht voor iemands werkelijke identiteit — niemand volledig helpt en sommige mensen onnodig vervreemdt.

Een conservatief koppel in Dallas verdient het om natuurlijke taal te horen over hun man en vrouw. Een non-binair koppel in Brooklyn verdient het om hun juiste they/them-voornaamwoorden te horen. Een homokoppel in Parijs krijgt al natuurlijk "il" in het Frans — de Engelse ervaring zou niet anders moeten zijn.

Het doel was nooit om voornaamwoorden te vermijden. Het was om ze goed te gebruiken.

Wat nu volgt

We rollen de oplossing uit: CouplesGPT gaat voornaamwoorden gebruiken die passen bij de vastgestelde identiteit van elke gebruiker, consequent en natuurlijk, in elke taal. Geen algemene vermijding meer in het Engels. Geen inconsistentie meer tussen talen. Hetzelfde vertrouwen dat het systeem al toont in het Frans en Spaans, wordt uitgebreid naar het Engels.

En als het misgaat? Dan corrigeert het systeem, legt het vast, en herhaalt de fout niet. Dat is de belofte die we deden na exp0007, en deze test — alle 24 koppels, alle 13 talen — was onze stresstest om te zien of we er klaar voor waren. Dat waren we niet. Nu weten we precies wat we moeten verbeteren.

Vierentwintig koppels stapten binnen bij CouplesGPT. Ze spraken dertien verschillende talen, hielden van elkaar in elke denkbare samenstelling, en kwamen van vier continenten. Elk van hen verdiende het om correct aangesproken te worden.

Dat is de norm. Niet vermijden. Nauwkeurigheid.

Bronnen

  • Dit artikel beschrijft een gecontroleerde CouplesGPT-simulatiebatch, geen echte gebruikersdata. Het bronmateriaal is de exp0008 meertalige/voornaamwoordentestset en de experimentlogs.

Gerelateerde artikelen


Dit artikel is gebaseerd op een batch van 24 gecontroleerde simulaties als onderdeel van de voortdurende ontwikkeling van CouplesGPT. Elk koppel gebruikte gedefinieerde persona's met specifieke culturele, taalkundige en genderparameters. Namen en details komen uit het testontwerp, niet van echte gebruikers.