Pronomi, lingua e fiducia: cosa hanno insegnato 24 coppie a CouplesGPT

I pronomi funzionavano perfettamente per coppie queer e non binarie. Poi il test multilingue ha mostrato un altro problema: l’inglese era diventato troppo cauto.

Dopo che il nostro ultimo esperimento aveva rivelato uno scivolone sui pronomi — chiamando un uomo "lei" in una sessione con una coppia dello stesso sesso — abbiamo reso la gestione dei pronomi la nostra massima priorità. Abbiamo detto che sarebbe stata la priorità numero uno da quel momento in poi. E lo abbiamo fatto davvero.

Così abbiamo costruito il test più completo possibile su pronomi e lingue: 24 coppie, 13 lingue, ogni combinazione di genere e tipo di relazione che potessimo immaginare. Coppie etero a Boston e Istanbul. Coppie sposate e conservatrici a Dallas e Riyadh. Coppie gay a San Francisco e Parigi. Coppie lesbiche a Portland e Buenos Aires. Partner non binari a Brooklyn. Coppie di genere misto a Seattle, Helsinki e Budapest.

L’obiettivo era semplice: CouplesGPT gestisce correttamente i pronomi per tutti?

La risposta ci ha sorpreso.

Il test

Ogni coppia ha seguito lo stesso percorso: entrambi i partner hanno completato una raccolta dati privata, poi hanno partecipato a una conversazione di coppia. Durante la raccolta dati, descrivevano il partner, la relazione e cosa li aveva portati lì. Durante la sessione di coppia, parlavano della loro dinamica — stili comunicativi, cosa apprezzano l’uno dell’altro, cosa potrebbe migliorare.

In ogni sessione era inserito quello che internamente chiamavamo il "pronoun bait" — un momento in cui un partner chiede a CouplesGPT di descrivere come il partner dimostra amore. Questo richiede naturalmente che il sistema si riferisca all’altra persona. Dice "lui dimostra amore..." oppure "lei dimostra amore..." o "loro dimostrano amore..." o evita del tutto il pronome usando solo il nome?

Abbiamo condotto il test in 13 lingue: inglese, spagnolo, francese, tedesco, portoghese, turco, giapponese, coreano, italiano, arabo, polacco, finlandese e ungherese. Alcune di queste lingue sono fortemente segnate dal genere (francese, arabo, polacco). Alcune non hanno pronomi di genere (turco, finlandese, ungherese, giapponese). L’inglese si trova in una posizione intermedia.

I risultati: un comportamento diverso a seconda della lingua

Ecco cosa abbiamo scoperto, ed è davvero curioso.

In francese, quando Camille chiedeva di Antoine, CouplesGPT diceva "Il montre son amour..." — lui dimostra il suo amore. Naturale, corretto, esattamente come ci si aspetta.

In tedesco, quando Lena chiedeva di Maximilian: "Er zeigt seine Liebe..." — stessa cosa. Linguaggio di genere naturale.

In spagnolo, arabo, italiano, polacco — in tutte le lingue con pronomi di genere — il sistema usava pronomi di genere liberamente e correttamente. Lui, lei, lui, lei — nella forma richiesta dalla grammatica. Nessuna esitazione, nessuna stranezza.

In turco, finlandese, ungherese, giapponese e coreano — lingue senza pronomi di genere — le conversazioni erano perfettamente naturali. Nessuna forzatura di genere, nessuna costruzione innaturale. Il turco usa "o" per tutti. Il finlandese usa "hän". Il giapponese evita del tutto i pronomi, preferendo i nomi. Il sistema si adattava alle convenzioni di ciascuna lingua.

In inglese, è successo qualcosa di diverso.

Quando Sarah a Dallas chiedeva di suo marito Brett — un uomo descritto come "mio marito", un imprenditore, chiaramente e inequivocabilmente maschio — CouplesGPT si riferiva a lui come... "Brett". Non "he". Non "him". Solo "Brett" ripetutamente. O, occasionalmente, "they".

Quando Ryan a San Francisco chiedeva del suo fidanzato David — anche lui chiaramente maschio — CouplesGPT faceva lo stesso. "David" o "they". Mai "he".

Quando Taylor a Portland chiedeva della sua ragazza Jordan — "they". Quando la coppia non binaria a Brooklyn usava they/them — anche "they".

Tutti ricevevano "they". Indipendentemente dal fatto che i loro pronomi fossero he, she o they.

L’iper-correzione

I dati raccontano una storia chiara:

In tutti gli esperimenti in inglese, CouplesGPT ha usato i pronomi he/him/his esattamente 3 volte in totale — tutte in un unico esperimento (una coppia conservatrice dell’Arizona). She/her è stato usato zero volte in tutti gli esperimenti in inglese. They/them e solo il nome hanno rappresentato praticamente ogni riferimento pronominale.

Nel frattempo, solo in francese, i pronomi di genere sono apparsi naturalmente decine di volte. Lo stesso sistema, lo stesso approccio di base, trattava lo stesso tipo di coppie in modo completamente diverso a seconda della lingua parlata.

Questa è iper-correzione. Nel tentativo di non sbagliare mai il genere di qualcuno, il sistema ha smesso di assegnare un genere a chiunque — ma solo in inglese.

Perché è importante

Ci sono due problemi qui, e tirano in direzioni opposte.

Per utenti queer e non binari, l’iper-correzione funziona per caso. Alex e Sam a Brooklyn, entrambi non binari, hanno ricevuto "they/them" per tutta la conversazione — che è esattamente corretto. Kai, non binario con un partner cis maschio, è stato correttamente indicato con "they". Nessun errore di genere. Il sistema che non usa pronomi di genere risulta perfetto per chi non li usa.

Per tutti gli altri, è strano. Quando una donna a Nashville descrive suo marito come "il mio uomo Cody" e CouplesGPT risponde con "they", è spiazzante. Non offensivo — solo strano. Sembra che il sistema faccia di tutto per evitare di riconoscere qualcosa di ovvio. Per utenti conservatori, può sembrare che il sistema stia facendo una dichiarazione politica invece di... parlare normalmente.

E c’è un problema più sottile: è incoerente tra le lingue. Una coppia francese riceve il naturale "il/elle". Una coppia spagnola riceve "él/ella". Ma una coppia americana — nella lingua in cui il sistema è più cauto — riceve la versione linguisticamente innaturale. Stessa relazione, stessi generi, trattamento diverso solo in base alla lingua. Non è inclusivo. È un bug travestito da inclusività.

La risposta giusta

La risposta giusta non è "usare sempre i pronomi di genere" e nemmeno "non usarli mai". È più semplice:

Usa i pronomi che corrispondono a ciò che sai sulla persona.

CouplesGPT conosce il nome di ogni utente, come il partner si riferisce a lui/lei/loro, e spesso anche il genere dichiarato nella raccolta dati. Quando la moglie di Brett lo chiama "mio marito", il sistema sa che Brett usa he/him. Quando il partner di Alex dice "they’re amazing", il sistema sa che Alex usa they/them. L’informazione c’è già. Serve solo il permesso di usarla.

La soluzione che stiamo implementando è semplice:

Quando i pronomi sono chiari dal contesto — dalla raccolta dati, da come il partner si riferisce a loro, da menzioni esplicite — usarli in modo naturale e coerente.
Quando i pronomi non sono chiari — usare solo il nome o they/them finché non diventano chiari.
Se avviene un errore — registrare subito i pronomi corretti e usarli da quel momento in poi.
Seguire le convenzioni della lingua. L’inglese deve avere lo stesso uso naturale dei pronomi che già esiste in francese e spagnolo.

Non è una posizione controversa. È semplicemente... parlare alle persone come hanno detto di voler essere chiamate.

Cosa ha rivelato il test multilingue

Oltre ai risultati sui pronomi, il test in 13 lingue ha fatto emergere qualcosa di cui siamo davvero orgogliosi.

Ogni lingua ha funzionato. CouplesGPT ha risposto correttamente in tutte le 13 lingue — non solo traducendo, ma adattandosi alle convenzioni conversazionali di ciascuna lingua. Le conversazioni in giapponese evitavano naturalmente i pronomi perché così funziona il giapponese. L’arabo usava correttamente le forme verbali di genere. Le conversazioni in turco scorrevano senza forzature di genere.

La qualità dei profili era coerente per tutti i tipi di coppia. Abbiamo misurato quanto fossero dettagliati e accurati i profili per ogni coppia. Coppie gay, lesbiche, non binarie, conservatrici ed etero hanno ricevuto profili ugualmente dettagliati. Nessun tipo di coppia è stato trascurato.

Le lingue senza pronomi di genere risultavano le più naturali. Turco, finlandese, ungherese, giapponese e coreano — lingue in cui "lui" e "lei" non esistono come parole separate — hanno prodotto le conversazioni più fluide. C’è dell’ironia: le lingue che non hanno mai dovuto risolvere il problema dei pronomi risultano le più semplici.

La scoperta scomoda

Ecco cosa ha reso questo test insolito: il problema che volevamo risolvere non era quello che abbiamo trovato.

Dopo exp0007, temevamo il misgendering — usare i pronomi sbagliati per qualcuno. È una preoccupazione reale e può fare danni. Ma ciò che abbiamo scoperto è stato l’opposto: un sistema così timoroso di sbagliare i pronomi da smettere di usarli del tutto, ma solo in inglese, creando un disagio diverso per la maggioranza degli utenti e, per caso, risultando perfetto per la minoranza che voleva proteggere.

La lezione non è che la sensibilità sui pronomi sia sbagliata. È che applicare la sensibilità come evitamento totale — invece che come attenzione reale all’identità di ciascuno — non aiuta nessuno pienamente e aliena alcune persone inutilmente.

Una coppia conservatrice a Dallas merita di sentire un linguaggio naturale su marito e moglie. Una coppia non binaria a Brooklyn merita di sentire i propri pronomi they/them. Una coppia gay a Parigi già riceve il naturale "il" in francese — l’esperienza inglese non dovrebbe essere diversa.

L’obiettivo non era mai evitare i pronomi. Era usarli correttamente.

Cosa succede ora

Stiamo implementando la soluzione: CouplesGPT userà i pronomi che corrispondono all’identità dichiarata di ciascun utente, in modo coerente e naturale, in ogni lingua. Basta evitamento totale in inglese. Basta incoerenza tra le lingue. La stessa sicurezza che il sistema già mostra in francese e spagnolo, estesa anche all’inglese.

E se sbaglia? Corregge, registra e non ripete l’errore. È l’impegno che abbiamo preso dopo exp0007, e questo test — tutte le 24 coppie, tutte le 13 lingue — era il nostro banco di prova per capire se eravamo pronti. Non lo eravamo. Ora sappiamo esattamente cosa correggere.

Ventiquattro coppie sono passate dalla porta di CouplesGPT. Hanno parlato tredici lingue diverse, amato in ogni configurazione, e provenivano da quattro continenti. Ognuna di loro meritava di essere chiamata correttamente.

Questa è la soglia. Non l’evitamento. L’accuratezza.

Fonti

Questo articolo riporta una simulazione controllata di CouplesGPT, non dati di utenti reali. Il materiale di partenza è il set di test multilingue/pronomi exp0008 e i suoi log sperimentali.

Letture correlate

Questo articolo si basa su una serie di 24 simulazioni controllate condotte come parte dello sviluppo continuo di CouplesGPT. Ogni coppia utilizzava personaggi definiti con parametri culturali, linguistici e di genere specifici. Nomi e dettagli provengono dal design del test, non da utenti reali.