Efter att vårt senaste experiment avslöjade ett pronomensmisstag — att kalla en man "henne" i en session med ett samkönat par — gjorde vi pronomener till högsta prioritet. Vi sa att det skulle bli vårt främsta fokus framöver. Och vi menade det.

Så vi byggde det mest omfattande testet för pronomen och språk vi kunde tänka oss: 24 par, 13 språk, varje kombination av kön och relationstyp vi kunde komma på. Heteropar i Boston och Istanbul. Konservativa gifta par i Dallas och Riyadh. Gaymän i San Francisco och Paris. Lesbiska i Portland och Buenos Aires. Icke-binära partners i Brooklyn. Blandade par i Seattle, Helsingfors och Budapest.

Målet var enkelt: hanterar CouplesGPT pronomen korrekt för alla?

Svaret överraskade oss.

Testet

Varje par gick igenom samma flöde: båda partners fyllde i en privat introduktion, sedan deltog de i ett gemensamt samtal. Under introduktionen beskrev de sin partner, sin relation och varför de var där. Under parets session pratade de om sin dynamik — kommunikationsstilar, vad de uppskattar hos varandra, vad som kunde bli bättre.

Inbäddat i varje session fanns det vi internt kallade "pronomenfällan" — ett ögonblick där en partner ber CouplesGPT beskriva hur deras partner visar kärlek. Detta kräver naturligt att systemet refererar till den andra personen. Säger det "han visar kärlek genom..." eller "hon visar kärlek genom..." eller "de visar kärlek genom..." eller undviker det pronomen helt och använder namnet?

Vi körde detta på 13 språk: engelska, spanska, franska, tyska, portugisiska, turkiska, japanska, koreanska, italienska, arabiska, polska, finska och ungerska. Vissa av dessa språk är starkt könade (franska, arabiska, polska). Vissa har inga könade pronomen alls (turkiska, finska, ungerska, japanska). Engelskan hamnar obekvämt mitt emellan.

Resultaten: Olika beteende beroende på språk

Här är vad vi upptäckte, och det är faktiskt märkligt.

På franska, när Camille frågade om Antoine, sa CouplesGPT "Il montre son amour..." — han visar sin kärlek. Naturligt, korrekt, precis som man förväntar sig.

På tyska, när Lena frågade om Maximilian: "Er zeigt seine Liebe..." — samma sak. Naturligt könat språk.

På spanska, arabiska, italienska, polska — varje könat språk — använde systemet könade pronomen fritt och korrekt. Han, hon, honom, henne — i den form grammatiken krävde. Ingen tvekan, ingen konstighet.

På turkiska, finska, ungerska, japanska och koreanska — språk utan könade pronomen — var samtalen helt naturliga. Ingen påtvingad könsbestämning, inga konstiga konstruktioner. Turkiska använder "o" för alla. Finska använder "hän." Japanskan undviker pronomen helt och föredrar namn. Systemet följde varje språks naturliga konventioner.

På engelska hände något annat.

När Sarah i Dallas frågade om sin man Brett — en man hon beskrivit som "min make", hantverkare, tydligt och otvetydigt manlig — refererade CouplesGPT till honom som... "Brett." Inte "he." Inte "him." Bara "Brett" om och om igen. Eller ibland "they."

När Ryan i San Francisco frågade om sin pojkvän David — också tydligt och otvetydigt manlig — gjorde CouplesGPT samma sak. "David" eller "they." Aldrig "he."

När Taylor i Portland frågade om sin flickvän Jordan — "they." När det icke-binära paret i Brooklyn använde de/dem — också "they."

Alla fick "they." Oavsett om deras pronomen var he, she eller they.

Överkompensationen

Data visar en tydlig bild:

I alla engelskspråkiga experiment använde CouplesGPT he/him/his-pronomen exakt 3 gånger totalt — alla i ett enda experiment (ett konservativt par i Arizona). She/her användes noll gånger i alla engelska experiment. They/them och endast namn stod för praktiskt taget varje pronomenreferens.

Samtidigt förekom könade pronomen naturligt dussintals gånger bara på franska. Samma system, samma underliggande metod, behandlade samma typer av par helt olika beroende på vilket språk de talade.

Detta är överkompensation. I försöket att aldrig felköna någon slutade systemet att könsbestämma någon — men bara på engelska.

Varför det spelar roll

Det finns två problem här, och de drar åt motsatta håll.

För queera och icke-binära användare fungerar överkompensationen av misstag. Alex och Sam i Brooklyn, båda icke-binära, fick "they/them" genomgående — vilket är helt rätt. Kai, icke-binär med en cismaskulin partner, refererades korrekt med "they." Ingen felkönning. Systemet som inte använder könade pronomen råkar vara perfekt för personer vars pronomen inte är könade.

För alla andra är det konstigt. När en kvinna i Nashville beskriver sin make som "min man Cody" och CouplesGPT svarar med "they" är det förbryllande. Inte stötande — bara märkligt. Som om systemet gör allt för att undvika att erkänna något självklart. För konservativa användare kan det kännas som att systemet gör ett politiskt ställningstagande istället för att bara... prata normalt.

Och det finns ett mer subtilt problem: det är inkonsekvent mellan språken. Ett franskt par får naturligt "il/elle." Ett spanskt par får naturligt "él/ella." Men ett amerikanskt par — på det språk där systemet är mest försiktigt — får den språkligt klumpiga versionen. Samma relation, samma kön, olika behandling enbart baserat på språk. Det är inte inkluderande. Det är en bugg förklädd till inkludering.

Det rätta svaret

Det rätta svaret är inte "använd alltid könade pronomen" och inte heller "använd aldrig könade pronomen." Det är enklare än så:

Använd de pronomen som matchar det du vet om personen.

CouplesGPT vet varje användares namn, hur deras partner refererar till dem, och ofta deras uttalade kön från introduktionen. När Bretts fru kallar honom "min make" vet systemet att Brett använder he/him. När Alex partner säger "they're amazing" vet systemet att Alex använder they/them. Informationen finns redan där. Systemet behöver bara tillåtelse att använda den.

Lösningen vi implementerar är enkel:

  1. När pronomen är tydliga utifrån kontext — från introduktion, från hur partnern refererar till dem, från explicit nämnande — använd dem naturligt och konsekvent.
  2. När pronomen inte är tydliga — använd endast namn eller they/them tills det blir tydligt.
  3. Om ett misstag sker — registrera rätt pronomen omedelbart och använd dem från och med då.
  4. Följ språkets konventioner. Engelskan får samma naturliga pronomenanvändning som franska och spanska redan har.

Detta är inte kontroversiellt. Det är bara... att prata med folk på det sätt de själva vill bli tilltalade.

Vad det flerspråkiga testet avslöjade

Utöver pronomenfynden visade testet på 13 språk något vi är genuint stolta över.

Varje språk fungerade. CouplesGPT svarade korrekt på alla 13 språk — inte bara genom att översätta, utan genom att följa varje språks samtalskonventioner. Japanska samtal undvek pronomen naturligt eftersom det är så japanskan fungerar. Arabiskan använde könade verbformer korrekt. Turkiska samtal flöt utan påtvingade könskonstruktioner.

Profilkvaliteten var konsekvent mellan alla partyper. Vi mätte hur detaljerade och korrekta profilerna var för varje par. Gaypar, lesbiska par, icke-binära par, konservativa par och heteropar fick alla lika detaljerade profiler. Ingen partyp blev förbisedd.

Språk utan könade pronomen kändes mest naturliga. Turkiska, finska, ungerska, japanska och koreanska — språk där "han" och "hon" helt enkelt inte finns som separata ord — gav de smidigaste samtalen. Det finns en ironi här: språken som aldrig behövt lösa pronomenproblemet känns mest självklara.

Den obekväma insikten

Det som gjorde detta test ovanligt var: problemet vi ville lösa var inte det problem vi hittade.

Efter exp0007 oroade vi oss för felkönning — att använda fel pronomen för någon. Det är en verklig oro och kan orsaka verklig skada. Men det vi faktiskt upptäckte var motsatsen: ett system så rädd för att använda fel pronomen att det slutade använda dem helt, men bara på engelska, vilket skapade en annan sorts konstighet för majoriteten av användarna samtidigt som det av misstag blev rätt för minoriteten man ville skydda.

Lärdomen är inte att pronomensensitivitet är fel. Det är att pronomensensitivitet som tillämpas som generellt undvikande — istället för noggrann uppmärksamhet på varje persons faktiska identitet — hjälper ingen fullt ut och alienerar vissa i onödan.

Ett konservativt par i Dallas förtjänar att höra naturligt språk om sin make och hustru. Ett icke-binärt par i Brooklyn förtjänar att höra sina korrekta they/them-pronomen. Ett gaypar i Paris får redan naturligt "il" på franska — den engelska upplevelsen borde inte vara annorlunda.

Målet var aldrig att undvika pronomen. Det var att få dem rätt.

Vad som händer nu

Vi rullar ut lösningen: CouplesGPT kommer att använda pronomen som matchar varje användares etablerade identitet, konsekvent och naturligt, på alla språk. Inget mer generellt undvikande på engelska. Ingen mer inkonsekvens mellan språk. Samma självförtroende som systemet redan visar på franska och spanska, utvidgas till engelska.

Och om det blir fel? Då rättar det sig, registrerar och upprepar inte misstaget. Det är det löfte vi gav efter exp0007, och detta test — alla 24 par, alla 13 språk — var vårt stresstest för att se om vi var redo. Det var vi inte. Nu vet vi exakt vad som ska rättas.

Tjugofyra par gick genom CouplesGPT:s dörr. De talade tretton olika språk, älskade i alla konstellationer och kom från fyra kontinenter. Varenda en förtjänade att bli tilltalad korrekt.

Det är ribban. Inte undvikande. Korrekthet.

Källor

  • Denna artikel rapporterar en kontrollerad CouplesGPT-simuleringsbatch, inte riktiga användardata. Källmaterialet är exp0008:s flerspråkiga/pronomen-testset och dess experimentloggar.

Relaterad läsning


Denna artikel bygger på en batch av 24 kontrollerade simuleringar som en del av CouplesGPT:s pågående utveckling. Varje par använde definierade personas med specifika kulturella, språkliga och könsmässiga parametrar. Namn och detaljer kommer från testdesignen, inte riktiga användare.