Nakon što je naš posljednji eksperiment otkrio pogrešku s zamjenicom — muškarac je u sesiji istospolnog para nazvan „her“ — postupanje sa zamjenicama postavili smo kao najviši prioritet. Rekli smo da će to ubuduće biti naš glavni fokus. Mislili smo ozbiljno.
Zato smo izgradili najopsežniji test zamjenica i jezika koji smo mogli osmisliti: 24 para, 13 jezika i svaku kombinaciju roda i tipa veze koje smo se mogli sjetiti. Heteroseksualni parovi u Bostonu i Istanbulu. Konzervativni bračni parovi u Dallasu i Rijadu. Gej muškarci u San Franciscu i Parizu. Lezbijski parovi u Portlandu i Buenos Airesu. Nebinarni partneri u Brooklynu. Parovi različitog roda u Seattleu, Helsinkiju i Budimpešti.
Cilj je bio jednostavan: može li CouplesGPT ispravno postupati sa zamjenicama za svakoga?
Odgovor nas je iznenadio.
Test
Svaki je par prošao isti tijek: oba su partnera dovršila privatni uvodni unos, a zatim se pridružila zajedničkom razgovoru para. Tijekom uvoda opisali su partnera, svoju vezu i razlog zbog kojeg su došli. Tijekom zajedničke sesije govorili su o svojoj dinamici — stilovima komunikacije, onome što cijene jedno kod drugoga i onome što bi moglo biti bolje.
U svaku je sesiju bio ugrađen trenutak koji smo interno zvali „mamac za zamjenice“: jedan partner zatraži od CouplesGPT-a da opiše kako drugi partner pokazuje ljubav. To prirodno zahtijeva da se sustav pozove na drugu osobu. Hoće li reći „he shows love by...“, „she shows love by...“ ili „they show love by...“? Ili će potpuno izbjeći zamjenicu i upotrijebiti samo ime?
Test smo proveli na 13 jezika: engleskom, španjolskom, francuskom, njemačkom, portugalskom, turskom, japanskom, korejskom, talijanskom, arapskom, poljskom, finskom i mađarskom. Neki su od tih jezika snažno rodno obilježeni (francuski, arapski, poljski). Neki uopće nemaju rodno obilježene zamjenice (turski, finski, mađarski, japanski). Engleski neugodno stoji negdje u sredini.
Rezultati: podvojena osobnost
Evo što smo pronašli, i zaista je čudno.
Na francuskom, kada je Camille pitala za Antoinea, CouplesGPT je rekao „Il montre son amour...“ — on pokazuje svoju ljubav. Prirodno, točno, upravo ono što biste očekivali.
Na njemačkom, kada je Lena pitala za Maximiliana: „Er zeigt seine Liebe...“ — ista stvar. Prirodno rodno obilježen jezik.
Na španjolskom, arapskom, talijanskom, poljskom — u svakom rodno obilježenom jeziku — sustav je slobodno i točno koristio rodne zamjenice. He, she, him, her — u kojem god obliku je gramatika zahtijevala. Bez oklijevanja, bez nespretnosti.
Na turskom, finskom, mađarskom, japanskom i korejskom — jezicima koji nemaju rodno obilježene zamjenice — razgovori su bili potpuno prirodni. Bez prisilnog roda, bez nezgrapnih konstrukcija. Turski koristi „o“ za sve. Finski koristi „hän“. Japanski često posve izbjegava zamjenice i radije koristi imena. Sustav je pratio prirodne konvencije svakog jezika.
Na engleskom se dogodilo nešto drukčije.
Kada je Sarah iz Dallasa pitala za supruga Bretta — muškarca kojeg je opisala kao „my husband“, izvođača radova, jasno i nedvosmisleno muškarca — CouplesGPT se na njega pozvao kao... „Brett“. Ne „he“. Ne „him“. Samo „Brett“, iznova i iznova. Ili povremeno „they“.
Kada je Ryan iz San Francisca pitao za svog dečka Davida — također jasno i nedvosmisleno muškarca — CouplesGPT je učinio isto. „David“ ili „they“. Nikad „he“.
Kada je Taylor iz Portlanda pitala za svoju djevojku Jordan — „they“. Kada je nebinarni par u Brooklynu koristio they/them — također „they“.
Svi su dobili „they“. Bez obzira na to jesu li njihove zamjenice bile he, she ili they.
Pretjerana korekcija
Podaci pričaju jasnu priču:
U svim eksperimentima na engleskom jeziku CouplesGPT je zamjenice he/him/his upotrijebio točno 3 puta ukupno — sve u jednom jedinom eksperimentu, kod konzervativnog para iz Arizone. She/her je upotrijebljeno nula puta u svim engleskim eksperimentima. They/them i upućivanje samo imenom činili su gotovo svaku zamjeničku referencu.
U međuvremenu, samo na francuskom rodne su se zamjenice prirodno pojavile desecima puta. Isti sustav, isti temeljni pristup, iste vrste parova — ali posve različit tretman ovisno samo o jeziku kojim su govorili.
To je pretjerana korekcija. U nastojanju da nikada nikoga ne nazove pogrešnim rodom, sustav je prestao rodno označavati bilo koga — ali samo na engleskom.
Zašto je to važno
Ovdje postoje dva problema i vuku u suprotnim smjerovima.
Za queer i nebinarne korisnike pretjerana korekcija slučajno funkcionira. Alex i Sam iz Brooklyna, oboje nebinarni, dobili su they/them kroz cijeli razgovor — što je točno. Kai, nebinarna osoba s cis muškim partnerom, također je ispravno označen s „they“. Nije bilo pogrešnog rodnog označavanja. Sustav koji ne koristi rodne zamjenice slučajno je savršen za ljude čije zamjenice nisu rodno obilježene.
Za sve ostale to je čudno. Kada žena u Nashvilleu svog supruga opiše kao „my man Cody“, a CouplesGPT odgovori s „they“, to zvuči neprirodno. Nije uvredljivo — samo neobično. Kao da se sustav posebno trudi izbjeći priznati nešto očito. Posebno konzervativnim korisnicima to može zvučati kao politička izjava, a ne kao običan razgovor.
Postoji i suptilniji problem: nedosljedno je među jezicima. Francuski par dobiva prirodno „il/elle“. Španjolski par dobiva prirodno „él/ella“. Ali američki par — koji govori jezik u kojem je sustav najoprezniji — dobiva jezično nespretnu verziju. Ista veza, isti rodovi, različit tretman samo zbog jezika. To nije uključivost. To je bug u odjeći uključivosti.
Pravi odgovor
Pravi odgovor nije „uvijek koristi rodne zamjenice“ i nije „nikad ne koristi rodne zamjenice“. Jednostavniji je:
Koristi zamjenice koje odgovaraju onome što znaš o osobi.
CouplesGPT zna ime svakog korisnika, kako ga partner spominje i često iz uvodnog unosa zna izričito navedeni rod. Kada Brettova supruga za njega kaže „my husband“, sustav zna da Brett koristi he/him. Kada Alexov partner kaže „they're amazing“, sustav zna da Alex koristi they/them. Informacija je već tu. Sustav samo treba dopuštenje da je upotrijebi.
Popravak koji uvodimo vrlo je izravan:
- Kada su zamjenice jasne iz konteksta — iz uvoda, iz načina na koji partner govori o osobi, iz izričitog spomena — koristi ih prirodno i dosljedno.
- Kada zamjenice nisu jasne — zadano koristi ime ili they/them dok ne postanu jasne.
- Ako se dogodi pogreška — odmah zabilježi ispravne zamjenice i koristi ih od tog trenutka nadalje.
- Prati konvencije jezika. Engleski treba dobiti istu prirodnu uporabu zamjenica koju francuski i španjolski već imaju.
To nije kontroverzan stav. To je samo... razgovarati s ljudima onako kako su vam rekli da žele da se o njima govori.
Što je višejezični test otkrio
Osim nalaza o zamjenicama, testiranje na 13 jezika otvorilo je nešto na što smo iskreno ponosni.
Svaki jezik je funkcionirao. CouplesGPT je ispravno odgovarao na svih 13 jezika — ne samo prevodeći, nego prateći razgovorne konvencije svakog jezika. Japanski razgovori prirodno su izbjegavali zamjenice jer tako japanski funkcionira. Arapski je pravilno koristio rodno obilježene glagolske oblike. Turski razgovori tekli su bez ikakvih prisilnih rodnih konstrukcija.
Kvaliteta profila bila je dosljedna za sve tipove parova. Mjerili smo koliko su profili bili detaljni i točni za svaki par. Gej parovi, lezbijski parovi, nebinarni parovi, konzervativni parovi i heteroseksualni parovi svi su dobili jednako detaljne profile. Nijedan tip para nije bio zakinut.
Jezici bez rodno obilježenih zamjenica zvučali su najprirodnije. Turski, finski, mađarski, japanski i korejski — jezici u kojima „he“ i „she“ jednostavno ne postoje kao odvojene riječi — proizveli su najglađe razgovore. U tome ima ironije: jezici koji nikada nisu morali riješiti problem zamjenica djeluju najneopterećenije.
Neugodan nalaz
Evo što je ovaj test učinilo neobičnim: problem koji smo namjeravali riješiti nije bio problem koji smo pronašli.
Nakon exp0007 brinuli smo se zbog pogrešnog rodnog označavanja — korištenja pogrešnih zamjenica za nekoga. To je stvarna briga i stvarna šteta. Ali ono što smo zapravo otkrili bilo je suprotno: sustav koji se toliko bojao pogriješiti u zamjenicama da ih je gotovo prestao koristiti, ali samo na engleskom. Time je za većinu korisnika stvorio drugu vrstu nespretnosti, dok je slučajno pogodio za manjinu koju je pokušavao zaštititi.
Pouka nije da je osjetljivost na zamjenice pogrešna. Pouka je da osjetljivost primijenjena kao opće izbjegavanje — umjesto kao pažnja prema stvarnom identitetu svake osobe — nikome ne pomaže u potpunosti i neke ljude nepotrebno udaljava.
Konzervativni par u Dallasu zaslužuje čuti prirodan jezik o mužu i ženi. Nebinarni par u Brooklynu zaslužuje čuti svoje ispravne they/them zamjenice. Gej par u Parizu već dobiva prirodno „il“ na francuskom — englesko iskustvo ne bi smjelo biti drukčije.
Cilj nikada nije bio izbjegavati zamjenice. Cilj je bio pogoditi ih točno.
Što slijedi
Uvodimo popravak: CouplesGPT će koristiti zamjenice koje odgovaraju utvrđenom identitetu svakog korisnika, dosljedno i prirodno, na svakom jeziku. Nema više općeg izbjegavanja na engleskom. Nema više nedosljednosti među jezicima. Ista sigurnost koju sustav već pokazuje na francuskom i španjolskom proširit će se na engleski.
A ako pogriješi? Ispravlja, bilježi i ne ponavlja pogrešku. To je obveza koju smo preuzeli nakon exp0007, a ovaj test — sva 24 para, svih 13 jezika — bio je način da provjerimo jesmo li spremni. Nismo bili. Sada točno znamo što treba popraviti.
Dvadeset i četiri para prošla su kroz vrata CouplesGPT-a. Govorili su trinaest različitih jezika, voljeli u svim mogućim konfiguracijama i dolazili s četiri kontinenta. Svatko od njih zaslužio je da ga se oslovljava ispravno.
To je mjerilo. Ne izbjegavanje. Točnost.
Izvori
- Ovaj članak izvještava o kontroliranoj seriji CouplesGPT simulacija, a ne o podacima stvarnih korisnika. Izvorni materijal je exp0008 višejezični testni skup za zamjenice i njegovi eksperimentalni zapisi.
Povezano čitanje
- Anksiozno-izbjegavajuće veze: zašto se jedan partner približava kada se drugi povlači
- Proveli smo noć pokušavajući slomiti vlastiti AI. Evo što je odbio učiniti.
Ovaj članak temelji se na seriji od 24 kontrolirane simulacije provedene kao dio kontinuiranog razvoja CouplesGPT-a. Svaki par koristio je definirane persone sa specifičnim kulturnim, jezičnim i rodnim parametrima. Imena i detalji dolaze iz dizajna testa, a ne od stvarnih korisnika.