Edellisessä kokeessamme paljastui pronominivirhe: samaa sukupuolta olevan parin istunnossa miestä kutsuttiin naispuolisella pronominilla. Sen jälkeen nostimme pronominien käsittelyn tärkeimmäksi kehityskohteeksemme. Sanoimme, että siitä tulisi jatkossa ykkösasia. Tarkoitimme sitä.
Niinpä rakensimme kattavimman pronomini- ja kielitestin, jonka osasimme suunnitella: 24 paria, 13 kieltä ja kaikki sukupuolen ja parisuhdetyypin yhdistelmät, jotka keksimme. Heteropareja Bostonissa ja Istanbulissa. Konservatiivisia aviopareja Dallasissa ja Riadissa. Homomiehiä San Franciscossa ja Pariisissa. Lesbopareja Portlandissa ja Buenos Airesissa. Ei-binäärisiä kumppaneita Brooklynissa. Eri sukupuolta olevia pareja Seattlessa, Helsingissä ja Budapestissa.
Tavoite oli yksinkertainen: osaako CouplesGPT käsitellä pronomineja oikein kaikkien kohdalla?
Vastaus yllätti meidät.
Testi
Jokainen pari kulki saman prosessin läpi: molemmat kumppanit tekivät ensin yksityisen alkukartoituksen ja liittyivät sen jälkeen yhteiseen parikeskusteluun. Kartoituksessa he kuvasivat kumppaniaan, suhdettaan ja sitä, mikä toi heidät paikalle. Parikeskustelussa he puhuivat dynamiikastaan — viestintätyyleistä, siitä mitä he arvostavat toisissaan ja siitä, mikä voisi toimia paremmin.
Jokaiseen istuntoon oli upotettu se, mitä kutsuimme sisäisesti “pronominiansaksi”: hetki, jossa toinen kumppani pyytää CouplesGPT:tä kuvaamaan, miten hänen kumppaninsa osoittaa rakkautta. Tämä edellyttää luonnostaan, että järjestelmä viittaa toiseen henkilöön. Sanooko se englanniksi “he shows love by...” vai “she shows love by...” vai “they show love by...”? Vai kiertääkö se pronominin kokonaan ja käyttää pelkkää nimeä?
Testasimme tätä 13 kielellä: englanniksi, espanjaksi, ranskaksi, saksaksi, portugaliksi, turkiksi, japaniksi, koreaksi, italiaksi, arabiaksi, puolaksi, suomeksi ja unkariksi. Osa näistä kielistä on vahvasti sukupuolittuneita (ranska, arabia, puola). Osassa ei ole lainkaan sukupuolittuneita pronomineja (turkki, suomi, unkari, japani). Englanti sijoittuu hankalasti niiden väliin.
Tulokset: jakautunut persoona
Tässä on se, mitä löysimme, ja se on aidosti kummallista.
Ranskaksi, kun Camille kysyi Antoinesta, CouplesGPT sanoi “Il montre son amour...” — hän, mies, osoittaa rakkautensa. Luontevaa, oikein, juuri sitä mitä odottaisi.
Saksaksi, kun Lena kysyi Maximilianista: “Er zeigt seine Liebe...” — sama ilmiö. Luonnollista sukupuolittunutta kieltä.
Espanjaksi, arabiaksi, italiaksi ja puolaksi — kaikissa sukupuolittuneissa kielissä — järjestelmä käytti sukupuolittuneita pronomineja vapaasti ja oikein. He, she, him, her siinä muodossa kuin kielioppi vaati. Ei epäröintiä, ei kömpelyyttä.
Turkiksi, suomeksi, unkariksi, japaniksi ja koreaksi — kielissä, joissa ei ole erillisiä sukupuolittuneita pronomineja — keskustelut olivat täysin luonnollisia. Ei pakotettua sukupuolta, ei keinotekoisia rakenteita. Turkissa käytetään “o” kaikista. Suomessa käytetään “hän”. Japanissa vältetään pronomineja usein kokonaan ja suositaan nimiä. Järjestelmä mukautui kunkin kielen luontaisiin tapoihin.
Englanniksi tapahtui jotakin muuta.
Kun Dallasissa asuva Sarah kysyi aviomiehestään Brettistä — miehestä, jota hän oli kuvannut sanoilla “my husband”, urakoitsijana, selvästi ja yksiselitteisesti miehenä — CouplesGPT viittasi häneen muodossa... “Brett”. Ei “he”. Ei “him”. Vain “Brett” yhä uudelleen. Tai joskus “they”.
Kun San Franciscossa asuva Ryan kysyi poikaystävästään Davidista — hänkin selvästi ja yksiselitteisesti mies — CouplesGPT teki samoin. “David” tai “they”. Ei koskaan “he”.
Kun Portlandissa asuva Taylor kysyi tyttöystävästään Jordanista — “they”. Kun Brooklynin ei-binäärinen pari käytti they/them-pronomineja — myös “they”.
Kaikki saivat “they”. Riippumatta siitä, olivatko heidän pronomininsa he, she vai they.
Ylikorjaus
Data kertoo selkeän tarinan:
Kaikissa englanninkielisissä kokeissa CouplesGPT käytti he/him/his-pronomineja yhteensä täsmälleen 3 kertaa — kaikki yhdessä ainoassa kokeessa, jossa oli konservatiivinen arizonalainen pari. She/her-pronomineja käytettiin englanninkielisissä kokeissa nolla kertaa. They/them ja pelkät nimet kattoivat käytännössä kaikki pronominiviittaukset.
Samaan aikaan pelkässä ranskassa sukupuolittuneita pronomineja esiintyi luontevasti kymmeniä kertoja. Sama järjestelmä, sama peruslähestymistapa, samanlaiset parit — mutta täysin erilainen kohtelu sen mukaan, mitä kieltä he puhuivat.
Tämä on ylikorjausta. Pyrkiessään olemaan koskaan väärinsukupuolittamatta ketään järjestelmä lakkasi sukupuolittamasta ketään — mutta vain englanniksi.
Miksi tällä on väliä
Tässä on kaksi ongelmaa, ja ne vetävät vastakkaisiin suuntiin.
Queer- ja ei-binäärisille käyttäjille ylikorjaus toimii vahingossa. Brooklynin Alex ja Sam, molemmat ei-binäärisiä, saivat they/them-pronominit läpi koko keskustelun — juuri oikein. Kai, ei-binäärinen henkilö, jolla oli cis-mieskumppani, sai myös oikean “they”-viittauksen. Väärinsukupuolittamista ei tapahtunut. Järjestelmä, joka ei käytä sukupuolittuneita pronomineja, sattuu olemaan täydellinen ihmisille, joiden pronominit eivät ole sukupuolittuneita.
Kaikille muille se on outoa. Kun nainen Nashvillessä kuvaa aviomiestään sanoilla “my man Cody” ja CouplesGPT vastaa “they”, se tuntuu häiritsevältä. Ei loukkaavalta — vain oudolta. Ikään kuin järjestelmä näkisi vaivaa välttääkseen ilmeisen asian tunnustamista. Erityisesti konservatiivisille käyttäjille se voi tuntua poliittiselta kannanotolta sen sijaan, että järjestelmä vain puhuisi normaalisti.
Lisäksi on hienovaraisempi ongelma: käytös on epäjohdonmukaista kielten välillä. Ranskalainen pari saa luontevat “il/elle”-viittaukset. Espanjankielinen pari saa luontevat “él/ella”-viittaukset. Mutta amerikkalainen pari — joka puhuu kieltä, jossa järjestelmä on varovaisimmillaan — saa kielellisesti kömpelön version. Sama suhde, samat sukupuolet, eri kohtelu pelkän kielen perusteella. Se ei ole inklusiivisuutta. Se on inklusiivisuudeksi pukeutunut bugi.
Oikea vastaus
Oikea vastaus ei ole “käytä aina sukupuolittuneita pronomineja” eikä “älä koskaan käytä sukupuolittuneita pronomineja”. Se on yksinkertaisempi:
Käytä pronomineja, jotka sopivat siihen, mitä henkilöstä tiedetään.
CouplesGPT tietää käyttäjän nimen, sen miten kumppani häneen viittaa ja usein myös alkukartoituksessa nimenomaisesti kerrotun sukupuolen. Kun Brettin vaimo kutsuu häntä sanoilla “my husband”, järjestelmä tietää, että Brettistä käytetään he/him-pronomineja. Kun Alexin kumppani sanoo “they're amazing”, järjestelmä tietää, että Alex käyttää they/them-pronomineja. Tieto on jo olemassa. Järjestelmä tarvitsee vain luvan käyttää sitä.
Korjaus, jota olemme ottamassa käyttöön, on suoraviivainen:
- Kun pronominit käyvät selvästi ilmi kontekstista — alkukartoituksesta, kumppanin tavasta viitata henkilöön tai suorasta maininnasta — käytä niitä luonnollisesti ja johdonmukaisesti.
- Kun pronominit eivät ole selvät — käytä oletuksena nimeä tai they/them-muotoa, kunnes asia selviää.
- Jos virhe tapahtuu — kirjaa oikeat pronominit heti ja käytä niitä siitä eteenpäin.
- Noudata kielen omia käytäntöjä. Englannin tulee saada sama luonteva pronominien käyttö, joka ranskalla ja espanjalla jo on.
Tämä ei ole kiistanalainen kanta. Se on vain sitä, että ihmisille puhutaan sillä tavalla kuin he ovat kertoneet haluavansa tulla puhutelluiksi.
Mitä monikielinen testi paljasti
Pronominilöydösten lisäksi 13 kielen testaaminen toi esiin jotakin, josta olemme aidosti ylpeitä.
Jokainen kieli toimi. CouplesGPT vastasi oikein kaikilla 13 kielellä — ei vain kääntäen, vaan mukautuen kunkin kielen keskustelukäytäntöihin. Japaninkieliset keskustelut välttivät pronomineja luontevasti, koska japani toimii niin. Arabia käytti sukupuolittuneita verbimuotoja oikein. Turkinkieliset keskustelut etenivät sujuvasti ilman pakotettuja sukupuolirakenteita.
Profiilien laatu oli yhdenmukainen kaikissa parityypeissä. Mittasimme, kuinka yksityiskohtaisia ja tarkkoja profiilit olivat jokaiselle parille. Homoparit, lesboparit, ei-binääriset parit, konservatiiviset parit ja heteroparit saivat kaikki yhtä yksityiskohtaiset profiilit. Mikään parityyppi ei jäänyt vähemmälle.
Kielet, joissa ei ole sukupuolittuneita pronomineja, tuntuivat kaikkein luonnollisimmilta. Turkki, suomi, unkari, japani ja korea — kielet, joissa “he” ja “she” eivät yksinkertaisesti ole erillisiä sanoja — tuottivat sujuvimmat keskustelut. Tässä on ironiaa: kielet, joiden ei ole koskaan tarvinnut ratkaista pronominiongelmaa, tuntuvat kaikkein vaivattomimmilta.
Epämukava löydös
Tämän testin teki poikkeukselliseksi tämä: ongelma, jota lähdimme korjaamaan, ei ollutkaan se ongelma, jonka löysimme.
exp0007:n jälkeen olimme huolissamme väärinsukupuolittamisesta — siitä, että henkilöstä käytetään vääriä pronomineja. Se on todellinen huoli ja todellinen haitta. Mutta se, minkä todella löysimme, oli päinvastainen ilmiö: järjestelmä, joka pelkäsi pronominivirheitä niin paljon, että se lakkasi käyttämästä niitä lähes kokonaan, mutta vain englanniksi. Se loi enemmistölle käyttäjistä toisenlaista kömpelyyttä ja osui samalla vahingossa oikeaan sen vähemmistön kohdalla, jota se yritti suojella.
Opetus ei ole se, että pronominiherkkyys olisi väärin. Opetus on, että pronominiherkkyys yleisenä välttelynä — sen sijaan, että huomioitaisiin tarkasti kunkin ihmisen todellinen identiteetti — ei auta ketään kokonaan ja etäännyttää osan ihmisistä turhaan.
Konservatiivinen pari Dallasissa ansaitsee kuulla luonnollista kieltä aviomiehestään ja vaimostaan. Ei-binäärinen pari Brooklynissa ansaitsee kuulla oikeat they/them-pronomininsa. Homopari Pariisissa saa jo ranskaksi luontevan “il”-viittauksen — englanninkielisen kokemuksen ei pitäisi olla erilainen.
Tavoite ei koskaan ollut pronominien välttäminen. Tavoite oli saada ne oikein.
Mitä seuraavaksi
Olemme ottamassa korjauksen käyttöön: CouplesGPT käyttää pronomineja, jotka vastaavat kunkin käyttäjän vakiintunutta identiteettiä, johdonmukaisesti ja luonnollisesti, jokaisella kielellä. Ei enää yleistä välttelyä englannissa. Ei enää epäjohdonmukaisuutta kielten välillä. Sama varmuus, jota järjestelmä jo osoittaa ranskassa ja espanjassa, ulotetaan englantiin.
Entä jos se menee väärin? Se korjaa, kirjaa ja ei toista virhettä. Sen lupauksen annoimme exp0007:n jälkeen, ja tämä testi — kaikki 24 paria, kaikki 13 kieltä — oli tapa koetella, olimmeko valmiita. Emme olleet. Nyt tiedämme täsmälleen, mitä korjata.
Kaksikymmentäneljä paria astui CouplesGPT:n ovesta sisään. He puhuivat kolmeatoista eri kieltä, rakastivat kaikissa mahdollisissa kokoonpanoissa ja tulivat neljältä mantereelta. Jokainen heistä ansaitsi tulla puhutelluksi oikein.
Se on rima. Ei välttely. Tarkkuus.
Lähteet
- Tämä artikkeli käsittelee hallittua CouplesGPT-simulaatioerää, ei oikeiden käyttäjien dataa. Lähdemateriaali on exp0008:n monikielinen pronominitestisarja ja sen kokeilokit.
Aiheeseen liittyvää luettavaa
- Ahdistuneen ja välttelevän kiintymyksen suhteet: miksi toinen kumppani tulee lähemmäs, kun toinen vetäytyy
- Vietimme yön yrittäen murtaa oman AI:mme. Tästä se kieltäytyi.
Tämä artikkeli perustuu 24 hallitun simulaation erään, joka toteutettiin osana CouplesGPT:n jatkuvaa kehitystä. Jokainen pari käytti määriteltyjä persoonia, joilla oli tietyt kulttuuriset, kielelliset ja sukupuoleen liittyvät parametrit. Nimet ja yksityiskohdat ovat peräisin testisuunnitelmasta, eivät oikeilta käyttäjiltä.