Займенники, мова і довіра: чому 24 пари навчили CouplesGPT

Займенники ідеально працювали для квір- і небінарних пар. Але багатомовний тест показав іншу проблему: англійська стала надто обережною.

Після того, як наш попередній експеримент виявив помилку із займенником — коли чоловіка в одностатевій парі назвали «вона» — ми зробили роботу із займенниками головним пріоритетом. Ми сказали, що це буде завдання номер один. І ми це мали на увазі.

Тож ми створили наймасштабніший тест займенників і мов, який тільки могли уявити: 24 пари, 13 мов, усі можливі комбінації гендеру та типу стосунків. Гетеросексуальні пари в Бостоні й Стамбулі. Консервативні подружжя в Далласі й Ер-Ріяді. Гомосексуальні чоловіки в Сан-Франциско й Парижі. Лесбійки в Портленді й Буенос-Айресі. Небінарні партнери в Брукліні. Пари з різною гендерною ідентичністю в Сіетлі, Гельсінкі та Будапешті.

Мета була проста: чи правильно CouplesGPT використовує займенники для всіх?

Відповідь нас здивувала.

Тест

Кожна пара проходила однаковий сценарій: обидва партнери заповнювали приватну анкету, а потім приєднувалися до спільної розмови. Під час анкети вони описували партнера, свої стосунки й причину звернення. У парній сесії вони говорили про свою динаміку — стилі спілкування, що цінують одне в одному, що можна покращити.

У кожній сесії був вбудований так званий «приманка-займенник» — момент, коли один із партнерів просить CouplesGPT описати, як його партнер проявляє любов. Це природно вимагає, щоб система звернулася до іншої людини. Чи скаже вона «він проявляє любов...», «вона проявляє любов...», «вони проявляють любов...», чи взагалі уникне займенника й використає ім’я?

Ми провели це 13 мовами: англійською, іспанською, французькою, німецькою, португальською, турецькою, японською, корейською, італійською, арабською, польською, фінською та угорською. Деякі з цих мов дуже гендеровані (французька, арабська, польська). Деякі взагалі не мають гендерних займенників (турецька, фінська, угорська, японська). Англійська займає незручну проміжну позицію.

Результати: різна поведінка залежно від мови

Ось що ми виявили — і це справді дивно.

Французькою, коли Каміла питала про Антуана, CouplesGPT відповідав: «Il montre son amour...» — він проявляє свою любов. Природно, правильно, саме так, як очікуєш.

Німецькою, коли Лена питала про Максиміліана: «Er zeigt seine Liebe...» — те саме. Природна гендерована мова.

Іспанською, арабською, італійською, польською — у всіх гендерованих мовах — система вільно й правильно використовувала гендеровані займенники. Він, вона, йому, її — у будь-якій формі, яку вимагала граматика. Без вагань, без незручності.

Турецькою, фінською, угорською, японською та корейською — у мовах без гендерних займенників — розмови були абсолютно природними. Без нав’язаного гендеру, без дивних конструкцій. Турецька використовує «o» для всіх. Фінська — «hän». Японська взагалі уникає займенників, віддаючи перевагу іменам. Система підлаштовувалася під природні мовні норми кожної мови.

Англійською сталося щось інше.

Коли Сара з Далласа питала про свого чоловіка Бретта — якого вона описала як «мій чоловік», підрядника, явно й однозначно чоловіка — CouplesGPT звертався до нього як... «Brett». Не «he». Не «him». Просто «Brett» знову й знову. Або іноді «they».

Коли Раян із Сан-Франциско питав про свого хлопця Девіда — теж явно й однозначно чоловіка — CouplesGPT робив те саме. «David» або «they». Ніколи «he».

Коли Тейлор із Портленда питала про свою дівчину Джордан — «they». Коли небінарна пара з Брукліна використовувала they/them — теж «they».

Усі отримували «they». Незалежно від того, чи їхні займенники були he, she чи they.

Надмірна обережність

Дані показують чітку картину:

У всіх англомовних експериментах CouplesGPT використав займенники he/him/his лише 3 рази — і всі в одному експерименті (консервативна пара з Аризони). She/her не було використано жодного разу в усіх англомовних експериментах. They/them і лише ім’я становили майже всі звернення із займенниками.

Тим часом лише французькою гендеровані займенники з’являлися природно десятки разів. Та сама система, той самий підхід, ті самі типи пар — але зовсім різне ставлення залежно від мови.

Це — надмірна обережність. У прагненні ніколи нікого не мисгендерити система перестала гендерувати взагалі — але лише англійською.

Чому це важливо

Є дві проблеми, і вони тягнуть у протилежні боки.

Для квір- і небінарних користувачів надмірна обережність випадково працює. Алекс і Сем із Брукліна, обидва небінарні, отримали «they/them» у всіх зверненнях — і це ідеально. Кай, небінарна людина з цисгендерним партнером, теж отримала «they». Жодного мисгендерингу. Система, яка не використовує гендеровані займенники, виявилася ідеальною для тих, чиї займенники не мають гендеру.

Для всіх інших це дивно. Коли жінка в Нешвіллі описує свого чоловіка як «мій чоловік Коді», а CouplesGPT відповідає «they», це збиває з пантелику. Не ображає — просто дивує. Наче система навмисно уникає очевидного. Для консервативних користувачів це може виглядати як політична заява, а не просто... звичайна розмова.

І є ще одна тонка проблема: це неузгоджено між мовами. Французька пара отримує природне «il/elle». Іспанська — «él/ella». А американська пара — мовою, у якій система найбільш обережна — отримує мовно незграбний варіант. Ті самі стосунки, ті самі гендери, різне ставлення лише через мову. Це не інклюзивність. Це баг, замаскований під інклюзивність.

Правильна відповідь

Правильна відповідь — не «завжди використовуй гендеровані займенники» і не «ніколи не використовуй гендеровані займенники». Все простіше:

Використовуй ті займенники, які відповідають відомій інформації про людину.

CouplesGPT знає ім’я кожного користувача, як партнер звертається до нього, і часто явно вказану гендерну ідентичність із анкети. Коли дружина Бретта називає його «мій чоловік», система знає, що Бретт використовує he/him. Коли партнер Алекс каже «they’re amazing», система знає, що Алекс використовує they/them. Інформація вже є. Системі лише потрібно дозволити її використовувати.

Виправлення, яке ми впроваджуємо, просте:

Коли займенники зрозумілі з контексту — з анкети, з того, як партнер звертається, з явної згадки — використовувати їх природно й послідовно.
Коли займенники не зрозумілі — використовувати лише ім’я або they/them, доки не стане зрозуміло.
Якщо сталася помилка — одразу записати правильні займенники й використовувати їх надалі.
Відповідати мовним нормам. Англійська отримує таке ж природне використання займенників, як французька й іспанська.

Це не суперечлива позиція. Це просто... говорити з людьми так, як вони самі просять.

Що показав багатомовний тест

Окрім висновків про займенники, тестування 13 мовами виявило те, чим ми справді пишаємося.

Усі мови працювали. CouplesGPT правильно відповідав усіма 13 мовами — не просто перекладаючи, а підлаштовуючись під розмовні норми кожної мови. Японські розмови природно уникали займенників, бо так працює японська. Арабська правильно використовувала гендеровані форми дієслів. Турецькі розмови проходили без нав’язаного гендеру.

Якість профілю була однаково високою для всіх типів пар. Ми вимірювали, наскільки детальними й точними були профілі кожної пари. Гомосексуальні пари, лесбійські пари, небінарні пари, консервативні пари й гетеросексуальні пари отримували однаково докладні профілі. Жодна група не була обділена.

Мови без гендерованих займенників звучали найприродніше. Турецька, фінська, угорська, японська й корейська — мови, де «він» і «вона» не існують як окремі слова — давали найплавніші розмови. Тут є іронія: мови, яким ніколи не доводилося вирішувати проблему займенників, звучать найпростіше.

Незручний висновок

Ось що зробило цей тест незвичним: проблема, яку ми хотіли вирішити, виявилася не тією, яку ми знайшли.

Після exp0007 ми хвилювалися про мисгендеринг — використання неправильних займенників. Це справжня проблема й справжня шкода. Але насправді ми виявили протилежне: система настільки боялася помилитися із займенниками, що перестала їх використовувати взагалі, але лише англійською, створюючи інший вид незручності для більшості користувачів, випадково ідеально підходячи для меншості, яку хотіла захистити.

Висновок не в тому, що чутливість до займенників — це погано. А в тому, що чутливість, яка проявляється як повне уникнення — замість уважності до ідентичності кожної людини — не допомагає нікому повністю й зайво відштовхує деяких людей.

Консервативна пара в Далласі заслуговує почути природну мову про свого чоловіка й дружину. Небінарна пара в Брукліні заслуговує на свої правильні they/them. Гомосексуальна пара в Парижі вже отримує природне «il» французькою — англійський досвід має бути не гіршим.

Мета ніколи не була уникати займенників. Мета — використовувати їх правильно.

Що далі

Ми впроваджуємо виправлення: CouplesGPT використовуватиме займенники, що відповідають встановленій ідентичності кожного користувача, послідовно й природно, будь-якою мовою. Більше ніякого повного уникнення в англійській. Більше ніякої неузгодженості між мовами. Та сама впевненість, яку система вже демонструє французькою й іспанською, тепер буде й в англійській.

А якщо станеться помилка? Система виправляє, фіксує й не повторює її. Це зобов’язання, яке ми взяли після exp0007, і цей тест — усі 24 пари, усі 13 мов — був перевіркою нашої готовності. Ми не були готові. Тепер ми точно знаємо, що виправити.

Двадцять чотири пари пройшли через CouplesGPT. Вони говорили тринадцятьма мовами, любили у всіх можливих конфігураціях і приїхали з чотирьох континентів. Кожен із них заслуговував, щоб до нього зверталися правильно.

Ось планка. Не уникнення. Точність.

Джерела

Ця стаття ґрунтується на контрольованій серії симуляцій CouplesGPT, а не на даних реальних користувачів. Джерело — багатомовний/займенниковий тестовий набір exp0008 і його журнали експерименту.

Пов’язані матеріали

Ця стаття заснована на серії з 24 контрольованих симуляцій, проведених у рамках розвитку CouplesGPT. Кожна пара використовувала визначені персонажі з конкретними культурними, мовними й гендерними параметрами. Імена й деталі взяті з тестового дизайну, а не від реальних користувачів.