ضمیر، زبان و اعتماد: ۲۴ زوج چه چیزی به CouplesGPT آموختند

ضمیرها برای زوج‌های queer و نان‌باینری عالی کار می‌کردند. سپس آزمون چندزبانه مشکل دیگری نشان داد: انگلیسی بیش از حد محتاط شده بود.

بعد از آخرین آزمایشمان، جایی که یک لغزش در ضمیر پیدا شد — در جلسه یک زوج هم‌جنس، یک مرد با «her» خطاب شده بود — رسیدگی به ضمیرها را به اولویت اصلی تبدیل کردیم. گفتیم از این به بعد تمرکز شماره یک ما همین است. جدی می‌گفتیم.

برای همین جامع‌ترین آزمون ضمیر و زبان را که می‌توانستیم طراحی کنیم ساختیم: ۲۴ زوج، ۱۳ زبان، و هر ترکیبی از جنسیت و نوع رابطه که به ذهنمان رسید. زوج‌های زن و مرد در بوستون و استانبول. زوج‌های متأهل محافظه‌کار در دالاس و ریاض. مردان همجنس‌گرا در سان‌فرانسیسکو و پاریس. زوج‌های زن همجنس‌گرا در پورتلند و بوئنوس‌آیرس. شریک‌های نان‌باینری در بروکلین. زوج‌های با جنسیت‌های متفاوت در سیاتل، هلسینکی و بوداپست.

هدف ساده بود: آیا CouplesGPT ضمیرها را برای همه درست به کار می‌برد؟

پاسخ ما را غافلگیر کرد.

آزمون

هر زوج از یک مسیر یکسان عبور کرد: هر دو شریک ابتدا یک intake خصوصی را کامل کردند و بعد وارد گفت‌وگوی مشترک زوج شدند. در intake، شریکشان، رابطه‌شان و دلیل آمدنشان را توصیف کردند. در جلسه زوج، درباره پویایی رابطه‌شان حرف زدند — سبک‌های ارتباطی، چیزهایی که در یکدیگر قدر می‌دانند، و چیزهایی که می‌تواند بهتر شود.

در هر جلسه لحظه‌ای قرار داده بودیم که در داخل تیم به آن «طعمه ضمیر» می‌گفتیم: یکی از شریک‌ها از CouplesGPT می‌خواهد توضیح دهد شریک دیگر چگونه عشقش را نشان می‌دهد. این به شکل طبیعی سیستم را مجبور می‌کند به آن شخص دیگر اشاره کند. آیا می‌گوید «he shows love by...»، یا «she shows love by...»، یا «they show love by...»؟ یا ضمیر را کاملاً دور می‌زند و فقط از نام استفاده می‌کند؟

این آزمون را در ۱۳ زبان اجرا کردیم: انگلیسی، اسپانیایی، فرانسوی، آلمانی، پرتغالی، ترکی، ژاپنی، کره‌ای، ایتالیایی، عربی، لهستانی، فنلاندی و مجاری. بعضی از این زبان‌ها به‌شدت جنسیت‌مند هستند (فرانسوی، عربی، لهستانی). بعضی اصلاً ضمیر جنسیت‌مند ندارند (ترکی، فنلاندی، مجاری، ژاپنی). انگلیسی به شکل ناخوشایندی جایی در میانه ایستاده است.

نتایج: شخصیتی دوپاره

آنچه پیدا کردیم واقعاً عجیب بود.

در فرانسوی، وقتی Camille درباره Antoine پرسید، CouplesGPT گفت «Il montre son amour...» — یعنی او، به‌صورت مذکر، عشقش را نشان می‌دهد. طبیعی، درست، دقیقاً همان چیزی که انتظار می‌رود.

در آلمانی، وقتی Lena درباره Maximilian پرسید: «Er zeigt seine Liebe...» — همان وضعیت. زبان جنسیت‌مند طبیعی.

در اسپانیایی، عربی، ایتالیایی و لهستانی — در همه زبان‌های جنسیت‌مند — سیستم آزادانه و درست از ضمیرهای جنسیت‌مند استفاده کرد. He, she, him, her — در هر شکلی که دستور زبان لازم داشت. بدون تردید، بدون دست‌انداز.

در ترکی، فنلاندی، مجاری، ژاپنی و کره‌ای — زبان‌هایی که ضمیر جنسیت‌مند ندارند — گفت‌وگوها کاملاً طبیعی بودند. جنسیت اجباری نبود، ساختارهای ناآشنا هم نبود. ترکی از «o» برای همه استفاده می‌کند. فنلاندی از «hän» استفاده می‌کند. ژاپنی غالباً ضمیرها را کاملاً کنار می‌گذارد و نام‌ها را ترجیح می‌دهد. سیستم با رسم طبیعی هر زبان هماهنگ شد.

در انگلیسی اما چیز دیگری رخ داد.

وقتی Sarah در دالاس درباره همسرش Brett پرسید — مردی که او را «my husband» توصیف کرده بود، پیمانکار دانسته بود، و کاملاً روشن بود مرد است — CouplesGPT به او اشاره کرد با... «Brett». نه «he». نه «him». فقط «Brett»، بارها و بارها. یا گاهی «they».

وقتی Ryan در سان‌فرانسیسکو درباره دوست‌پسرش David پرسید — او هم کاملاً روشن بود مرد است — CouplesGPT همان کار را کرد. «David» یا «they». هرگز «he».

وقتی Taylor در پورتلند درباره دوست‌دخترش Jordan پرسید — «they». وقتی زوج نان‌باینری در بروکلین از they/them استفاده می‌کردند — باز هم «they».

همه «they» گرفتند. فرقی نداشت ضمیرهایشان he، she یا they باشد.

اصلاح بیش از حد

داده‌ها داستان روشنی می‌گویند:

در همه آزمایش‌های انگلیسی، CouplesGPT ضمیرهای he/him/his را در مجموع دقیقاً ۳ بار استفاده کرد — همه در یک آزمایش واحد، با یک زوج محافظه‌کار از آریزونا. She/her در همه آزمایش‌های انگلیسی صفر بار استفاده شد. They/them و اشاره فقط با نام تقریباً همه ارجاع‌ها را پوشاندند.

در همین حال، فقط در فرانسوی، ضمیرهای جنسیت‌مند ده‌ها بار به شکل طبیعی ظاهر شدند. همان سیستم، همان رویکرد زیربنایی، همان نوع زوج‌ها — اما رفتاری کاملاً متفاوت فقط بر اساس زبانی که حرف می‌زدند.

این اصلاح بیش از حد است. سیستم برای اینکه هرگز کسی را با جنسیت نادرست خطاب نکند، از جنسیت‌مند کردن همه دست کشید — اما فقط در انگلیسی.

چرا مهم است

اینجا دو مشکل وجود دارد، و در جهت‌های مخالف می‌کشند.

برای کاربران queer و نان‌باینری، این اصلاح بیش از حد تصادفاً جواب می‌دهد. Alex و Sam در بروکلین، هر دو نان‌باینری، در تمام گفت‌وگو they/them گرفتند — دقیقاً درست. Kai، فردی نان‌باینری با شریک مرد cis، هم درست با «they» خطاب شد. misgendering رخ نداد. سیستمی که ضمیرهای جنسیت‌مند استفاده نمی‌کند، تصادفاً برای کسانی که ضمیرهایشان جنسیت‌مند نیست عالی است.

برای بقیه، عجیب است. وقتی زنی در نشویل همسرش را «my man Cody» توصیف می‌کند و CouplesGPT با «they» جواب می‌دهد، آزاردهنده نیست، اما نامأنوس است. انگار سیستم دارد تلاش می‌کند یک چیز آشکار را نپذیرد. برای کاربران محافظه‌کار به‌ویژه، این می‌تواند شبیه موضع‌گیری سیاسی به نظر برسد، نه فقط حرف زدن عادی.

مسئله ظریف‌تری هم هست: بین زبان‌ها ناسازگار است. یک زوج فرانسوی «il/elle» طبیعی می‌گیرد. یک زوج اسپانیایی «él/ella» طبیعی می‌گیرد. اما یک زوج آمریکایی — با زبانی که سیستم در آن محتاط‌ترین است — نسخه‌ای زبان‌شناختی و ناهنجار می‌گیرد. همان رابطه، همان جنسیت‌ها، رفتار متفاوت فقط به خاطر زبان. این فراگیری نیست. این باگی است که لباس فراگیری پوشیده.

پاسخ درست

پاسخ درست «همیشه از ضمیرهای جنسیت‌مند استفاده کن» نیست، و «هرگز از ضمیرهای جنسیت‌مند استفاده نکن» هم نیست. ساده‌تر است:

ضمیرهایی را استفاده کن که با دانسته‌هایت درباره آن شخص سازگارند.

CouplesGPT نام هر کاربر را می‌داند، می‌داند شریکش چگونه به او اشاره می‌کند، و اغلب جنسیتی را که در intake صریحاً گفته شده می‌داند. وقتی همسر Brett او را «my husband» می‌خواند، سیستم می‌داند Brett از he/him استفاده می‌کند. وقتی شریک Alex می‌گوید «they're amazing»، سیستم می‌داند Alex از they/them استفاده می‌کند. اطلاعات از قبل وجود دارد. سیستم فقط باید اجازه استفاده از آن را داشته باشد.

اصلاحی که اجرا می‌کنیم مستقیم است:

وقتی ضمیرها از زمینه روشن‌اند — از intake، از شیوه اشاره شریک، یا از ذکر صریح — آن‌ها را طبیعی و پیوسته استفاده کن.
وقتی ضمیرها روشن نیستند — تا زمان روشن شدن، از نام یا they/them استفاده کن.
اگر خطایی رخ داد — ضمیرهای درست را فوراً ثبت کن و از همان لحظه به بعد از آن‌ها استفاده کن.
با رسم زبان هماهنگ باش. انگلیسی باید همان کاربرد طبیعی ضمیر را داشته باشد که فرانسوی و اسپانیایی از قبل دارند.

این موضع جنجالی نیست. فقط یعنی با آدم‌ها همان‌طور حرف بزنیم که نشان داده‌اند می‌خواهند درباره‌شان حرف زده شود.

آزمون چندزبانه چه چیز دیگری نشان داد

فراتر از یافته‌های مربوط به ضمیر، آزمایش در ۱۳ زبان چیزی را نشان داد که واقعاً به آن افتخار می‌کنیم.

همه زبان‌ها کار کردند. CouplesGPT در هر ۱۳ زبان درست پاسخ داد — نه فقط ترجمه، بلکه مطابق رسم گفت‌وگوی هر زبان. گفت‌وگوهای ژاپنی به‌طور طبیعی از ضمیرها پرهیز کردند، چون ژاپنی این‌گونه کار می‌کند. عربی شکل‌های فعلی جنسیت‌مند را درست به کار برد. گفت‌وگوهای ترکی بدون هیچ ساختار جنسیتی اجباری روان پیش رفتند.

کیفیت پروفایل‌ها در همه نوع زوج ثابت بود. ما سنجیدیم پروفایل هر زوج چقدر دقیق و مفصل بود. زوج‌های gay، زوج‌های lesbian، زوج‌های نان‌باینری، زوج‌های محافظه‌کار و زوج‌های straight همگی پروفایل‌هایی به یک اندازه مفصل گرفتند. هیچ نوع زوجی کم‌برخوردار نشد.

زبان‌های بدون ضمیر جنسیت‌مند طبیعی‌ترین حس را داشتند. ترکی، فنلاندی، مجاری، ژاپنی و کره‌ای — زبان‌هایی که در آن‌ها «he» و «she» به‌عنوان دو واژه جدا وجود ندارند — روان‌ترین گفت‌وگوها را تولید کردند. طنزی در این هست: زبان‌هایی که هرگز مجبور نبودند مسئله ضمیر را حل کنند، بی‌زحمت‌ترین به نظر می‌رسند.

یافته ناراحت‌کننده

چیزی که این آزمون را غیرعادی کرد این بود: مشکلی که برای حلش شروع کرده بودیم، مشکلی نبود که پیدا کردیم.

بعد از exp0007، نگران misgendering بودیم — استفاده از ضمیر اشتباه برای یک نفر. این نگرانی واقعی است و آسیب واقعی دارد. اما چیزی که واقعاً کشف کردیم برعکس بود: سیستمی که آن‌قدر از اشتباه در ضمیر می‌ترسید که تقریباً استفاده از آن را کنار گذاشته بود، اما فقط در انگلیسی. این برای اکثریت کاربران نوع دیگری از ناهنجاری ساخت، در حالی که برای اقلیتی که می‌خواست از آن محافظت کند تصادفاً درست عمل کرد.

درس این نیست که حساسیت به ضمیر اشتباه است. درس این است که اگر حساسیت به ضمیر به جای توجه دقیق به هویت واقعی هر فرد، به پرهیز کلی تبدیل شود، به هیچ‌کس به‌طور کامل کمک نمی‌کند و بعضی‌ها را بی‌دلیل دور می‌کند.

یک زوج محافظه‌کار در دالاس سزاوار است درباره شوهر و زن خود زبان طبیعی بشنود. یک زوج نان‌باینری در بروکلین سزاوار است they/them درست خود را بشنود. یک زوج gay در پاریس از قبل در فرانسوی «il» طبیعی می‌گیرد — تجربه انگلیسی نباید متفاوت باشد.

هدف هرگز پرهیز از ضمیرها نبود. هدف درست به کار بردن آن‌ها بود.

بعد چه می‌شود

ما اصلاح را منتشر می‌کنیم: CouplesGPT در هر زبان، ضمیرهایی را که با هویت تثبیت‌شده هر کاربر سازگارند، طبیعی و پیوسته استفاده خواهد کرد. دیگر پرهیز کلی در انگلیسی نیست. دیگر ناسازگاری بین زبان‌ها نیست. همان اطمینانی که سیستم در فرانسوی و اسپانیایی نشان می‌دهد، به انگلیسی هم گسترش می‌یابد.

و اگر اشتباه کند؟ اصلاح می‌کند، ثبت می‌کند و اشتباه را تکرار نمی‌کند. این تعهدی بود که بعد از exp0007 دادیم، و این آزمون — ۲۴ زوج، ۱۳ زبان — راهی بود برای اینکه زیر فشار ببینیم آماده‌ایم یا نه. آماده نبودیم. حالا دقیقاً می‌دانیم چه چیزی را باید درست کنیم.

بیست‌وچهار زوج از در CouplesGPT وارد شدند. به سیزده زبان متفاوت حرف زدند، در هر ترکیبی عشق ورزیدند، و از چهار قاره آمدند. تک‌تکشان سزاوار بودند درست خطاب شوند.

معیار همین است. نه پرهیز. دقت.

منابع

این مقاله درباره یک دسته شبیه‌سازی کنترل‌شده CouplesGPT گزارش می‌دهد، نه داده کاربران واقعی. مواد منبع، مجموعه آزمون چندزبانه/ضمیر exp0008 و گزارش‌های آزمایش آن است.

مطالعه‌های مرتبط

این مقاله بر پایه دسته‌ای از ۲۴ شبیه‌سازی کنترل‌شده نوشته شده که بخشی از توسعه مداوم CouplesGPT بودند. هر زوج از پرسوناهای تعریف‌شده با پارامترهای فرهنگی، زبانی و جنسیتی مشخص استفاده کرد. نام‌ها و جزئیات از طراحی آزمون آمده‌اند، نه از کاربران واقعی.