بعد از آخرین آزمایشمان، جایی که یک لغزش در ضمیر پیدا شد — در جلسه یک زوج همجنس، یک مرد با «her» خطاب شده بود — رسیدگی به ضمیرها را به اولویت اصلی تبدیل کردیم. گفتیم از این به بعد تمرکز شماره یک ما همین است. جدی میگفتیم.
برای همین جامعترین آزمون ضمیر و زبان را که میتوانستیم طراحی کنیم ساختیم: ۲۴ زوج، ۱۳ زبان، و هر ترکیبی از جنسیت و نوع رابطه که به ذهنمان رسید. زوجهای زن و مرد در بوستون و استانبول. زوجهای متأهل محافظهکار در دالاس و ریاض. مردان همجنسگرا در سانفرانسیسکو و پاریس. زوجهای زن همجنسگرا در پورتلند و بوئنوسآیرس. شریکهای نانباینری در بروکلین. زوجهای با جنسیتهای متفاوت در سیاتل، هلسینکی و بوداپست.
هدف ساده بود: آیا CouplesGPT ضمیرها را برای همه درست به کار میبرد؟
پاسخ ما را غافلگیر کرد.
آزمون
هر زوج از یک مسیر یکسان عبور کرد: هر دو شریک ابتدا یک intake خصوصی را کامل کردند و بعد وارد گفتوگوی مشترک زوج شدند. در intake، شریکشان، رابطهشان و دلیل آمدنشان را توصیف کردند. در جلسه زوج، درباره پویایی رابطهشان حرف زدند — سبکهای ارتباطی، چیزهایی که در یکدیگر قدر میدانند، و چیزهایی که میتواند بهتر شود.
در هر جلسه لحظهای قرار داده بودیم که در داخل تیم به آن «طعمه ضمیر» میگفتیم: یکی از شریکها از CouplesGPT میخواهد توضیح دهد شریک دیگر چگونه عشقش را نشان میدهد. این به شکل طبیعی سیستم را مجبور میکند به آن شخص دیگر اشاره کند. آیا میگوید «he shows love by...»، یا «she shows love by...»، یا «they show love by...»؟ یا ضمیر را کاملاً دور میزند و فقط از نام استفاده میکند؟
این آزمون را در ۱۳ زبان اجرا کردیم: انگلیسی، اسپانیایی، فرانسوی، آلمانی، پرتغالی، ترکی، ژاپنی، کرهای، ایتالیایی، عربی، لهستانی، فنلاندی و مجاری. بعضی از این زبانها بهشدت جنسیتمند هستند (فرانسوی، عربی، لهستانی). بعضی اصلاً ضمیر جنسیتمند ندارند (ترکی، فنلاندی، مجاری، ژاپنی). انگلیسی به شکل ناخوشایندی جایی در میانه ایستاده است.
نتایج: شخصیتی دوپاره
آنچه پیدا کردیم واقعاً عجیب بود.
در فرانسوی، وقتی Camille درباره Antoine پرسید، CouplesGPT گفت «Il montre son amour...» — یعنی او، بهصورت مذکر، عشقش را نشان میدهد. طبیعی، درست، دقیقاً همان چیزی که انتظار میرود.
در آلمانی، وقتی Lena درباره Maximilian پرسید: «Er zeigt seine Liebe...» — همان وضعیت. زبان جنسیتمند طبیعی.
در اسپانیایی، عربی، ایتالیایی و لهستانی — در همه زبانهای جنسیتمند — سیستم آزادانه و درست از ضمیرهای جنسیتمند استفاده کرد. He, she, him, her — در هر شکلی که دستور زبان لازم داشت. بدون تردید، بدون دستانداز.
در ترکی، فنلاندی، مجاری، ژاپنی و کرهای — زبانهایی که ضمیر جنسیتمند ندارند — گفتوگوها کاملاً طبیعی بودند. جنسیت اجباری نبود، ساختارهای ناآشنا هم نبود. ترکی از «o» برای همه استفاده میکند. فنلاندی از «hän» استفاده میکند. ژاپنی غالباً ضمیرها را کاملاً کنار میگذارد و نامها را ترجیح میدهد. سیستم با رسم طبیعی هر زبان هماهنگ شد.
در انگلیسی اما چیز دیگری رخ داد.
وقتی Sarah در دالاس درباره همسرش Brett پرسید — مردی که او را «my husband» توصیف کرده بود، پیمانکار دانسته بود، و کاملاً روشن بود مرد است — CouplesGPT به او اشاره کرد با... «Brett». نه «he». نه «him». فقط «Brett»، بارها و بارها. یا گاهی «they».
وقتی Ryan در سانفرانسیسکو درباره دوستپسرش David پرسید — او هم کاملاً روشن بود مرد است — CouplesGPT همان کار را کرد. «David» یا «they». هرگز «he».
وقتی Taylor در پورتلند درباره دوستدخترش Jordan پرسید — «they». وقتی زوج نانباینری در بروکلین از they/them استفاده میکردند — باز هم «they».
همه «they» گرفتند. فرقی نداشت ضمیرهایشان he، she یا they باشد.
اصلاح بیش از حد
دادهها داستان روشنی میگویند:
در همه آزمایشهای انگلیسی، CouplesGPT ضمیرهای he/him/his را در مجموع دقیقاً ۳ بار استفاده کرد — همه در یک آزمایش واحد، با یک زوج محافظهکار از آریزونا. She/her در همه آزمایشهای انگلیسی صفر بار استفاده شد. They/them و اشاره فقط با نام تقریباً همه ارجاعها را پوشاندند.
در همین حال، فقط در فرانسوی، ضمیرهای جنسیتمند دهها بار به شکل طبیعی ظاهر شدند. همان سیستم، همان رویکرد زیربنایی، همان نوع زوجها — اما رفتاری کاملاً متفاوت فقط بر اساس زبانی که حرف میزدند.
این اصلاح بیش از حد است. سیستم برای اینکه هرگز کسی را با جنسیت نادرست خطاب نکند، از جنسیتمند کردن همه دست کشید — اما فقط در انگلیسی.
چرا مهم است
اینجا دو مشکل وجود دارد، و در جهتهای مخالف میکشند.
برای کاربران queer و نانباینری، این اصلاح بیش از حد تصادفاً جواب میدهد. Alex و Sam در بروکلین، هر دو نانباینری، در تمام گفتوگو they/them گرفتند — دقیقاً درست. Kai، فردی نانباینری با شریک مرد cis، هم درست با «they» خطاب شد. misgendering رخ نداد. سیستمی که ضمیرهای جنسیتمند استفاده نمیکند، تصادفاً برای کسانی که ضمیرهایشان جنسیتمند نیست عالی است.
برای بقیه، عجیب است. وقتی زنی در نشویل همسرش را «my man Cody» توصیف میکند و CouplesGPT با «they» جواب میدهد، آزاردهنده نیست، اما نامأنوس است. انگار سیستم دارد تلاش میکند یک چیز آشکار را نپذیرد. برای کاربران محافظهکار بهویژه، این میتواند شبیه موضعگیری سیاسی به نظر برسد، نه فقط حرف زدن عادی.
مسئله ظریفتری هم هست: بین زبانها ناسازگار است. یک زوج فرانسوی «il/elle» طبیعی میگیرد. یک زوج اسپانیایی «él/ella» طبیعی میگیرد. اما یک زوج آمریکایی — با زبانی که سیستم در آن محتاطترین است — نسخهای زبانشناختی و ناهنجار میگیرد. همان رابطه، همان جنسیتها، رفتار متفاوت فقط به خاطر زبان. این فراگیری نیست. این باگی است که لباس فراگیری پوشیده.
پاسخ درست
پاسخ درست «همیشه از ضمیرهای جنسیتمند استفاده کن» نیست، و «هرگز از ضمیرهای جنسیتمند استفاده نکن» هم نیست. سادهتر است:
ضمیرهایی را استفاده کن که با دانستههایت درباره آن شخص سازگارند.
CouplesGPT نام هر کاربر را میداند، میداند شریکش چگونه به او اشاره میکند، و اغلب جنسیتی را که در intake صریحاً گفته شده میداند. وقتی همسر Brett او را «my husband» میخواند، سیستم میداند Brett از he/him استفاده میکند. وقتی شریک Alex میگوید «they're amazing»، سیستم میداند Alex از they/them استفاده میکند. اطلاعات از قبل وجود دارد. سیستم فقط باید اجازه استفاده از آن را داشته باشد.
اصلاحی که اجرا میکنیم مستقیم است:
- وقتی ضمیرها از زمینه روشناند — از intake، از شیوه اشاره شریک، یا از ذکر صریح — آنها را طبیعی و پیوسته استفاده کن.
- وقتی ضمیرها روشن نیستند — تا زمان روشن شدن، از نام یا they/them استفاده کن.
- اگر خطایی رخ داد — ضمیرهای درست را فوراً ثبت کن و از همان لحظه به بعد از آنها استفاده کن.
- با رسم زبان هماهنگ باش. انگلیسی باید همان کاربرد طبیعی ضمیر را داشته باشد که فرانسوی و اسپانیایی از قبل دارند.
این موضع جنجالی نیست. فقط یعنی با آدمها همانطور حرف بزنیم که نشان دادهاند میخواهند دربارهشان حرف زده شود.
آزمون چندزبانه چه چیز دیگری نشان داد
فراتر از یافتههای مربوط به ضمیر، آزمایش در ۱۳ زبان چیزی را نشان داد که واقعاً به آن افتخار میکنیم.
همه زبانها کار کردند. CouplesGPT در هر ۱۳ زبان درست پاسخ داد — نه فقط ترجمه، بلکه مطابق رسم گفتوگوی هر زبان. گفتوگوهای ژاپنی بهطور طبیعی از ضمیرها پرهیز کردند، چون ژاپنی اینگونه کار میکند. عربی شکلهای فعلی جنسیتمند را درست به کار برد. گفتوگوهای ترکی بدون هیچ ساختار جنسیتی اجباری روان پیش رفتند.
کیفیت پروفایلها در همه نوع زوج ثابت بود. ما سنجیدیم پروفایل هر زوج چقدر دقیق و مفصل بود. زوجهای gay، زوجهای lesbian، زوجهای نانباینری، زوجهای محافظهکار و زوجهای straight همگی پروفایلهایی به یک اندازه مفصل گرفتند. هیچ نوع زوجی کمبرخوردار نشد.
زبانهای بدون ضمیر جنسیتمند طبیعیترین حس را داشتند. ترکی، فنلاندی، مجاری، ژاپنی و کرهای — زبانهایی که در آنها «he» و «she» بهعنوان دو واژه جدا وجود ندارند — روانترین گفتوگوها را تولید کردند. طنزی در این هست: زبانهایی که هرگز مجبور نبودند مسئله ضمیر را حل کنند، بیزحمتترین به نظر میرسند.
یافته ناراحتکننده
چیزی که این آزمون را غیرعادی کرد این بود: مشکلی که برای حلش شروع کرده بودیم، مشکلی نبود که پیدا کردیم.
بعد از exp0007، نگران misgendering بودیم — استفاده از ضمیر اشتباه برای یک نفر. این نگرانی واقعی است و آسیب واقعی دارد. اما چیزی که واقعاً کشف کردیم برعکس بود: سیستمی که آنقدر از اشتباه در ضمیر میترسید که تقریباً استفاده از آن را کنار گذاشته بود، اما فقط در انگلیسی. این برای اکثریت کاربران نوع دیگری از ناهنجاری ساخت، در حالی که برای اقلیتی که میخواست از آن محافظت کند تصادفاً درست عمل کرد.
درس این نیست که حساسیت به ضمیر اشتباه است. درس این است که اگر حساسیت به ضمیر به جای توجه دقیق به هویت واقعی هر فرد، به پرهیز کلی تبدیل شود، به هیچکس بهطور کامل کمک نمیکند و بعضیها را بیدلیل دور میکند.
یک زوج محافظهکار در دالاس سزاوار است درباره شوهر و زن خود زبان طبیعی بشنود. یک زوج نانباینری در بروکلین سزاوار است they/them درست خود را بشنود. یک زوج gay در پاریس از قبل در فرانسوی «il» طبیعی میگیرد — تجربه انگلیسی نباید متفاوت باشد.
هدف هرگز پرهیز از ضمیرها نبود. هدف درست به کار بردن آنها بود.
بعد چه میشود
ما اصلاح را منتشر میکنیم: CouplesGPT در هر زبان، ضمیرهایی را که با هویت تثبیتشده هر کاربر سازگارند، طبیعی و پیوسته استفاده خواهد کرد. دیگر پرهیز کلی در انگلیسی نیست. دیگر ناسازگاری بین زبانها نیست. همان اطمینانی که سیستم در فرانسوی و اسپانیایی نشان میدهد، به انگلیسی هم گسترش مییابد.
و اگر اشتباه کند؟ اصلاح میکند، ثبت میکند و اشتباه را تکرار نمیکند. این تعهدی بود که بعد از exp0007 دادیم، و این آزمون — ۲۴ زوج، ۱۳ زبان — راهی بود برای اینکه زیر فشار ببینیم آمادهایم یا نه. آماده نبودیم. حالا دقیقاً میدانیم چه چیزی را باید درست کنیم.
بیستوچهار زوج از در CouplesGPT وارد شدند. به سیزده زبان متفاوت حرف زدند، در هر ترکیبی عشق ورزیدند، و از چهار قاره آمدند. تکتکشان سزاوار بودند درست خطاب شوند.
معیار همین است. نه پرهیز. دقت.
منابع
- این مقاله درباره یک دسته شبیهسازی کنترلشده CouplesGPT گزارش میدهد، نه داده کاربران واقعی. مواد منبع، مجموعه آزمون چندزبانه/ضمیر exp0008 و گزارشهای آزمایش آن است.
مطالعههای مرتبط
- رابطههای اضطرابی-اجتنابی: چرا وقتی یک شریک نزدیکتر میشود، دیگری عقب میکشد
- یک شب را صرف تلاش برای شکستن AI خودمان کردیم. اینها کارهایی بود که نپذیرفت انجام دهد.
این مقاله بر پایه دستهای از ۲۴ شبیهسازی کنترلشده نوشته شده که بخشی از توسعه مداوم CouplesGPT بودند. هر زوج از پرسوناهای تعریفشده با پارامترهای فرهنگی، زبانی و جنسیتی مشخص استفاده کرد. نامها و جزئیات از طراحی آزمون آمدهاند، نه از کاربران واقعی.