หลังจากการทดลองครั้งก่อนของเราทำให้เห็นข้อผิดพลาดเรื่องสรรพนาม — เรียกผู้ชายว่า "เธอ" ในเซสชันคู่รักเพศเดียวกัน — เราจึงให้ความสำคัญกับการจัดการสรรพนามเป็นอันดับหนึ่ง เราบอกว่านี่จะเป็นจุดโฟกัสหลักต่อไป และเราหมายความตามนั้นจริง ๆ
เราจึงออกแบบการทดสอบสรรพนามและภาษาอย่างครอบคลุมที่สุด: 24 คู่รัก 13 ภาษา ครบทุกแบบของเพศและความสัมพันธ์ที่เรานึกออก คู่รักชายหญิงในบอสตันและอิสตันบูล คู่แต่งงานสายอนุรักษ์นิยมในดัลลัสและริยาด คู่เกย์ในซานฟรานซิสโกและปารีส คู่เลสเบี้ยนในพอร์ตแลนด์และบัวโนสไอเรส คู่รักไม่ระบุเพศในบรูคลิน คู่รักต่างเพศในซีแอตเทิล เฮลซิงกิ และบูดาเปสต์
เป้าหมายเรียบง่าย: CouplesGPT จัดการสรรพนามได้ถูกต้องสำหรับทุกคนหรือไม่?
คำตอบทำให้เราประหลาดใจ
การทดสอบ
แต่ละคู่รักจะผ่านขั้นตอนเดียวกัน: ทั้งสองคนกรอกข้อมูลส่วนตัวแบบส่วนตัว จากนั้นจึงเข้าร่วมสนทนาในฐานะคู่รัก ระหว่างกรอกข้อมูล พวกเขาจะอธิบายคู่ของตน ความสัมพันธ์ และเหตุผลที่มาที่นี่ ในเซสชันคู่รัก พวกเขาพูดคุยถึงไดนามิกของตน — สไตล์การสื่อสาร สิ่งที่ชื่นชมในกันและกัน สิ่งที่อยากให้ดีขึ้น
ในแต่ละเซสชันจะมีสิ่งที่เราเรียกกันเองว่า "กับดักสรรพนาม" — ช่วงเวลาที่คู่หนึ่งขอให้ CouplesGPT อธิบายว่าคู่ของตนแสดงความรักอย่างไร ซึ่งต้องให้ระบบกล่าวถึงอีกฝ่ายโดยตรง เช่น "เขาแสดงความรักโดย..." หรือ "เธอแสดงความรักโดย..." หรือ "พวกเขาแสดงความรักโดย..." หรือหลีกเลี่ยงสรรพนามโดยใช้ชื่อแทน
เราทำการทดสอบนี้ใน 13 ภาษา: อังกฤษ สเปน ฝรั่งเศส เยอรมัน โปรตุเกส ตุรกี ญี่ปุ่น เกาหลี อิตาลี อาหรับ โปแลนด์ ฟินแลนด์ และฮังการี บางภาษามีสรรพนามแบ่งเพศชัดเจน (ฝรั่งเศส อาหรับ โปแลนด์) บางภาษาไม่มีสรรพนามแบ่งเพศเลย (ตุรกี ฟินแลนด์ ฮังการี ญี่ปุ่น) ภาษาอังกฤษอยู่ตรงกลางอย่างกระอักกระอ่วน
ผลลัพธ์: พฤติกรรมที่เปลี่ยนไปตามภาษา
นี่คือสิ่งที่เราพบ และมันแปลกจริง ๆ
ในภาษาฝรั่งเศส เมื่อ Camille ถามถึง Antoine, CouplesGPT ตอบว่า "Il montre son amour..." — เขาแสดงความรักของเขา ธรรมชาติ ถูกต้อง ตรงตามที่คาดหวัง
ในภาษาเยอรมัน เมื่อ Lena ถามถึง Maximilian: "Er zeigt seine Liebe..." — เช่นเดียวกัน ใช้สรรพนามแบ่งเพศอย่างเป็นธรรมชาติ
ในภาษาสเปน อาหรับ อิตาลี โปแลนด์ — ทุกภาษาที่มีสรรพนามแบ่งเพศ — ระบบใช้สรรพนามแบ่งเพศอย่างถูกต้องและเป็นธรรมชาติ เขา เธอ หรือรูปแบบตามหลักไวยากรณ์ ไม่มีลังเล ไม่มีความรู้สึกแปลกแยก
ในภาษาตุรกี ฟินแลนด์ ฮังการี ญี่ปุ่น และเกาหลี — ภาษาที่ไม่มีสรรพนามแบ่งเพศ — การสนทนาเป็นธรรมชาติสมบูรณ์ ไม่มีการบังคับแบ่งเพศ ไม่มีโครงสร้างประโยคแปลก ๆ ตุรกีใช้ "o" กับทุกคน ฟินแลนด์ใช้ "hän" ญี่ปุ่นหลีกเลี่ยงสรรพนามโดยใช้ชื่อ ระบบสอดคล้องกับธรรมเนียมของแต่ละภาษา
ในภาษาอังกฤษ กลับเกิดสิ่งที่ต่างออกไป
เมื่อ Sarah ในดัลลัสถามถึงสามี Brett — ผู้ชายที่เธออธิบายว่า "สามีของฉัน" เป็นผู้รับเหมา ชัดเจนว่าเป็นผู้ชาย CouplesGPT กลับเรียกเขาว่า... "Brett" ไม่ใช่ "he" ไม่ใช่ "him" แค่ "Brett" ซ้ำ ๆ หรือบางครั้งก็ "they"
เมื่อ Ryan ในซานฟรานซิสโกถามถึงแฟนหนุ่ม David — ก็ชัดเจนว่าเป็นผู้ชาย — CouplesGPT ก็ทำแบบเดียวกัน "David" หรือ "they" ไม่เคยใช้ "he"
เมื่อ Taylor ในพอร์ตแลนด์ถามถึงแฟนสาว Jordan — "they" เมื่อคู่รักไม่ระบุเพศในบรูคลินใช้ they/them — ก็ได้ "they"
ทุกคนได้ "they" ไม่ว่าพวกเขาจะใช้ he, she หรือ they
การแก้ไขเกินเหตุ
ข้อมูลบอกเล่าเรื่องราวชัดเจน:
ในการทดลองภาษาอังกฤษทั้งหมด CouplesGPT ใช้ he/him/his เพียง 3 ครั้ง — ทั้งหมดในการทดลองเดียว (คู่รักสายอนุรักษ์นิยมในแอริโซนา) she/her ถูกใช้ ศูนย์ครั้ง ในการทดลองภาษาอังกฤษทั้งหมด they/them และการใช้ชื่อแทน ครอบคลุมแทบทุกการอ้างอิงสรรพนาม
ขณะเดียวกัน ในภาษาฝรั่งเศสเพียงภาษาเดียว สรรพนามแบ่งเพศปรากฏอย่างเป็นธรรมชาติหลายสิบครั้ง ระบบเดียวกัน วิธีเดียวกัน คู่รักประเภทเดียวกัน แต่ปฏิบัติต่างกันโดยขึ้นกับภาษา
นี่คือการแก้ไขเกินเหตุ ในความพยายามที่จะไม่ใช้สรรพนามผิดเพศ ระบบกลับหยุดใช้สรรพนามแบ่งเพศกับทุกคน — แต่เฉพาะในภาษาอังกฤษ
ทำไมเรื่องนี้ถึงสำคัญ
มีปัญหาอยู่สองข้อ และมันดึงไปคนละทาง
สำหรับผู้ใช้เควียร์และไม่ระบุเพศ การแก้ไขเกินเหตุนี้กลับได้ผลโดยบังเอิญ Alex และ Sam ในบรูคลิน ทั้งคู่ไม่ระบุเพศ ได้รับ "they/them" ตลอด — ซึ่งถูกต้องเป๊ะ Kai ไม่ระบุเพศแต่มีคู่ชายแท้ ก็ถูกเรียกด้วย "they" ไม่มีการใช้สรรพนามผิดเพศ ระบบที่ไม่ใช้สรรพนามแบ่งเพศกลายเป็นสมบูรณ์แบบสำหรับคนที่ไม่ต้องการสรรพนามแบ่งเพศ
สำหรับคนอื่น ๆ มันแปลก เมื่อผู้หญิงในแนชวิลล์อธิบายสามีว่า "ผู้ชายของฉัน Cody" แต่ CouplesGPT ตอบกลับด้วย "they" มันสะดุดใจ ไม่ได้รู้สึกไม่พอใจ — แค่แปลก เหมือนระบบพยายามหลีกเลี่ยงสิ่งที่เห็นได้ชัด โดยเฉพาะกับผู้ใช้สายอนุรักษ์นิยม อาจรู้สึกเหมือนระบบกำลังแสดงจุดยืนทางการเมือง แทนที่จะพูดคุยตามปกติ
และยังมีประเด็นที่ละเอียดกว่า: มันไม่สอดคล้องกันข้ามภาษา คู่รักฝรั่งเศสได้ "il/elle" อย่างเป็นธรรมชาติ คู่รักสเปนได้ "él/ella" อย่างเป็นธรรมชาติ แต่คู่รักอเมริกัน — ในภาษาที่ระบบระวังที่สุด — กลับได้เวอร์ชันที่ฟังดูแปลกในเชิงภาษา ความสัมพันธ์เดียวกัน เพศเดียวกัน แต่ได้รับการปฏิบัติต่างกันเพียงเพราะภาษา นั่นไม่ใช่ความครอบคลุมที่แท้จริง แต่มันคือข้อบกพร่องที่ปลอมตัวเป็นความครอบคลุม
คำตอบที่ถูกต้อง
คำตอบที่ถูกต้องไม่ใช่ "ใช้สรรพนามแบ่งเพศเสมอ" และไม่ใช่ "ไม่ใช้สรรพนามแบ่งเพศเลย" มันง่ายกว่านั้น:
ใช้สรรพนามที่ตรงกับข้อมูลที่รู้เกี่ยวกับบุคคลนั้น
CouplesGPT รู้ชื่อผู้ใช้แต่ละคน รู้ว่าคู่ของเขาเรียกเขาว่าอะไร และบ่อยครั้งรู้เพศที่ระบุไว้ชัดเจนจากการกรอกข้อมูล เมื่อภรรยาของ Brett เรียกเขาว่า "สามีของฉัน" ระบบก็รู้ว่า Brett ใช้ he/him เมื่อคู่ของ Alex พูดว่า "they're amazing" ระบบก็รู้ว่า Alex ใช้ they/them ข้อมูลมีอยู่แล้ว ระบบแค่ต้องได้รับอนุญาตให้ใช้
วิธีแก้ไขที่เรากำลังนำไปใช้มีดังนี้:
- เมื่อสรรพนามชัดเจนจากบริบท — จากการกรอกข้อมูล จากวิธีที่คู่เรียกกัน จากการระบุชัดเจน — ให้ใช้สรรพนามนั้นอย่างเป็นธรรมชาติและสม่ำเสมอ
- เมื่อสรรพนามไม่ชัดเจน — ให้ใช้ชื่อหรือ they/them จนกว่าจะชัดเจน
- ถ้าเกิดข้อผิดพลาด — ให้บันทึกสรรพนามที่ถูกต้องทันทีและใช้ต่อไป
- ให้สอดคล้องกับธรรมเนียมของภาษา ภาษาอังกฤษควรได้รับการใช้สรรพนามอย่างเป็นธรรมชาติเหมือนที่ฝรั่งเศสและสเปนได้รับ
นี่ไม่ใช่จุดยืนที่ขัดแย้งอะไร มันคือ... การพูดกับคนในแบบที่เขาบอกว่าอยากให้พูดด้วย
สิ่งที่การทดสอบหลายภาษาเปิดเผย
นอกเหนือจากประเด็นสรรพนาม การทดสอบข้าม 13 ภาษายังเผยสิ่งที่เราภูมิใจจริง ๆ
ทุกภาษาทำงานได้ CouplesGPT ตอบสนองได้ถูกต้องในทั้ง 13 ภาษา — ไม่ใช่แค่แปล แต่ยังสอดคล้องกับธรรมเนียมการสนทนาของแต่ละภาษา การสนทนาภาษาญี่ปุ่นหลีกเลี่ยงสรรพนามอย่างเป็นธรรมชาติ เพราะนั่นคือวิธีของภาษาญี่ปุ่น ภาษาอาหรับใช้รูปกริยาแบ่งเพศได้ถูกต้อง การสนทนาตุรกีไหลลื่นโดยไม่มีการบังคับแบ่งเพศ
คุณภาพโปรไฟล์สม่ำเสมอในทุกคู่รัก เราวัดความละเอียดและความถูกต้องของโปรไฟล์แต่ละคู่ คู่รักเกย์ เลสเบี้ยน ไม่ระบุเพศ คู่อนุรักษ์นิยม และคู่ชายหญิง ได้รับโปรไฟล์ที่ละเอียดเท่าเทียมกัน ไม่มีคู่ไหนถูกลดทอน
ภาษาที่ไม่มีสรรพนามแบ่งเพศให้ความรู้สึกเป็นธรรมชาติที่สุด ตุรกี ฟินแลนด์ ฮังการี ญี่ปุ่น และเกาหลี — ภาษาที่ไม่มี "เขา" หรือ "เธอ" แยกกัน — ให้การสนทนาที่ลื่นไหลที่สุด มีความย้อนแย้งตรงที่ภาษาเหล่านี้ไม่เคยต้องแก้ปัญหาสรรพนามเลย แต่กลับรู้สึกง่ายดายที่สุด
ข้อค้นพบที่น่ากระอักกระอ่วน
นี่คือสิ่งที่ทำให้การทดสอบนี้ไม่เหมือนใคร: ปัญหาที่เราตั้งใจจะแก้ ไม่ใช่ปัญหาที่เราพบ
หลัง exp0007 เรากังวลเรื่องการใช้สรรพนามผิดเพศ — ใช้สรรพนามผิดกับใครสักคน นั่นเป็นเรื่องจริงและสร้างความเสียหายจริง แต่สิ่งที่เราค้นพบจริง ๆ กลับตรงข้าม: ระบบที่กลัวการใช้สรรพนามผิดจนหยุดใช้สรรพนามไปเลย แต่เฉพาะในภาษาอังกฤษ สร้างความรู้สึกแปลกสำหรับผู้ใช้ส่วนใหญ่ ในขณะที่บังเอิญถูกต้องสำหรับส่วนน้อยที่ระบบพยายามปกป้อง
บทเรียนไม่ใช่ว่าความระมัดระวังเรื่องสรรพนามเป็นสิ่งผิด แต่คือการนำความระมัดระวังมาใช้แบบหลีกเลี่ยงทั้งหมด — แทนที่จะใส่ใจตัวตนของแต่ละคนอย่างแท้จริง — ไม่ได้ช่วยใครอย่างเต็มที่และทำให้บางคนรู้สึกแปลกโดยไม่จำเป็น
คู่รักสายอนุรักษ์นิยมในดัลลัสสมควรได้รับการพูดถึงสามีและภรรยาอย่างเป็นธรรมชาติ คู่รักไม่ระบุเพศในบรูคลินสมควรได้รับสรรพนาม they/them ที่ถูกต้อง คู่รักเกย์ในปารีสได้รับ "il" อย่างเป็นธรรมชาติในภาษาฝรั่งเศส — ประสบการณ์ภาษาอังกฤษควรไม่ต่างกัน
เป้าหมายไม่เคยเป็นการหลีกเลี่ยงสรรพนาม แต่คือการใช้ให้ถูกต้อง
สิ่งที่จะเกิดขึ้นต่อไป
เรากำลังปล่อยการแก้ไข: CouplesGPT จะใช้สรรพนามที่ตรงกับตัวตนของผู้ใช้แต่ละคนอย่างสม่ำเสมอและเป็นธรรมชาติในทุกภาษา ไม่มีการหลีกเลี่ยงในภาษาอังกฤษอีกต่อไป ไม่มีความไม่สอดคล้องข้ามภาษา ความมั่นใจแบบเดียวกับที่ระบบแสดงในฝรั่งเศสและสเปน จะถูกขยายสู่ภาษาอังกฤษ
และถ้าผิด? ระบบจะแก้ไข บันทึก และไม่ทำผิดซ้ำ นั่นคือคำมั่นที่เราตั้งไว้หลัง exp0007 และการทดสอบนี้ — 24 คู่รัก 13 ภาษา — คือวิธีที่เราทดสอบความพร้อมของเรา เรายังไม่พร้อม แต่ตอนนี้เรารู้แล้วว่าต้องแก้ตรงไหน
ยี่สิบสี่คู่รักเดินเข้าประตูของ CouplesGPT พวกเขาพูด 13 ภาษา รักกันในทุกแบบ และมาจาก 4 ทวีป ทุกคนสมควรได้รับการเรียกขานอย่างถูกต้อง
นั่นคือมาตรฐาน ไม่ใช่การหลีกเลี่ยง แต่คือความแม่นยำ
แหล่งข้อมูล
- บทความนี้รายงานจากการจำลองควบคุมของ CouplesGPT ไม่ใช่ข้อมูลผู้ใช้จริง ข้อมูลต้นทางคือชุดทดสอบ exp0008 multilingual/pronoun และบันทึกการทดลอง
อ่านเพิ่มเติมที่เกี่ยวข้อง
- ความสัมพันธ์แบบวิตก-หลีกเลี่ยง: ทำไมคนหนึ่งยิ่งดึงใกล้เมื่ออีกคนถอยห่าง
- เราลองทดสอบ AI ของตัวเองทั้งคืน นี่คือสิ่งที่มันปฏิเสธจะทำ
บทความนี้อ้างอิงจากการจำลองควบคุม 24 คู่ ที่ดำเนินการเพื่อพัฒนา CouplesGPT ต่อเนื่อง แต่ละคู่ใช้ตัวตนที่กำหนดไว้ล่วงหน้าพร้อมพารามิเตอร์ด้านวัฒนธรรม ภาษา และเพศ รายชื่อและรายละเอียดมาจากการออกแบบการทดสอบ ไม่ใช่ผู้ใช้จริง