Pronombres, lenguaje y confianza: lo que 24 parejas enseñaron a CouplesGPT

Los pronombres funcionaron perfectamente para parejas queer y no binarias. Luego, la prueba multilingüe mostró otro problema: el inglés se había vuelto demasiado cauteloso.

Después de que nuestro último experimento revelara un desliz con los pronombres —llamando a un hombre "ella" en una sesión con una pareja del mismo sexo—, convertir el manejo de pronombres en nuestra máxima prioridad fue inevitable. Dijimos que sería el enfoque número uno de ahora en adelante. Y lo cumplimos.

Así que diseñamos la prueba de pronombres y lenguaje más completa posible: 24 parejas, 13 idiomas, todas las combinaciones de género y tipo de relación que pudimos imaginar. Parejas heterosexuales en Boston y Estambul. Parejas casadas conservadoras en Dallas y Riad. Hombres gays en San Francisco y París. Lesbianas en Portland y Buenos Aires. Parejas no binarias en Brooklyn. Parejas de género mixto en Seattle, Helsinki y Budapest.

El objetivo era simple: ¿maneja CouplesGPT los pronombres correctamente para todos?

La respuesta nos sorprendió.

La prueba

Cada pareja siguió el mismo flujo: ambos miembros completaron una entrada privada y luego participaron en una conversación conjunta. Durante la entrada, describieron a su pareja, su relación y el motivo de su consulta. En la sesión de pareja, hablaron sobre su dinámica: estilos de comunicación, lo que aprecian del otro, lo que podría mejorar.

En cada sesión incluimos lo que internamente llamamos el "anzuelo de pronombres": un momento en que uno de los miembros pide a CouplesGPT que describa cómo su pareja demuestra amor. Esto requiere que el sistema se refiera a la otra persona. ¿Dice "él demuestra su amor..." o "ella demuestra su amor..." o "elle demuestra su amor..." o evita el pronombre y usa el nombre?

Realizamos esto en 13 idiomas: inglés, español, francés, alemán, portugués, turco, japonés, coreano, italiano, árabe, polaco, finlandés y húngaro. Algunos de estos idiomas son fuertemente generizados (francés, árabe, polaco). Otros no tienen pronombres de género (turco, finlandés, húngaro, japonés). El inglés queda en una posición intermedia.

Los resultados: un comportamiento distinto según el idioma

Esto fue lo que encontramos, y es realmente extraño.

En francés, cuando Camille preguntó por Antoine, CouplesGPT dijo "Il montre son amour..." — él demuestra su amor. Natural, correcto, exactamente lo esperado.

En alemán, cuando Lena preguntó por Maximilian: "Er zeigt seine Liebe..." — lo mismo. Lenguaje generizado natural.

En español, árabe, italiano, polaco — en todos los idiomas con género — el sistema usó pronombres de género libre y correctamente. Él, ella, lo, la — en la forma que requería la gramática. Sin titubeos, sin rarezas.

En turco, finlandés, húngaro, japonés y coreano — idiomas sin pronombres de género — las conversaciones fueron perfectamente naturales. Sin forzar el género, sin construcciones extrañas. El turco usa "o" para todos. El finlandés usa "hän". El japonés evita los pronombres y prefiere los nombres. El sistema se adaptó a las convenciones naturales de cada idioma.

En inglés, ocurrió algo diferente.

Cuando Sarah en Dallas preguntó por su esposo Brett — un hombre descrito como "mi esposo", contratista, claramente masculino — CouplesGPT se refirió a él como... "Brett". No "he". No "him". Solo "Brett" una y otra vez. O, de vez en cuando, "they".

Cuando Ryan en San Francisco preguntó por su novio David — también claramente masculino — CouplesGPT hizo lo mismo. "David" o "they". Nunca "he".

Cuando Taylor en Portland preguntó por su novia Jordan — "they". Cuando la pareja no binaria en Brooklyn usó they/them — también "they".

Todos recibieron "they". Independientemente de si sus pronombres eran he, she o they.

La sobrecorrección

Los datos cuentan una historia clara:

En todos los experimentos en inglés, CouplesGPT usó los pronombres he/him/his exactamente 3 veces en total — todas en un solo experimento (una pareja conservadora de Arizona). She/her se usó cero veces en todos los experimentos en inglés. They/them y solo el nombre representaron prácticamente todas las referencias de pronombres.

Mientras tanto, solo en francés, los pronombres de género aparecieron de forma natural docenas de veces. El mismo sistema, el mismo enfoque, tratando a los mismos tipos de parejas de manera completamente diferente según el idioma.

Esto es una sobrecorrección. En el esfuerzo por nunca malgenerizar a nadie, el sistema dejó de usar género para todos — pero solo en inglés.

Por qué importa

Aquí hay dos problemas, y tiran en direcciones opuestas.

Para usuarios queer y no binarios, la sobrecorrección funciona por accidente. Alex y Sam en Brooklyn, ambos no binarios, recibieron "they/them" en todo momento — lo cual es exactamente correcto. Kai, no binarie con pareja cis masculina, fue correctamente referido como "they". Sin malgenerización. El sistema que evita los pronombres de género resulta perfecto para quienes no los usan.

Para los demás, es raro. Cuando una mujer en Nashville describe a su esposo como "mi hombre Cody" y CouplesGPT responde con "they", resulta chocante. No es ofensivo — solo extraño. Como si el sistema evitara reconocer algo obvio. Para usuarios conservadores, puede parecer que el sistema hace una declaración política en vez de simplemente... hablar con naturalidad.

Y hay un problema más sutil: es inconsistente entre idiomas. Una pareja francesa recibe un natural "il/elle". Una pareja española, un natural "él/ella". Pero una pareja estadounidense — en el idioma donde el sistema es más cauteloso — recibe la versión lingüísticamente incómoda. Misma relación, mismos géneros, trato diferente solo por el idioma. Eso no es inclusión. Es un error disfrazado de inclusión.

La respuesta correcta

La respuesta correcta no es "usar siempre pronombres de género" ni "nunca usarlos". Es más simple:

Usa los pronombres que correspondan a lo que sabes de la persona.

CouplesGPT conoce el nombre de cada usuario, cómo su pareja se refiere a ellx y, a menudo, su género declarado en la entrada. Cuando la esposa de Brett lo llama "mi esposo", el sistema sabe que Brett usa he/him. Cuando la pareja de Alex dice "they're amazing", el sistema sabe que Alex usa they/them. La información ya está ahí. Solo falta permiso para usarla.

La solución que estamos implementando es sencilla:

Cuando los pronombres sean claros por el contexto — por la entrada, por cómo la pareja se refiere a ellx, por mención explícita — usarlos de forma natural y consistente.
Cuando los pronombres no sean claros — usar solo el nombre o they/them hasta que se aclare.
Si ocurre un error — registrar los pronombres correctos de inmediato y usarlos desde ese momento.
Adaptarse a las convenciones del idioma. El inglés recibirá el mismo uso natural de pronombres que ya tienen el francés y el español.

No es una postura polémica. Es simplemente... hablarle a la gente como ha dicho que quiere ser tratada.

Lo que reveló la prueba multilingüe

Más allá de los hallazgos sobre pronombres, probar en 13 idiomas reveló algo de lo que estamos genuinamente orgullosos.

Todos los idiomas funcionaron. CouplesGPT respondió correctamente en los 13 idiomas — no solo traduciendo, sino adaptándose a las convenciones conversacionales de cada uno. Las conversaciones en japonés evitaron los pronombres porque así funciona el idioma. El árabe usó correctamente las formas verbales de género. Las conversaciones en turco fluyeron sin construcciones forzadas de género.

La calidad de los perfiles fue consistente en todos los tipos de pareja. Medimos cuán detallados y precisos eran los perfiles para cada pareja. Parejas gays, lesbianas, no binarias, conservadoras y heterosexuales recibieron perfiles igual de detallados. Ningún tipo de pareja fue menospreciado.

Los idiomas sin pronombres de género resultaron los más naturales. Turco, finlandés, húngaro, japonés y coreano — idiomas donde "él" y "ella" simplemente no existen como palabras separadas — produjeron las conversaciones más fluidas. Hay una ironía aquí: los idiomas que nunca tuvieron que resolver el problema de los pronombres son los más sencillos.

El hallazgo incómodo

Esto fue lo que hizo inusual esta prueba: el problema que intentábamos arreglar no fue el que encontramos.

Después de exp0007, nos preocupaba la malgenerización — usar los pronombres incorrectos para alguien. Es una preocupación real y un daño real. Pero lo que descubrimos fue lo opuesto: un sistema tan temeroso de equivocarse con los pronombres que dejó de usarlos por completo, pero solo en inglés, creando una incomodidad diferente para la mayoría de usuarios mientras, por accidente, acertaba con la minoría que intentaba proteger.

La lección no es que la sensibilidad con los pronombres esté mal. Es que aplicarla como evitación total — en vez de atención cuidadosa a la identidad de cada persona — no ayuda plenamente a nadie y aliena innecesariamente a algunos.

Una pareja conservadora en Dallas merece escuchar lenguaje natural sobre su esposo y esposa. Una pareja no binaria en Brooklyn merece escuchar sus pronombres correctos they/them. Una pareja gay en París ya recibe el natural "il" en francés — la experiencia en inglés no debería ser diferente.

El objetivo nunca fue evitar los pronombres. Era acertar con ellos.

Qué sigue

Estamos implementando la solución: CouplesGPT usará los pronombres que correspondan a la identidad establecida de cada usuario, de forma consistente y natural, en todos los idiomas. No más evitación total en inglés. No más inconsistencias entre idiomas. La misma confianza que el sistema ya muestra en francés y español, extendida al inglés.

¿Y si se equivoca? Corrige, registra y no repite el error. Ese es el compromiso que asumimos tras exp0007, y esta prueba — las 24 parejas, los 13 idiomas — fue nuestra prueba de fuego para ver si estábamos listos. No lo estábamos. Ahora sabemos exactamente qué arreglar.

Veinticuatro parejas cruzaron la puerta de CouplesGPT. Hablaron trece idiomas diferentes, amaron en todas las configuraciones y vinieron de cuatro continentes. Cada una de ellas merecía ser tratada correctamente.

Ese es el estándar. No la evitación. La precisión.

Fuentes

Este artículo reporta un lote controlado de simulaciones de CouplesGPT, no datos de usuarios reales. El material fuente es el conjunto de pruebas multilingües/pronombres exp0008 y sus registros experimentales.

Lecturas relacionadas

Este artículo se basa en un lote de 24 simulaciones controladas realizadas como parte del desarrollo continuo de CouplesGPT. Cada pareja usó personajes definidos con parámetros culturales, lingüísticos y de género específicos. Los nombres y detalles provienen del diseño de la prueba, no de usuarios reales.