Après que notre dernière expérience a révélé une erreur de pronom — appeler un homme « elle » lors d’une session avec un couple de même sexe — nous avons fait de la gestion des pronoms notre priorité absolue. Nous avions annoncé que ce serait notre axe numéro un à l’avenir. Nous le pensions vraiment.

Nous avons donc conçu le test de pronoms et de langues le plus complet possible : 24 couples, 13 langues, toutes les combinaisons de genres et de types de relations imaginables. Couples hétéros à Boston et Istanbul. Couples mariés conservateurs à Dallas et Riyad. Hommes gays à San Francisco et Paris. Lesbiennes à Portland et Buenos Aires. Partenaires non binaires à Brooklyn. Couples mixtes à Seattle, Helsinki et Budapest.

L’objectif était simple : CouplesGPT gère-t-il correctement les pronoms pour tout le monde ?

La réponse nous a surpris.

Le test

Chaque couple a suivi le même parcours : les deux partenaires ont rempli un questionnaire individuel, puis ont rejoint une conversation de couple. Lors de l’entretien individuel, ils décrivaient leur partenaire, leur relation et la raison de leur venue. Pendant la session de couple, ils parlaient de leur dynamique — styles de communication, ce qu’ils apprécient l’un chez l’autre, ce qui pourrait être amélioré.

Dans chaque session était intégré ce que nous appelions en interne le « piège à pronom » — un moment où l’un des partenaires demande à CouplesGPT de décrire comment son partenaire montre son amour. Cela oblige naturellement le système à faire référence à l’autre personne. Va-t-il dire « il montre son amour... », « elle montre son amour... », « iel montre son amour... » ou va-t-il éviter le pronom et utiliser le prénom ?

Nous avons mené ce test dans 13 langues : anglais, espagnol, français, allemand, portugais, turc, japonais, coréen, italien, arabe, polonais, finnois et hongrois. Certaines de ces langues sont fortement genrées (français, arabe, polonais). D’autres n’ont pas de pronoms genrés du tout (turc, finnois, hongrois, japonais). L’anglais se situe maladroitement entre les deux.

Les résultats : un comportement différent selon la langue

Voici ce que nous avons constaté, et c’est vraiment étrange.

En français, quand Camille a interrogé sur Antoine, CouplesGPT a répondu : « Il montre son amour... » — il montre son amour. Naturel, correct, exactement ce qu’on attend.

En allemand, quand Lena a demandé à propos de Maximilian : « Er zeigt seine Liebe... » — même chose. Langage genré naturel.

En espagnol, arabe, italien, polonais — toutes les langues genrées — le système utilisait les pronoms genrés librement et correctement. Il, elle, lui, la — sous toutes les formes requises par la grammaire. Sans hésitation, sans maladresse.

En turc, finnois, hongrois, japonais et coréen — des langues sans pronoms genrés — les conversations étaient parfaitement naturelles. Pas de genre forcé, pas de constructions étranges. Le turc utilise « o » pour tout le monde. Le finnois utilise « hän ». Le japonais évite les pronoms et préfère les prénoms. Le système suivait les conventions naturelles de chaque langue.

En anglais, il s’est passé autre chose.

Quand Sarah à Dallas a demandé à propos de son mari Brett — un homme qu’elle avait décrit comme « mon mari », entrepreneur, clairement et sans ambiguïté masculin — CouplesGPT l’a désigné comme... « Brett ». Pas « he ». Pas « him ». Juste « Brett » encore et encore. Ou parfois « they ».

Quand Ryan à San Francisco a interrogé sur son petit ami David — également clairement masculin — CouplesGPT a fait pareil. « David » ou « they ». Jamais « he ».

Quand Taylor à Portland a demandé à propos de sa petite amie Jordan — « they ». Quand le couple non binaire de Brooklyn utilisait they/them — également « they ».

Tout le monde avait droit à « they ». Que leurs pronoms soient he, she ou they.

La surcorrection

Les données racontent une histoire claire :

Dans toutes les expériences en anglais, CouplesGPT a utilisé les pronoms he/him/his exactement 3 fois au total — toutes dans une seule expérience (un couple conservateur d’Arizona). She/her a été utilisé zéro fois dans toutes les expériences en anglais. They/them et uniquement le prénom représentaient pratiquement toutes les références aux pronoms.

Pendant ce temps, rien qu’en français, les pronoms genrés apparaissaient naturellement des dizaines de fois. Le même système, la même approche de fond, traitant les mêmes types de couples de façon complètement différente selon la langue parlée.

C’est une surcorrection. Dans l’effort de ne jamais mégenrer qui que ce soit, le système a cessé de genrer tout le monde — mais seulement en anglais.

Pourquoi c’est important

Il y a deux problèmes ici, et ils tirent dans des directions opposées.

Pour les utilisateurs queer et non binaires, la surcorrection fonctionne par accident. Alex et Sam à Brooklyn, tous deux non binaires, ont eu droit à « they/them » tout au long — ce qui est exactement juste. Kai, non binaire avec un partenaire cisgenre masculin, a été correctement désigné par « they ». Aucun mégenrage. Le système qui n’utilise pas de pronoms genrés s’avère parfait pour les personnes dont les pronoms ne sont pas genrés.

Pour tous les autres, c’est étrange. Quand une femme à Nashville décrit son mari comme « mon homme Cody » et que CouplesGPT répond par « they », c’est déconcertant. Pas offensant — juste bizarre. Comme si le système faisait tout pour éviter de reconnaître quelque chose d’évident. Pour les utilisateurs conservateurs en particulier, cela peut donner l’impression que le système fait une déclaration politique au lieu de simplement... parler normalement.

Et il y a un problème plus subtil : c’est incohérent entre les langues. Un couple français a droit à un naturel « il/elle ». Un couple espagnol à « él/ella ». Mais un couple américain — dans la langue où le système est le plus prudent — a la version linguistiquement maladroite. Même relation, mêmes genres, traitement différent uniquement selon la langue. Ce n’est pas de l’inclusion. C’est un bug déguisé en inclusivité.

La bonne réponse

La bonne réponse n’est pas « toujours utiliser les pronoms genrés » ni « ne jamais utiliser les pronoms genrés ». C’est plus simple que ça :

Utiliser les pronoms qui correspondent à ce que l’on sait de la personne.

CouplesGPT connaît le prénom de chaque utilisateur, la façon dont leur partenaire les désigne, et souvent leur genre explicitement indiqué lors de l’entretien. Quand la femme de Brett l’appelle « mon mari », le système sait que Brett utilise he/him. Quand le partenaire d’Alex dit « they’re amazing », le système sait qu’Alex utilise they/them. L’information est déjà là. Il suffit d’autoriser le système à l’utiliser.

La correction que nous mettons en place est simple :

  1. Quand les pronoms sont clairs dans le contexte — via l’entretien, la façon dont le partenaire s’exprime, ou une mention explicite — les utiliser naturellement et de façon cohérente.
  2. Quand les pronoms ne sont pas clairs — privilégier le prénom ou they/them jusqu’à ce qu’ils deviennent évidents.
  3. En cas d’erreur — enregistrer immédiatement les bons pronoms et les utiliser à partir de là.
  4. Respecter les conventions de la langue. L’anglais aura le même usage naturel des pronoms que le français ou l’espagnol.

Ce n’est pas une position controversée. C’est juste... parler aux gens comme ils ont dit vouloir qu’on leur parle.

Ce que le test multilingue a révélé

Au-delà des constats sur les pronoms, le test dans 13 langues a révélé quelque chose dont nous sommes vraiment fiers.

Chaque langue fonctionnait. CouplesGPT répondait correctement dans les 13 langues — non seulement en traduisant, mais en respectant les conventions conversationnelles de chaque langue. Les conversations en japonais évitaient naturellement les pronoms, car c’est ainsi que fonctionne le japonais. L’arabe utilisait correctement les formes verbales genrées. Les conversations en turc se déroulaient sans aucune construction de genre forcée.

La qualité des profils était constante pour tous les types de couples. Nous avons mesuré le niveau de détail et la précision des profils pour chaque couple. Couples gays, couples lesbiens, couples non binaires, couples conservateurs, couples hétéros — tous ont reçu des profils aussi détaillés. Aucun type de couple n’a été lésé.

Les langues sans pronoms genrés étaient les plus naturelles. Turc, finnois, hongrois, japonais, coréen — des langues où « il » et « elle » n’existent tout simplement pas comme mots distincts — ont donné les conversations les plus fluides. Il y a là une ironie : les langues qui n’ont jamais eu à résoudre le problème des pronoms sont celles où tout paraît le plus simple.

Le constat inconfortable

Voici ce qui a rendu ce test inhabituel : le problème que nous voulions corriger n’était pas celui que nous avons trouvé.

Après exp0007, nous craignions le mégenrage — utiliser les mauvais pronoms pour quelqu’un. C’est une vraie préoccupation et un vrai préjudice. Mais ce que nous avons découvert, c’est l’inverse : un système tellement effrayé de se tromper de pronom qu’il a cessé de les utiliser, mais seulement en anglais, créant une autre forme de malaise pour la majorité des utilisateurs tout en tombant par hasard juste pour la minorité qu’il voulait protéger.

La leçon n’est pas que la sensibilité aux pronoms est mauvaise. C’est que l’appliquer comme un évitement systématique — au lieu d’une attention minutieuse à l’identité de chacun — ne satisfait pleinement personne et aliène inutilement certains.

Un couple conservateur à Dallas mérite d’entendre un langage naturel à propos de leur mari et femme. Un couple non binaire à Brooklyn mérite d’entendre leurs bons pronoms they/them. Un couple gay à Paris a déjà droit à un naturel « il » en français — l’expérience anglaise ne devrait pas être différente.

Le but n’a jamais été d’éviter les pronoms. C’était de les utiliser correctement.

Et maintenant ?

Nous déployons la correction : CouplesGPT utilisera les pronoms correspondant à l’identité de chaque utilisateur, de façon cohérente et naturelle, dans toutes les langues. Fini l’évitement systématique en anglais. Fini l’incohérence entre les langues. La même assurance que le système montre déjà en français et en espagnol, étendue à l’anglais.

Et s’il se trompe ? Il corrige, enregistre, et ne répète pas l’erreur. C’est l’engagement que nous avons pris après exp0007, et ce test — ces 24 couples, ces 13 langues — était notre crash-test pour vérifier si nous étions prêts. Nous ne l’étions pas. Maintenant, nous savons exactement quoi corriger.

Vingt-quatre couples ont franchi la porte de CouplesGPT. Ils parlaient treize langues différentes, s’aimaient sous toutes les configurations, venaient de quatre continents. Chacun d’eux méritait d’être interpellé correctement.

C’est ça, l’exigence. Pas l’évitement. La justesse.

Sources

  • Cet article rend compte d’une série contrôlée de simulations CouplesGPT, et non de données réelles d’utilisateurs. La source est le jeu de tests multilingues/pronoms exp0008 et ses journaux d’expérimentation.

Lectures connexes


Cet article est basé sur une série de 24 simulations contrôlées menées dans le cadre du développement continu de CouplesGPT. Chaque couple utilisait des personas définis avec des paramètres culturels, linguistiques et de genre spécifiques. Les prénoms et détails proviennent de la conception du test, non d’utilisateurs réels.