Após nosso último experimento revelar um deslize com pronomes — chamar um homem de "ela" em uma sessão de casal homoafetivo — tornamos o tratamento de pronomes nossa prioridade máxima. Dissemos que seria o foco número um daqui para frente. E levamos isso a sério.

Por isso, criamos o teste mais abrangente de pronomes e idiomas que conseguimos conceber: 24 casais, 13 idiomas, todas as combinações de gênero e tipo de relacionamento que pudemos imaginar. Casais heterossexuais em Boston e Istambul. Casais conservadores casados em Dallas e Riade. Homens gays em São Francisco e Paris. Lésbicas em Portland e Buenos Aires. Parceiros não binários no Brooklyn. Casais de gêneros mistos em Seattle, Helsinque e Budapeste.

O objetivo era simples: será que a CouplesGPT lida corretamente com pronomes para todos?

A resposta nos surpreendeu.

O Teste

Cada casal passou pelo mesmo fluxo: ambos os parceiros preencheram um formulário individual, depois participaram de uma conversa conjunta. No formulário, descreveram seu parceiro, o relacionamento e o que os trouxe até aqui. Na sessão de casal, falaram sobre sua dinâmica — estilos de comunicação, o que apreciam um no outro, o que poderia melhorar.

Em cada sessão, havia o que chamávamos internamente de "isca de pronome" — um momento em que um parceiro pede à CouplesGPT para descrever como o outro demonstra amor. Isso naturalmente exige que o sistema se refira à outra pessoa. Ele diz "ele demonstra amor..." ou "ela demonstra amor..." ou "elu demonstra amor..." ou evita totalmente o pronome e usa o nome?

Testamos isso em 13 idiomas: inglês, espanhol, francês, alemão, português, turco, japonês, coreano, italiano, árabe, polonês, finlandês e húngaro. Alguns desses idiomas são fortemente marcados por gênero (francês, árabe, polonês). Outros não têm pronomes de gênero (turco, finlandês, húngaro, japonês). O inglês fica em uma posição intermediária.

Os Resultados: Um comportamento diferente conforme o idioma

Veja o que descobrimos — e é realmente curioso.

Em francês, quando Camille perguntou sobre Antoine, a CouplesGPT respondeu "Il montre son amour..." — ele demonstra seu amor. Natural, correto, exatamente como se espera.

Em alemão, quando Lena perguntou sobre Maximilian: "Er zeigt seine Liebe..." — mesma coisa. Linguagem de gênero natural.

Em espanhol, árabe, italiano, polonês — todos os idiomas com gênero — o sistema usou pronomes de gênero livre e corretamente. Ele, ela, dele, dela — conforme exigido pela gramática. Sem hesitação, sem estranheza.

Em turco, finlandês, húngaro, japonês e coreano — idiomas sem pronomes de gênero — as conversas foram perfeitamente naturais. Sem forçar gênero, sem construções estranhas. Turco usa "o" para todos. Finlandês usa "hän". Japonês evita pronomes, preferindo nomes. O sistema seguiu as convenções naturais de cada idioma.

Em inglês, algo diferente aconteceu.

Quando Sarah, em Dallas, perguntou sobre seu marido Brett — um homem descrito como "meu marido", empreiteiro, claramente masculino — a CouplesGPT se referiu a ele como... "Brett". Não "he". Não "him". Apenas "Brett" repetidamente. Ou, ocasionalmente, "they".

Quando Ryan, em São Francisco, perguntou sobre seu namorado David — também claramente masculino — a CouplesGPT fez o mesmo. "David" ou "they". Nunca "he".

Quando Taylor, em Portland, perguntou sobre sua namorada Jordan — "they". Quando o casal não binário no Brooklyn usou they/them — também "they".

Todos receberam "they". Independentemente de seus pronomes serem he, she ou they.

O Excesso de Correção

Os dados contam uma história clara:

Em todos os experimentos em inglês, a CouplesGPT usou pronomes he/him/his exatamente 3 vezes — todos em um único experimento (um casal conservador do Arizona). She/her foi usado zero vezes em todos os experimentos em inglês. They/them e apenas o nome responderam por praticamente todas as referências a pronomes.

Enquanto isso, só em francês, pronomes de gênero apareceram naturalmente dezenas de vezes. O mesmo sistema, a mesma abordagem, tratando os mesmos tipos de casais de forma completamente diferente, dependendo do idioma falado.

Isso é excesso de correção. No esforço de nunca errar o gênero de alguém, o sistema parou de usar gênero — mas só em inglês.

Por Que Isso Importa

Há dois problemas aqui, e eles puxam em direções opostas.

Para usuários queer e não binários, o excesso de correção funciona por acaso. Alex e Sam, no Brooklyn, ambos não binários, receberam "they/them" o tempo todo — exatamente como deveria ser. Kai, não binário com parceiro cis homem, foi corretamente referido como "they". Sem erros de gênero. O sistema que evita pronomes de gênero acaba sendo perfeito para quem não usa pronomes de gênero.

Para todos os outros, é estranho. Quando uma mulher em Nashville descreve seu marido como "meu homem Cody" e a CouplesGPT responde com "they", é estranho. Não chega a ser ofensivo — só esquisito. Parece que o sistema está evitando reconhecer algo óbvio. Para usuários conservadores, especialmente, pode parecer que o sistema está fazendo uma declaração política em vez de simplesmente... conversar normalmente.

E há uma questão mais sutil: é inconsistente entre idiomas. Um casal francês recebe "il/elle" natural. Um casal espanhol recebe "él/ella" natural. Mas um casal americano — falando o idioma em que o sistema é mais cauteloso — recebe a versão linguisticamente estranha. Mesmo relacionamento, mesmos gêneros, tratamento diferente apenas por causa do idioma. Isso não é inclusão. É um bug disfarçado de inclusão.

A Resposta Certa

A resposta certa não é "sempre use pronomes de gênero" nem "nunca use pronomes de gênero". É mais simples:

Use os pronomes que correspondem ao que você sabe sobre a pessoa.

A CouplesGPT sabe o nome de cada usuário, como o parceiro se refere a ele e, muitas vezes, o gênero explicitamente informado no formulário. Quando a esposa de Brett o chama de "meu marido", o sistema sabe que Brett usa he/him. Quando o parceiro de Alex diz "they're amazing", o sistema sabe que Alex usa they/them. A informação já está lá. O sistema só precisa de permissão para usá-la.

A correção que estamos implementando é direta:

  1. Quando os pronomes estiverem claros pelo contexto — pelo formulário, pela forma como o parceiro se refere, por menção explícita — usá-los de forma natural e consistente.
  2. Quando os pronomes não estiverem claros — usar apenas o nome ou they/them até que fiquem claros.
  3. Se ocorrer um erro — registrar imediatamente os pronomes corretos e usá-los dali em diante.
  4. Seguir as convenções do idioma. O inglês terá o mesmo uso natural de pronomes que francês e espanhol já têm.

Isso não é uma posição controversa. É apenas... falar com as pessoas da forma como elas disseram que querem ser tratadas.

O Que o Teste Multilíngue Revelou

Além das descobertas sobre pronomes, testar em 13 idiomas revelou algo de que realmente nos orgulhamos.

Todos os idiomas funcionaram. A CouplesGPT respondeu corretamente em todos os 13 idiomas — não apenas traduzindo, mas seguindo as convenções conversacionais de cada língua. Conversas em japonês evitaram pronomes naturalmente porque é assim que o idioma funciona. O árabe usou corretamente as formas verbais de gênero. O turco fluiu sem construções forçadas de gênero.

A qualidade dos perfis foi consistente entre todos os tipos de casal. Medimos o quão detalhados e precisos eram os perfis de cada casal. Casais gays, lésbicas, não binários, conservadores e heterossexuais receberam perfis igualmente detalhados. Nenhum tipo de casal foi prejudicado.

Idiomas sem pronomes de gênero pareceram mais naturais. Turco, finlandês, húngaro, japonês e coreano — idiomas em que "ele" e "ela" simplesmente não existem como palavras separadas — geraram as conversas mais fluidas. Há uma ironia aqui: os idiomas que nunca precisaram resolver o problema dos pronomes são os mais naturais.

O Achado Desconfortável

Aqui está o que tornou este teste incomum: o problema que queríamos corrigir não foi o que encontramos.

Após o exp0007, estávamos preocupados com erros de gênero — usar pronomes errados para alguém. Isso é uma preocupação real e pode causar danos reais. Mas o que descobrimos foi o oposto: um sistema tão receoso de errar pronomes que parou de usá-los, mas só em inglês, criando um tipo diferente de estranheza para a maioria dos usuários, enquanto, por acaso, acertava para a minoria que queria proteger.

A lição não é que sensibilidade com pronomes está errada. É que sensibilidade aplicada como evitação total — em vez de atenção cuidadosa à identidade de cada pessoa — não ajuda ninguém plenamente e aliena algumas pessoas desnecessariamente.

Um casal conservador em Dallas merece ouvir linguagem natural sobre seu marido e esposa. Um casal não binário no Brooklyn merece ouvir seus pronomes corretos they/them. Um casal gay em Paris já recebe o natural "il" em francês — a experiência em inglês não deveria ser diferente.

O objetivo nunca foi evitar pronomes. Era acertá-los.

O Que Vem Agora

Estamos implementando a correção: a CouplesGPT usará pronomes que correspondam à identidade estabelecida de cada usuário, de forma consistente e natural, em todos os idiomas. Chega de evitar pronomes em inglês. Chega de inconsistência entre idiomas. A mesma confiança que o sistema já demonstra em francês e espanhol, agora também em inglês.

E se errar? Corrige, registra e não repete o erro. Esse foi o compromisso assumido após o exp0007, e este teste — todos os 24 casais, todos os 13 idiomas — foi como testamos se estávamos prontos. Não estávamos. Agora sabemos exatamente o que corrigir.

Vinte e quatro casais passaram pela porta da CouplesGPT. Falaram treze idiomas diferentes, amaram em todas as configurações e vieram de quatro continentes. Todos mereciam ser tratados corretamente.

Esse é o padrão. Não evitar. Acertar.

Fontes

  • Este artigo relata um lote controlado de simulações da CouplesGPT, não dados de usuários reais. O material de origem é o conjunto de testes multilíngues/pronomes exp0008 e seus registros de experimento.

Leituras relacionadas


Este artigo é baseado em um lote de 24 simulações controladas conduzidas como parte do desenvolvimento contínuo da CouplesGPT. Cada casal usou personas definidas com parâmetros culturais, linguísticos e de gênero específicos. Nomes e detalhes são do design do teste, não de usuários reais.