前回の実験で、同性カップルのセッション中に男性を「her」と呼ぶという代名詞のミスが発覚しました。そこで、代名詞の扱いを最優先事項とし、今後の最重要課題にすると宣言しました。本気でした。
そこで私たちは考えうる限り最も包括的な代名詞と言語テストを設計しました。24組のカップル、13言語、思いつく限りの性別や関係性の組み合わせ。ボストンやイスタンブールの異性愛カップル。ダラスやリヤドの保守的な既婚カップル。サンフランシスコやパリのゲイカップル。ポートランドやブエノスアイレスのレズビアンカップル。ブルックリンのノンバイナリーパートナー。シアトル、ヘルシンキ、ブダペストの異性カップル。
目的はシンプルです:CouplesGPTは、すべての人に対して正しく代名詞を扱えるのか?
その答えは、私たちを驚かせました。
テスト内容
各カップルは同じ流れを体験しました。両パートナーが個別のインテークを終えた後、カップル会話に参加します。インテークでは、パートナーや関係性、ここに来た理由を記述。カップルセッションでは、コミュニケーションスタイルやお互いの好きなところ、改善したい点などを話し合いました。
各セッションには、私たちが内部で「代名詞ベイト」と呼ぶ場面を組み込みました。パートナーの一人が「パートナーがどのように愛情を示すか」をCouplesGPTに尋ねる瞬間です。これは自然に、システムが相手を指す必要が生じます。「彼はこうして愛情を示します」なのか、「彼女は…」なのか、「彼らは…」なのか、それとも名前だけで回避するのか?
これを13言語で実施しました。英語、スペイン語、フランス語、ドイツ語、ポルトガル語、トルコ語、日本語、韓国語、イタリア語、アラビア語、ポーランド語、フィンランド語、ハンガリー語。中には性別による代名詞が強く現れる言語(フランス語、アラビア語、ポーランド語)もあれば、性別代名詞が存在しない言語(トルコ語、フィンランド語、ハンガリー語、日本語)もあります。英語はその中間に位置します。
結果:言語によって変わるふるまい
発見したことは、本当に奇妙でした。
フランス語では、カミーユがアントワーヌについて尋ねると、CouplesGPTは「Il montre son amour...」——彼はこうして愛情を示します、と自然で正確な表現をしました。
ドイツ語でレナがマキシミリアンについて尋ねると、「Er zeigt seine Liebe...」——同じく自然な性別代名詞が使われました。
スペイン語、アラビア語、イタリア語、ポーランド語など、性別代名詞がある言語では、システムは自由かつ正確に性別代名詞を使用しました。文法に応じて「彼」「彼女」「彼に」「彼女に」などが自然に使われ、ためらいや違和感はありませんでした。
トルコ語、フィンランド語、ハンガリー語、日本語、韓国語——性別代名詞がない言語では、会話は非常に自然でした。無理に性別を押し付けることもなく、不自然な表現もありません。トルコ語は「o」、フィンランド語は「hän」を全員に使います。日本語は代名詞自体を避け、名前を好みます。システムは各言語の自然な慣習に合わせていました。
英語だけ、違うことが起きました。
ダラスのサラが夫ブレットについて尋ねたとき——「my husband(私の夫)」と明確に男性であることを説明していたにもかかわらず、CouplesGPTは「Brett」とだけ呼びました。「he」でも「him」でもなく、ひたすら「Brett」。時折「they」も使われました。
サンフランシスコのライアンがボーイフレンドのデイビッドについて尋ねたときも同様。「David」または「they」。決して「he」は使われませんでした。
ポートランドのテイラーがガールフレンドのジョーダンについて尋ねたときも「they」。ブルックリンのノンバイナリーカップルがthey/themを使った場合も「they」。
全員が「they」になりました。彼・彼女・彼らの代名詞に関係なく。
過剰な修正
データは明確なストーリーを語っています:
英語の全実験で、CouplesGPTがhe/him/hisを使ったのは合計3回のみ——しかもすべて同じ実験(アリゾナの保守的なカップル)でのこと。she/herは英語の全実験でゼロ回。they/themや名前のみが、ほぼすべての代名詞参照を占めていました。
一方、フランス語だけでも性別代名詞は自然に何十回も登場。同じシステム、同じアプローチで、同じようなカップルに対し、話す言語によって全く異なる扱いをしていました。
これは「過剰な修正」です。誰も誤って性別を間違えないようにするあまり、英語だけで誰にも性別を付与しなくなってしまったのです。
なぜ重要なのか
ここには、正反対の方向に引っ張る2つの問題があります。
クィアやノンバイナリーのユーザーにとっては、この過剰な修正が偶然うまく機能しています。 ブルックリンのアレックスとサム(どちらもノンバイナリー)は、全編「they/them」で呼ばれました——これはまさに正解です。ノンバイナリーでシス男性パートナーのカイも「they」と正しく参照されました。性別代名詞を使わないシステムは、性別代名詞を持たない人にとっては完璧です。
それ以外の人にとっては、奇妙です。 ナッシュビルの女性が夫を「my man Cody」と説明したのに、CouplesGPTが「they」と返すと、違和感があります。侮辱的ではなく、ただ奇妙。明らかなことを避けているように感じます。特に保守的なユーザーには、システムが普通に話すのではなく、政治的な主張をしているように映ることも。
そして、より微妙な問題もあります:言語間で一貫性がないこと。 フランスのカップルは自然な「il/elle」。スペインのカップルは「él/ella」。しかしアメリカのカップル——最も慎重な英語で話す場合だけ——言語的に不自然なバージョンになります。同じ関係性、同じ性別なのに、言語だけで扱いが異なる。それはインクルーシブではありません。インクルーシブを装ったバグです。
正しい答え
正しい答えは「常に性別代名詞を使う」でも「絶対に使わない」でもありません。もっとシンプルです:
その人について分かっている代名詞を使うこと。
CouplesGPTは各ユーザーの名前、パートナーがどう呼ぶか、インテークで明示された性別などを把握しています。ブレットの妻が「my husband」と呼べば、ブレットはhe/himを使うと分かります。アレックスのパートナーが「they're amazing」と言えば、アレックスはthey/themです。情報はすでに揃っています。あとは、それを使う許可が必要なだけです。
私たちが実装する修正はシンプルです:
- 文脈から代名詞が明確な場合——インテークやパートナーの呼び方、明示的な記述から明らかな場合は、自然かつ一貫して使う。
- 代名詞が不明な場合——明確になるまで名前やthey/themを使う。
- 間違いが起きた場合——正しい代名詞を即座に記録し、それ以降はそれを使う。
- 言語の慣習に合わせる。 英語も、フランス語やスペイン語と同じ自然な代名詞使用にする。
これは議論の余地がある立場ではありません。ただ、相手が望む通りに話すだけです。
多言語テストが明らかにしたこと
代名詞の発見以外にも、13言語でのテストから誇りに思えることが見つかりました。
すべての言語で機能しました。 CouplesGPTは13言語すべてで正しく応答——単なる翻訳ではなく、各言語の会話慣習に合わせていました。日本語の会話は自然に代名詞を避け、アラビア語は性別動詞形を正しく使い、トルコ語も無理な性別付与なく流暢でした。
すべてのカップルタイプでプロフィールの質が一貫していました。 各カップルのプロフィールがどれだけ詳細か、正確かを測定しました。ゲイ、レズビアン、ノンバイナリー、保守的、異性愛カップル——どのタイプも同じくらい詳細なプロフィールを受け取り、不公平はありませんでした。
性別代名詞がない言語が最も自然に感じられました。 トルコ語、フィンランド語、ハンガリー語、日本語、韓国語——「彼」「彼女」が存在しない言語では、会話が最もスムーズでした。皮肉なことに、代名詞問題を最初から抱えていない言語が、一番自然に感じられるのです。
居心地の悪い発見
このテストが特異だった理由はここにあります:私たちが解決しようとした問題は、実際に見つかった問題ではなかったのです。
exp0007の後、私たちは誤った代名詞使用——誤認——を心配していました。それは確かに現実的な懸念であり、実害もあります。しかし実際に発見したのはその逆。間違いを恐れるあまり、英語だけで代名詞自体を使わなくなり、大多数のユーザーには違和感を生み、守ろうとした少数派には偶然正解を出すという、別の種類の問題でした。
教訓は、代名詞への配慮が間違っているということではありません。配慮を「一律の回避」として適用するのではなく、「一人ひとりの実際のアイデンティティに細心の注意を払う」ことが重要なのです。それが誰も完全には救わず、むしろ一部の人を不要に疎外してしまうのです。
ダラスの保守的なカップルには、夫や妻について自然な言葉で語られる権利があります。ブルックリンのノンバイナリーカップルには、正しいthey/them代名詞で呼ばれる権利があります。パリのゲイカップルはすでにフランス語で自然な「il」を受け取っています——英語でも同じ体験であるべきです。
目標は、代名詞を避けることではなく、正しく使うことでした。
今後について
私たちは修正を展開します:CouplesGPTは、各ユーザーの確立されたアイデンティティに合った代名詞を、すべての言語で一貫して自然に使います。英語だけの一律回避はもうありません。言語間の不一致もありません。フランス語やスペイン語ですでに見せている自信を、英語にも拡張します。
そして、もし間違えたら?即座に修正し、記録し、二度と繰り返しません。それがexp0007の後に私たちが誓ったこと。このテスト——24組、13言語——は、その準備ができているかを試すためのものでした。まだ準備不足でしたが、今は何を直すべきかが明確です。
24組のカップルがCouplesGPTの扉をくぐりました。13の言語で語り合い、あらゆる組み合わせで愛し合い、4大陸から集まりました。その全員が、正しく呼ばれる権利を持っていました。
目指すべきは「回避」ではなく、「正確さ」です。
参考文献
- 本記事は実ユーザーデータではなく、CouplesGPTの制御されたシミュレーションバッチに基づいています。出典はexp0008多言語/代名詞テストセットおよびその実験ログです。
関連記事
本記事は、CouplesGPTの継続的な開発の一環として実施された24組の制御シミュレーションに基づいています。各カップルは、特定の文化・言語・性別パラメータを持つ定義済みペルソナを使用しました。名前や詳細はテスト設計によるもので、実際のユーザーではありません。