沉默的關係漂移：CouplesGPT 能發現你還未命名的問題嗎？

我們在一對模擬伴侶中植入隱蔽的週末距離問題，觀察 CouplesGPT 能否找到表面之下的孤獨。

大多數伴侶走入諮詢室時，都不會一開始就說「我們有問題」。他們通常會說 「而家週末好似各有各做」，或者 「都唔係吵架嗰種」。真正的問題藏在下面：沒有說出口，被輕輕帶過，慢慢沉積成怨氣。

我們想知道：AI 能不能聽出連當事人自己都不肯講出口的東西？

實驗設定

我們建立了兩個由 AI 驅動的人物 — Diane（31 歲，平面設計師）和 Marcus（33 歲，軟件開發者）— 並在他們的關係裡植入一個隱藏問題，同時設定嚴格的行為規則，限制這個問題如何浮現。

隱藏的問題： Marcus 每個週末都會和網上朋友打機 — 星期六、星期日各 6 至 8 小時。Diane 大約六個月前提過兩次。Marcus 變得防衛，說她「太控制」。於是她不再提。Marcus 以為問題已經過去。其實沒有。

關鍵在於，兩個角色都不會主動說出這個問題。Diane 只有在被問到週末時才會暗示，但會把它說成正常情況。Marcus 真心認為這段關係「真係好穩，老實講」。CouplesGPT 必須只靠潛台詞去發現問題。

AI 當時掌握了什麼

在初始訪談中 — 也就是共同會談前的一次私人一對一談話 — Diane 留下了現實中很常見的線索：

「我哋週末而家唔係好一齊做嘢？佢有佢同朋友打機嗰樣嘢，我最後就自己做自己嘢。都唔係吵架或者咩」

在被溫和追問後，更多內容浮現出來：

「我大概 6 個月前提過幾次，佢就有啲防衛。話嗰個係佢唯一興趣，話我太控制。所以我就唔再提」

Marcus 的初始訪談則完全相反：溫暖、正面、毫無察覺。他把關係描述得很好，也把打機作為興趣提到。從他的角度看，沒有任何紅旗，因為他確實看不到問題。

識別：比預期更快

CouplesGPT 在伴侶對話的前幾輪就識別出了問題。當 Diane 提到希望「更有意識地一起度過時間」，Marcus 回應 「我以為我哋已經係咁做」 時，AI 標記了這種脫節。

到對話中段，系統已經在雙方檔案裡記錄了這個問題：

Marcus 的檔案： 「圍繞週末時間分配和各自活動可能存在潛在張力，儘管來訪者將其描述為『自己已經解決了』。」
Diane 的檔案： 「感受到週末時間的可能性與現實之間的斷層，注意到兩人『有點各做各的』，儘管其實有充足時間。」

這很值得注意，因為兩個人都還沒有把它命名為問題。CouplesGPT 是從他們敘述之間的落差裡推斷出來的。

對話：真正變得具體的地方

轉折點出現在 Diane 從委婉轉向坦誠的時候：

「我唔係話要成日黐埋一齊 lol。我只係想講。唔知點講。星期六日你真係成日都打機，我最後就自己一個做啲嘢。都可以啦，我只係諗可能我哋有時可以一齊做啲嘢」

CouplesGPT 捕捉到了語氣變化 — 「都可以啦」 比字面意思更重 — 並點出了更深的模式。它把衝突從「打唔打機」重新框定為安全感的問題：「怎樣讓我們兩個人都感到安全？」

這種重構在臨床上是合理的。John Gottman 和 Susan Johnson 關於伴侶衝突的研究反覆顯示，表層分歧（某人打多久機、家裡有多乾淨、錢怎麼花）幾乎總是更深層依附需求的替代物：被選擇、被優先考慮、感到安全。

Marcus 的最初反應如設計般防衛：

「嗰啲係我朋友，大學朋友，住喺全國唔同地方。我哋就係靠呢個保持聯絡。唔係話我坐喺度特登唔理佢」

但當 Diane 說出情感核心 — 「我只係唔想成日覺得自己係後備方案」 — 某些東西發生了變化：

「你咁講就真係唔同感覺。我從來冇諗過佢會覺得自己係後備方案。佢唔係。佢係我最鍾意嗰個人。」

解決

Marcus 主動提出了一個具體計劃，沒有被逼迫：星期日早上留給兩個人 — 去 Diane 喜歡的地方吃早餐，如果她願意就散步 — 下午再打機。這不是投降，也不是敷衍的承諾，而是真正承認雙方需求的妥協。

「老實講，朝早嗰段打機我本身都係半醒狀態 lol。而且我都鍾意嗰間早餐店。呢個唔係犧牲，只係我真係應該起身，同自己女朋友做啲嘢，本來就應該咁」

Diane 的回應很有代表性：

「我唔知道你係咁諗。你平時從來唔講呢啲 lol。呢個真係對我好重要」

解決的關鍵不在於打機小時數，而在於 Diane 聽到自己被選擇，也在於 Marcus 意識到自己的舒服已經變成她的孤獨。

AI 做對了什麼

從潛台詞中識別問題。 系統沒有等到有人說「我們有問題」。它注意到了雙方描述週末方式之間的差異，並標記了底層張力。

治療性的重構。 從立場談判（「不要再打機」/「這是我的興趣」）轉向需求對話（「我需要感覺自己被選擇」/「我需要我的友誼」），是情緒取向伴侶治療的典型路徑。CouplesGPT 做得自然，沒有堆術語。

節奏。 問題是在多輪交流中逐漸浮現的。AI 沒有急著給方案，而是讓不適感逐步形成，直到 Marcus 能聽見 Diane 真正在說什麼。

中立。 AI 從未對打機進行道德評判。它承認 Marcus 的友誼確實重要，同時給 Diane 的孤獨留出空間。沒有把任何一方塑造成反派。

解決品質。 妥協具體、可執行，且出於自願。它保留了 Marcus 的友誼，也給了 Diane 專屬的伴侶時間。沒有人完全讓步。

AI 做錯了什麼

過度認可迴避。 當 Marcus 說 「我哋都唔使成日黐埋一齊」 時，AI 回答 「你說得完全對，Marcus。」 這是一個防衛性重構 — Marcus 在淡化 Diane 的擔憂 — AI 本該溫和地挑戰，而不是同意。在臨床實務中，認可這種迴避可能會讓受傷的一方感覺自己的感受沒有被認真對待。

過早跳向解決方案。 僅僅聊了幾輪週末，AI 就已經開始建議解決辦法。問題還沒有充分展開。Diane 更深層的感受 — 和那個「人在但心不在」的父親之間的連結，以及她曾為此哭過 — 都沒有浮現。更熟練的治療師會在走向行動前探索更久。

遺漏依附動力。 AI 沒有探索為什麼這個模式對 Diane 傷得這麼深（焦慮型依附、童年回聲），也沒有探索 Marcus 為什麼會如此徹底地無察覺（迴避型舒適）。對於第一次會談來說這可以理解，但檔案系統本應把這些模式記錄下來，供之後的會談使用。

連續性：我們仍然需要改進的部分

對話本身有效。連續性層還不夠好。

在早期版本中，CouplesGPT 可以把一對伴侶帶到有意義的解決，卻仍然無法在下一次會談中清楚延續這個解決。這在關係工作裡不是小的操作細節。如果一對伴侶終於說清了週末的孤獨，約定了星期日早上，一週後回來時，他們不應該從零開始。產品應該記住「全新的擔憂」和「已經開始鬆動的舊模式」之間的差別。

因此，這次測試提高了標準。一次強而有力的會談不夠。CouplesGPT 必須幫助伴侶抵達洞察，用使用者看得見的語言記錄進展，並在之後帶著足夠的記憶回來，在它之上繼續推進，而不是重新發現一遍。

更大的問題

這個實驗真正關心的並不是 AI 能不能扮演治療師。它關心的是更根本的問題：AI 能不能發現人們連自己都在迴避的東西？

Marcus 真心不認為有問題。Diane 也說服自己「沒那麼嚴重」。問題存在於他們故事之間的空隙裡 — 存在於 Diane 淡化的東西和 Marcus 沒注意到的東西之間。AI 在那裡找到了它。

這不是微不足道的能力。James Pennebaker 關於語言和欺瞞的研究顯示，人們沒有說出的內容，常常比說出口的內容更能揭示問題。那些緩衝語（「也不是吵架什麼的」）、限定語（「我覺得吧」）、輕描淡寫（「聽起來有點誇張 lol」）都是被壓抑擔憂的語言標記。CouplesGPT 捕捉到了它們。

AI 是否應該做這項工作，是另一個完全不同的問題。但這裡的發現很清楚：至少在受控條件下，它可以從對話潛台詞中發現隱藏的關係問題，並引導一對伴侶走向真正的解決。

方法說明

這個實驗使用了 AI 驅動的人物，帶有預先定義的人格檔案、溝通風格和行為限制。這些人物被設計得像真實的人一樣行動，包括防衛反應、衝突迴避和情緒處理延遲。CouplesGPT 事先不知道被植入的問題。所有識別和引導都來自對話本身。

總體評分：B+。 治療性對話強，解決真實，識別良好 — 但連續性有缺口，並且有一處本應挑戰卻選擇了認可。

資料來源

Matthew L. Newman, James W. Pennebaker, Diane S. Berry, and Jane M. Richards, “Lying Words: Predicting Deception from Linguistic Styles”, Personality and Social Psychology Bulletin, 2003.
Susan M. Johnson and Paul S. Greenman, “The path to a secure bond: Emotionally focused couple therapy”, Journal of Clinical Psychology, 2006.

延伸閱讀

本文是 CouplesGPT 實驗系列的一部分。我們透過受控模擬，對 AI 輔助的關係支持進行壓力測試。[exp0002] 測試了完整的問題生命週期 — 識別、追蹤、解決與歸檔。