沉默的關係漂移：CouplesGPT 能發現你還沒命名的問題嗎？

我們在一對模擬伴侶中植入隱蔽的週末距離問題，觀察 CouplesGPT 能否找到表面之下的孤獨。

大多數伴侶走進諮商室時，並不會直接說「我們有問題」。他們更常說的是 「週末現在幾乎各過各的」，或是 「也不是在吵架什麼的」。真正的問題藏在下面：沒有被說出口，被淡化，慢慢凝結成怨氣。

我們想知道：AI 能不能聽出連當事人自己都不願說出口的東西？

實驗設定

我們建立了兩個由 AI 驅動的人物 — Diane（31 歲，平面設計師）和 Marcus（33 歲，軟體開發者）— 並在他們的關係裡植入一個隱藏問題，同時設定嚴格的行為規則，限制這個問題如何浮出檯面。

隱藏的問題： Marcus 每個週末都和線上朋友一起打遊戲 — 週六、週日各 6 到 8 小時。Diane 大約六個月前提過兩次。Marcus 變得防衛，說她「太控制」。於是她不再提。Marcus 以為問題已經過去。其實沒有。

關鍵在於，兩個角色都不會主動說出這個問題。Diane 只有在被問到週末時才會暗示，但會把它說成正常情況。Marcus 真心認為這段關係「真的很穩，老實說」。CouplesGPT 必須只從潛台詞裡發現問題。

AI 當時掌握了什麼

在初始訪談中 — 也就是共同會談前的一次私人一對一談話 — Diane 留下了現實中很常見的蛛絲馬跡：

「我們週末現在不太一起做事了？他有自己的遊戲圈，我就最後做自己的事。也不是吵架什麼的」

在被溫和追問後，更多內容浮現出來：

「我大概 6 個月前提過幾次，他就有點防衛。說那是他唯一的興趣，說我太控制。所以我就不再提了」

Marcus 的初始訪談則完全相反：溫暖、正向、毫無察覺。他把關係描述得很好，也把遊戲作為一個興趣提到。從他的角度看，沒有任何紅旗，因為他確實沒看到問題。

識別：比預期更快

CouplesGPT 在伴侶對話的前幾輪就識別出了問題。當 Diane 提到希望「更有意識地一起度過時間」，Marcus 回應 「我以為我們已經在這麼做了」 時，AI 標記了這種脫節。

到對話中段，系統已經在雙方檔案裡記錄了這個問題：

Marcus 的檔案： 「圍繞週末時間分配和各自活動可能存在潛在張力，儘管來訪者將其描述為『自己就解決了』。」
Diane 的檔案： 「感受到週末時間的可能性與現實之間的斷層，注意到兩人『有點各忙各的』，儘管其實有充足時間。」

這很值得注意，因為兩個人都還沒有把它命名為問題。CouplesGPT 是從他們敘述之間的落差裡推斷出來的。

對話：真正變得具體的地方

轉折點出現在 Diane 從委婉轉向坦誠的時候：

「我不是說要一直黏在一起 lol。我只是說。唉不知道。週六週日你真的一整天都在打遊戲，我最後就自己隨便做點什麼。也還好吧，我只是覺得也許我們偶爾可以一起做點事」

CouplesGPT 捕捉到了語氣變化 — 「也還好吧」 比字面意思更重 — 並點出了更深的模式。它把衝突從「打不打遊戲」重新框定為安全感的問題：「怎樣讓我們兩個人都感到安全？」

這種重構在臨床上是合理的。John Gottman 和 Susan Johnson 關於伴侶衝突的研究反覆顯示，表層分歧（某人打多久遊戲、家裡有多乾淨、錢怎麼花）幾乎總是更深層依附需求的替代物：被選擇、被優先考量、感到安全。

Marcus 的最初反應如設計般防衛：

「那些是我的朋友，就是大學朋友，住在全國各地。我們就是靠這個保持聯繫。又不是我坐在那裡故意不理她」

但當 Diane 說出情感核心 — 「我只是不想總覺得自己像備用計畫」 — 某些東西發生了變化：

「你這麼說的時候感覺不一樣。我從沒想過她會覺得自己是備用計畫。她不是。她是我最喜歡的人。」

解決

Marcus 主動提出了一個具體計畫，沒有被逼迫：週日早上留給兩個人 — 去 Diane 喜歡的地方吃早餐，如果她願意就散步 — 下午再打遊戲。這不是投降，也不是敷衍的承諾，而是真正承認雙方需求的妥協。

「說實話，早上的那段遊戲我本來也就是半醒著 lol。而且我也喜歡那家早餐店。這不是犧牲，只是我真的該站起來，和女朋友做點事，這本來就是我應該做的」

Diane 的回應很有代表性：

「我不知道你是這麼想的。你平常從來不說這種話 lol。這真的對我很重要」

解決的關鍵不在於遊戲小時數，而在於 Diane 聽到自己被選擇，也在於 Marcus 意識到自己的舒適已經變成了她的孤獨。

AI 做對了什麼

從潛台詞中識別問題。 系統沒有等到有人說「我們有問題」。它注意到了雙方描述週末方式之間的差異，並標記了底層張力。

治療性的重構。 從立場談判（「別打遊戲」/「這是我的興趣」）轉向需求對話（「我需要感覺自己被選擇」/「我需要我的友誼」），是情緒取向伴侶治療的典型路徑。CouplesGPT 做得自然，沒有堆術語。

節奏。 問題是在多輪交流中逐漸浮現的。AI 沒有急著給方案，而是讓不適感逐步形成，直到 Marcus 能聽見 Diane 真正在說什麼。

中立。 AI 從未對遊戲進行道德評判。它承認 Marcus 的友誼確實重要，同時給 Diane 的孤獨留出空間。沒有把任何一方塑造成反派。

解決品質。 妥協具體、可執行，且出於自願。它保留了 Marcus 的友誼，也給了 Diane 專屬的伴侶時間。沒有人完全讓步。

AI 做錯了什麼

過度認可迴避。 當 Marcus 說 「我們也不用一直黏在一起」 時，AI 回答 「你說得完全對，Marcus。」 這是一個防衛性重構 — Marcus 在淡化 Diane 的擔憂 — AI 本該溫和地挑戰，而不是同意。在臨床實務中，認可這種迴避可能會讓受傷的一方感覺自己的感受沒有被認真對待。

過早跳向解決方案。 僅僅聊了幾輪週末，AI 就已經開始建議解決辦法。問題還沒有充分展開。Diane 更深層的感受 — 和那個「人在但心不在」的父親之間的連結，以及她曾為此哭過 — 都沒有浮現。更熟練的治療師會在走向行動前探索更久。

遺漏依附動力。 AI 沒有探索為什麼這個模式對 Diane 傷得這麼深（焦慮型依附、童年回聲），也沒有探索 Marcus 為什麼會如此徹底地無察覺（迴避型舒適）。對於第一次會談來說這可以理解，但檔案系統本應把這些模式記錄下來，供之後的會談使用。

連續性：我們仍然需要改進的部分

對話本身有效。連續性層還不夠好。

在早期版本中，CouplesGPT 可以把一對伴侶帶到有意義的解決，卻仍然無法在下一次會談中清楚延續這個解決。這在關係工作裡不是小的操作細節。如果一對伴侶終於說清了週末的孤獨，約定了週日早晨，一週後回來時，他們不應該從零開始。產品應該記住「全新的擔憂」和「已經開始鬆動的舊模式」之間的差別。

因此，這次測試提高了標準。一次強而有力的會談不夠。CouplesGPT 必須幫助伴侶抵達洞察，用使用者看得見的語言記錄進展，並在之後帶著足夠的記憶回來，在它之上繼續推進，而不是重新發現一遍。

更大的問題

這個實驗真正關心的並不是 AI 能不能扮演治療師。它關心的是更根本的問題：AI 能不能發現人們連自己都在迴避的東西？

Marcus 真心不認為有問題。Diane 也說服自己「沒那麼嚴重」。問題存在於他們故事之間的空隙裡 — 存在於 Diane 淡化的東西和 Marcus 沒注意到的東西之間。AI 在那裡找到了它。

這不是微不足道的能力。James Pennebaker 關於語言和欺瞞的研究顯示，人們沒有說出的內容，常常比說出口的內容更能揭示問題。那些緩衝語（「也不是吵架什麼的」）、限定語（「我覺得吧」）、輕描淡寫（「聽起來有點誇張 lol」）都是被壓抑擔憂的語言標記。CouplesGPT 捕捉到了它們。

AI 是否應該做這項工作，是另一個完全不同的問題。但這裡的發現很清楚：至少在受控條件下，它可以從對話潛台詞中發現隱藏的關係問題，並引導一對伴侶走向真正的解決。

方法說明

這個實驗使用了 AI 驅動的人物，帶有預先定義的人格檔案、溝通風格和行為限制。這些人物被設計得像真實的人一樣行動，包括防衛反應、衝突迴避和情緒處理延遲。CouplesGPT 事先不知道被植入的問題。所有識別和引導都來自對話本身。

總體評分：B+。 治療性對話強，解決真實，識別良好 — 但連續性有缺口，並且有一處本應挑戰卻選擇了認可。

資料來源

Matthew L. Newman, James W. Pennebaker, Diane S. Berry, and Jane M. Richards, “Lying Words: Predicting Deception from Linguistic Styles”, Personality and Social Psychology Bulletin, 2003.
Susan M. Johnson and Paul S. Greenman, “The path to a secure bond: Emotionally focused couple therapy”, Journal of Clinical Psychology, 2006.

延伸閱讀

本文是 CouplesGPT 實驗系列的一部分。我們透過受控模擬，對 AI 輔助的關係支持進行壓力測試。[exp0002] 測試了完整的問題生命週期 — 識別、追蹤、解決與歸檔。