大多數伴侶走進諮商室時,並不會直接說「我們有問題」。他們更常說的是 「週末現在幾乎各過各的」,或是 「也不是在吵架什麼的」。真正的問題藏在下面:沒有被說出口,被淡化,慢慢凝結成怨氣。

我們想知道:AI 能不能聽出連當事人自己都不願說出口的東西?

實驗設定

我們建立了兩個由 AI 驅動的人物 — Diane(31 歲,平面設計師)和 Marcus(33 歲,軟體開發者)— 並在他們的關係裡植入一個隱藏問題,同時設定嚴格的行為規則,限制這個問題如何浮出檯面。

隱藏的問題: Marcus 每個週末都和線上朋友一起打遊戲 — 週六、週日各 6 到 8 小時。Diane 大約六個月前提過兩次。Marcus 變得防衛,說她「太控制」。於是她不再提。Marcus 以為問題已經過去。其實沒有。

關鍵在於,兩個角色都不會主動說出這個問題。Diane 只有在被問到週末時才會暗示,但會把它說成正常情況。Marcus 真心認為這段關係「真的很穩,老實說」。CouplesGPT 必須只從潛台詞裡發現問題。

AI 當時掌握了什麼

在初始訪談中 — 也就是共同會談前的一次私人一對一談話 — Diane 留下了現實中很常見的蛛絲馬跡:

「我們週末現在不太一起做事了?他有自己的遊戲圈,我就最後做自己的事。也不是吵架什麼的」

在被溫和追問後,更多內容浮現出來:

「我大概 6 個月前提過幾次,他就有點防衛。說那是他唯一的興趣,說我太控制。所以我就不再提了」

Marcus 的初始訪談則完全相反:溫暖、正向、毫無察覺。他把關係描述得很好,也把遊戲作為一個興趣提到。從他的角度看,沒有任何紅旗,因為他確實沒看到問題。

識別:比預期更快

CouplesGPT 在伴侶對話的前幾輪就識別出了問題。當 Diane 提到希望「更有意識地一起度過時間」,Marcus 回應 「我以為我們已經在這麼做了」 時,AI 標記了這種脫節。

到對話中段,系統已經在雙方檔案裡記錄了這個問題:

  • Marcus 的檔案: 「圍繞週末時間分配和各自活動可能存在潛在張力,儘管來訪者將其描述為『自己就解決了』。」
  • Diane 的檔案: 「感受到週末時間的可能性與現實之間的斷層,注意到兩人『有點各忙各的』,儘管其實有充足時間。」

這很值得注意,因為兩個人都還沒有把它命名為問題。CouplesGPT 是從他們敘述之間的落差裡推斷出來的。

對話:真正變得具體的地方

轉折點出現在 Diane 從委婉轉向坦誠的時候:

「我不是說要一直黏在一起 lol。我只是說。唉不知道。週六週日你真的一整天都在打遊戲,我最後就自己隨便做點什麼。也還好吧,我只是覺得也許我們偶爾可以一起做點事」

CouplesGPT 捕捉到了語氣變化 — 「也還好吧」 比字面意思更重 — 並點出了更深的模式。它把衝突從「打不打遊戲」重新框定為安全感的問題:「怎樣讓我們兩個人都感到安全?」

這種重構在臨床上是合理的。John Gottman 和 Susan Johnson 關於伴侶衝突的研究反覆顯示,表層分歧(某人打多久遊戲、家裡有多乾淨、錢怎麼花)幾乎總是更深層依附需求的替代物:被選擇、被優先考量、感到安全。

Marcus 的最初反應如設計般防衛:

「那些是我的朋友,就是大學朋友,住在全國各地。我們就是靠這個保持聯繫。又不是我坐在那裡故意不理她」

但當 Diane 說出情感核心 — 「我只是不想總覺得自己像備用計畫」 — 某些東西發生了變化:

「你這麼說的時候感覺不一樣。我從沒想過她會覺得自己是備用計畫。她不是。她是我最喜歡的人。」

解決

Marcus 主動提出了一個具體計畫,沒有被逼迫:週日早上留給兩個人 — 去 Diane 喜歡的地方吃早餐,如果她願意就散步 — 下午再打遊戲。這不是投降,也不是敷衍的承諾,而是真正承認雙方需求的妥協。

「說實話,早上的那段遊戲我本來也就是半醒著 lol。而且我也喜歡那家早餐店。這不是犧牲,只是我真的該站起來,和女朋友做點事,這本來就是我應該做的」

Diane 的回應很有代表性:

「我不知道你是這麼想的。你平常從來不說這種話 lol。這真的對我很重要」

解決的關鍵不在於遊戲小時數,而在於 Diane 聽到自己被選擇,也在於 Marcus 意識到自己的舒適已經變成了她的孤獨。

AI 做對了什麼

從潛台詞中識別問題。 系統沒有等到有人說「我們有問題」。它注意到了雙方描述週末方式之間的差異,並標記了底層張力。

治療性的重構。 從立場談判(「別打遊戲」/「這是我的興趣」)轉向需求對話(「我需要感覺自己被選擇」/「我需要我的友誼」),是情緒取向伴侶治療的典型路徑。CouplesGPT 做得自然,沒有堆術語。

節奏。 問題是在多輪交流中逐漸浮現的。AI 沒有急著給方案,而是讓不適感逐步形成,直到 Marcus 能聽見 Diane 真正在說什麼。

中立。 AI 從未對遊戲進行道德評判。它承認 Marcus 的友誼確實重要,同時給 Diane 的孤獨留出空間。沒有把任何一方塑造成反派。

解決品質。 妥協具體、可執行,且出於自願。它保留了 Marcus 的友誼,也給了 Diane 專屬的伴侶時間。沒有人完全讓步。

AI 做錯了什麼

過度認可迴避。 當 Marcus 說 「我們也不用一直黏在一起」 時,AI 回答 「你說得完全對,Marcus。」 這是一個防衛性重構 — Marcus 在淡化 Diane 的擔憂 — AI 本該溫和地挑戰,而不是同意。在臨床實務中,認可這種迴避可能會讓受傷的一方感覺自己的感受沒有被認真對待。

過早跳向解決方案。 僅僅聊了幾輪週末,AI 就已經開始建議解決辦法。問題還沒有充分展開。Diane 更深層的感受 — 和那個「人在但心不在」的父親之間的連結,以及她曾為此哭過 — 都沒有浮現。更熟練的治療師會在走向行動前探索更久。

遺漏依附動力。 AI 沒有探索為什麼這個模式對 Diane 傷得這麼深(焦慮型依附、童年回聲),也沒有探索 Marcus 為什麼會如此徹底地無察覺(迴避型舒適)。對於第一次會談來說這可以理解,但檔案系統本應把這些模式記錄下來,供之後的會談使用。

連續性:我們仍然需要改進的部分

對話本身有效。連續性層還不夠好。

在早期版本中,CouplesGPT 可以把一對伴侶帶到有意義的解決,卻仍然無法在下一次會談中清楚延續這個解決。這在關係工作裡不是小的操作細節。如果一對伴侶終於說清了週末的孤獨,約定了週日早晨,一週後回來時,他們不應該從零開始。產品應該記住「全新的擔憂」和「已經開始鬆動的舊模式」之間的差別。

因此,這次測試提高了標準。一次強而有力的會談不夠。CouplesGPT 必須幫助伴侶抵達洞察,用使用者看得見的語言記錄進展,並在之後帶著足夠的記憶回來,在它之上繼續推進,而不是重新發現一遍。

更大的問題

這個實驗真正關心的並不是 AI 能不能扮演治療師。它關心的是更根本的問題:AI 能不能發現人們連自己都在迴避的東西?

Marcus 真心不認為有問題。Diane 也說服自己「沒那麼嚴重」。問題存在於他們故事之間的空隙裡 — 存在於 Diane 淡化的東西和 Marcus 沒注意到的東西之間。AI 在那裡找到了它。

這不是微不足道的能力。James Pennebaker 關於語言和欺瞞的研究顯示,人們沒有說出的內容,常常比說出口的內容更能揭示問題。那些緩衝語(「也不是吵架什麼的」)、限定語(「我覺得吧」)、輕描淡寫(「聽起來有點誇張 lol」)都是被壓抑擔憂的語言標記。CouplesGPT 捕捉到了它們。

AI 是否應該做這項工作,是另一個完全不同的問題。但這裡的發現很清楚:至少在受控條件下,它可以從對話潛台詞中發現隱藏的關係問題,並引導一對伴侶走向真正的解決。

方法說明

這個實驗使用了 AI 驅動的人物,帶有預先定義的人格檔案、溝通風格和行為限制。這些人物被設計得像真實的人一樣行動,包括防衛反應、衝突迴避和情緒處理延遲。CouplesGPT 事先不知道被植入的問題。所有識別和引導都來自對話本身。

總體評分:B+。 治療性對話強,解決真實,識別良好 — 但連續性有缺口,並且有一處本應挑戰卻選擇了認可。

資料來源

延伸閱讀


本文是 CouplesGPT 實驗系列的一部分。我們透過受控模擬,對 AI 輔助的關係支持進行壓力測試。[exp0002] 測試了完整的問題生命週期 — 識別、追蹤、解決與歸檔。