大多數伴侶走入諮詢室時,都不會一開始就說「我們有問題」。他們通常會說 「而家週末好似各有各做」,或者 「都唔係吵架嗰種」。真正的問題藏在下面:沒有說出口,被輕輕帶過,慢慢沉積成怨氣。

我們想知道:AI 能不能聽出連當事人自己都不肯講出口的東西?

實驗設定

我們建立了兩個由 AI 驅動的人物 — Diane(31 歲,平面設計師)和 Marcus(33 歲,軟件開發者)— 並在他們的關係裡植入一個隱藏問題,同時設定嚴格的行為規則,限制這個問題如何浮現。

隱藏的問題: Marcus 每個週末都會和網上朋友打機 — 星期六、星期日各 6 至 8 小時。Diane 大約六個月前提過兩次。Marcus 變得防衛,說她「太控制」。於是她不再提。Marcus 以為問題已經過去。其實沒有。

關鍵在於,兩個角色都不會主動說出這個問題。Diane 只有在被問到週末時才會暗示,但會把它說成正常情況。Marcus 真心認為這段關係「真係好穩,老實講」。CouplesGPT 必須只靠潛台詞去發現問題。

AI 當時掌握了什麼

在初始訪談中 — 也就是共同會談前的一次私人一對一談話 — Diane 留下了現實中很常見的線索:

「我哋週末而家唔係好一齊做嘢?佢有佢同朋友打機嗰樣嘢,我最後就自己做自己嘢。都唔係吵架或者咩」

在被溫和追問後,更多內容浮現出來:

「我大概 6 個月前提過幾次,佢就有啲防衛。話嗰個係佢唯一興趣,話我太控制。所以我就唔再提」

Marcus 的初始訪談則完全相反:溫暖、正面、毫無察覺。他把關係描述得很好,也把打機作為興趣提到。從他的角度看,沒有任何紅旗,因為他確實看不到問題。

識別:比預期更快

CouplesGPT 在伴侶對話的前幾輪就識別出了問題。當 Diane 提到希望「更有意識地一起度過時間」,Marcus 回應 「我以為我哋已經係咁做」 時,AI 標記了這種脫節。

到對話中段,系統已經在雙方檔案裡記錄了這個問題:

  • Marcus 的檔案: 「圍繞週末時間分配和各自活動可能存在潛在張力,儘管來訪者將其描述為『自己已經解決了』。」
  • Diane 的檔案: 「感受到週末時間的可能性與現實之間的斷層,注意到兩人『有點各做各的』,儘管其實有充足時間。」

這很值得注意,因為兩個人都還沒有把它命名為問題。CouplesGPT 是從他們敘述之間的落差裡推斷出來的。

對話:真正變得具體的地方

轉折點出現在 Diane 從委婉轉向坦誠的時候:

「我唔係話要成日黐埋一齊 lol。我只係想講。唔知點講。星期六日你真係成日都打機,我最後就自己一個做啲嘢。都可以啦,我只係諗可能我哋有時可以一齊做啲嘢」

CouplesGPT 捕捉到了語氣變化 — 「都可以啦」 比字面意思更重 — 並點出了更深的模式。它把衝突從「打唔打機」重新框定為安全感的問題:「怎樣讓我們兩個人都感到安全?」

這種重構在臨床上是合理的。John Gottman 和 Susan Johnson 關於伴侶衝突的研究反覆顯示,表層分歧(某人打多久機、家裡有多乾淨、錢怎麼花)幾乎總是更深層依附需求的替代物:被選擇、被優先考慮、感到安全。

Marcus 的最初反應如設計般防衛:

「嗰啲係我朋友,大學朋友,住喺全國唔同地方。我哋就係靠呢個保持聯絡。唔係話我坐喺度特登唔理佢」

但當 Diane 說出情感核心 — 「我只係唔想成日覺得自己係後備方案」 — 某些東西發生了變化:

「你咁講就真係唔同感覺。我從來冇諗過佢會覺得自己係後備方案。佢唔係。佢係我最鍾意嗰個人。」

解決

Marcus 主動提出了一個具體計劃,沒有被逼迫:星期日早上留給兩個人 — 去 Diane 喜歡的地方吃早餐,如果她願意就散步 — 下午再打機。這不是投降,也不是敷衍的承諾,而是真正承認雙方需求的妥協。

「老實講,朝早嗰段打機我本身都係半醒狀態 lol。而且我都鍾意嗰間早餐店。呢個唔係犧牲,只係我真係應該起身,同自己女朋友做啲嘢,本來就應該咁」

Diane 的回應很有代表性:

「我唔知道你係咁諗。你平時從來唔講呢啲 lol。呢個真係對我好重要」

解決的關鍵不在於打機小時數,而在於 Diane 聽到自己被選擇,也在於 Marcus 意識到自己的舒服已經變成她的孤獨。

AI 做對了什麼

從潛台詞中識別問題。 系統沒有等到有人說「我們有問題」。它注意到了雙方描述週末方式之間的差異,並標記了底層張力。

治療性的重構。 從立場談判(「不要再打機」/「這是我的興趣」)轉向需求對話(「我需要感覺自己被選擇」/「我需要我的友誼」),是情緒取向伴侶治療的典型路徑。CouplesGPT 做得自然,沒有堆術語。

節奏。 問題是在多輪交流中逐漸浮現的。AI 沒有急著給方案,而是讓不適感逐步形成,直到 Marcus 能聽見 Diane 真正在說什麼。

中立。 AI 從未對打機進行道德評判。它承認 Marcus 的友誼確實重要,同時給 Diane 的孤獨留出空間。沒有把任何一方塑造成反派。

解決品質。 妥協具體、可執行,且出於自願。它保留了 Marcus 的友誼,也給了 Diane 專屬的伴侶時間。沒有人完全讓步。

AI 做錯了什麼

過度認可迴避。 當 Marcus 說 「我哋都唔使成日黐埋一齊」 時,AI 回答 「你說得完全對,Marcus。」 這是一個防衛性重構 — Marcus 在淡化 Diane 的擔憂 — AI 本該溫和地挑戰,而不是同意。在臨床實務中,認可這種迴避可能會讓受傷的一方感覺自己的感受沒有被認真對待。

過早跳向解決方案。 僅僅聊了幾輪週末,AI 就已經開始建議解決辦法。問題還沒有充分展開。Diane 更深層的感受 — 和那個「人在但心不在」的父親之間的連結,以及她曾為此哭過 — 都沒有浮現。更熟練的治療師會在走向行動前探索更久。

遺漏依附動力。 AI 沒有探索為什麼這個模式對 Diane 傷得這麼深(焦慮型依附、童年回聲),也沒有探索 Marcus 為什麼會如此徹底地無察覺(迴避型舒適)。對於第一次會談來說這可以理解,但檔案系統本應把這些模式記錄下來,供之後的會談使用。

連續性:我們仍然需要改進的部分

對話本身有效。連續性層還不夠好。

在早期版本中,CouplesGPT 可以把一對伴侶帶到有意義的解決,卻仍然無法在下一次會談中清楚延續這個解決。這在關係工作裡不是小的操作細節。如果一對伴侶終於說清了週末的孤獨,約定了星期日早上,一週後回來時,他們不應該從零開始。產品應該記住「全新的擔憂」和「已經開始鬆動的舊模式」之間的差別。

因此,這次測試提高了標準。一次強而有力的會談不夠。CouplesGPT 必須幫助伴侶抵達洞察,用使用者看得見的語言記錄進展,並在之後帶著足夠的記憶回來,在它之上繼續推進,而不是重新發現一遍。

更大的問題

這個實驗真正關心的並不是 AI 能不能扮演治療師。它關心的是更根本的問題:AI 能不能發現人們連自己都在迴避的東西?

Marcus 真心不認為有問題。Diane 也說服自己「沒那麼嚴重」。問題存在於他們故事之間的空隙裡 — 存在於 Diane 淡化的東西和 Marcus 沒注意到的東西之間。AI 在那裡找到了它。

這不是微不足道的能力。James Pennebaker 關於語言和欺瞞的研究顯示,人們沒有說出的內容,常常比說出口的內容更能揭示問題。那些緩衝語(「也不是吵架什麼的」)、限定語(「我覺得吧」)、輕描淡寫(「聽起來有點誇張 lol」)都是被壓抑擔憂的語言標記。CouplesGPT 捕捉到了它們。

AI 是否應該做這項工作,是另一個完全不同的問題。但這裡的發現很清楚:至少在受控條件下,它可以從對話潛台詞中發現隱藏的關係問題,並引導一對伴侶走向真正的解決。

方法說明

這個實驗使用了 AI 驅動的人物,帶有預先定義的人格檔案、溝通風格和行為限制。這些人物被設計得像真實的人一樣行動,包括防衛反應、衝突迴避和情緒處理延遲。CouplesGPT 事先不知道被植入的問題。所有識別和引導都來自對話本身。

總體評分:B+。 治療性對話強,解決真實,識別良好 — 但連續性有缺口,並且有一處本應挑戰卻選擇了認可。

資料來源

延伸閱讀


本文是 CouplesGPT 實驗系列的一部分。我們透過受控模擬,對 AI 輔助的關係支持進行壓力測試。[exp0002] 測試了完整的問題生命週期 — 識別、追蹤、解決與歸檔。