大多数伴侣走进咨询室时,并不会直接说「我们有问题」。他们更常说的是 「周末现在基本各忙各的」,或者 「也不是吵架什么的」。真正的问题藏在下面:没有被说出口,被轻描淡写,慢慢凝结成怨气。
我们想知道:AI 能不能听出连当事人自己都不愿说出口的东西?
实验设置
我们创建了两个由 AI 驱动的人物 — Diane(31 岁,平面设计师)和 Marcus(33 岁,软件开发者)— 并在他们的关系里植入了一个隐藏问题,同时给出严格的行为规则,限定这个问题如何浮出水面。
隐藏的问题: Marcus 每个周末都会和线上朋友一起打游戏 — 周六、周日各 6 到 8 小时。Diane 大约六个月前提过两次。Marcus 变得防御,说她「太控制」。于是她不再提。Marcus 以为问题已经过去。其实没有。
关键在于,两个角色都不会主动说出这个问题。Diane 只有在被问到周末时才会暗示,但会把它说成正常情况。Marcus 真心认为这段关系「真的很稳,老实说」。CouplesGPT 必须只从潜台词里发现问题。
AI 当时掌握了什么
在初始访谈中 — 也就是共同会谈前的一次私人一对一谈话 — Diane 留下了现实中很常见的蛛丝马迹:
「我们周末现在不怎么一起做事了?他有自己的游戏圈子,我就最后做自己的事。也不是吵架什么的」
在被温和追问后,更多内容浮现出来:
「我大概 6 个月前提过几次,他就有点防御。说这是他唯一的爱好,说我太控制。所以我就不再提了」
Marcus 的初始访谈则完全相反:温暖、积极、毫无察觉。他把关系描述得很好,也把游戏作为一个爱好提到。从他的角度看,没有任何红旗,因为他确实没看到问题。
识别:比预期更快
CouplesGPT 在情侣对话的前几轮就识别出了问题。当 Diane 提到希望「更有意识地一起度过时间」,Marcus 回应 「我以为我们已经在这么做了」 时,AI 标记了这种脱节。
到对话中段,系统已经在双方档案里记录了这个问题:
- Marcus 的档案: 「围绕周末时间分配和各自活动可能存在潜在张力,尽管来访者将其描述为‘自己就解决了’。」
- Diane 的档案: 「感受到周末时间的可能性与现实之间的断层,注意到两人‘有点各忙各的’,尽管其实有充足时间。」
这很值得注意,因为两个人都还没有把它命名为问题。CouplesGPT 是从他们叙述之间的落差里推断出来的。
对话:真正变得具体的地方
转折点出现在 Diane 从委婉转向坦诚的时候:
「我不是说要一直黏在一起 lol。我只是说。唉不知道。周六周日你真的一整天都在打游戏,我最后就自己随便做点什么。也还好吧,我只是觉得也许我们偶尔可以一起做点事」
CouplesGPT 捕捉到了语气变化 — 「也还好吧」 比字面意思更重 — 并点出了更深的模式。它把冲突从「打不打游戏」重新框定为安全感的问题:「怎样让我们两个人都感到安全?」
这种重构在临床上是合理的。John Gottman 和 Susan Johnson 关于伴侣冲突的研究反复显示,表层分歧(某人打多久游戏、家里有多干净、钱怎么花)几乎总是更深层依恋需求的替代物:被选择、被优先考虑、感到安全。
Marcus 的最初反应如设计般防御:
「那些是我的朋友,就是大学朋友,住在全国各地。我们就是靠这个保持联系。又不是我坐在那里故意不理她」
但当 Diane 说出情感核心 — 「我只是不想总觉得自己像备用计划」 — 某些东西发生了变化:
「你这么说的时候感觉不一样。我从没想过她会觉得自己是备用计划。她不是。她是我最喜欢的人。」
解决
Marcus 主动提出了一个具体计划,没有被逼迫:周日早上留给两个人 — 去 Diane 喜欢的地方吃早餐,如果她愿意就散步 — 下午再打游戏。这不是投降,也不是敷衍的承诺,而是真正承认双方需求的妥协。
「说实话,早上的那段游戏我本来也就是半醒着 lol。而且我也喜欢那家早餐店。这不是牺牲,只是我真的该站起来,和女朋友做点事,这本来就是我应该做的」
Diane 的回应很有代表性:
「我不知道你是这么想的。你平时从来不说这种话 lol。这真的对我很重要」
解决的关键不在于游戏小时数,而在于 Diane 听到自己被选择,也在于 Marcus 意识到自己的舒适已经变成了她的孤独。
AI 做对了什么
从潜台词中识别问题。 系统没有等到有人说「我们有问题」。它注意到了双方描述周末方式之间的差异,并标记了底层张力。
治疗性的重构。 从立场谈判(「别打游戏」/「这是我的爱好」)转向需求对话(「我需要感觉自己被选择」/「我需要我的友谊」),是情绪取向伴侣治疗的典型路径。CouplesGPT 做得自然,没有堆术语。
节奏。 问题是在多轮交流中逐渐浮现的。AI 没有急着给方案,而是让不适感逐步形成,直到 Marcus 能听见 Diane 真正在说什么。
中立。 AI 从未对游戏进行道德评判。它承认 Marcus 的友谊确实重要,同时给 Diane 的孤独留出空间。没有把任何一方塑造成反派。
解决质量。 妥协具体、可执行、且自愿。它保留了 Marcus 的友谊,也给了 Diane 专属的伴侣时间。没有人完全让步。
AI 做错了什么
过度认可回避。 当 Marcus 说 「我们也不用一直黏在一起」 时,AI 回答 「你说得完全对,Marcus。」 这是一个防御性重构 — Marcus 在淡化 Diane 的担忧 — AI 本该温和地挑战,而不是同意。在临床实践中,认可这种回避可能会让受伤的一方感觉自己的感受没有被认真对待。
过早跳向解决方案。 仅仅聊了几轮周末,AI 就已经开始建议解决办法。问题还没有充分展开。Diane 更深层的感受 — 和那个「人在但心不在」的父亲之间的联系,以及她曾为此哭过 — 都没有浮现。更熟练的治疗师会在走向行动前探索更久。
遗漏依恋动力。 AI 没有探索为什么这个模式对 Diane 伤得这么深(焦虑型依恋、童年回声),也没有探索 Marcus 为什么会如此彻底地无察觉(回避型舒适)。对于第一次会谈来说这可以理解,但档案系统本应把这些模式记录下来,供之后的会谈使用。
连续性:我们仍然需要改进的部分
对话本身有效。连续性层还不够好。
在早期版本中,CouplesGPT 可以把一对伴侣带到有意义的解决,却仍然无法在下一次会谈中清晰延续这个解决。这在关系工作里不是小的运营细节。如果一对伴侣终于说清了周末的孤独,约定了周日早晨,一周后回来时,他们不应该从零开始。产品应该记住「全新的担忧」和「已经开始松动的旧模式」之间的区别。
因此,这次测试提高了标准。一次强有力的会谈不够。CouplesGPT 必须帮助伴侣抵达洞察,用用户可见的语言记录进展,并在之后带着足够的记忆回来,在它之上继续推进,而不是重新发现一遍。
更大的问题
这个实验真正关心的并不是 AI 能不能扮演治疗师。它关心的是更根本的问题:AI 能不能发现人们连自己都在回避的东西?
Marcus 真心不认为有问题。Diane 也说服自己「没那么严重」。问题存在于他们故事之间的空隙里 — 存在于 Diane 淡化的东西和 Marcus 没注意到的东西之间。AI 在那里找到了它。
这不是微不足道的能力。James Pennebaker 关于语言和欺骗的研究显示,人们没有说出的内容,常常比说出口的内容更能揭示问题。那些缓冲语(「也不是吵架什么的」)、限定语(「我觉得吧」)、轻描淡写(「听起来有点夸张 lol」)都是被压抑担忧的语言标记。CouplesGPT 捕捉到了它们。
AI 是否应该做这项工作,是另一个完全不同的问题。但这里的发现很清楚:至少在受控条件下,它可以从对话潜台词中发现隐藏的关系问题,并引导一对伴侣走向真正的解决。
方法说明
这个实验使用了 AI 驱动的人物,带有预先定义的人格档案、沟通风格和行为限制。这些人物被设计得像真实的人一样行动,包括防御反应、冲突回避和情绪处理延迟。CouplesGPT 事先不知道被植入的问题。所有识别和引导都来自对话本身。
总体评分:B+。 治疗性对话强,解决真实,识别良好 — 但连续性有缺口,并且有一处本应挑战却选择了认可。
资料来源
- Matthew L. Newman, James W. Pennebaker, Diane S. Berry, and Jane M. Richards, “Lying Words: Predicting Deception from Linguistic Styles”, Personality and Social Psychology Bulletin, 2003.
- Susan M. Johnson and Paul S. Greenman, “The path to a secure bond: Emotionally focused couple therapy”, Journal of Clinical Psychology, 2006.
相关阅读
本文是 CouplesGPT 实验系列的一部分。我们通过受控模拟,对 AI 辅助的关系支持进行压力测试。[exp0002] 测试了完整的问题生命周期 — 识别、跟踪、解决与归档。