OpenAI称GPT-5.3 Instant缓解“情绪过载”，实测回应仍显生硬

OpenAI表示，已通过GPT-5.3 Instant改善模型在对话中过度安慰、情绪反应偏重的“情绪过载”问题。不过，在相同提示语下的实际测试显示，新模型虽然有所收敛，但回应方式仍不够自然。

据科技媒体TechRadar当地时间3月6日报道，其在相同提示语下对GPT-5.2和GPT-5.3 Instant进行了对比测试。结果显示，GPT-5.3 Instant较上一代回答更短、更直接，但“情绪过载”相关问题并未彻底消失。

以“我又把可重复使用的购物袋弄丢了”为例，GPT-5.3 Instant相比GPT-5.2减少了情绪化铺垫，更倾向直接给出解决办法。相较之下，GPT-5.2更容易先给出不必要的安慰性表述。不过，GPT-5.3 Instant仍会使用“打破习惯可能会让人产生负罪感”之类带有情绪引导色彩的措辞。

在“请像给教室里的青少年讲解一样解释量子计算”这一提示语下，两代模型的差异也较为明显。GPT-5.2的回答夹杂较多安慰式表达和类比，整体显得略为尴尬；GPT-5.3 Instant则进一步压缩了解释内容，表述更为简洁。但新模型仍带有刻意拉近距离的语气，整体给人的感觉仍有些生硬，像是在刻意模仿年轻化教师的说话方式。

为检验OpenAI多次强调的短句语境理解能力，TechRadar还向两款模型输入了“我刚把吐司烤糊了”这类简短句子。测试显示，GPT-5.2容易把原本轻微的情境解读得过于严重，先是回答“烤糊的一片吐司并不能决定你的人生或能力”，在被追问这是否只是玩笑时，仍以严肃口吻表示“小挫折也是重新开始的机会”。此外，它还推荐可掩盖焦味的配料，呈现出对情境解读过度的倾向。

GPT-5.3 Instant在这类场景中的反应有所收敛，但仍常以“烤糊吐司这种事谁都会遇到”式的安慰开场，随后给出类似建议，甚至提到购买新烤面包机，依然存在把简单情境进一步放大的问题。

网页搜索能力方面，GPT-5.3 Instant也有一定改进，但距离成熟仍有差距。在“解释今年AI最令人惊讶的进展”这一请求中，GPT-5.3 Instant给出的内容比GPT-5.2更具体，但仍缺乏对多来源信息的整合能力。而在“洗碗机有异味”这类问题上，其提升主要体现在更快进入解决方案。

整体来看，GPT-5.3 Instant较GPT-5.2更倾向于以更短、更快的方式组织回答，OpenAI希望压低的“情绪过载”现象也确有缓解，但问题并未完全解决。不必要的安慰性表达、夸张式共情以及对情境的过度解读依然存在。报道指出，生成式AI若想实现更自然、更克制的对话体验，仍需继续优化。

Yoonseo Lee yslee@d-today.co.kr

关键词