GPT-5.3 Instant。图片来源:OpenAI

OpenAI表示,已通过GPT-5.3 Instant改善模型在对话中过度安慰、情绪反应偏重的“情绪过载”问题。不过,在相同提示语下的实际测试显示,新模型虽然有所收敛,但回应方式仍不够自然。

据科技媒体TechRadar当地时间3月6日报道,其在相同提示语下对GPT-5.2和GPT-5.3 Instant进行了对比测试。结果显示,GPT-5.3 Instant较上一代回答更短、更直接,但“情绪过载”相关问题并未彻底消失。

以“我又把可重复使用的购物袋弄丢了”为例,GPT-5.3 Instant相比GPT-5.2减少了情绪化铺垫,更倾向直接给出解决办法。相较之下,GPT-5.2更容易先给出不必要的安慰性表述。不过,GPT-5.3 Instant仍会使用“打破习惯可能会让人产生负罪感”之类带有情绪引导色彩的措辞。

在“请像给教室里的青少年讲解一样解释量子计算”这一提示语下,两代模型的差异也较为明显。GPT-5.2的回答夹杂较多安慰式表达和类比,整体显得略为尴尬;GPT-5.3 Instant则进一步压缩了解释内容,表述更为简洁。但新模型仍带有刻意拉近距离的语气,整体给人的感觉仍有些生硬,像是在刻意模仿年轻化教师的说话方式。

为检验OpenAI多次强调的短句语境理解能力,TechRadar还向两款模型输入了“我刚把吐司烤糊了”这类简短句子。测试显示,GPT-5.2容易把原本轻微的情境解读得过于严重,先是回答“烤糊的一片吐司并不能决定你的人生或能力”,在被追问这是否只是玩笑时,仍以严肃口吻表示“小挫折也是重新开始的机会”。此外,它还推荐可掩盖焦味的配料,呈现出对情境解读过度的倾向。

GPT-5.3 Instant在这类场景中的反应有所收敛,但仍常以“烤糊吐司这种事谁都会遇到”式的安慰开场,随后给出类似建议,甚至提到购买新烤面包机,依然存在把简单情境进一步放大的问题。

网页搜索能力方面,GPT-5.3 Instant也有一定改进,但距离成熟仍有差距。在“解释今年AI最令人惊讶的进展”这一请求中,GPT-5.3 Instant给出的内容比GPT-5.2更具体,但仍缺乏对多来源信息的整合能力。而在“洗碗机有异味”这类问题上,其提升主要体现在更快进入解决方案。

整体来看,GPT-5.3 Instant较GPT-5.2更倾向于以更短、更快的方式组织回答,OpenAI希望压低的“情绪过载”现象也确有缓解,但问题并未完全解决。不必要的安慰性表达、夸张式共情以及对情境的过度解读依然存在。报道指出,生成式AI若想实现更自然、更克制的对话体验,仍需继续优化。

关键词

#OpenAI #GPT-5.3 Instant #GPT-5.2 #生成式AI #提示词 #情绪过载 #对话体验 #网页搜索能力
版权所有 © DigitalToday。未经授权禁止转载或传播。