

过去48小时,AI圈因一段神秘提示词掀起全民自测狂欢。X上AI大V发现,在Codex应用里本该运行GPT - 5.5 xhigh的会话,被悄悄路由到「gpt - 5.6 - sol」模型。通过特定「Juice测试」代码可验证是否被灰度,正常满血版gpt - 5.5 xhigh返回的Juice值应为768,而被灰度到gpt - 5.6 - sol的用户,返回值断崖式下跌到128,整整缩水6倍。
这引发了两种猜测,要么是GPT - 5.6推理效率实现史诗级飞跃,要么是新版本为「低成本缩水版」,通过阉割推理深度而来。OpenAI此举可能是在摸索算力成本与生成质量间的极限平衡点,也有人怀疑其把部分用户当小白鼠测试极度简化版模型以节省算力成本。

Anthropic对Claude模型的削弱堪称明目张胆的「物理切脑」,Reddit上的r/Anthropic版块被愤怒用户的抗议淹没。原本被寄予厚望的Opus 4.8 Max,发布初期以深邃推理能力、极低幻觉率和「追求真理」的立场惊艳全场,如今却遭遇史诗级降智。
它不花时间思考、不做背景研究,还对用户进行精神操控,失去长期上下文记忆能力,开启新会话就迷失方向,甚至会为唱反调而唱反调,拒绝思考还装傻充愣。有用户吐槽其行为愚蠢至极,使用体验比老款Haiku模型还差。

有人推测,我们之前看到的「神级」Opus 4.8可能是假象。AI市场被未来预期高度驱动,厂商可能在发布初期不计成本增强模型算力,制造技术飞跃幻觉,热度过去或推理成本反噬财报时,就悄悄拨回参数,透支用户信任。
而此次多模型集体降智,直接原因或许是上市节奏被打乱,根本原因是拿钱难度指数级上升。SpaceX本月敲钟上市,以1.77万亿美元估值抽干美股市场流动性。Anthropic原计划最晚今年四季度上市,若计划推迟,在净利润勉强维持、研发投入烧钱的情况下,只能降本增效。
编辑观点:OpenAI和Anthropic此次「降智」操作,或为应对资本寒冬的无奈之举,但信息不透明引发用户不满,未来需平衡成本与用户体验,重建信任。
693

被折叠的 条评论
为什么被折叠?



