xAI的下一代AI模型未能按时到达,加剧了一种趋势

继续增加未能如期推出的旗舰AI模型的清单。

去年夏天,亿万富翁埃隆·马斯克,也是AI公司xAI的创始人兼首席执行官,表示xAI的下一代重要AI模型Grok 3将在2024年年底之前到达。 Grok是xAI对OpenAI的GPT-4o和谷歌的Gemini等模型的回应,可以分析图像并回答问题,并为马斯克的社交网络X的许多功能提供动力。

7月份,在X上发布的一篇帖子中,马斯克写道:“经过在10万个H100s上训练后,Grok 3年底应该会变得非常特别。” 然后在12月中旬的一篇跟进帖子中,他说:“Grok 3将是一个重大飞跃。”

然而,现在已经是1月2日,Grok 3尚未到来,也没有迹象表明它的推出即将到来。

事实上,AI爆料者Tibor Blaho在xAI网站上发现的一些代码显示,一种中间模型“Grok 2.5”可能会首先推出。

Grok[.]com可能很快就会推出Grok 2.5模型(grok-2-latest - “我们最智能的模型”) - 匿名表示感谢! pic.twitter.com/emsvmZyaf7

— Tibor Blaho (@btibor91) 2024年12月20日

当然,这并不是马斯克第一次设立高远目标却没有实现。众所周知,马斯克对产品推出时间的预测往往是不切实际的。

而且公平地说,马斯克在8月接受播客Lex Fridman采访时表示,如果幸运的话,Grok 3将会在2024年“有望”推出。

但Grok 3失约的状态是令人感兴趣的,因为它是一个不断增长的趋势的一部分。

去年,人工智能初创公司Anthropic未能推出其顶级模型Claude 3 Opus的后继机型。在宣布下一代模型Claude 3.5 Opus将在2024年年底之前发布几个月后,Anthropic从其开发者文档中删除了有关该模型的所有提及。(根据一份报告,Anthropic在去年某个时候完成了对Claude 3.5 Opus的训练,但决定发布它没有经济意义。)

据报道,谷歌和OpenAI最近也遭遇了其旗舰模型的挫折。

这可能是当前人工智能扩展规律的限制的证据 - 公司用来增加其模型能力的方法。在不太遥远的过去,通过使用大量的计算资源和不断增大的数据集来训练模型可以实现相当大的性能提升。但是,每一代模型所取得的增益已经开始缩小,导致公司寻求其他技术。

Grok 3正在使用Grok 2的10倍计算能力进行训练,很快将提高到20倍

— Elon Musk (@elonmusk) 2024年9月21日

马斯克本人在Fridman采访中也提到了这一点。

“您希望[Grok 3]是处于最先进水平吗?” Fridman问道。

“希望是的,”马斯克回答道。“我的意思是,这是目标。我们可能会在这个目标上失败。这是我们的愿望。”

Grok 3延迟可能存在其他原因。xAI的团队比许多竞争对手要小得多。尽管如此,推迟的推出时间加剧了传统AI训练方法面临瓶颈的证据。