一文看懂:Grok 4到底强在哪里?

就在几天前,马斯克的xAI正式发布Grok 4大模型,号称世界最强AI。

Grok 4在一个超级难的考试中得了高分,让人惊讶。这个考试叫HLE,是专门测试AI有多聪明的。以前最好的AI只得了26.9分,Grok 4得了44.4分。进步很大。

马斯克的公司xAI发布了Grok 4。他们用了很多电脑来训练它。这些电脑叫GPU,数量有20万台。花了超多钱,每个月10亿美元。

Grok 4有两个版本。一个便宜点,月费30美元。另一个贵,月费300美元。贵的叫Heavy版,能同时开多个AI一起干活。最后把结果合起来。这很爽,省时间。

Grok 4最大的新东西是“多智能体内生化”。啥意思?以前AI干活,要人告诉它怎么思考。现在不用了,它自己就会。比如,多个AI协作,成了它天生的本事。

回顾一下AI发展。2022年,人们用提示词让AI一步步想问题。这叫思维链。2024年,OpenAI的o1模型把思维链变成AI自己的本事。这叫内生化。2025年,Gemini模型把看图、听声音也内生化。Grok 4更进一步,把多个AI协作内生化。

好比家里做饭。以前你要看菜谱一步步做。现在你学会了,不用菜谱也能做。Grok 4就是这样,自己会协作。

HLE考试很重要。它测试AI能不能像人一样解决难题。题目有2500道,覆盖数学、科学、历史等。问题很难,网上搜不到答案。Grok 4 Heavy得分高,说明它聪明。

但Grok 4也有不足。它写代码时老出错。比如做游戏,它忘加重要工具库。用户实测不满意。马斯克说会改进,未来出专门写代码的版本。

大家要明白,写代码的AI不是光会做题。它要能建完整项目。用Github资源做东西。这叫实战派。Base44公司就做这个,被高价收购了。用户喜欢这种。

算力需求在涨。算力就是电脑干活的能力。Grok 4训练用了Colossus超算中心。在美国田纳西州。有35万张GPU卡。花大钱搞推理训练。推理是AI干活的过程。

过去两年,AI训练主要在预训练。现在后训练和推理需求变大。多智能体内生化让算力需求翻倍涨。黄仁勋说过,算力需求会指数级增长。

其他公司会跟上。OpenAI、Google可能也做多智能体内生化。AI军备竞赛开始。未来AI更聪明,帮人做复杂事。

看到AI进步这么快,真爽。它像家里帮手,越来越能干。大家期待吧。

举报