诚然马斯克本东谈主一脸疲态,但他切身镇守,给Grok 4的噱头拉到顶配。
“天地最强模子”“它比统共规模的东谈主类博士王人智谋,无一例外”“Grok 4还没发明新科学或新物理定律仅仅时候问题”“Grok 4惩办代码问题,比Cursor更好用”……
以上宣言,是马斯克为旗下AI公司xAI最新旗舰大模子Grok 4的定调。
Grok 4也如实争光,在“东谈主类终末的考试”(Humanity's Last Exam)中,拿到了38.6%的准确率,杰出了谷歌Gemini 2.5 Pro的21.6%和OpenAI o3的21%。多智能体版块Grok 4 Heavy拿到了44.4%,若是进一步使用器用扶植,则能达到50.7%。
这背后,是“暴力诡计好意思学”,xAI耗时6个月搭建起来的10万块H100 GPU超等算力中心正在给出禀报,Grok 4的锤真金不怕火量是Grok 3的10倍,是Grok 2的100倍。
总结买卖宇宙的马斯克火力全开,接下来还盘算 8 月推出代码模子,9 月上线多模态智能代理,10 月发布视频生成模子。
据悉,Grok照旧被确立在了特斯拉最新固件里,明天也将通过东谈主形机器东谈主与施行宇宙交互。
AI大模子、自动驾驶、东谈主形机器东谈主、买卖航天,马斯克的AI帝国正在越来越坚韧,节律也更甚从前。
Grok 4有多能打?
在多个高难度基准测试中,Grok 4施展出色。
马斯克在直播中强调,Grok 4在东谈主文、数学、物理、工程等学科均达到博士以上水平,“比确实统共学科的扣问生更智谋”。
推聪敏商刷新记录。Grok 4 拿到历史高分的“东谈主类终末的考试”,是一份被称为“AI 宇宙终极试真金不怕火”的测试书册,这份有益针对AI的考卷,狡饰了数学、化学、话语学、当然科学等一百多个学科,大模子在这份测试中无法依赖汇聚搜索,只可凭我方的相识和推聪敏商作答。
能疏漏这份考卷的Grok 4,推聪敏商有大幅进步,不错减少对现存学问框架的依赖。
除HLE测试开端外,Grok 4在GPQA(扣问生级问答)中拿到了88.9%,在好意思国数学邀请赛(AIME25)中拿下满分,ARC-AGI-2测试中以16.2%得分登顶(超第二名Claude Opus 4近一倍)。
买卖场景的落地考证方面,在名为 Vending-Bench 的买卖模拟任务中,Grok 4 也施展凸起,谈论自动售货机时平均净钞票达到 4684.15 好意思元,是第二名的两倍,解释了弥远谈论和多轮番推聪敏商。
值得明慧的是,Grok 4的鼎新点在于“器用原生会通”架构。与多量模子后期接入器用不同,Grok 4在锤真金不怕火阶段镶嵌了搜索、代码实践等器用,使其能纯真调用资源惩办复杂问题。举例直播演示中,它通过检索学术论文、调用模拟器用,生成了黑洞碰撞的可视化动态模子。
不外,业内东谈主士合计,Grok 4 的阻滞主要聚拢在推理和复杂学问整合方面,而在代码、多模态、图像和视频生成等方面还有高出空间。
“最贵”模子的思象空间
xAI同步推出了行业最贵订阅盘算:Super Grok Heavy月费高达300好意思元,较OpenAI顶级订阅贵50%。API订价通常激进,每百万token输入3好意思元、输出15好意思元。
高订价背后其实是锤真金不怕火资本的陡增。Grok 4百倍于前代的锤真金不怕火量,依托10万块H100 GPU集群完成,xAI并未露出单次锤真金不怕火耗资,但马斯克提到的“咱们快莫得允洽问题考验AI了”,侧面印证了模子智商已迫临现时测试极限。
Grok 4的终极目的是与施行宇宙交互。马斯克自大,本年Grok 4还将会通有限元分析、流体能源学等器用,构建高精度物理模拟器(如黑洞模拟)。在他的谈论中,Grok 4将通过Optimus(马斯克旗下的擎天柱)东谈主形机器东谈主聚拢施行,“让AI收受物理定律的最终查考”。另有音讯自大,现在特斯拉最新固件已预埋Grok,明天或将看成车载语音助手及自动驾驶的“大脑”。
“咱们正站在智能大爆炸的开端。”马斯克暗意,对AI的最终测试是施行宇宙,明天AI技巧将会放到雠校汽车或火箭等规模考证灵验性。
“睡在算力中心”的掌舵东谈主归来
从特斯拉Robotaxi(无东谈主驾驶出租车)秀肌肉,到Grok 4的暴力好意思学,近10天,马斯克照旧称霸公论场两回,他正以标记性的激进节律鼓动业务。
马斯克所布局的自动驾驶、AI大模子、东谈主形机器东谈主、买卖航天,巩固酿成闭环。Grok大模子看成“大脑”,脱手特斯拉自动驾驶、Optimus机器东谈主举止有盘算;特斯拉车辆与机器东谈主响应的实在场景数据,反哺模子迭代;其旗下SpaceX星链提供寰球低延伸通讯,支援及时AI交互。
OpenAI的ChatGPT-5还在酝酿中,现在AI武备竞赛参加“马斯克节律”。马斯克的算力碾压、多场景系缚,如实具有更广宽的利用思象力。
但在AI大模子快速迭代确当下,有些许用户风光为了300好意思元月费的Grok 4买单,如故未知数。
高调背后也隐私风险。Grok近期因发表反犹言论遭土耳其封禁、波兰政府投诉,迫使xAI攻击删除欠妥实质并诊治审核战略。在“AI寻求真谛”的路上,如安在洞开性与安全性间均衡,不仅仅OpenAI 塞姆·奥特曼的用功,亦然马斯克的。
马斯克在今天的直播中说:“安全是最要紧的事,咱们需要确保AI是一个好AI。你不错把AI看作是超等天才的孩子,它最终会比你智谋,但咱们仍然要看重正确的价值不雅。”
泓川证券提示:文章来自网络,不代表本站观点。