7月9日晚Elon Musk发布最强AI模型Grok 4？能力跃迁太惊人

大数据文摘出品

7月9日夜晚，Elon Musk正式对外揭晓了他所研发出的迄今为止最为先进的人工智能模型——Grok 4。

该模型系他率领的xAI团队所创制，Musk亲自赞誉其为“具有宇宙大爆炸般影响力的智能飞跃”。

推特官方账号宣布，Grok 4被誉为“地表之最”（全球最强大）的人工智能模型。这并非简单的版本更新，而是一次涵盖所有方面的重大能力飞跃。

据消息透露，Grok 4拥有自然语言交流的能力，其表达流畅如同人类，成功消除了以往人工智能在对话中的断裂感。

它不仅具备处理文本的能力，而且能够接收图像信息，展望未来，甚至有望融入视频识别技术，从而大步跨入全面的多模态人工智能时代。

开发者将享受到“Grok 4 Code”的定制版，这一版本特别适用于编写代码、进行调试以及阐释逻辑，其性能几乎可以与GitHub Copilot和GPT-4相媲美。

据传，Grok 4不仅智慧超群，更有着独特的“歌唱”才能，其嗓音自然流畅，同时还能掌握网络用语、俚言和趣谈，堪称最精通网络文化的AI系统之一。

目前，对于Gork-4，在官网付费用户已经可以使用。

Grok 4的问世并非基于情绪化的宣传，而是依托于坚实的数据支撑。通过Artificial Analysis进行的全面基准测试显示，Grok 4凭借AI指数高达73分，成功登顶全球排行榜首位。

这一得分一举超越了OpenAI的O3（得分70）、Google的Gemini 2.5 Pro（得分70）以及Anthropic的Claude 4 Opus（得分64）。

Grok 4在数学领域、编程技巧以及综合推理能力方面均展现出卓越的表现，其在“人类最后的考试”这一挑战中，堪称表现最为出色的AI。

地表最强研究员值得买吗__地表最强啥意思啊大神

在LiveCodeBench和SciCode的测试中，Grok 4实现了高达88%的编码精确度，这一成绩刷新了该领域的最高记录。

图片来源于：https://x.com/apples_jimmy/status/1943167164359545137/photo/1，请点击链接查看。

在GPQA Diamond测试中，该产品取得了88%的优异成绩，这一成绩超越了之前由Gemini 2.5 Pro所保持的84%的最高分记录。

在《人类最后的考试》这项挑战中，Grok 4 heavy版本实现了令人瞩目的50.7%突破性进展，并且它是目前唯一一个达到这一成绩水平的模型。

在AIME 2024竞赛中，该团队取得了94%的卓越成绩；而在MMLU-Pro测试中，他们同样实现了87%的杰出表现。

推特上的网友透露，Elon Musk对于该模型的能力评价极高，他直言：“Grok 4或许能够在各个领域实现博士级别的模型水平。”

一些技术领域的观察者指出，尽管这场考试的名称被称为“人类最后的考试”，但实际上它可能并非AI发展的终点，而更可能是人类自身理解能力的边界所在。

此外，尽管其输出速率（75个token每秒）比O3（每秒188个token）和Gemini 2.5 Pro（每秒142个token）慢，然而它依旧超越了Claude 4 Opus（每秒66个token），性能方面稳居行业前列。

Grok 4具备处理长达256k token上下文的能力，这一特性使得它能够胜任对复杂文档的深入分析和执行记忆性任务。

它具备调用函数的能力，并能生成结构化的输出，其整体设计架构更加适宜用于科研、商业和教育等领域，这些场景通常对系统性能有较高要求。

在价格设定上，与Grok 3保持一致：针对每百万个输入token，费用为3美元，而对于输出，则是15美元，而缓存输入的费用更是降至了0.75美元。

作者持续追踪AI领域的发展与学术研究，热忱邀请对此领域感兴趣的各位朋友添加微信Q1yezi，携手探讨行业资讯及技术走向！

深圳保障房类型大揭秘！人才房、安居房、共有产权房区别在哪？