大数据文摘出品
7月9日夜晚,Elon Musk正式对外揭晓了他所研发出的迄今为止最为先进的人工智能模型——Grok 4。
该模型系他率领的xAI团队所创制,Musk亲自赞誉其为“具有宇宙大爆炸般影响力的智能飞跃”。
推特官方账号宣布,Grok 4被誉为“地表之最”(全球最强大)的人工智能模型。这并非简单的版本更新,而是一次涵盖所有方面的重大能力飞跃。
据消息透露,Grok 4拥有自然语言交流的能力,其表达流畅如同人类,成功消除了以往人工智能在对话中的断裂感。
它不仅具备处理文本的能力,而且能够接收图像信息,展望未来,甚至有望融入视频识别技术,从而大步跨入全面的多模态人工智能时代。
开发者将享受到“Grok 4 Code”的定制版,这一版本特别适用于编写代码、进行调试以及阐释逻辑,其性能几乎可以与GitHub Copilot和GPT-4相媲美。
据传,Grok 4不仅智慧超群,更有着独特的“歌唱”才能,其嗓音自然流畅,同时还能掌握网络用语、俚言和趣谈,堪称最精通网络文化的AI系统之一。
目前,对于Gork-4,在官网付费用户已经可以使用。
Grok 4的问世并非基于情绪化的宣传,而是依托于坚实的数据支撑。通过Artificial Analysis进行的全面基准测试显示,Grok 4凭借AI指数高达73分,成功登顶全球排行榜首位。
这一得分一举超越了OpenAI的O3(得分70)、Google的Gemini 2.5 Pro(得分70)以及Anthropic的Claude 4 Opus(得分64)。
Grok 4在数学领域、编程技巧以及综合推理能力方面均展现出卓越的表现,其在“人类最后的考试”这一挑战中,堪称表现最为出色的AI。
在LiveCodeBench和SciCode的测试中,Grok 4实现了高达88%的编码精确度,这一成绩刷新了该领域的最高记录。
图片来源于:https://x.com/apples_jimmy/status/1943167164359545137/photo/1,请点击链接查看。
在GPQA Diamond测试中,该产品取得了88%的优异成绩,这一成绩超越了之前由Gemini 2.5 Pro所保持的84%的最高分记录。
在《人类最后的考试》这项挑战中,Grok 4 heavy版本实现了令人瞩目的50.7%突破性进展,并且它是目前唯一一个达到这一成绩水平的模型。
在AIME 2024竞赛中,该团队取得了94%的卓越成绩;而在MMLU-Pro测试中,他们同样实现了87%的杰出表现。
推特上的网友透露,Elon Musk对于该模型的能力评价极高,他直言:“Grok 4或许能够在各个领域实现博士级别的模型水平。”
一些技术领域的观察者指出,尽管这场考试的名称被称为“人类最后的考试”,但实际上它可能并非AI发展的终点,而更可能是人类自身理解能力的边界所在。
此外,尽管其输出速率(75个token每秒)比O3(每秒188个token)和Gemini 2.5 Pro(每秒142个token)慢,然而它依旧超越了Claude 4 Opus(每秒66个token),性能方面稳居行业前列。
Grok 4具备处理长达256k token上下文的能力,这一特性使得它能够胜任对复杂文档的深入分析和执行记忆性任务。
它具备调用函数的能力,并能生成结构化的输出,其整体设计架构更加适宜用于科研、商业和教育等领域,这些场景通常对系统性能有较高要求。
在价格设定上,与Grok 3保持一致:针对每百万个输入token,费用为3美元,而对于输出,则是15美元,而缓存输入的费用更是降至了0.75美元。
作者持续追踪AI领域的发展与学术研究,热忱邀请对此领域感兴趣的各位朋友添加微信Q1yezi,携手探讨行业资讯及技术走向!