7月9日晚Elon Musk发布最强AI模型Grok 4?能力跃迁太惊人

大数据文摘出品

7月9日夜晚,Elon Musk正式对外揭晓了他所研发出的迄今为止最为先进的人工智能模型——Grok 4。

该模型系他率领的xAI团队所创制,Musk亲自赞誉其为“具有宇宙大爆炸般影响力的智能飞跃”。

推特官方账号宣布,Grok 4被誉为“地表之最”(全球最强大)的人工智能模型。这并非简单的版本更新,而是一次涵盖所有方面的重大能力飞跃。

据消息透露,Grok 4拥有自然语言交流的能力,其表达流畅如同人类,成功消除了以往人工智能在对话中的断裂感。

它不仅具备处理文本的能力,而且能够接收图像信息,展望未来,甚至有望融入视频识别技术,从而大步跨入全面的多模态人工智能时代。

开发者将享受到“Grok 4 Code”的定制版,这一版本特别适用于编写代码、进行调试以及阐释逻辑,其性能几乎可以与GitHub Copilot和GPT-4相媲美。

据传,Grok 4不仅智慧超群,更有着独特的“歌唱”才能,其嗓音自然流畅,同时还能掌握网络用语、俚言和趣谈,堪称最精通网络文化的AI系统之一。

目前,对于Gork-4,在官网付费用户已经可以使用。

Grok 4的问世并非基于情绪化的宣传,而是依托于坚实的数据支撑。通过Artificial Analysis进行的全面基准测试显示,Grok 4凭借AI指数高达73分,成功登顶全球排行榜首位。

这一得分一举超越了OpenAI的O3(得分70)、Google的Gemini 2.5 Pro(得分70)以及Anthropic的Claude 4 Opus(得分64)。

Grok 4在数学领域、编程技巧以及综合推理能力方面均展现出卓越的表现,其在“人类最后的考试”这一挑战中,堪称表现最为出色的AI。

地表最强研究员值得买吗__地表最强啥意思啊大神

在LiveCodeBench和SciCode的测试中,Grok 4实现了高达88%的编码精确度,这一成绩刷新了该领域的最高记录。

图片来源于:https://x.com/apples_jimmy/status/1943167164359545137/photo/1,请点击链接查看。

在GPQA Diamond测试中,该产品取得了88%的优异成绩,这一成绩超越了之前由Gemini 2.5 Pro所保持的84%的最高分记录。

在《人类最后的考试》这项挑战中,Grok 4 heavy版本实现了令人瞩目的50.7%突破性进展,并且它是目前唯一一个达到这一成绩水平的模型。

在AIME 2024竞赛中,该团队取得了94%的卓越成绩;而在MMLU-Pro测试中,他们同样实现了87%的杰出表现。

推特上的网友透露,Elon Musk对于该模型的能力评价极高,他直言:“Grok 4或许能够在各个领域实现博士级别的模型水平。”

一些技术领域的观察者指出,尽管这场考试的名称被称为“人类最后的考试”,但实际上它可能并非AI发展的终点,而更可能是人类自身理解能力的边界所在。

此外,尽管其输出速率(75个token每秒)比O3(每秒188个token)和Gemini 2.5 Pro(每秒142个token)慢,然而它依旧超越了Claude 4 Opus(每秒66个token),性能方面稳居行业前列。

Grok 4具备处理长达256k token上下文的能力,这一特性使得它能够胜任对复杂文档的深入分析和执行记忆性任务。

它具备调用函数的能力,并能生成结构化的输出,其整体设计架构更加适宜用于科研、商业和教育等领域,这些场景通常对系统性能有较高要求。

在价格设定上,与Grok 3保持一致:针对每百万个输入token,费用为3美元,而对于输出,则是15美元,而缓存输入的费用更是降至了0.75美元。

作者持续追踪AI领域的发展与学术研究,热忱邀请对此领域感兴趣的各位朋友添加微信Q1yezi,携手探讨行业资讯及技术走向!

免责声明:本站发布的所有文章图片内容,由AI一键生成,根据关键词和其他参数进行文章自动采集、加工、发布。不对文章内容的真实性、合法性、时效性负责。

版权所有 copyright 2019 长子县融媒体中心 www.zzc-media.com XML地图
三十头镇卫生院 黄石市委机关幼儿园

关于站点

‌长子县融媒体中心‌是长子县的一个重要媒体机构,主要负责新闻宣传和媒体融合工作。由原‌长子县广播电视台和‌长子县新闻中心合并组建,成立于2018年12月,标志着长子县新闻宣传工作进入了融合发展的新时代‌。长子县融媒体中心位于山西省长子县会堂四楼,是长子县新闻发布和宣传活动的主要枢纽‌。

搜索Search

搜索一下,你就知道。