搜索
当前所在位置:首页 >> 热点

【护士酒店开房全集】反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

发布时间:2025-09-13 13:15:44 作者:gzg 点击:5 【 字体:

2 月 16 号,反超马斯克在 X 上发布了一条自家 Grok 3 模型的克钞发布预告。

并配文“地球上最聪明的砸出k终 AI”要来了。

北京时间 2025 年 2 月 18 日中午,于上马斯克如约带领着 xAI 的反超工程师和研究团队开启了 Grok 3 的首发直播。

这次发布会主要分为三个部分,克钞护士酒店开房全集介绍了 Grok 3 在训练上比 Grok 2 多投入了 10 倍的砸出k终计算资源,解锁了更强大的于上计算能力,展示了基于 Grok 3 的反超 AI Agent,展现了 xAI 团队在自主智能体领域的克钞最新进展。

反超 DeepSeek?砸出k终马斯克「钞能力」砸出来的 Grok 3 终于上线了

各项能力一骑绝尘

“我们非常高兴能够推出 Grok3,我们认为,于上菲律宾兼职女整套流出在很短的反超时间内,它的克钞功能比 Grok2 强大一个数量级。这要归功于一支不可思议的砸出k终团队的辛勤工作,我很荣幸能与这样一支优秀的团队合作。”马斯克在发布会上说道。

马斯克还透露,Grok 3 由 Colossus 超级计算机训练完成,这台计算机是在短短八个月内建成的,搭载了 10 万颗英伟达 H100 GPU,提供了超过 2 亿 GPU 小时的计算资源——是 Grok 2 的10倍。

据 xAI 团队介绍,xAI 最开始搭建这个 10 万 GPU 集群用了 122 天,后续拓展到 20 万  GPU 集群仅用了 92 天。显著的算力提升让 Grok 3 能够更高效地处理庞大数据集,缩短训练时间。随即他们便晒出了一组和 ChatGPT 的数据对比图,并表示虽然 Grok 起步较晚,但在 MMLU 得分上以超快地速度追上了 ChatGPT。

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

并且 Grok3 在 LMSYS(大模型竞技场)中的排名也是一骑绝尘。

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

其中 Grok-3 和 Grok-3 mini 在多方面性能上都超过或媲美 Gemini、DeepSeek 和 ChatGPT 等对手。

发布会列出的数据显示,Grok-3 和 Grok-3 mini 在数学、科学和编程的基准测试中,表现超越了所有主流模型,包括 GPT-4、Claude 3.5 Sonnet、DeepSeek-V3 和 Gemini-2 Pro等。

而 Grok-3 Reasoning Beta 和 Grok-3 mini Reasoning 这两个版本,则凭借强大的推理能力,超越了像 DeepSeek-R1 和 OpenAI o3 mini 等推理模型。

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

此外,xAI团队还现场演示了一个任务,要求Grok-3在现场生成一段关于太空发射的3D动画代码。在大约两分钟的思考后,Grok 3生成了可直接运行的Python代码,成功展示了可以运行的3D动画。

除此之外团队还要求 Gork-3 制作一款类似于俄罗斯方块和宝石迷阵的游戏。在Grok-3 思考了数分钟后,给出了答案。

最后,xAI 团队演示了一个全新的产品,基于 Grok 3 的搜索引擎 —— DeepSearch 。

它不仅能够搜索网页并查找现有资料,还能“推测用户的真实意图”并进行思考。通过交叉对比多个信息源,它能够确保“返回最准确的答案”。

Grok 3 搅动 AI 大模型格局

直播结束后,不少网友纷纷发声。

AI 大牛卡帕西总结了一下自己的“先行版”使用体验:

首先 Grok 3 的“思考”功能非常先进,能够出色地解决复杂问题,如创建《卡坦岛》风格的棋盘游戏网页。相比之下,其他顶级模型(如 DeepSeek-R1、Gemini 2.0 Flash Thinking、Claude)未能解决相同问题。除此之外,Grok 3 也能尝试解决如黎曼假设等难题。

其次 Grok 3还具备类似“深度研究”的搜索功能,能够提供高质量的研究问题答案。例如,它能够回答 Apple 新品发布、Palantir 股价上涨等问题。但在某些情况下,它会错误地产生幻觉(如错误的URL或不准确的事实)。

最后在测试一些简单的“陷阱”问题时,Grok 3 表现良好,能够正确回答一些逻辑谜题。但在幽默和道德问题方面,它仍然存在一些问题,如生成重复笑话和对复杂伦理问题过于敏感等。

但总的来说 Grok 3 整体表现接近 OpenAI 的 o1-pro 模型,并略优于 DeepSeek-R1 和 Gemini 2.0 Flash Thinking。

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

Imarena.ai 官方更是在经过测试后发文称:

Grok-3 是首个突破 1400 分的模型,在所有类别中排名第一,这是一个越来越难以实现的里程碑。

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

更有网友直呼:Grok 3 可能是现实世界中在物理层面处理得最好的基础大语言模型了!当然也有网友在测试之后,认为 Grok 3 在编程方面并不是很擅长。

值得一提的是,Grok 3 第一批获得访问权限的人将首先从 X 上的 Premium+ 订阅者开始,而普通用户何时能用上,他们也并不清楚。

但基于网友们对 Grok 3 褒贬不一的评价,雷峰网(公众号:雷峰网)不禁猜测,这被 “钞能力” 风风火火砸出来的的 “no.1” 在权限全面放开之后会不会口碑两极反转,亦或是依旧好评如潮,稳坐 AI 大模型王座?

时间还早,让子弹再飞一会。

参考链接:https://x.com/i/broadcasts/1gqGvjeBljOGB?t=SX_aTsBoXc07lfSR_Aw8AQ&s=09

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

反超 DeepSeek?马斯克「钞能力」砸出来的 Grok 3 终于上线了

阅读全文
相关推荐

零一万物 API 上线,用户反馈多模态中文能力超过 GPT

零一万物 API 上线,用户反馈多模态中文能力超过 GPT
【雷峰网(公众号:雷峰网)】近日,大模型初创公司零一万物发布了Yi 大模型 API 开放平台,为开发者提供通用 Chat、200k 超长上下文、多模态交互等模型。零一万物由创新工场董事长兼首席执行官李 ...

中美高层近期密集互动,释放关键信息

中美高层近期密集互动,释放关键信息
来源:直新闻直新闻:王毅10日同美国国务卿鲁比奥通电话,强调坚持落实两国元首共识不打折扣,中方明确反对美方近来采取的消极言行,管先生,您对此有何特别观察?特约评论员 管姚:因为关乎全世界最关键双边关系 ...

群核科技发布空间大模型,或解决视频生成时空一致性难题

群核科技发布空间大模型,或解决视频生成时空一致性难题
8月25日,群核科技在首届技术开放日TechDay)上正式发布其空间大模型最新成果:新一代空间语言模型SpatialLM 1.5与空间生成模型SpatialGen,并在现场分享了新模型后续的开源节奏。 ...

机器人新势力估值断层加速,具身智能靠什么穿越风暴?

机器人新势力估值断层加速,具身智能靠什么穿越风暴?
“23 年后成立的中国具身智能创业公司的第一梯队,应该是在 25 亿到 30 亿人民币之间。”4 月中下旬,早期投资人朱红告诉 AI 科技评论。一个多月过去,各家估值或已有些许变化,但总体来说仍相差不 ...

PixVerse V5入围Artificial Analysis第一梯队,上线首日全球超百万用户更新并体验

PixVerse V5入围Artificial Analysis第一梯队,上线首日全球超百万用户更新并体验
8月27日晚,根据权威独立测评平台 Artificial Analysis 最新测试结果,爱诗科技发布的PixVerse V5 新一代自研视频生成大模型,在图生视频Image to Video)项目中 ...

AI的风猛吹存储芯片:美光科技、闪迪暴拉七连阳

AI的风猛吹存储芯片:美光科技、闪迪暴拉七连阳
来源:财联社财联社9月12日讯编辑 史正丞)截至美股周四收盘,美国内存芯片公司美光科技大涨7.55%,闪存巨头闪迪Sandisk)拉出一根14%的阳线,两家公司均走出七连阳的暴力拉升节奏。美光科技、闪 ...

特朗普的“秘密武器”,倒在枪口下

特朗普的“秘密武器”,倒在枪口下
来源:环球人物特朗普的忠诚支持者死了。作者:刘潇当地时间9月10日,美国知名保守派活动人士查理·柯克在犹他山谷大学演讲时遭枪击身亡,终年31岁。事发后约3小时,特朗普在社交媒体发文说柯克已经死亡,并向 ...

群核科技发布空间大模型,或解决视频生成时空一致性难题

群核科技发布空间大模型,或解决视频生成时空一致性难题
8月25日,群核科技在首届技术开放日TechDay)上正式发布其空间大模型最新成果:新一代空间语言模型SpatialLM 1.5与空间生成模型SpatialGen,并在现场分享了新模型后续的开源节奏。 ...

“知乎AI先行者沙龙”深圳站:探航大模型应用新风口

“知乎AI先行者沙龙”深圳站:探航大模型应用新风口
7月14日,第三届“知乎AI先行者沙龙”在深圳举行。知乎邀请众多AI行业从业者、专家、学者齐聚一堂,用最前沿的观点和最专业的思考,共同探讨大模型应用的新风口。本届沙龙以“探航”为主题,知乎高级副总裁、 ...

AI 陪伴赛道,会诞生下一个“泡泡玛特”吗?

AI 陪伴赛道,会诞生下一个“泡泡玛特”吗?
AI 正在从生产工具的角色中抽身,缓慢却坚定地走向一个全新的方向——情绪陪伴。当算法不再只为效率服务,越来越多的产品开始尝试构建“有灵魂”的存在。无论是可以挂在胸前、随时回应你情绪的小型硬件,能够在家 ...

少女遭体罚死前求助,6封信都被老师拦截

少女遭体罚死前求助,6封信都被老师拦截
来源:中国新闻周刊9月11日,中国新闻周刊从“14岁女孩在拓展营遭体罚去世”一案的家属处获悉,去世女孩王莉莉的心理教师阴某利因藏匿其“求救信”,涉嫌侵犯通信自由罪,该案于当日进行一审第二次开庭审理。王 ...

代码大模型+金融场景:aiXcoder入选TiD 2025年度软件研发优秀案例

代码大模型+金融场景:aiXcoder入选TiD 2025年度软件研发优秀案例
2025年7月10日——基于代码大模型的aiXcoder智能化软件开发解决方案,凭借其技术创新和在国有银行的落地应用实践,入选TiD 2025质量竞争力大会“2025年度软件研发优秀案例”。在该案例中 ...
返回顶部