搜索
当前所在位置:首页 >> 知识

【医生私密合影内幕合集】新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude

发布时间:2025-09-13 13:21:41 作者:gdw 点击:67133 【 字体:

8月2日,新王新超lmsys官方在推特发布一则消息,登基度更恭喜DeepMind研发的新王新超Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名登顶,超越GPT 4o和Claude-3.5夺得第一。登基度更

这是新王新超继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来,OpenAI第二次让出Chatbot Arena的登基度更医生私密合影内幕合集Overall ranking宝座。

新王登基,新王新超Gemini 1.5 Pro再度更新,登基度更超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena测试一周后。获得了超过12,登基度更000个社区投票,新王新超在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的登基度更好成绩。之前说GPT-4o有刷分技巧,新王新超现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。登基度更

新王登基,新王新超Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版(0801)不仅在综合表现上极为突出,在各个细分领域上也有着出色的表现。它在数学方面排名前三,微博情感导师封号合集指令遵循排名前二,编码排名前五,硬提示(英语)排名前五。

Gemini 1.5 Pro 实验版(0801)具有强大的多语言能力,在中文、日语、德语、俄语方面均表现第一。

从总体胜率图上,也能看出Gemini 1.5 Pro 实验版 (0801)实力强劲,对阵 GPT-4o 的胜率为 54%,对阵 Claude-3.5-Sonnet 的胜率为 59%。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

前OpenAI的开发者,现Google AI Studio的产品负责人Logan Kilpatrick火速转发,向大家宣布Gemini 1.5 Pro 实验版(0801)目前在 LMSYS 的文本和多模式排名中均位居第一的好消息。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

DeepMind的CEO Demis Hassabis也转发了这条消息,祝贺Gemini 1.5 Pro 实验版(0801)能够在极具竞争力的榜单中拿下第一,并且宣布这一版本的已经可以在 AI Studio上进行试用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

带领研发Gemini的Jeff Dean也随后转发,对此次实验版本的Gemini 1.5 Pro突破1300+elo分数拿下排名第一的好消息感到非常自豪,也很期待未来能看到其他更好的模型。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5


听闻这则消息,其他从业人员也纷纷发来祝贺。


新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有不少人分享自己的试用体验。大神elvis对在聊天机器人领域超越了 GPT-4o 和 Claude 3.5 Sonnet的Gemini 1.5 Pro非常感兴趣。elvis分享了自己的测试全过程视频,并总结道,Gemini 1.5 Pro强大的图像和PDF提取能力给他留下了深刻的印象,Gemini 1.5 Pro有着和GPT-4o不相上下的视觉能力,也有Claude 3.5 Sonnet接近的代码生成及PDF理解/推理能力。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

有人认为Gemini 1.5 Pro在解决高级数学难题方面表现相当不错。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有人说Gemini 1.5 Pro在图像识别植物和动物方面做得确实要比GPT 4o更好。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有更多的人在期待Gemini 1.5 Pro这一版本的正式上线,希望能够API实现Gemini 1.5 Pro的实际运用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

大家对Gemini 1.5 Pro这次发布的实验版本有什么看法,欢迎评论区留言分享~雷峰网雷峰网(公众号:雷峰网)


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

阅读全文
相关推荐

独家丨知名AI科学家叶杰平、薄列峰,加入阿里达摩院

独家丨知名AI科学家叶杰平、薄列峰,加入阿里达摩院
雷峰网独家消息,近日,达摩院新增两位AI 科学家,原贝壳技术副总裁、首席科学家叶杰平,前京东数科 AI 实验室首席科学家薄列峰已于近日入职阿里,分别担任达摩院城市大脑实验室和XR实验室X Lab)负责 ...

苹果大模型最新论文:AFM 模型多维度评测「出炉」

苹果大模型最新论文:AFM 模型多维度评测「出炉」
编译 | 朱可轩编辑 | 陈彩娴不久前,苹果在全球开发者大会WWDC)上推出了最新个人智能系统 Apple Intelligence,可以深度集成到 iOS 18、iPadOS 18 和 macOS ...

拒绝「PPTSD」!通义上线PPT新功能,重塑工作学习流

拒绝「PPTSD」!通义上线PPT新功能,重塑工作学习流
作为一名合格的打工人,你是什么时候对 PPT “PPTSD”的?制作PPT,当代打工人的“阿喀琉斯之踵”最近,在一档综艺节目——《脱口秀和 ta 的朋友们》中,选手赵晓卉对着 PPT 进行了长达几分钟 ...

马斯克的「xAI」计划

马斯克的「xAI」计划
在马斯克的商业帝国中,每一块新增的拼图都不仅仅是战略的延伸,更是对未来的一次大胆延伸与规划。8月14日下午,这个帝国又迎来了一个历史性时刻——xAI 正式发布了新一代的 Grok 2 大模型。在LMS ...

拳打可灵,脚踢 Veo 3,谁是物理世界的「懂王」?

拳打可灵,脚踢 Veo 3,谁是物理世界的「懂王」?
一个优秀的多模态视频生成大模型永远是一套复杂的系统级工程,它包括但不限于:跨模态理解与对齐能力,时序一致性的控制能力,精细化的编辑和修正能力,以及高效计算和成本控制的能力等。这让它看起来总像是一个巨头 ...

转发有奖|AFAC2024 金融智能创新大赛,持续火热招募中!

转发有奖|AFAC2024 金融智能创新大赛,持续火热招募中!
在上海市科学技术委员会指导、中国计算机学会(CCF)支持下,由北京大学、复旦大学、香港大学、蚂蚁集团等共同发起了AFAC2024金融智能创新大赛。报名通道已正式上线,7月份进行成果初选,8月份进入决赛 ...

对话 IJCAI2024 大会主席张成奇:克服了幻觉,大模型就不够「靓丽」

对话 IJCAI2024 大会主席张成奇:克服了幻觉,大模型就不够「靓丽」
作者丨王悦 张进编辑丨陈彩娴第 33 届IJCAI大会在韩国济州岛圆满结束,为期一周8.3-8.9)的 IJCAI 吸引了来自全世界各地人工智能领域的研究者和关注者,大会现场的氛围跟 8 月的济州岛天 ...

奇瑞 1 亿元成立 AI 机器人新公司;AI Infra 公司趋境科技获天使融资;地平线组建具身智能实验室丨AI情报局

奇瑞 1 亿元成立 AI 机器人新公司;AI Infra 公司趋境科技获天使融资;地平线组建具身智能实验室丨AI情报局
今日融资快报奇瑞汽车1亿成立科技新公司,含多项AI业务天眼查App显示,安徽开阳科技有限公司成立,法定代表人为尹同跃,注册资本1亿人民币,经营范围含网络与信息安全软件开发、智能机器人的研发、人工智能基 ...

AI 编程新星 Anysphere 获 A16z 估值 4 亿美元投资;微软为 Excel 等研发新 AI 模型丨AI情报局

AI 编程新星 Anysphere 获 A16z 估值 4 亿美元投资;微软为 Excel 等研发新 AI 模型丨AI情报局
今日融资快报AI编程Anysphere获得A16z新一轮投资,估值达4亿美元AI 编程初创公司 Anysphere 发布AI代码编辑器 Cursor,并成功从知名风险投资公司 A16z 获得新一轮融资 ...

AI文档搜索公司Hebbia完成1.3亿美元融资,a16z领投;奥特曼成立AI健康公司;大模型最强架构TTT问世丨AI情报局

AI文档搜索公司Hebbia完成1.3亿美元融资,a16z领投;奥特曼成立AI健康公司;大模型最强架构TTT问世丨AI情报局
融资快报Hebbia 完成 1.3 亿美元融资:位于纽约的 AI 初创公司 Hebbia 宣布完成新一轮 1.3 亿美元融资,由 a16z 领投,Index Ventures、Google Ventu ...

WAIC 2024 :容犀智能大模型应用升级发布,助力大模型提升产业效能

WAIC 2024 :容犀智能大模型应用升级发布,助力大模型提升产业效能
7月6日,在2024世界人工智能大会上,容联云成功举办主题为“数智聚合 产业向上”的生成式应用与大模型商业化实践论坛。论坛上,容联云发布了容犀智能大模型应用升级,该系列应用包括容犀Agent Copi ...

IJCAI 2024:论文提交量增加了23.8%,但录用率并无上升

IJCAI 2024:论文提交量增加了23.8%,但录用率并无上升
作者丨张进 王悦编辑丨陈彩娴北京时间 8 月 9 日下午四点,第 33 届国际人工智能联合会议 IJCAI 正式结束,此次大会为期 7 天,于 8 月 3 日到 8 月 9 日在韩国济州岛举行,所有相 ...
返回顶部