新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude

2025-07-11 10:26:24 - 热讯

8月2日,新王新超lmsys官方在推特发布一则消息,登基度更恭喜DeepMind研发的新王新超家庭自拍流出完整版Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名登顶,超越GPT 4o和Claude-3.5夺得第一。登基度更

这是新王新超继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来,OpenAI第二次让出Chatbot Arena的登基度更Overall ranking宝座。

新王登基,新王新超Gemini 1.5 Pro再度更新,登基度更超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena测试一周后。获得了超过12,登基度更家庭自拍流出完整版000个社区投票,新王新超在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的登基度更好成绩。之前说GPT-4o有刷分技巧,新王新超现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。登基度更

新王登基,新王新超Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

Gemini 1.5 Pro 实验版(0801)不仅在综合表现上极为突出,在各个细分领域上也有着出色的表现。它在数学方面排名前三,指令遵循排名前二,编码排名前五,硬提示(英语)排名前五。

Gemini 1.5 Pro 实验版(0801)具有强大的多语言能力,在中文、日语、德语、俄语方面均表现第一。

从总体胜率图上,也能看出Gemini 1.5 Pro 实验版 (0801)实力强劲,对阵 GPT-4o 的胜率为 54%,对阵 Claude-3.5-Sonnet 的胜率为 59%。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

前OpenAI的开发者,现Google AI Studio的产物负责人Logan Kilpatrick火速转发,向大家宣布Gemini 1.5 Pro 实验版(0801)目前在 LMSYS 的文本和多模式排名中均位居第一的好消息。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

DeepMind的CEO Demis Hassabis也转发了这条消息,祝贺Gemini 1.5 Pro 实验版(0801)能够在极具竞争力的榜单中拿下第一,并且宣布这一版本的已经可以在 AI Studio上进行试用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

带领研发Gemini的Jeff Dean也随后转发,对此次实验版本的Gemini 1.5 Pro突破1300+elo分数拿下排名第一的好消息感到非常自豪,也很期待未来能看到其他更好的模型。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5


听闻这则消息,其他从业人员也纷纷发来祝贺。


新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有不少人分享自己的试用体验。大神elvis对在聊天机器人领域超越了 GPT-4o 和 Claude 3.5 Sonnet的Gemini 1.5 Pro非常感兴趣。elvis分享了自己的测试全过程影片,并总结道,Gemini 1.5 Pro强大的图像和PDF提取能力给他留下了深刻的印象,Gemini 1.5 Pro有着和GPT-4o不相上下的视觉能力,也有Claude 3.5 Sonnet接近的代码生成及PDF理解/推理能力。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

有人认为Gemini 1.5 Pro在解决高级数学难题方面表现相当不错。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有人说Gemini 1.5 Pro在图像识别植物和动物方面做得确实要比GPT 4o更好。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

也有更多的人在期待Gemini 1.5 Pro这一版本的正式上线,希望能够API实现Gemini 1.5 Pro的实际运用。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

大家对Gemini 1.5 Pro这次发布的实验版本有什么看法,欢迎评论区留言分享~雷峰网(公众号:雷峰网)雷峰网


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude-3.5

- END -

6784

匈牙利总理:欧洲领导人必须承认对乌克兰的战略错误

匈牙利总理:欧洲领导人必须承认对乌克兰的战略错误

当地时间9日,匈牙利总理欧尔班在当地媒体播发的采访中表示,目前,欧洲几乎所有问题都源于俄乌冲突,随着美国政策转变,跨大西洋关系出现裂痕,这场战争对于欧盟来说已经失败,欧洲领导人必须承认他们的错误战略。

微软人工智能公开课概览

微软人工智能公开课概览

人工智能无疑是当前最为热门的科技概念。作为科技界的领军企业,微软在人工智能领域耕耘已久。早在25年前微软研究院建立时,人工智能就已经成为整个微软的战略目标。微软为此倾注了许多精力和资源,并取得了亮眼的

2025看东方·芭莎之夜暨超音尚派对燃擎上海 多元舞台引爆时尚音浪

2025看东方·芭莎之夜暨超音尚派对燃擎上海 多元舞台引爆时尚音浪

来源标题:2025看东方·芭莎之夜暨超音尚派对燃擎上海 多元舞台引爆时尚音浪由《时尚芭莎》联合SMG看东方、华纳音乐打造的年度盛典——“2025 BAZAAR GA

上合组织国家电影节闭幕,《三大队》获最佳影片

上合组织国家电影节闭幕,《三大队》获最佳影片

来源标题:上合组织国家电影节闭幕,《三大队》获最佳影片电影节的电影市场活动上,嘉宾观看中国电影科技企业的虚拟影片。 新华社发7月6日晚,2025上合组织国家电影节闭幕式在重庆永川区举办。本届电影节集中

别再声讨零一万物了

别再声讨零一万物了

最近两天,由原阿里技术副总裁、深度学习框架 Caffe 发明者贾扬清一则朋友圈引发的关于“国内某大厂新模型套壳 LLaMA 架构”的问题在中国人工智能圈与科技媒体中产生了热烈讨论。由于贾扬清在国内 A

百度Create AI开发者大会:李彦宏发布两大新模型、多款热门AI应用,帮助开发者全面拥抱MCP

百度Create AI开发者大会:李彦宏发布两大新模型、多款热门AI应用,帮助开发者全面拥抱MCP

4月25日,Create2025百度AI开发者大会在武汉隆重举办。百度创始人李彦宏发表了题为《模型的世界 应用的天下》的演讲。60分钟的演讲中,李彦宏发布了两大模型,多款热门AI应用,并宣布将帮助开发

乌兰图雅化身体验官,邀您共赴庄浪的美食与人文非遗之旅!

乌兰图雅化身体验官,邀您共赴庄浪的美食与人文非遗之旅!

来源标题:乌兰图雅化身体验官,邀您共赴庄浪的美食与人文非遗之旅!“一路过来看到景色特别美,庄浪的梯田之美、人文之美,太值得让更多的人看见了!”在“花开四季&rdqu

香港首个商业AI展「AI+ Power 2025」盛大开幕,本地及海外行业精英齐聚共探AI发展

香港首个商业AI展「AI+ Power 2025」盛大开幕,本地及海外行业精英齐聚共探AI发展

香港,2025年6月5日)——由BUSINESS GOVirtualBGOV)主办的「AI+ Power 2025」今日在香港会议展览中心举行。作为香港首个聚焦商业AI应用的行业盛会,展会汇聚本地及海

哀悼 !中国计算机视觉领军者、商汤创始人汤晓鸥去世

哀悼 !中国计算机视觉领军者、商汤创始人汤晓鸥去世

12 月 16 日中午雷峰网获悉:上海人工智能实验室主任、商汤科技创始人、香港中文大学信息工程学系教授汤晓鸥去世。经多位独立信源确认,此消息属实,目前等待官方发布讣告。20世纪60年代末,汤晓鸥出生于

DeckSpeed 严訸:创业的本质是对全世界的祛魅| 00后创业者系列

DeckSpeed 严訸:创业的本质是对全世界的祛魅| 00后创业者系列

作者丨朱可轩编辑丨陈彩娴受到姥爷影响,如果给人生写两个关键词,严訸首当其冲想到的是「工程」和「生意」。从小未曾想过长大要「进厂打工」,他创业的种子自初中便已在心中萌芽,产品基因也自此开始积淀。那时每逢

《戏台》从话剧舞台搬上了大银幕 陈佩斯、黄渤、姜武、尹正主演 7月17日上映

《戏台》从话剧舞台搬上了大银幕 陈佩斯、黄渤、姜武、尹正主演 7月17日上映

来源标题:《戏台》从话剧舞台搬上了大银幕 陈佩斯、黄渤、姜武、尹正主演 7月17日上映“戏是演给人看的,可剧场装不下所有想看的人。”在电影《戏台》发布的“嬉笑怒骂皆

受台风“丹娜丝”作用,福建江西部分旅客列车停运

受台风“丹娜丝”作用,福建江西部分旅客列车停运

受台风“丹娜丝”作用 ,预计今天8日)至10日,福建全省、江西南部有大到暴雨,福建局地有特大暴雨。为确保铁路运输保障,国铁南昌局于今天8日)18时,在合福、昌福、南龙、赣瑞龙等高铁,以及兴泉、建化、清