发布时间:2025-09-13 13:21:41 作者:gdw 点击:67133 【 字体:大中小 】
8月2日,新王新超lmsys官方在推特发布一则消息,登基度更恭喜DeepMind研发的新王新超Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena排名登顶,超越GPT 4o和Claude-3.5夺得第一。登基度更
这是新王新超继今年3月Claude 3 “超大杯”Opus版本短暂超越GPT-4以来,OpenAI第二次让出Chatbot Arena的登基度更医生私密合影内幕合集Overall ranking宝座。
Gemini 1.5 Pro 实验版 (0801)在Chatbot Arena测试一周后。获得了超过12,登基度更000个社区投票,新王新超在Chatbot Arena和Vision Leaderboard排名上均取得了第一名的登基度更好成绩。之前说GPT-4o有刷分技巧,新王新超现在看起来Gemini 1.5 Pro可能也学到了这个技巧呢。登基度更
Gemini 1.5 Pro 实验版(0801)不仅在综合表现上极为突出,在各个细分领域上也有着出色的表现。它在数学方面排名前三,微博情感导师封号合集指令遵循排名前二,编码排名前五,硬提示(英语)排名前五。
Gemini 1.5 Pro 实验版(0801)具有强大的多语言能力,在中文、日语、德语、俄语方面均表现第一。
从总体胜率图上,也能看出Gemini 1.5 Pro 实验版 (0801)实力强劲,对阵 GPT-4o 的胜率为 54%,对阵 Claude-3.5-Sonnet 的胜率为 59%。
前OpenAI的开发者,现Google AI Studio的产品负责人Logan Kilpatrick火速转发,向大家宣布Gemini 1.5 Pro 实验版(0801)目前在 LMSYS 的文本和多模式排名中均位居第一的好消息。
DeepMind的CEO Demis Hassabis也转发了这条消息,祝贺Gemini 1.5 Pro 实验版(0801)能够在极具竞争力的榜单中拿下第一,并且宣布这一版本的已经可以在 AI Studio上进行试用。
带领研发Gemini的Jeff Dean也随后转发,对此次实验版本的Gemini 1.5 Pro突破1300+elo分数拿下排名第一的好消息感到非常自豪,也很期待未来能看到其他更好的模型。
听闻这则消息,其他从业人员也纷纷发来祝贺。
也有不少人分享自己的试用体验。大神elvis对在聊天机器人领域超越了 GPT-4o 和 Claude 3.5 Sonnet的Gemini 1.5 Pro非常感兴趣。elvis分享了自己的测试全过程视频,并总结道,Gemini 1.5 Pro强大的图像和PDF提取能力给他留下了深刻的印象,Gemini 1.5 Pro有着和GPT-4o不相上下的视觉能力,也有Claude 3.5 Sonnet接近的代码生成及PDF理解/推理能力。
有人认为Gemini 1.5 Pro在解决高级数学难题方面表现相当不错。
也有人说Gemini 1.5 Pro在图像识别植物和动物方面做得确实要比GPT 4o更好。
也有更多的人在期待Gemini 1.5 Pro这一版本的正式上线,希望能够API实现Gemini 1.5 Pro的实际运用。
大家对Gemini 1.5 Pro这次发布的实验版本有什么看法,欢迎评论区留言分享~雷峰网雷峰网(公众号:雷峰网)
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
ICLR 2025:顶尖科学家最关心的 AI 趋势有哪些?丨GAIR Live
商汤大模型的「5o」交互,普通人如何和 AI 过一天?
国内首个!商汤科技发布“日日新5o”,实时多模态流式交互对标GPT
戴盟机器人王煜:「具身技能」才能发挥人形机器人的作用
群核科技发布3D高斯语义数据集,给机器人装上“空间大脑”
Neuralink发布超能力V0.2版本:CAD设计、CS轻松拿捏
Viggle 获 a16z 领投 1900 万美元;华为启动 AI 百校计划,解决高校算力问题;字节成立大模型研究院丨AI情报局
Jim Gao:曾助谷歌节能40%的AI专家,如今致力打造“虚拟工厂操作员”
Demis Hassabis荣获诺贝尔化学奖,网友:诺奖需要AI
AI 手术平台 Caresyntax 获 1.8 亿美元融资;智元发布 5 款商用人形机器人,开发者还能“0元购”丨AI情报局
Viggle 获 a16z 领投 1900 万美元;华为启动 AI 百校计划,解决高校算力问题;字节成立大模型研究院丨AI情报局
当人形机器人开始走进车厂
于朦胧去世?那英两次婚姻被辜负?虞书欣女主没了?鹿晗排挤李晨?热剧女星恋爱脑当三?
Groq 获 6.4 亿美元融资;传 ResNet 作者张祥雨加盟阶跃星辰;OpenAI 研发 ChatGPT 文本水印丨AI情报局
新王登基,Gemini 1.5 Pro再度更新,超越GPT 4o和Claude
人形机器人「星尘智能」获数千万美元Pre
黑龙江一煤矿发生矿震 6名被困人员全部保障获救
苹果 AI 版 iOS 登场,模型使用谷歌芯片;Meta 推新模型,与黄仁勋探讨 AI 与开源生态的未来丨AI情报局
Andrej Karpathy:自动驾驶已经实现AGI,汽车其实就是机器人
Anthropic 联设 1 亿美元 AI 初创基金;OpenAI推出“小”模型GPT
新能源时代,国产3D视觉「冲击」保守的汽车行业
四个月融两轮,千寻智能获 2 亿元天使轮融资;大模型公司卓世科技获亿元人民币 B+ 轮融资;小鹏机器手首次亮相丨AI情报局
门板上做研究的首席科学家:Jeff Dean解密谷歌和Gemini背后的故事
考拉悠然完成亿元 B 轮融资;童欣投身 AGI 创业团队;吴恩达离开其 AI 创业公司,或专注新设立的 AI 基金丨AI情报局
独家丨知名AI科学家叶杰平、薄列峰,加入阿里达摩院
苹果大模型最新论文:AFM 模型多维度评测「出炉」
拒绝「PPTSD」!通义上线PPT新功能,重塑工作学习流
马斯克的「xAI」计划
拳打可灵,脚踢 Veo 3,谁是物理世界的「懂王」?
转发有奖|AFAC2024 金融智能创新大赛,持续火热招募中!
对话 IJCAI2024 大会主席张成奇:克服了幻觉,大模型就不够「靓丽」
奇瑞 1 亿元成立 AI 机器人新公司;AI Infra 公司趋境科技获天使融资;地平线组建具身智能实验室丨AI情报局
AI 编程新星 Anysphere 获 A16z 估值 4 亿美元投资;微软为 Excel 等研发新 AI 模型丨AI情报局
AI文档搜索公司Hebbia完成1.3亿美元融资,a16z领投;奥特曼成立AI健康公司;大模型最强架构TTT问世丨AI情报局
WAIC 2024 :容犀智能大模型应用升级发布,助力大模型提升产业效能
IJCAI 2024:论文提交量增加了23.8%,但录用率并无上升