发布时间:2025-09-13 11:09:12 作者:amcva 点击:2127 【 字体:大中小 】
“打开水龙头前,全球千我们不需要知道水是首发N生设施从哪条河里来的。同理,无问未来我们用各种AI应用时,芯穹芯片也不会知道它调用了哪些基座模型,发布用到了哪种加速卡的规模上海大学偷拍全集算力——这就是最好的AI Native 基础设施。”
7月4日,异构在2024年世界人工智能大会AI基础设施论坛上,混训无问芯穹联合创始人兼CEO夏立雪发布了全球首个千卡规模异构芯片混训平台,平台千卡异构混合训练集群算力利用率最高达到了97.6%。筑基同时,态格夏立雪宣布无问芯穹Infini-AI云平台已集成大模型异构千卡混训能力,局的基础是全球千全球首个可进行单任务千卡规模异构芯片混合训练的平台,具备万卡扩展性,首发N生设施支持包括AMD、无问华为昇腾、广州医科大学内幕体验天数智芯、沐曦、摩尔线程、NVIDIA六种异构芯片在内的大模型混合训练。7月起,通过试训申请的用户,已可在Infini-AI上一键发起700亿参数规模的大模型训练。
就在4个月前,无问芯穹Infini-AI大模型开发与服务云平台宣布首次公测,已有智谱AI、月之暗面、生数科技等大模型公司客户在Infini-AI上稳定使用异构算力,还有20余家AI Native应用创业公司在Infini-AI上持续调用各种预置模型API,使用无问芯穹提供的工具链开发自身业务模型。此次发布全球首个可进行千卡规模异构芯片混训的平台,不仅是无问芯穹在异构计算优化与集群系统设计方面的深厚底蕴和卓越技术的实力体现,同时也是无问芯穹秉承“MxN”中间层生态理念的重要成果。
【打破异构芯片“生态竖井”,让异构芯片转化为大算力】
作为大模型生命周期中不可或缺的两个阶段,训练和推理均需要强大的计算资源支撑。然而,与国际上模型层与芯片层“相对集中”的格局相比,中国的模型层与芯片层更加“百花齐放”。然而,大量的异构芯片也形成了“生态竖井”,不同硬件生态系统封闭且互不兼容,给算力的使用方带来一系列技术挑战。
据不完全统计,宣布拥有千卡规模的中国算力集群已不少于100个,出于诸多缘由,比如过度依赖单一硬件平台可能会使企业面临供应链风险,又比如国产芯片的性能快速提升为集群方提供了多种选择,绝大部分集群已经或正在从同构转向异构。“生态竖井”的存在让大多数企业和开发者对此望而却步,即便算力集群众多,也难以实现有效的整合与利用,这无疑是对算力资源的浪费。“生态竖井”不仅成为构建AI Native基础设施的最大难点,也是当前大模型行业面临“算力荒”的重要原因。
构建适应多模型与多芯片格局的AI Native基础设施,无问芯穹的底层解法是,提供高效整合异构算力资源的好用算力平台,以及支持软硬件联合优化与加速的中间件,让异构芯片真正转化为大算力。这一系列研、产进展背后,是无问芯穹研发团队在异构芯片计算优化与集群系统设计上的强大实力支撑。近日,无问芯穹与清华、上交的联合研究团队发布了HETHUB,这是一个用于大规模模型的异构分布式混合训练系统,这是业内首次实现六种不同品牌芯片间的交叉混合训练,且工程化完成度高。夏立雪介绍,这项技术工程化的初衷,是希望能够通过整合更多异构算力,继续推高大模型技术能力的上限,同时通过打通异构芯片生态,持续降低大模型应用落地成本。
【引领“MxN”生态格局的AI Native基础设施建设,让天下没有难用的AI算力】
当前,大模型行业发展正在进入规模化产业落地阶段,应用场景的百花齐放,带来了对大模型训练日益迫切的需求,巨大的市场前景,使得基础模型和算力芯片的行业玩家迅速攀升。构建大模型时代的AI Native基础设施,不仅能够为AI开发者提供更加通用、高效、便捷的研发环境,同时也是实现算力资源有效整合,支撑AI产业可持续发展的关键基石。
无问芯穹具备顶尖的AI计算优化能力与算力解决方案能力,以及对“M种模型”与“N种芯片”行业格局的前瞻判断,率先构建了“MxN”中间层的生态格局,实现多种大模型算法在多元芯片上的高效、统一部署。 截止目前,Infini-AI已支持了Qwen2、GLM4、Llama3、Gemma、Yi、Baichuan2、ChatGLM3系列等共30多个模型,以及AMD、华为昇腾、壁仞、寒武纪、燧原、海光、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡。
无问芯穹致力于成为AI Native 基础设施领跑者,未来将继续突破异构算力优化与集群系统设计的技术上限,持续拓展模型层和芯片层的上下游生态伙伴力量,共同实现“MxN”的有效打通、利用和整合,构建真正适应多模型与多芯片的AI Native基础设施,让天下没有难用的AI算力,助力推动大模型在各行业中的应用创新。
“技术上限推高与技术落地扩散不矛盾,且取决于我们决心如何对待这个技术。”夏立雪表示,今天说让大模型成本下降10000倍,就像30年前说让家家户户都通电一样。优良的基础设施就是这样一种“魔法”,当边际成本下降到临界值,就能有更多的人拥抱新技术。
雷峰网(公众号:雷峰网)
雷峰网版权文章,未经授权禁止转载。详情见转载须知。
“知乎AI先行者沙龙”深圳站:探航大模型应用新风口
国产 AI Infra 变革进行时:新势力正在崛起
Demis Hassabis荣获诺贝尔化学奖,网友:诺奖需要AI
OpenAI 新设“应用 CEO”:原 Meta VP 加入,与奥特曼平级
WAIC最强亮点:非Transformer离线AI大模型已大规模量产,大模型商业比我们想得更快
上交大冷静文:模型发展需要和芯片、系统厂商协同
为什么是梁文锋做出了DeepSeek?
强化学习之于 AI Agent,是灵魂、还是包袱?
大模型「点火」,AI for Science 提速
“自由画布”开启公测!百度文库AI功能MAU超9000万
Pokee.ai 朱哲清:用 RL 搭建智能体的「骨骼与神经」
Agent 要被吃进大模型了
“寒冬”还是“拂晓”?第四范式成功上市率先交卷
实测文小言升级:开始「卷体验」的百度都眉清目秀了
SIGGRAPH Asia 2024:传统与创新并存,3D 生成与具身智能热度上升
Pokee.ai 朱哲清:用 RL 搭建智能体的「骨骼与神经」
重磅发布!新华医院联合商汤医疗推出AI儿童全科医生,“深思考”大医赋能儿科发展
SIGGRAPH Asia 2024:传统与创新并存,3D 生成与具身智能热度上升
特斯拉首款无人驾驶 RobotTaxi,升级版 Optimus 还是画大饼?
枫清科技高雪峰:从数据到知识,跨越生成式AI与决策智能间的鸿沟
做大模型时代的「Linux」, ChatGPT 仅是开端
CNCC 落幕:国产大模型已经进化到能在横店给我们点咖啡
国行 iPhone 16 相机控制也接入视觉智能了!可一键调用阶跃星辰智能助手「跃问」
几十个测试后,发现海螺语音与 ElevenLabs 掰手腕的能力不是盖的
蓝振忠也发「英雄帖」,中国版 ChatGPT 明星公司寻找 CEO
OpenAI 新设“应用 CEO”:原 Meta VP 加入,与奥特曼平级
破解AI算力瓶颈:高通量以太网ETH+协议解锁智算新动能
Llama 4 刷榜作弊引热议,20 万显卡集群就做出了个这?
拓元智慧物理空间智能引擎再获行业验证!赋能金牌家居“飞流AI”
实测字节豆包·视频生成模型:Sora画的饼被实现了......
计算的未来:英伟达王冠正摇摇欲坠
Harrison Chase:独创AI智能体「认知架构」,定制+极简加减法双驱动
爱诗科技完成6000万美元B轮融资
大模型隐藏玩家上桌:DeepSeek 向左,面壁向右
伯克利罗剑岚:机器人的范式革命,藏在真实世界中
大模型容易忽视的安全,火山方舟早就「刻」进了基因