Fireworks乔琳:AI产物上市时间从五年压缩到五天,我们的秘诀是什么?
2025-07-11 10:42:09 - 短料
在大模型革命的物上第一波浪潮中,许多初创公司和企业基于领先的市时缩闭源模型,如OpenAI的间从诀长沙大学曝光评论ChatGPT设计自己的商业模式。然而,年压随着越来越多新的天们开源模型的出现,大模型从训练转向推理,物上基于大模型的市时缩商业模式也在悄然改变。
最近,间从诀在机器智能领域,年压一家名为Fireworks AI的天们公司迅速崭露头角。在今年7月的物上B轮融资中,该公司在红杉资本的市时缩领投下筹集了5200万美元,估值达到了5.22亿美元。间从诀
作为一个SaaS平台,年压Fireworks AI专注于提供生成式机器智能推理和高质量的天们调优支持。公司致力于为客户打造速度快、成本合理且高度可定制的生成式机器智能(GenAI)解决方案,满足不同客户的独特需求。
在获得融资一个月后,Fireworks AI首席执行官乔琳做客红杉资本的Training Data Podcast,从自己之前领导 Meta 的 PyTorch 团队重建了整个堆栈、满足商业客户的复杂需求开始,讲述了Fireworks对大模型时代如何帮助客户进行优化、创造价值的长沙大学曝光评论思考。AI科技评论节选了部分内容并进行了解读,Podcast全文见:https://www.sequoiacap.com/podcast/training-data-lin-qiao/
简单、可以扩展:PyTorch和Fireworks的通用逻辑
乔琳创立Fireworks的初衷源自于一个特别的想法:缩短AI模型训练和推理时间,以此推动各种AI应用的繁荣增长。在training data podcast的对谈中,她分享了一个关键信息:Fireworks能够加速整个行业的产物上市周期,将其从五年压缩到五周甚至五天。而这一切,都离不开Fireworks最核心的AI框架,PyTorch。
乔琳在Meta的PyTorch团队的工作经历让她注意到,无论是通用AI模型还是其他类型,越来越多的模型都在PyTorch中构建和运行。她认为这是由于PyTorch的漏斗效应,使其从研究人员的工具逐渐转变为模型创建和生产应用的主流框架。
简单、可以扩展,这是PyTorch的设计逻辑,也是研究人员喜欢PyTorch的原因。PyTorch的设计哲学是简化客户体验,隐藏后端复杂性。类似地,Fireworks保留其美观简单的前端并重建后端,为客户提供更快的开箱即用体验。
例如,当Fireworks聚焦于以高性能提供推理时,他们手写了 CUDA 内核,实现了跨节点的分布式推理,以及跨 GPU 的聚合推理,将模型分成几部分,并以不同的方式进行缩放。此外Fireworks还实现了语义缓存,在给定内容的情况下不必重新计算。此外还专门捕获应用程序工作负载模式,然后将其构建到其推理堆栈中。
这一切组合成一个完整的系统,而不仅仅是一个库,能够自动调整以适应开发者或企业工作负载。从客户角度看,Fireworks提供了一个平台,让客户能够访问100多个模型,并帮助他们微调和定制模型以满足特定需求。
那PyTorch在里面又起了什么作用呢?
Fireworks用PyTorch替换其他的现有框架,让研究人员和开发者能够轻松地将他们现有的工作迁移到PyTorch上,就像替换一个普通的代码库一样。这样一来,就能够让研究和生产环境都能统一在PyTorch上,简化开发流程并提高效率。
这个看似简单的的替换过程实际上比预期的要复杂得多,因为它涉及到了整个推理和训练堆栈的重建,以及对信息加载、分布式推理和训练扩展等方面的优化。这个过程最终花费了五年时间,并且支持每天超过五万亿次推理;而现在,客户可以通过Fireworks的这套系统,将五年的经验压缩到五天中。
Fireworks与开源
越来越多的开源项目让商业活动使用AI模型的成本越来越低,但乔琳认为,和其他开源项目对比,Fireworks的优势不仅仅在于针对客户需求定制模型。
与开源项目相比,使用Fireworks的成本更低,这不仅仅体现在经济成本上,还包括了开发成本。Fireworks提供的是一套现成的解决方案,它减少了在尝试和优化不同模型上所花费的时间和精力。
此外,Fireworks还能提供更低延迟的推理速度,以更低的成本实现更多功能。根据Fireworks官方信息,Fireworks的RAG速度比Groq要高9倍;Fireworks SDXL的图像生成速度比其他提供商的平均水平高6倍;Fireworks的推测解码速度更是能够达到惊人的1000个令牌/秒。
与开源原始模型相比,Fireworks能将成本降低五倍,甚至在进一步微调的情况下降低三十倍。以vLLM为例,FireAttention吞吐量比vLLM高15倍,Mixtral 8x7b的每枚代币价格要比vLLM低4倍。
Fireworks还提供了极致简化的自动化支持。Fireworks在后端进行了大量的自动化工作,包括自动调整复杂性和性能优化。这一点是许多仅提供基础库和工具的开源项目所不具备的。Fireworks构建了一个完整的系统,能够自动根据开发者或企业的工作负载进行调整,实现更高的性能和更优的质量。这种自动化支持不仅简化了开发过程,也提高了整体的效率和产出。
市场趋势与竞争
许多初创公司在探索创意产物与市场契合度时,倾向于从OpenAI起步。然而,随着业务规模的扩展,他们迫切需要选择性能更优、延迟更低的AI模型来适应产物市场的需求。在这一关键时刻,Fireworks AI能够提供既经济又性能出色的AI解决方案。
乔琳观察到,在与客户的互动中,与CTO的接触日益频繁,这反映出整个行业正朝着创新驱动型业务转型的方向迅速增长。这一转变的背后有两个主要原因:
首先,行业领导层都注意到了生成式机器智能(Generative Artificial Intelligence,GenAI)浪潮正在重塑行业格局。新兴的初创公司正在以惊人的速度涌现。如果现有企业创新速度不够快,不能高效利用生成式机器智能,就会很快被市场淘汰。
其次,生成式机器智能降低了AI模型训练门槛。传统机器智能训练中,一般只有大规模公司才能提供训练模型需要的海量信息和资源。但生成式机器智能的出现让人们可以在已有的基础模型上进行构建,通过微调得到合适的模型。
在这一行业变革中,通用小模型因其灵活性越来越受到商业客户的青睐。Fireworks提供了大量规模在7B-13B之间的开源模型,在降低成本的同时,使开发人员能够专注于更小、更集中的信息集,更高效地处理部分特定的业务。
尽管OpenAI等公司研发出了可随意使用的通用款机器智能,但在某些领域,通用模型缺乏业务逻辑,无法满足特定业务需求。
Fireworks AI的模型微调支持正是为了解决这一市场痛点。Fireworks要求客户或开发人员首先收集并标记业务信息,然后根据具体情况选择合适的微调运算规则,调整参数和模型权重等。Fireworks在后端处理复杂的工艺问题,而在前端为客户提供一个简单易用的界面,并留给客户足够的设计空间。通过这种方式,Fireworks使客户能够轻松地定制和优化AI模型,以满足其特定的业务需求。
未来愿景
Fireworks AI的愿景是构建一个能够提供全面知识访问的简单API。
目前,公司已经开发了一百多个模型,包括大型语言模型、图像生成模型、音频生成模型、影片生成模型、嵌入式模型和多模态模型,实现了广泛的基础模型覆盖,并针对延迟、吞吐量和每个Token的成本进行了优化。
尽管这些基础模型集合了丰富的知识和训练信息,但它们所涵盖的信息仍然有限。许多实时信息无法被捕获,而且大量信息隐藏在不公开的API之后,无法直接访问。
为了克服这些限制,Fireworks致力于创建一个功能强大的API,它能够精确地调用不同的模型和API,实现对全部知识的访问。在此基础上,Fireworks想建立一个可以访问数百名专家的专家混合网络,每个专家都很小但很灵活,能够针对特定问题提供高质量的解决方案。
乔琳相信,随着AI模型规模收益的放缓,行业将转向更注重模型适用性的优化。Fireworks AI凭借其创新的工艺和定制化支持,完全有能力引领这一行业转变,为客户带来更高效、更精准的AI应用体验。
谁是乔琳?
Fireworks AI于2022年底在加州创立,乔琳是 Fireworks AI 的首席执行官兼联合创始人,她本科和研究生毕业于复旦大学完成了计算机科学专业,并拥有加州大学圣塔芭芭拉分校计算机科学博士学位。
2015年,乔琳加入了Meta(原Facebook)。当时正值公司AI工艺从CPU向GPU转型的关键时期,需要从头开始设计AI基础设施。她带领团队研发了Caffe2等创新模型;并在后来的几年时间里带领由300 多名世界级优秀工程师组成的Meta PyTorch团队,领导开发了PyTorch及其周围的整个系统,乔琳也被誉为“PyTorch之母”。Meta PyTorch团队的研发成果给Facebook 信息中心提供了有力支持,并广泛应用于数十亿移动设备和数百万 AR/VR 设备。
乔琳从PyTorch上了解到了开发人员在AI开发竞赛中时面临的巨大障碍,找到稳定可靠的模型和架构和较低的模型总拥有成本。面对这处市场空白,乔琳选择离开Meta开启新的事业。她和Dmytro Dzhulgakov、Dmytro Ivchenko、James Reed、赵晨宇、Pawel Garbacki还有Benny Chen一起创立了Fireworks。这一批来自Meta PyTorch团队和GCP团队的精英在AI框架和AI基础设施方面有着深厚的背景,也正是这些专业知识能够让他们把复杂的AI构建不断简化,在保证灵活稳定的基础上降低AI的使用成本。
曾和乔琳在Meta同组研究AI Infra的贾扬清,也在去年创立了自己的机器智能公司,Lepton AI。Lepton AI和Fireworks属于同一赛道上的竞争对手。AI开发简化这个赛道考验的是团队的工艺经验,只有工艺大牛才有底气创立团队加入竞争。雷峰网(公众号:雷峰网)雷峰网
乔琳的Fireworks也是打出了很有底气的口号,“用于构建可用于生产的复合 AI 系统的最快、最高效的推理引擎”。
雷峰网原创文章,未经授权禁止转载。详情见转载须知。
- END -
冯德莱恩对中国提出三项要求,外交部回应

【环球时报-环球网报道 记者李萌】在7月9日外交部例行记者会上,有记者提问称,欧盟委员会主席冯德莱恩昨天对中国提出了三项要求,其中包括与俄罗斯的合作。中方对此有何评论?对此,发言人毛宁表示, 中俄之间
斯坦福 AI 指数报告发布:2024年美国 AI 私人投资约为中国的 12 倍、GPT3.5 级别模型推理成本下降 280 倍

4 月 7 日,斯坦福大学以人为本的人工智能研究所 HAI) 发表了新的《2025年人工智能指数报告》,多项数据统计表明:中美 AI 的差距正在缩小,AI 技术的创新速度是过去十年的数倍之快。该报告总
香港乐高探索中心开启夏日玩乐模式 「乐高夏日拼乐祭」暑期全新上线

来源标题:香港乐高探索中心开启夏日玩乐模式 「乐高夏日拼乐祭」暑期全新上线这个暑假,默林娱乐集团旗下的香港乐高 ® 探索中心诚邀亲子家庭们一同投 入充满趣味的乐高® 夏日拼乐祭!由即日
阿里AI旗舰应用夸克发布全新“AI相机” 提升AI超级框多模态能力

4月27日,夸克AI超级框发布全新AI相机,上新“拍照问夸克”功能。基于视觉理解与思考推理的强大模型能力,夸克AI超级框从视觉出发创新下一代搜索体验,进一步理解和回答物理世界中的各类问题。作为阿里巴巴
人民日报:不少声音呼吁“同志”称呼重归主流

来源:北京青年报7月7日,《人民日报》刊发了题为《称呼与风气金台随感)》的文章。全文如下:称呼,一个老生常谈的问题。曾几何时,招呼人无须刻意措辞,一声“同志”便可,听者坦然、舒泰。后来,经济增长、文化
实测文小言升级:开始「卷体验」的百度都眉清目秀了

刚刚无缝接入文心 4.5、文心 X1 和 满血版 DeepSeek-R1 的文小言,转身又整出了新动作。3 月 31 日,文小言迎来了一次全面升级,上新了多模型融合调度、全新语音大模型、图片问答、拍题
香港乐高探索中心开启夏日玩乐模式 「乐高夏日拼乐祭」暑期全新上线

来源标题:香港乐高探索中心开启夏日玩乐模式 「乐高夏日拼乐祭」暑期全新上线这个暑假,默林娱乐集团旗下的香港乐高 ® 探索中心诚邀亲子家庭们一同投 入充满趣味的乐高® 夏日拼乐祭!由即日
“为一场演出赴一座城”,演唱会经济持续升温

“你总是心太软”“我等的船还不来,我等的人还不明白”,7月4日晚,任贤齐“齐迹”演唱会北京的首场演出在首都体育馆落下帷幕,歌迷们哼着熟悉的旋律从体育馆走出,兴奋劲儿久久不散。“我们去吃个夜宵吧,魏公村
大模型时代的三道鸿沟:数据、成本与想象力

跨入2023年,大模型兴起、诸多公司「跑步进场」的头几个月,大模型一边倒向 C 端类 ChatGPT 的研发,对成本、效率更敏感的企业客户似乎不在关注焦点。然而近两个月,情况发生了变化。基于医疗、金融
受台风“丹娜丝”作用,福建江西部分旅客列车停运

受台风“丹娜丝”作用 ,预计今天8日)至10日,福建全省、江西南部有大到暴雨,福建局地有特大暴雨。为确保铁路运输保障,国铁南昌局于今天8日)18时,在合福、昌福、南龙、赣瑞龙等高铁,以及兴泉、建化、清
破界·共生:网络综艺的融合创新与价值跃升

来源标题:破界·共生:网络综艺的融合创新与价值跃升盛夏时节,网络综艺的蓬勃生机与创新活力在北京汇聚。 7月2日下午,第三届北京网络视听艺术大会网络综艺创作主题研讨成功举办。本次研讨以“&l
Pokee.ai 朱哲清:用 RL 搭建智能体的「骨骼与神经」

在 Pokee.ai 内测之前,我们就先感受了一把这款 Agent 的能力。“你发给我一个邮件就行,我的 Agent 能自动生成日程表。”在跟朱哲清约电话会议的时候,微信那头的这个人如是说。他是知乎和