搜索
当前所在位置:首页 >> 热点

【武汉中学绯闻评价】Meta 重金抢人,明星云集就能复制 DeepSeek 的成功吗?

发布时间:2025-09-13 13:48:51 作者:yrigo 点击:21831 【 字体:

最近 AI 圈最大的重金制新闻,大约就是抢人 Meta 扎克伯格亲自出手、重金招人的明星消息了。根据公开信息,云集如今在小扎亲自出手的成功推动下,Meta 已经组建起一支堪称豪华的重金制武汉中学绯闻评价 AI 战队。

核心领导团队方面,抢人包括前 Scale AI 创始人 Alexandr Wang(现任 Meta 首席 AI 官)、明星前 GitHub CEO Nat Friedman,云集以及 Safe Superintelligence 联合创始人 Daniel Gross,成功三人共同执掌 Meta Superintelligence Labs 的重金制战略与节奏。

技术阵容同样令人瞩目。抢人Meta 从 OpenAI 挖来了多位重量级研究员,明星包括 GPT-4o 的云集语音与图像模块开发者 Shuchao Bi 和 Huiwen Chang,“思维链”(Chain-of-Thought)技术代表人物 Trapit Bansal,成功以及 GPT 系列模型的重要研发成员 Ji Lin、Shengjia Zhao、Hongyu Ren 和 Jiahui Yu 等人。

而在 OpenAI 之外,Meta 同样高价吸引了 Apple 和 DeepMind 的核心人才:包括 Apple Foundation Models 负责人 Ruoming Pang(据称签约价高达 2 亿美元),DeepMind 前研究员 Jack Rae 与 Pei Sun,以及来自 Anthropic 的 Joel Pobar 和 Sesame AI 的 Johan Schalkwyk,也都陆续加盟。

而网传 Meta 的最新挖人动向,则是他们又成功挖走了 OpenAI 的两员大将,分别是武汉高中曝光评价 Jason Wei 和 Hyung Won Chung。

其中 Jason Wei 曾在 OpenAI 主导参与了 o1/o3 系列模型及 deep research 项目,是强化学习的坚定拥护者,同时也是 2022 年“Emergent Abilities”(涌现能力)概念的开创者之一。他在思维链(Chain-of-Thought)等前沿技术上的贡献广受认可。而 Hyung Won Chung 同样是 OpenAI 的核心研究员,深度参与了 o1 系列与 deep research 项目,研究方向主要聚焦于推理能力(reasoning)与智能体(agents)。

Meta 重金抢人,明星云集就能复制 DeepSeek 的成功吗?

据报道,目前两人的 OpenAI 内部 Slack 账号已被注销,基本坐实了离职消息。更惊人的是,据称 Meta 为吸引这两位 AI 顶尖科学家,直接开出了高达 3 亿美元的四年期薪酬包,可见其对“超级智能”战略的重视与投入之大。

不少人感慨“大厂要拼命了”“AI 人才再次供不应求”,但也有人冷静指出:大家关注的不是 Meta 的产品愿景、人才密度,而是它开出的高薪。

这就很耐人寻味,为什么我们对“只要聚集足够多聪明人就能做出伟大成果”这件事不再那么有信心了?

因为,现实一次次证明:人多、人强≠结果好。

世界大战中,团队比个人重要

OpenAI 推出 ChatGPT 时,所有人都关注它的技术、以及背后的组织力,但由于当时 OpenAI 云集的世界知名大神很多,所以组织力的归因占比还不算最突出。但在 DeepSeek 这样一个神秘又主要凝聚中国本土 C9 高校学者的团队冒出后,所有人都无法再忽视这样的一个事实:

在像 AGI 这样的大规模团队作战形式中,个人能力拔尖不如组织能力拔尖重要。

回顾人工智能的发展史,曾像 Meta 一样集结超多杰出人才的团队不胜枚举:MSRA、DeepMind、谷歌、百度、智源……乃至大模型时代,近两年腾讯、字节也都曾组织过各个方向的杰出人才组成大团队,但最终都要么人才四散而去、要么组织目标由高降低、要么做出一两件大新闻后泯然众人。

背后的原因众多,有企业的文化架构问题,有行业变化影响,但往往也容易出现一个普遍的现象,即:优秀人才之间的离散与斗争。

最终,强人集合没有产生加倍的效果,反而天才之间可以互相抵消。

每个牛人都有一套成熟的认知系统、经验路径和话语权构建逻辑,而伟大的突破往往来自对路径的反常识性挑战。如果组织没有“容错机制”,牛人越多,分歧越大,行动越慢。

一群彼此不服、各自为营的聪明人凑在一起,容易像一场永不散场的学术讨论会,而不是一个能落地的工程团队。

DeepSeek 是一个有意思的反例。它没有明星科学家,没有学术巨擘撑场,成员年轻,团队规模小(基础研究员在 150 人左右)、扁平化、没有打卡、没有层层 KPI 管理,创始人亲自下场撸代码,文化更像一个纯粹的研究小组。

直到推出 V3,外界还认为它只是在“巨人肩膀上摘果子”,但当 R1 发布、实现推理性能超越时,它直接被推到了行业第一梯队。

DeepSeek 的成功,并不是因为他们“比别人更聪明”,而是因为他们“比别人更敢干、更能协同”。从组织的角度来看,DeepSeek 几乎反其道而行:

极致扁平:没有层层结构,没有 KPI 内卷,反而激发了探索欲。

投入纯粹:大家都在搞基础研究,不用分心“交付”“商业”“报表”。

执行高效:一群动手能力超强的人每天都在干正事,不在做汇报。

认知一致:没有“上下级权威差”,只有“想清楚再动手”的共识。

对比之下,过去两年,字节 Seed 的团队曾一度多达 1000 人,大模型创业公司的基础模型团队虽控制在一百来人的规模、但同样要背负商业交付与产品支持的压力,因此难以构建起“高信任、低管理、强动机”组织模型。最终,DeepSeek 的第一轮胜出,几乎是注定的。

组织力 ≠ 人力总和,而是效率乘积

我们很容易陷入“能力总和论”陷阱:觉得一个组织的战斗力 = 每个人的能力总和 × 工作时间。但事实更接近于:组织战斗力 = 协同效率 × 方向一致性 × 持续稳定性。

换句话说:牛人越多,协同越难,任务越复杂,扁平化越重要。

所有大厂与模型团队的人都在看下一轮基础模型的竞争力,一种直觉的观点认为:大厂同样不缺人、不缺钱、不缺卡甚至不缺场景与数据,战斗力也不应该低于 DeepSeek。但如果将不同团队的研究日常作对比,就不难发现,实际上纯以 AGI 为研究目标的团队与复杂大厂之间的差距。

如果将人才的能力水平从 0 到 100 分划分,单人每天平均研究投入时间为 0 到 14 个小时,那么人才组织与产出的公式就可以清晰转化为效率的乘积:

假设在 DeepSeek 团队中,专注基础研究的年轻博士能力可以打 70-80 分,Top 大模型研究选手如张正彦这样基础理论与实践能力兼具的研究员是 100 分,那么 DeepSeek 的整体平均水平约为 85 分。同时 DeepSeek 没有商业化压力,150 人团队可以每天平均集中投入 12 个小时做基础研究。

对比一个千人研究团队的大厂,基础研究人员与工程师的战斗力由高到低不等,加上大团队意味着管理压力大,算平均值 60 分。且由于要花时间做商业化交付与应用产品支持,1000 人的团队平均每人每天可能最多只能投入 6 个小时做基础研究。

那么基础研究总投入来看,DeepSeek 与大厂的对比实际是:150*85*12 VS 1000*60*6。

除了客观可量化的投入,组织效率、协同成本、执行张力这些更难量化的变量,也是决定战斗力的关键。

如果 DeepSeek 拥有近乎满分的执行效率,记作 1.0,而大厂在目标分散、协作链条冗长等影响下,组织效率只有 0.2,那最终真正释放出来的有效产出会是:

DeepSeek:153000 × 1 = 153000

大厂团队:360000 × 0.2 = 72000

如此来看,其实不难发现 Deepseek 在基础问题的研究投入与产出预期上,实际上是比大厂要多得多。

这也就解释了,为什么 DeepSeek 一个 150 人的小团队,反而能做出一鸣惊人的成果,而一些大厂的千人团队,却因为组织结构复杂、任务重心分散,反而削弱了在基础研究上的真实投入。

再次回到 Mate 花大钱买人的这个事情上,其中有一个非常容易被忽视的变量:动机的成分到底是什么?

Meta 的超高薪能买来聪明人,但买不来“持续愿意干活”的动机。DeepSeek 为什么让人愿意拼 14 个小时?不是因为钱给得最多,而是因为愿景真实、结构自由、成果看得见。

如果动机只建立在薪水上,个体会进入“被动等待回报”的状态,但如果动机来自共创、掌控感和对问题的真实兴趣,反而会激发内驱。

而 Meta、Google 等大型科技公司的问题在于——他们的组织系统已经高度僵化,即使有牛人加入,也只能发挥一小部分。

除了被忽视的动机成分外,人们也经常会误解“创新”是由最聪明的人做出来的。但其实,创新更多发生在边缘人群、结构松散的小团队中。

另一个容易被忽视的客观事实是:随着人工智能的发展时间拉长、各种开源技术的发展,AGI 的知识门槛也在不断降低——这就意味着,十年前只有 AI 技术大牛才能研究出来的算法,如今一个 985 高校的硕博生沉下心来也能钻研明白、探究清楚,并提出大胆的改进设想了。

据 AI 科技评论了解,即使是 Transformer 这样的权威主流架构,国内的 MiniMax、Rock AI 等团队在敢于修改注意力机制后也能取得较大的创新,且在这些团队中主导架构修改的研究人员都并非以往行业追捧的顶级技术明星。

这也是 DeepSeek 给整个行业的启示:与其追求明星团队,不如追求执行团队;与其拼大模型预算,不如拼问题沉淀和反馈机制;与其堆博士、挖大牛,不如形成一个真正愿意彼此合作、共同思考的小集体。

Meta 很难复制 DeepSeek

回到问题本身,雷峰网认为或许 Meta 很难复制 DeepSeek。不是说 Meta 没有足够的钱,而是 Meta 已经不是一个“可变”的组织。

DeepSeek 是一个不断试错的小机器,相比之下 Meta 就是一个巨型飞轮,一旦启动,就很难偏航。组织的惯性,才是最难被打败的东西。

Meta 的高薪策略背后,其实反映出一种焦虑:他们需要重建早期 OpenAI 的文化,但用的是“招聘+绩效+话语权”的老一套工具。这套系统能招来人,但无法召唤真正的协作精神。

归根结底,人工智能行业目前最迫切的或许是打破“聪明人多就能赢”的迷信——聪明人当然重要,但关键是这些聪明人能不能真正协同起来,有没有共识,有没有足够多的自由去试错,甚至是有没有愿意亲自写代码的创始人... ...

雷峰网(公众号:雷峰网)认为在这轮 AI 创新浪潮中,组织的重构能力可能比模型的进步还要重要。

雷峰网原创文章,未经授权禁止转载。详情见转载须知。

Meta 重金抢人,明星云集就能复制 DeepSeek 的成功吗?

阅读全文
相关推荐

安理会15国强烈谴责多哈袭击事件 呼吁各方抓住和平机遇

安理会15国强烈谴责多哈袭击事件 呼吁各方抓住和平机遇
当地时间9月11日,联合国安理会发表声明,对9月9日发生在卡塔尔首都多哈的袭击事件表示强烈谴责。声明称该袭击发生在一个关键调解方的领土上,对造成的平民伤亡深表遗憾。声明指出,安理会成员强调缓解紧张局势 ...

特朗普称愿意对中印大幅加征关税 外交部回应

特朗普称愿意对中印大幅加征关税 外交部回应
来源:财联社财联社9月10日电,据北京日报,外交部发言人林剑9月10日主持例行记者会。彭博社记者提问,据报道,美国总统特朗普亲口对欧洲官员表示,为了迫使俄罗斯总统普京与乌克兰谈判,他愿意对印度和中国大 ...

腾讯Q2财报:营销服务358亿!再创新高

腾讯Q2财报:营销服务358亿!再创新高
8月13日,腾讯发布二季度财报。AI技术及应用正加速转化为业绩动能。当季实现营收1845亿元同比增长15%。在资本开支同比三位数增长的高投入背景下,腾讯当季仍实现毛利22%与经营利润Non-IFRS) ...

大模型热度退潮,真正的技术创新者开始被「看见」

大模型热度退潮,真正的技术创新者开始被「看见」
“过去两年中国的大模型投资并不是投技术,而是套着投技术的壳投商业模式。硅谷的投资人投 OpenAI 是投技术。”一位投资人对 AI 科技评论表示。商业模式驱动的投资核心是可预见的数字增长,而技术投资则 ...

特朗普的“秘密武器”,倒在枪口下

特朗普的“秘密武器”,倒在枪口下
来源:环球人物特朗普的忠诚支持者死了。作者:刘潇当地时间9月10日,美国知名保守派活动人士查理·柯克在犹他山谷大学演讲时遭枪击身亡,终年31岁。事发后约3小时,特朗普在社交媒体发文说柯克已经死亡,并向 ...

独家丨盛大挖角代季峰,筹建新 AGI 公司对标 DeepSeek

独家丨盛大挖角代季峰,筹建新 AGI 公司对标 DeepSeek
AI 科技评论独家获悉,近日盛大网络挖角清华大学电子工程系副教授代季锋,正在筹备一家新的 AGI 公司,号称“对标 DeepSeek”,已有多位技术人才被猎头接触、介绍该团队的工作机会。目前,该项目正 ...

重磅发布!新华医院联合商汤医疗推出AI儿童全科医生,“深思考”大医赋能儿科发展

重磅发布!新华医院联合商汤医疗推出AI儿童全科医生,“深思考”大医赋能儿科发展
2025 年 6 月 28 日,上海交通大学医学院附属新华医院奉贤院区正式起航。在开业仪式上,新华医院联合商汤医疗重磅发布基于商汤“深思考”大医·医疗大模型的AI 儿童全科医生,为基层儿科医生诊疗与儿 ...

国防部:日本加速军事扩张意欲何为?

国防部:日本加速军事扩张意欲何为?
据报道,日本防卫省公布预算草案显示,2026财年日防卫预算达8.85万亿日元,创历史新高。国防部新闻发言人今天表示,日本加速军事扩张,增长远超“专守防卫”所需的军力,包括进攻性武器装备,不禁让全世界爱 ...

AI短剧公司获百度投资;苹果AI将登VisionPro,今秋或将接入谷歌Gemini;上海医院用AI自动生成病历丨AI情报局

AI短剧公司获百度投资;苹果AI将登VisionPro,今秋或将接入谷歌Gemini;上海医院用AI自动生成病历丨AI情报局
融资快报CreativeFitting获百度PreA+轮融资:CreativeFitting井英科技)推出全球首款AI短剧APP,Reel.AI在海外市场正式发布,并迅速登上娱乐应用畅销榜,主创团队获 ...

阿里国际AI进展:日均调用量已破10亿次,获 WAIC 2025「SAIL之星」

阿里国际AI进展:日均调用量已破10亿次,获 WAIC 2025「SAIL之星」
7月26日,2025世界人工智能大会卓越人工智能引领者SAIL奖公布,阿里国际跨境电商AI解决方案Marco斩获本届SAIL之星,成为该领域的首个获得者。Marco由阿里国际AI Business团队 ...

独家丨前阿里通义视觉负责人薄列峰,已加入腾讯混元团队

独家丨前阿里通义视觉负责人薄列峰,已加入腾讯混元团队
AI 科技评论独家获悉,原通义实验室应用视觉团队负责人薄列峰已加入腾讯混元大模型团队,直接向腾讯副总裁兼混元项目负责人蒋杰汇报。据悉,薄列峰在今年 4 月 30 日从阿里离任,彼时曾有传闻称他已加盟某 ...

拳打可灵,脚踢 Veo 3,谁是物理世界的「懂王」?

拳打可灵,脚踢 Veo 3,谁是物理世界的「懂王」?
一个优秀的多模态视频生成大模型永远是一套复杂的系统级工程,它包括但不限于:跨模态理解与对齐能力,时序一致性的控制能力,精细化的编辑和修正能力,以及高效计算和成本控制的能力等。这让它看起来总像是一个巨头 ...
返回顶部