【武汉中学绯闻评价】Meta 重金抢人，明星云集就能复制 DeepSeek 的成功吗？-视角见闻录- 走进心情，感受奇妙趣事

当前所在位置:首页 >> 热点

【武汉中学绯闻评价】Meta 重金抢人，明星云集就能复制 DeepSeek 的成功吗？

发布时间：2025-09-13 13:48:51 作者：yrigo 点击：21831 【字体：大中小】

最近 AI 圈最大的重金制新闻，大约就是抢人 Meta 扎克伯格亲自出手、重金招人的明星消息了。根据公开信息，云集如今在小扎亲自出手的成功推动下，Meta 已经组建起一支堪称豪华的重金制武汉中学绯闻评价 AI 战队。

核心领导团队方面，抢人包括前 Scale AI 创始人 Alexandr Wang（现任 Meta 首席 AI 官）、明星前 GitHub CEO Nat Friedman，云集以及 Safe Superintelligence 联合创始人 Daniel Gross，成功三人共同执掌 Meta Superintelligence Labs 的重金制战略与节奏。

技术阵容同样令人瞩目。抢人Meta 从 OpenAI 挖来了多位重量级研究员，明星包括 GPT-4o 的云集语音与图像模块开发者 Shuchao Bi 和 Huiwen Chang，“思维链”（Chain-of-Thought）技术代表人物 Trapit Bansal，成功以及 GPT 系列模型的重要研发成员 Ji Lin、Shengjia Zhao、Hongyu Ren 和 Jiahui Yu 等人。

而在 OpenAI 之外，Meta 同样高价吸引了 Apple 和 DeepMind 的核心人才：包括 Apple Foundation Models 负责人 Ruoming Pang（据称签约价高达 2 亿美元），DeepMind 前研究员 Jack Rae 与 Pei Sun，以及来自 Anthropic 的 Joel Pobar 和 Sesame AI 的 Johan Schalkwyk，也都陆续加盟。

而网传 Meta 的最新挖人动向，则是他们又成功挖走了 OpenAI 的两员大将，分别是武汉高中曝光评价 Jason Wei 和 Hyung Won Chung。

其中 Jason Wei 曾在 OpenAI 主导参与了 o1/o3 系列模型及 deep research 项目，是强化学习的坚定拥护者，同时也是 2022 年“Emergent Abilities”（涌现能力）概念的开创者之一。他在思维链（Chain-of-Thought）等前沿技术上的贡献广受认可。而 Hyung Won Chung 同样是 OpenAI 的核心研究员，深度参与了 o1 系列与 deep research 项目，研究方向主要聚焦于推理能力（reasoning）与智能体（agents）。

Meta 重金抢人，明星云集就能复制 DeepSeek 的成功吗？

据报道，目前两人的 OpenAI 内部 Slack 账号已被注销，基本坐实了离职消息。更惊人的是，据称 Meta 为吸引这两位 AI 顶尖科学家，直接开出了高达 3 亿美元的四年期薪酬包，可见其对“超级智能”战略的重视与投入之大。

不少人感慨“大厂要拼命了”“AI 人才再次供不应求”，但也有人冷静指出：大家关注的不是 Meta 的产品愿景、人才密度，而是它开出的高薪。

这就很耐人寻味，为什么我们对“只要聚集足够多聪明人就能做出伟大成果”这件事不再那么有信心了？

因为，现实一次次证明：人多、人强≠结果好。

世界大战中，团队比个人重要

OpenAI 推出 ChatGPT 时，所有人都关注它的技术、以及背后的组织力，但由于当时 OpenAI 云集的世界知名大神很多，所以组织力的归因占比还不算最突出。但在 DeepSeek 这样一个神秘又主要凝聚中国本土 C9 高校学者的团队冒出后，所有人都无法再忽视这样的一个事实：

在像 AGI 这样的大规模团队作战形式中，个人能力拔尖不如组织能力拔尖重要。

回顾人工智能的发展史，曾像 Meta 一样集结超多杰出人才的团队不胜枚举：MSRA、DeepMind、谷歌、百度、智源……乃至大模型时代，近两年腾讯、字节也都曾组织过各个方向的杰出人才组成大团队，但最终都要么人才四散而去、要么组织目标由高降低、要么做出一两件大新闻后泯然众人。

背后的原因众多，有企业的文化架构问题，有行业变化影响，但往往也容易出现一个普遍的现象，即：优秀人才之间的离散与斗争。

最终，强人集合没有产生加倍的效果，反而天才之间可以互相抵消。

每个牛人都有一套成熟的认知系统、经验路径和话语权构建逻辑，而伟大的突破往往来自对路径的反常识性挑战。如果组织没有“容错机制”，牛人越多，分歧越大，行动越慢。

一群彼此不服、各自为营的聪明人凑在一起，容易像一场永不散场的学术讨论会，而不是一个能落地的工程团队。

DeepSeek 是一个有意思的反例。它没有明星科学家，没有学术巨擘撑场，成员年轻，团队规模小（基础研究员在 150 人左右）、扁平化、没有打卡、没有层层 KPI 管理，创始人亲自下场撸代码，文化更像一个纯粹的研究小组。

直到推出 V3，外界还认为它只是在“巨人肩膀上摘果子”，但当 R1 发布、实现推理性能超越时，它直接被推到了行业第一梯队。

DeepSeek 的成功，并不是因为他们“比别人更聪明”，而是因为他们“比别人更敢干、更能协同”。从组织的角度来看，DeepSeek 几乎反其道而行：

极致扁平：没有层层结构，没有 KPI 内卷，反而激发了探索欲。

投入纯粹：大家都在搞基础研究，不用分心“交付”“商业”“报表”。

执行高效：一群动手能力超强的人每天都在干正事，不在做汇报。

认知一致：没有“上下级权威差”，只有“想清楚再动手”的共识。

对比之下，过去两年，字节 Seed 的团队曾一度多达 1000 人，大模型创业公司的基础模型团队虽控制在一百来人的规模、但同样要背负商业交付与产品支持的压力，因此难以构建起“高信任、低管理、强动机”组织模型。最终，DeepSeek 的第一轮胜出，几乎是注定的。

组织力 ≠ 人力总和，而是效率乘积

我们很容易陷入“能力总和论”陷阱：觉得一个组织的战斗力 = 每个人的能力总和 × 工作时间。但事实更接近于：组织战斗力 = 协同效率 × 方向一致性 × 持续稳定性。

换句话说：牛人越多，协同越难，任务越复杂，扁平化越重要。

所有大厂与模型团队的人都在看下一轮基础模型的竞争力，一种直觉的观点认为：大厂同样不缺人、不缺钱、不缺卡甚至不缺场景与数据，战斗力也不应该低于 DeepSeek。但如果将不同团队的研究日常作对比，就不难发现，实际上纯以 AGI 为研究目标的团队与复杂大厂之间的差距。

如果将人才的能力水平从 0 到 100 分划分，单人每天平均研究投入时间为 0 到 14 个小时，那么人才组织与产出的公式就可以清晰转化为效率的乘积：

假设在 DeepSeek 团队中，专注基础研究的年轻博士能力可以打 70-80 分，Top 大模型研究选手如张正彦这样基础理论与实践能力兼具的研究员是 100 分，那么 DeepSeek 的整体平均水平约为 85 分。同时 DeepSeek 没有商业化压力，150 人团队可以每天平均集中投入 12 个小时做基础研究。

对比一个千人研究团队的大厂，基础研究人员与工程师的战斗力由高到低不等，加上大团队意味着管理压力大，算平均值 60 分。且由于要花时间做商业化交付与应用产品支持，1000 人的团队平均每人每天可能最多只能投入 6 个小时做基础研究。

那么基础研究总投入来看，DeepSeek 与大厂的对比实际是：150*85*12 VS 1000*60*6。

除了客观可量化的投入，组织效率、协同成本、执行张力这些更难量化的变量，也是决定战斗力的关键。

如果 DeepSeek 拥有近乎满分的执行效率，记作 1.0，而大厂在目标分散、协作链条冗长等影响下，组织效率只有 0.2，那最终真正释放出来的有效产出会是：

DeepSeek：153000 × 1 = 153000

大厂团队：360000 × 0.2 = 72000

如此来看，其实不难发现 Deepseek 在基础问题的研究投入与产出预期上，实际上是比大厂要多得多。

这也就解释了，为什么 DeepSeek 一个 150 人的小团队，反而能做出一鸣惊人的成果，而一些大厂的千人团队，却因为组织结构复杂、任务重心分散，反而削弱了在基础研究上的真实投入。

再次回到 Mate 花大钱买人的这个事情上，其中有一个非常容易被忽视的变量：动机的成分到底是什么？

Meta 的超高薪能买来聪明人，但买不来“持续愿意干活”的动机。DeepSeek 为什么让人愿意拼 14 个小时？不是因为钱给得最多，而是因为愿景真实、结构自由、成果看得见。

如果动机只建立在薪水上，个体会进入“被动等待回报”的状态，但如果动机来自共创、掌控感和对问题的真实兴趣，反而会激发内驱。

而 Meta、Google 等大型科技公司的问题在于——他们的组织系统已经高度僵化，即使有牛人加入，也只能发挥一小部分。