搜索
当前所在位置:首页 >> 时尚

【快手大V吐槽合集合集】独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元

发布时间:2025-09-13 13:15:44 作者:pa 点击:798 【 字体:


近日,端侧模型关于字节跳动大语言模型研发技术专家杨红霞离职创业的杨红业入事情,坊间传得沸沸扬扬。霞创

雷峰网独家获悉,局投杨红霞已于 5 月下旬正式从字节跳动离职,后估开始筹备 AI 创业项目。值亿快手大V吐槽合集合集不过,美元杨红霞不做“大”模型,端侧模型而是杨红业入将方向瞄准端侧模型,布局 AI Agent。霞创目前,局投团队正在筹备组建中,后估已获得 3000 至 4000 万美元的值亿投资,投后估值 1.5 亿美元。美元

此前,端侧模型杨红霞为大家所熟知的是,她曾是阿里达摩院万亿参数规模多模态预训练模型 M6 的技术负责人,参与过北京智源研究院主导的“悟道”大模型项目,而该项目是越南旅游妹整套流出中国最早的大模型项目之一。

在字节跳动的大模型队伍中,杨红霞的学术气质较为突出。据雷峰网(公众号:雷峰网)梳理,字节大模型团队的核心成员主要是在字节抖音、西瓜等产品内部成长起来的骨干。

2007 年,杨红霞从南开大学本科毕业后,赴杜克大学攻读博士,师从著名统计学家 David Dunson,著有超过 100 篇杰出学术论文。

博士毕业后,杨红霞入职 IBM 全球研发中心任 Watson 研究员,之后又加入雅虎公司,担任首席数据科学家。

2016年,杨红霞回国加入阿里达摩院,就职期间杨红霞的职级为 P9,曾任达摩院智能计算实验室主任,作为技术负责人,一路见证了 M6 从百亿、千亿进化到万亿参数量规模。

去年年初,杨红霞加入字节跳动 AML(Applied Machine Learning,机器学习系统),向团队的负责人项亮汇报,带领一支大约 40 人的团队。

如今,杨红霞身上又多了一层创业者的身份。

今年以来,通用大模型格局逐渐收缩,落地应用成为主旋律,越来越多的目光开始瞄向行业、端侧大模型。而端侧模型,主要应用在手机、电脑、智能网联汽车等终端设备上,具有成本低、移动性强、数据安全等优势,正逐渐成为行业追逐的热门话题。

今年 2 月,清华 THUNLP 走出的 AI 公司——面壁智能推出 20 亿参数的开源端侧模型 MiniCPM;

4 月,商汤推出 1.8B 参数规模的 SenseChat-Lite 版本端侧⼤模型;

5 月,来自斯坦福大学的 NEXA AI 团队发布了全球首个参数量小于 10 亿的多模态 AI Agent 模型 Octopus V3,在函数调用性能上远超同类模型,可与 GPT-4V+GPT4 相媲美,更是将端侧模型卷到新高度。

据了解,NEXA AI 团队创始人兼首席科学家陈伟(Alex Chen),正在攻读斯坦福大学博士学位,拥有丰富的AI研究经验;联合创始人兼首席技术官李志远,毕业于斯坦福大学,并在 Google 和 Amazon Lab 126 实验室拥有 4 年端侧 AI 的研发经验。

不管是手机,还是电脑,或者汽车,在人们的生活中都扮演着重要角色,可见,端侧大模型前景广阔,在如何更好地训练出小且好用的端侧模型的新行业命题下,大有可为。


雷峰网原创文章,未经授权禁止转载。详情见转载须知。

独家|杨红霞创业入局“端侧模型”,投后估值 1.5 亿美元

阅读全文
相关推荐

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science

何恺明 MIT 最新演讲:未来工作将聚焦 AI for science
作者 | 黄楠编辑 | 陈彩娴又一名 AI 大神有了新动向!当地时间3月13日下午3点,何恺明在MIT做学术演讲。据现场网友所述,即便自己提前半小时去到现场,但仍挤不进会场,仅排队就拐了几个弯,MIT ...

“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样

“通用大脑”来了!MIT何恺明用大模型思维玩出机器人预训练新花样
在机器人领域,一场关于“通用智能”的探索正如火如荼地展开。MIT 的何恺明和 Lirui Wang 等人最近成功在“通用数据”上取得了进展,让机器人离拥有“通用大脑”的目标又近了一步。机器人数据的异质 ...

Kimi 数理化能跟 o1 掰手腕了?新模型 k1 有点儿强

Kimi 数理化能跟 o1 掰手腕了?新模型 k1 有点儿强
「雷峰网(公众号:雷峰网)消息」今天,月之暗面官方宣布:继 11 月 16 日发布数学模型 k0-math 后,他们又推出了新的视觉思考模型 k1,且「数理化」的能力又上了一个新台阶,实测结果丝毫不输 ...

独家丨字节招兵买马,拟在欧洲设立AI研发中心

独家丨字节招兵买马,拟在欧洲设立AI研发中心
雷峰网(公众号:雷峰网)独家获悉,字节跳动准备在欧洲设立 AI 研发中心。知情人士透露,字节跳动目前已经开始寻找欧洲的 LLM 和 AI 方面技术大牛,积极招揽人才。而纵观欧洲各国的 AI 技术水平, ...

算力存力Buff都叠满,至强6最强形态现身!

算力存力Buff都叠满,至强6最强形态现身!
2024年是至强的大年。先于6月正式发布的至强®️6700E系列开启了全新的、更为简洁命名方式:至强®️6能效核。144核的规格也意味着英特尔在最近几年当中首次在核心数量方面实现了领先。而且,这还并不 ...

为什么是梁文锋做出了DeepSeek?

为什么是梁文锋做出了DeepSeek?
这是2025年开年最火的科技明星,短短几天时间,梁文锋从小到大的种种过往都被展现在世人眼前,包括他来不及装修的新房以及在房子里睡觉用的帐篷,都成为了他独特个性的象征。独特个性固然为人津津乐道,但并不是 ...

千寻智能解浚源:具身智能的 Scaling Law 已跨过起跑线丨具身先锋十人谈

千寻智能解浚源:具身智能的 Scaling Law 已跨过起跑线丨具身先锋十人谈
作者 | 赖文昕编辑 | 陈彩娴不久前,首届“人形机器人半程马拉松”在北京亦庄举办,为本就热度满满的具身智能行业再添了一把火。一共 20 支队伍组成的“钢铁生命竞赛”,让此前集中在实验室 demo 阶 ...

中国首次!高文院士获得 IEEE 社会基础设施创新奖

中国首次!高文院士获得 IEEE 社会基础设施创新奖
作者|朱可轩编辑|陈彩娴近日,IEEE奖励委员会官网(https://corporate-awards.ieee.org/)正式公布了 2025 年度“IEEE技术领域奖”IEEE Technical ...

门板上做研究的首席科学家:Jeff Dean解密谷歌和Gemini背后的故事

门板上做研究的首席科学家:Jeff Dean解密谷歌和Gemini背后的故事
“最开始我就知道谷歌相当有希望,谷歌能发展到现在的规模不过是水到渠成。”这位谷歌首席科学家在谷歌度过了近乎一半的人生,对谷歌的喜爱不减反增,到现在还依然坚守着谷歌最初的愿景并为此奋斗:组织全球信息并使 ...

三大模型巨头比拼思考“幻觉”:DeepSeek 不敌 ChatGPT,Gemini 用词最少

三大模型巨头比拼思考“幻觉”:DeepSeek 不敌 ChatGPT,Gemini 用词最少
近日,智利大学 CIAE 教育研究所的研究员 Roberto Araya 进行了 4 组对照实验:提供相同的提示词,让 Gemini 2.0 Flash、ChatGPT o3-mini、DeepSee ...

清程极智 CEO 汤雄超:训推一体机并非 AI Infra 的未来

清程极智 CEO 汤雄超:训推一体机并非 AI Infra 的未来
早在超算时代,清华大学高性能计算研究中心便一直是解决算力需求相关软件问题的行家。“目前 AI Infra 赛道几家国内厂商中,只有我们有过十万台服务器的超大规模国产算力集群的使用和调优经验。”汤雄超向 ...

实测文小言升级:开始「卷体验」的百度都眉清目秀了

实测文小言升级:开始「卷体验」的百度都眉清目秀了
刚刚无缝接入文心 4.5、文心 X1 和 满血版 DeepSeek-R1 的文小言,转身又整出了新动作。3 月 31 日,文小言迎来了一次全面升级,上新了多模型融合调度、全新语音大模型、图片问答、拍题 ...
返回顶部