搜索
当前所在位置:首页 >> 时尚

【泰国留学生群聊截图】昆仑万维开源「天工」13B系列大模型,0门槛商用

发布时间:2025-09-13 14:33:48 作者:ydk 点击:341 【 字体:

10月30日,昆仑开源昆仑万维宣布开源百亿级大语言模型「天工」Skywork-13B系列,天工并罕见地配套开源了600GB、模型门槛150B Tokens的商用超大高质量开源中文数据集。

昆仑万维「天工」Skywork-13B系列目前包括130亿参数的昆仑开源两大模型:Skywork-13B-Base模型、Skywork-13B-Math模型,天工泰国留学生群聊截图它们在CEVAL,模型门槛 GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,商用在中文科技、昆仑开源金融、天工政务等领域表现均高于其他开源模型。模型门槛

Skywork-13B下载地址(Model Scope): https://modelscope.cn/organization/skywork

Skywork-13B下载地址(Github): https://github.com/SkyworkAI/Skywork

除模型开源外,商用Skywork-13B系列大模型还将开源600GB、昆仑开源150B Tokens的天工高质量中文语料数据集Skypile/Chinese-Web-Text-150B,这是模型门槛越南外派女员工视频目前最大的开源中文数据集之一。

同时,昆仑万维「天工」Skywork-13B系列大模型即将全面开放商用——开发者无需申请,即可商用。

130亿参数、两大模型、最大中文数据集之一、全面开放商用。昆仑万维「天工」Skywork-13B系列大模型堪称业内开源最彻底的百亿高质量商用模型。

Skywork-13B系列大模型的开源将为大模型的场景应用和开源社区发展提供最佳技术支持,降低大模型商业门槛,推动人工智能技术落地千行百业,为人工智能生态建设添砖加瓦,携手开源社区探索未知世界、创造美好未来。

两大模型 领先行业

昆仑万维「天工」Skywork-13B系列包括两大模型及150B高质量中文数据集。

  • Skywork-13B-Base模型是Skywork-13B的基础模型,其经由3.2万亿个多语言高质量数据训练,在CEVAL, CMMLU, MMLU, GSM8K等评测与基准测试上都展现了同等规模模型的最佳效果。

  • Skywork-13B-Math模型经过专门的数学能力强化训练,在GSM8K等数据集上取得了同等规模模型的最佳效果。

  • Skypile/Chinese-Web-Text-150B数据集。该数据集是根据我们经过精心过滤的数据处理流程从中文网页中筛选出的高质量数据。本次开源的数据集大小约为600GB,总token数量约为(1500亿),是目前最大得开源中文数据集之一。

除此之外,Skywork-13B系列还公开了模型中使用的评估方法、数据配比研究和训练基础设施调优方案等。希望这些开源内容能够进一步启发社区对于大型模型预训练的认知,并推动人工智能通用智能(AGI)的实现。

五大特点 全面超越

昆仑万维「天工」Skywork-13B系列大模型在CEVAL, GSM8K等多个权威评测与基准测试上都展现了同等规模模型的最佳效果,其中文能力尤为出色,在中文科技、金融、政务等领域表现均高于其他开源模型。

Skywork-13B系列模型的五大特点:

1.最强参数表现:全面超越同等规模大模型

本次开源的Skywork-13B系列模型在CEVAL, CMMLU, MMLU, GSM8K等几大权威评估基准中全面超越LLaMA2-13B等开源大模型,在同等规模大模型间取得最佳效果。(截止至10月25日数据)

昆仑万维开源「天工」13B系列大模型,0门槛商用

2.最多训练数据:3.2T高质量的多语言训练数据

Skywork-13B系列大模型拥有130亿参数、3.2万亿高质量多语言训练数据。模型的生成能力、创作能力和数学推理能力提升明显。

3.最强中文语言建模能力:中文语言建模困惑度评测,超越所有中文开源模型

Skywork-13B系列大模型在中文语言建模方面表现出色,具有优秀的中文文创能力。在中文文本创作领域的评测中,Skywork-13B系列大模型展现出了卓越的能力,尤其在科技、金融、政务、企业服务、文创、游戏等领域均表现高于业内其他开源模型。

昆仑万维开源「天工」13B系列大模型,0门槛商用
上图为不同领域数据下评估模型的困惑度,越低代表模型在该领域建模能力越强。结果显示天工13B在技术文章,电影,政务报告,游戏,金融,通用领域均表现出色

4.最大中文开源数据集之一:150B Tokens高质量中文语料

Skywork-13B系列将配套开源600GB、150B Tokens的高质量中文语料数据集Skypile/Chinese-Web-Text-150B,这是目前最大的开源中文数据集之一。开发者可以最大程度地借鉴技术报告中大模型预训练的过程和经验,深度定制模型参数,有针对性的进行训练与优化。

5.最有诚意的开源商用:无需申请,即可实现商用

目前开源社区中的中文大模型多数并非是完全可商用,一般开源社区用户通常需要进行复杂的商用授权申请流程,在某些情况,甚至有对公司规模、所在行业、用户数等维度有明确规定不给予商业授权。

昆仑万维对Skywork-13B系列开源的开放性和可商用性高度重视,将授权流程做到极简,取消对行业、公司规模、用户等方面的限制,目的是帮助更多对中文大模型感兴趣的用户和企业在行业中不断探索和进步。

此次Skywork-13B系列大模型将全面开放商用许可,用户在下载模型并同意并遵守《Skywork模型社区许可协议》后,无需再次申请授权即可将大模型进行商业用途。希望用户能够更便捷地探索Skywork-13B系列大模型技术能力,探索在不同场景下的商业化应用。

推动开源生态繁荣,让更多开发者们参与到AIGC的技术发展中,在共创和共享中推动技术的提升。

面向AI的时代,蓬勃发展的开源生态建设是构建AI和应用融合的重要一环。降低模型的研发门槛,使用成本,最大化的共享技术能力和经验,让更多的企业和开发者们参与到此次AI引领的科技变革中去。昆仑万维董事长兼CEO方汉是最早参与到开源生态建设的开源老兵,也是中文Linux开源最早的推动者之一,开源的精神和AIGC技术的发展将会在昆仑万维战略中完美融合。

All in AGI与AIGC

All in AGI与AIGC是昆仑万维的战略。

4月17日,昆仑万维发布了中国第一个真正实现智能涌现的国产大语言模型——「天工3.5」,并启动邀请测试。

5月19日,北京市经济和信息化局公布第一批《北京市通用人工智能产业创新伙伴计划成员名单》。昆仑万维凭借在AIGC领域的前沿探索和投资布局,成为第一批模型伙伴和投资伙伴。

8月23日,昆仑万维发布国内第一款AI搜索产品——天工AI搜索。

9月1日,计算机视觉和机器学习领域的国际顶级专家颜水成教授正式加盟昆仑万维,与昆仑万维创始人周亚辉一起出任天工智能联席CEO,并兼任昆仑万维2050全球研究院院长,负责前沿技术的研究。

9月5日,昆仑万维天工大模型在腾讯优图实验室联合厦门大学开展的多模态大语言模型测评中,综合得分排名第一。

9月25日,昆仑万维正式控股艾捷科芯,布局AI芯片。

今天,天工Skywork-13B系列大模型的开源标志着昆仑万维持续投资AGI生态的决心。

雷峰网(公众号:雷峰网)

雷峰网版权文章,未经授权禁止转载。详情见转载须知。

昆仑万维开源「天工」13B系列大模型,0门槛商用

阅读全文
相关推荐

成立996天,MiniMax 每日与世界的30亿次交互

成立996天,MiniMax 每日与世界的30亿次交互
8月31日,“2024 MiniMax Link伙伴日”活动在上海正式举行。本次活动以Link连接)为主题,聚焦AI创新技术发展。活动现场,MiniMax创始人闫俊杰分享了基于MOE混合专家模型)+ ...

Jim Gao:曾助谷歌节能40%的AI专家,如今致力打造“虚拟工厂操作员”

Jim Gao:曾助谷歌节能40%的AI专家,如今致力打造“虚拟工厂操作员”
只是使用了AI就让工厂能耗降低40%是的,你没有看错,就是降低了整整40%,几乎将能耗砍半!这是Jim Gao在Google大型数据中心的一次尝试。这位华人机械工程师巧妙地使用了AI系统辅助控制数据中 ...

JetBrains与阿里云战略合作发布JetBrains AI Assistant:聚焦中国市场开发者,实现开发效率代际提升

JetBrains与阿里云战略合作发布JetBrains AI Assistant:聚焦中国市场开发者,实现开发效率代际提升
9月19日,全球知名的软件开发工具提供商JetBrains在2024云栖大会上正式发布基于阿里云通义大模型的JetBrains AI Assistant,标志着JetBrains在完善其开发工具产品生 ...

揭秘全网刷屏的人形机器人NEO,背后是比特斯拉还猛的AI公司

揭秘全网刷屏的人形机器人NEO,背后是比特斯拉还猛的AI公司
人类一样的外型,能动能跳还能干家务,人工智能界怎么背着我们偷偷搞科研啊?科技公司1X最近推出了一款人形机器人NEO Beta,超静音,号称是专为人类家庭设计打造的全能机器人。根据1X放出来的视频,雷峰 ...

00后创业胡雅婷:相比连续创业者,年轻人的优势是做“新模态”。

00后创业胡雅婷:相比连续创业者,年轻人的优势是做“新模态”。
作者:马蕊蕾编辑:陈彩娴全国信息学奥林匹克竞赛冬令营金牌,签约北京大学计算机系,24岁的胡雅婷,和她的清北团队即将上线4D模型,建造属于他们的4D世界。“不能和成熟的创业者竞争偏传统或较成熟的AI领域 ...

动易科技获千万级融资;曝 OpenAI 首颗芯片:台积电 1.6nm,为 Sora 定制;阶跃星辰上线图像生成大模型丨AI情报局

动易科技获千万级融资;曝 OpenAI 首颗芯片:台积电 1.6nm,为 Sora 定制;阶跃星辰上线图像生成大模型丨AI情报局
今日融资快报人形机器人动易科技完成千万级融资,峰瑞资本和Z基金领投成立于2024年6月的动易科技完成数千万元天使轮融资,由峰瑞资本和Z基金智谱生态基金)领投,多家知名投资机构跟投。公司由具备丰富足式人 ...

阿里云CTO周靖人:阿里云百炼服务客户数从9万增长至23万,涨幅超150%

阿里云CTO周靖人:阿里云百炼服务客户数从9万增长至23万,涨幅超150%
7月5日,在上海世界人工智能大会上,阿里云CTO周靖人公布近期通义大模型和阿里云百炼平台的最新进展。近2个月,通义千问开源模型下载量增长2倍,突破2000万次,阿里云百炼服务客户数从9万增长至23万, ...

GPT新版本猜想:奥特曼草莓图引发推理热潮

GPT新版本猜想:奥特曼草莓图引发推理热潮
昨晚深夜,OpenAI首席执行官奥特曼Sam Altman)在推特上发布了一张草莓的图片,并配文“我喜欢花园里的夏天”。该条推特发布几个小时就斩获百万查看和近千条评论。人们除了在评论区分享奥特曼花园里 ...

北京香山论坛基本准备就绪

北京香山论坛基本准备就绪
国防部新闻发言人今天表示,第十二届北京香山论坛各项准备工作已基本就绪,截至目前,包括越南、新加坡、俄罗斯、法国、尼日利亚、巴西在内的100余个国家防务部门、军队领导以及国际和地区组织代表确认出席。本届 ...

智谱获华策 1 亿元战略投资,打造影视 AI 研究平台;杨红霞入职香港理工大学;蔚来发布中国首个智能驾驶世界模型丨AI情报局

智谱获华策 1 亿元战略投资,打造影视 AI 研究平台;杨红霞入职香港理工大学;蔚来发布中国首个智能驾驶世界模型丨AI情报局
今日融资快报智谱华章获得浙江华策投资战略投资智谱华章是一家AI知识智能技术开发商,由清华大学计算机系知识工程实验室的技术成果转化而来。智谱宣布获得浙江华策投资有限公司的战略投资。华策影视全资子公司华策 ...

智谱获华策 1 亿元战略投资,打造影视 AI 研究平台;杨红霞入职香港理工大学;蔚来发布中国首个智能驾驶世界模型丨AI情报局

智谱获华策 1 亿元战略投资,打造影视 AI 研究平台;杨红霞入职香港理工大学;蔚来发布中国首个智能驾驶世界模型丨AI情报局
今日融资快报智谱华章获得浙江华策投资战略投资智谱华章是一家AI知识智能技术开发商,由清华大学计算机系知识工程实验室的技术成果转化而来。智谱宣布获得浙江华策投资有限公司的战略投资。华策影视全资子公司华策 ...

亚马逊 8000 万美元收购 Perceive AI;昆仑万维发布首个 AI 短剧平台;百川智能成立新公司丨AI情报局

亚马逊 8000 万美元收购 Perceive AI;昆仑万维发布首个 AI 短剧平台;百川智能成立新公司丨AI情报局
今日融资快报AMD以49亿美元收购服务器制造商ZT Systems据报道,AMD已同意以49亿美元现金和股票交易收购人工智能基础设施集团ZT Systems,此举延续了该芯片公司在人工智能领域的投资势 ...
返回顶部