昆仑万维宣布开源“天工”Skywork-13B 系列大模型,0 门槛商用

AIBetas消息,10月30日,昆仑万维今日宣布开源百亿级大语言模型「天工」Skywork-13B 系列,开源了Skywork-13B-Base 和 Skywork-13B-Math 以及对应模型的量化模型,同时开源了Skywork/Skypile-150B数据集。

昆仑万维「天工」Skywork-13B 系列目前包括 130 亿参数的两大模型:Skywork-13B-Base 模型、Skywork-13B-Math 模型.

  • Skywork-13B-Base模型在高质量清洗过滤的3.2万亿个多语言(主要是中文和英文)和代码数据上进行预训练,它在多种评测和各种基准测试上都展现了同等规模模型的最佳效果
  • Skywork-13B-Math模型经过专门的数学能力强化训练。在13B参数规模下,模型在GSM8K评测上得分第一,同时在MATH数据集以及CMATH上也表现优异,处于13B模型顶尖水平。

Skywork/Skypile-150B数据集是根据经过精心过滤的数据处理流程从中文网页中筛选出的高质量数据。本次开源的数据集大小约为600GB,总的token数量约为150B,是目前开源最大中文数据集

天工大模型开源

天工Skywork-13B 系列大模型开源地址

Skywork-13B 下载地址(Model Scope):https://modelscope.cn/organization/skywork

Skywork-13B 下载地址(Github):https://github.com/SkyworkAI/Skywork

© 版权声明
THE END
喜欢就支持一下吧
点赞16 分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情

    暂无评论内容