AIBetas消息,10月30日,昆仑万维今日宣布开源百亿级大语言模型「天工」Skywork-13B 系列,开源了Skywork-13B-Base 和 Skywork-13B-Math 以及对应模型的量化模型,同时开源了Skywork/Skypile-150B数据集。
昆仑万维「天工」Skywork-13B 系列目前包括 130 亿参数的两大模型:Skywork-13B-Base 模型、Skywork-13B-Math 模型.
- Skywork-13B-Base模型在高质量清洗过滤的3.2万亿个多语言(主要是中文和英文)和代码数据上进行预训练,它在多种评测和各种基准测试上都展现了同等规模模型的最佳效果。
- Skywork-13B-Math模型经过专门的数学能力强化训练。在13B参数规模下,模型在GSM8K评测上得分第一,同时在MATH数据集以及CMATH上也表现优异,处于13B模型顶尖水平。
Skywork/Skypile-150B数据集是根据经过精心过滤的数据处理流程从中文网页中筛选出的高质量数据。本次开源的数据集大小约为600GB,总的token数量约为150B,是目前开源最大中文数据集。
天工Skywork-13B 系列大模型开源地址
Skywork-13B 下载地址(Model Scope):https://modelscope.cn/organization/skywork
Skywork-13B 下载地址(Github):https://github.com/SkyworkAI/Skywork
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容