深言科技联合清华大学NLP实验室开源语鲸LingoWhale-8B模型

AIBetas消息,11月3日,深言科技宣布由深言科技与清华大学NLP实验室共同研发的语鲸LingoWhale-8B模型(下称LingoWhale-8B)已面向社会开源。LingoWhale-8B模型是拥有约80亿参数的中英双语大语言模型,在C-Eval、MMLU、CMMLU等多个权威的公开评测基准上,在10B以下开源模型中达到领先效果。

LingoWhale-8B模型简介

LingoWhale-8B是深言科技与清华大学NLP实验室共同推出的语鲸系列大模型中首个开源的中英双语大语言模型。

LingoWhale-8B模型在数万亿token的高质量中英数据上进行预训练,具有强大的基础能力,在多个公开评测基准上均达到领先效果。在预训练阶段,模型使用8K的上下文长度进行训练,能够完成更长上下文的理解和生成任务。LingoWhale-8B模型对学术研究完全开放,开发者通过邮件申请并获得官方商用许可后,即可免费商用

LingoWhale-8B模型测评

截至10月24日,在中文领域权威评测C-Eval中,LingoWhale-8B模型的性能仅次于GPT-4。在C-Eval、CMMLU、GAOKAO测评中,性能超过GPT-3.5Turbo,在10B以下尺寸模型中性能处于领先位置。

图片[1] - 深言科技联合清华大学NLP实验室开源语鲸LingoWhale-8B模型 - AIBetas

LingoWhale-8B开源地址

GitHub:https://github.com/DeepLangAI/LingoWhale-8B

Huggingface:https://huggingface.co/deeplang-ai/LingoWhale-8B

ModelScope:https://www.modelscope.cn/models/DeepLang/LingoWhale-8B

Wisemodel:https://wisemodel.cn/models/DeepLang/LingoWhale-8B

LingoWhale-8B 模型免费商用申请

地址:https://deeplang.feishu.cn/share/base/form/shrcnzt705EDAvVrmAJUCyg7TIb

© 版权声明
THE END
喜欢就支持一下吧
点赞46分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情

    暂无评论内容