Llama 模型概览
发布时间 | 2023年2月24日 |
最新版本 | Llama 2 |
英文全称 | Large Language Model Meta AI |
更新时间 | 2023年7月19日 |
参数量级 | 700亿 |
所属公司 | Meta |
模型官网 | Llama 2 – Meta AI |
开源地址 | https://github.com/facebookresearch/llama |
Llama模型简介
Meta Llama是Meta(原Facebook)公开发布的一个大语言模型,用于帮助研究人员推进人工智能的子领域。它有多个版本,参数量从70亿到650亿不等。它是一个开源和免费的平台,旨在加速创新和探索大语言模型的潜在用途和挑战。
Meta Llama是基于Transformer架构训练的,使用了20种最常用的语言,包括拉丁语和西里尔语1。它可以处理多种自然语言处理任务,如文本生成、阅读理解、数学推理、蛋白质结构预测等。它还可以生成图像,提供多模态的交互能力。
Meta Llama是一个基础模型,可以根据不同的需求进行微调和优化。Meta和Microsoft已经建立了合作伙伴关系,将Microsoft作为Llama的首选合作伙伴,提供计算资源和技术支持。
Llama 模型发展历程
2023年2月24日,作为Meta对开放科学的承诺的一部分,Meta公开发布了Llama,这是一种最先进的基础大型语言模型,旨在帮助研究人员推进这个人工智能子领域的研究工作。
2023年7月19日,Meta Llama2正式发布,免费可商用,相较于Llama1,Llama 2的训练参数增加了40%,上下文长度翻倍,Llama 2模型在2万亿tokens上训练得到。
Llama 2.0模型官网
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容