刚刚,Anthropic正式发布Claude 3模型!
据介绍,Claude3共推出了三款尖端模型:Claude 3 Haiku、Claude 3 Sonnet以及Claude 3 Opus,按性能递增排列。
目前,Opus 和 Sonnet 现已可在 claude.ai 和 Claude API 中使用,后者现已在 159 个国家普遍可用。Haiku 即将推出。
经过实际测试,claude.ai窗口已经提示使用Claude 3 Sonnet进行免费交互。Claude 3 Opus仍是付费订阅,目前的订阅价格为$20/month,与gpt-4价格相当。
官方公布API价格,最小版本Haiku输入定价$0.25 / MTok,Opus的定价为 $15 / MTok。
根据官方公布的评测结果,目前最优的Claude 3 Opus大模型,在本科水平的专业知识(MMLU)、研究生水平的专家推理(GPQA)、基础数学(GSM8K)等能力基准测试中,均超过GPT-4
此外在文件视觉格式,包括照片、图表、图形和技术图表识别方面都有不错的表现
同时官方表示,Claude 3模型在分析和预测、细致内容创作、代码生成以及像西班牙语、日语和法语这样的非英语对话方面都显示出更强的能力。
在以下几个方面明显提升:
- 即时响应:支持实时的客户聊天、自动补全和数据提取任务。其中Haiku是最快,目前成本最低的模型,可以在不到3秒的时间内阅读一篇包含图表的信息和数据密集型arXiv研究论文(~10k个token)。Sonnet的速度比Claude 2和Claude 2.1快2倍,Opus提供与Claude 2和2.1相似的速度,但智能水平更高。
- 视觉能力:处理各种视觉格式,包括照片、图表、图形和技术图表的能力提升。
- 拒绝回答变少:上下文的理解能力有一定提升,Opus、Sonnet 和 Haiku 拒绝回答系统护栏提示的可能性变小。
- 回答准确性提升:与 Claude 2.1 相比,Opus 在这些具有挑战性的开放式问题的准确性(或正确答案)方面提高了两倍,同时也减少了错误答案的水平。同时将很快在 Claude 3 模型中启用引用,以便可以指向参考资料中的精确句子来验证答案。
- 支持更大的上下文窗口:Claude 3 模型系列在发布时最初将支持 200K 上下文窗口,所有三个模型都能够接受超过 100 万token的输入。
加持了Claude 3的大模型效果到底如何?第一时间进行了上手实测。
Claude Sonnet 上手实测
提到的速度提升,我实测了一篇8页的论文,仅用了不到20s就完成了内容的归纳总结。
针对于提升比较明显的识别功能也进行了测试,识别的效果十分不错,后续可以试试作为OCR识别工具的体验
但在一部分的推理问题上的表现还是会有问题,比如一个房间里有1000本书,读完两本书后,房间还剩了多少本书的问题,没有给出预期的答案。
当然网上,一些解决谜题的答案还是成功给出了答案
整体效果体验着实还不错
而在Cluade 3的下方纷纷@奥特曼
还有网友开玩笑表示等待过几个小时GPT-5发布
或许这个时候该问问OpenAI,GPT-5在路上了吗?
Claude 3体验地址:https://claude.ai/
已经看到这里了,如果这篇文章对你有帮助,欢迎点赞,分享,在看!👇
暂无评论内容