Claude 3重磅发布,GPT-5在路上了么?

Claude 3重磅发布,GPT-5在路上了么?

刚刚,Anthropic正式发布Claude 3模型!

图片[1] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

据介绍,Claude3共推出了三款尖端模型:Claude 3 Haiku、Claude 3 Sonnet以及Claude 3 Opus,按性能递增排列。

图片[2] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

目前,Opus 和 Sonnet 现已可在 claude.ai 和 Claude API 中使用,后者现已在 159 个国家普遍可用。Haiku 即将推出。

经过实际测试,claude.ai窗口已经提示使用Claude 3 Sonnet进行免费交互。Claude 3 Opus仍是付费订阅,目前的订阅价格为$20/month,与gpt-4价格相当。

图片[3] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

官方公布API价格,最小版本Haiku输入定价$0.25 / MTok,Opus的定价为 $15 / MTok。

图片[4] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

根据官方公布的评测结果,目前最优的Claude 3 Opus大模型,在本科水平的专业知识(MMLU)、研究生水平的专家推理(GPQA)、基础数学(GSM8K)等能力基准测试中,均超过GPT-4

图片[5] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

此外在文件视觉格式,包括照片、图表、图形和技术图表识别方面都有不错的表现

图片[6] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

同时官方表示,Claude 3模型在分析和预测、细致内容创作、代码生成以及像西班牙语、日语和法语这样的非英语对话方面都显示出更强的能力。

在以下几个方面明显提升:

  1.  即时响应:支持实时的客户聊天、自动补全和数据提取任务。其中Haiku是最快,目前成本最低的模型,可以在不到3秒的时间内阅读一篇包含图表的信息和数据密集型arXiv研究论文(~10k个token)。Sonnet的速度比Claude 2和Claude 2.1快2倍,Opus提供与Claude 2和2.1相似的速度,但智能水平更高。
  2. 视觉能力:处理各种视觉格式,包括照片、图表、图形和技术图表的能力提升。
  3. 拒绝回答变少:上下文的理解能力有一定提升,Opus、Sonnet 和 Haiku 拒绝回答系统护栏提示的可能性变小。
  4. 回答准确性提升:与 Claude 2.1 相比,Opus 在这些具有挑战性的开放式问题的准确性(或正确答案)方面提高了两倍,同时也减少了错误答案的水平。同时将很快在 Claude 3 模型中启用引用,以便可以指向参考资料中的精确句子来验证答案。
  5. 支持更大的上下文窗口:Claude 3 模型系列在发布时最初将支持 200K 上下文窗口,所有三个模型都能够接受超过 100 万token的输入。
图片[7] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

加持了Claude 3的大模型效果到底如何?第一时间进行了上手实测。

Claude Sonnet 上手实测

提到的速度提升,我实测了一篇8页的论文,仅用了不到20s就完成了内容的归纳总结。

图片[8] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

针对于提升比较明显的识别功能也进行了测试,识别的效果十分不错,后续可以试试作为OCR识别工具的体验

图片[9] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

但在一部分的推理问题上的表现还是会有问题,比如一个房间里有1000本书,读完两本书后,房间还剩了多少本书的问题,没有给出预期的答案。

图片[10] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

当然网上,一些解决谜题的答案还是成功给出了答案

图片[11] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

整体效果体验着实还不错

而在Cluade 3的下方纷纷@奥特曼

图片[12] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

还有网友开玩笑表示等待过几个小时GPT-5发布

图片[13] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

或许这个时候该问问OpenAI,GPT-5在路上了吗?

图片[14] - Claude 3重磅发布,GPT-5在路上了么? - AIBetas

Claude 3体验地址:https://claude.ai/

已经看到这里了,如果这篇文章对你有帮助,欢迎点赞,分享,在看!👇

© 版权声明
THE END
喜欢就支持一下吧
点赞15分享
评论 抢沙发
头像
欢迎您留下宝贵的见解!
提交
头像

昵称

取消
昵称表情

    暂无评论内容