AIBetas消息,2023年9月25日,百川智能发布了其全新闭源大模型——Baichuan2-53B,该模型在原有 Baichuan-53B 的基础上进行了全方位升级,表现出在数学和逻辑推理等方面的显著优势。据悉,Baichuan2-53B 采用了高质量的数据体系和搜索增强技术,大大降低了模型的幻觉问题,成为目前国内幻觉问题最低的大模型。
作为首批通过备案的大模型企业,百川智能在本次发布会上同样宣布了 Baichuan2-53B API 接口的开放,这标志着百川智能正式进军 To B 领域,开始了全新的商业化进程。借助 Baichuan2-53B 的强大模型能力,百川智能计划赋能给各行各业的合作伙伴,助推万千企业智能化发展。Baichuan2-53B 是继 Baichuan-53B 之后,百川智能发布的第六款大模型。
百川智能于2023年8月8日发布Baichuan-53B搜索增强大模型,模型在知识问答、文学创作等方面表现优异,展现出商业文案创作(邮件撰写、公司命名、营销文案生成)、文学创作(故事续写、诗词创作)、中文理解(语义识别、成语含义、诗词分析)等多种任务场景下的强大能力。
大模型的数学和逻辑推理能力一直是业内的关注焦点,也是评价一款大模型是否领先的重要指标。在Baichuan-53B的基础上,Baichuan2-53B不仅重点强化了以上两个维度的能力,并且对整体能力进行了全面升级。其中,逻辑推理能力提升100%,数学能力提升31%,语言理解能力提升29%,文本创作提升18%,知识问答提升9%。
幻觉是大模型落地应用必须跨越的鸿沟。通常而言,解决这一问题有两种方式,一种是不断增加模型的数据规模、提升数据质量;另一种是通过调用搜索等外部工具让模型能够获取实时信息。
Baichuan2-53B在这两个方面均做了大量优化。高质量数据构建方面,Baichuan2-53B独创了一套数据质量体系。以低质、优质为标准将数据进行分类,确保模型始终使用优质数据进行预训练。
除了能力全面升级,Baichuan2-53B 还开放了API接口,企业和开发者可以通过API将Baichuan2-53B集成至他们的应用程序和服务中。Baichuan2-53B 的 API 调用服务采用按照时间段分档收费的方式:
- 每日的 8:00 至 24:00,按照每千 tokens 0.02 元的方式收费;
- 每日的 00:00 至 8:00 期间,按照每千 tokens 0.01 元的方式收费。
暂无评论内容