“荀子”大模型简介
12月12日,南京农业大学信息管理学院王东波教授研究团队在北京发布“荀子”古籍大语言模型。荀子”古籍大语言模型是该团队在国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”的支持下,联合中华书局古联公司推出的专门进行古籍处理与研究的智能工具。该模型包含《四库全书》在内的绝大多数传世古籍文献,拥有超过20亿字的大型语料库。
据介绍,“荀子”古籍大语言模型以古籍智能化研究为目的,为古籍智能处理而设计,在推动我国古籍研究与保护工作创新发展、提高中华传统文化传承的效率与质量、实现大语言模型与古籍处理的深度融合上提供重要支撑。该模型作为开源公益研究成果已在GitHub、ModelScope等网站发布,用户可免费下载部署使用。
本次荀子系列模型开源包括两个部分:基座模型XunziALLM与对话模型XunziChat,模型的调用方式与阿里云的Qwen系列大模型一致。
“荀子”大模型概览
- 诗歌生成:荀子模型还具备诗歌生成的能力,能够根据给定的主题或关键词,自动生成符合语法规则和韵律要求的古诗,为诗词爱好者提供创作灵感。
- 古籍高质量翻译:对于那些难以理解的古籍文献,荀子模型能够提供高质量的翻译服务,帮助研究人员更好地理解原文含义。
- 阅读理解:荀子模型能够对给出的古文文本进行分析解释,实现对古籍文本的自动阅读。
- 词法分析:荀子模型可以完成古籍文本的自动分词和词性标注,能够有效提升语言学工作者的研究效率。
- 自动标点:荀子大模型可以快速完成古籍文本的断句和标点,提升研究者以及业余爱好者对古籍文本的阅读体验。
“荀子”大模型项目地址
开源地址:https://github.com/Xunzi-LLM-of-Chinese-classics/XunziALLM
基座模型XunziALLM:https://modelscope.cn/models/Xunzillm4cc/Xunzi-Qwen
对话模型XunziChat:https://modelscope.cn/models/Xunzillm4cc/Xunzi-Qwen-Chat
© 版权声明
文章版权归作者所有,未经允许请勿转载。
THE END
暂无评论内容