×

澜舟科技开源孟子3-13B大模型支持免费商用

admin admin 发表于2024-05-02 06:04:10 浏览12 评论0

抢沙发发表评论

  北京商报讯(记者杨月涵)4 月 1 日,澜舟科技正式宣布 Mengzi3-13B 开源,对学术研究完全开放,同时支持免费商用。

  今年 3 月 18 日,澜舟科技推出了其"一横N纵"孟子大模型系列及产品体系。其中,"一横"的核心——孟子大模型技术,经过高效迭代后,孟子大模型 V3 版本的 Mengzi3-13B 也正式与大家见面。

  据介绍,相较于今年 1 月发布的孟子大模型 GPT V2 系列(包括孟子大模型-标准、孟子大模型-轻量、孟子大模型-金融、孟子大模型-编码),Mengzi3-13B 在数据集质量上有了显著的提升。其采用的 Mengzi-3 数据集规模高达 3T tokens,涵盖了网页、代码、书籍、论文等多元化、高质量的数据来源。

  在 MMLU、Chinese-MMLU、GSM8K、HUMAN-EVAL 等多项公开数据集进行的模型效果评估中,Mengzi3-13B 均展现出了卓越的性能表现。在参数量 20B 以内的轻量化大模型领域,Mengzi3-13B 在中英文语言能力方面的成绩尤为突出,具备了出色的实用性和高性价比,能更好的满足企业的商业化需求。

群贤毕至

访客