|
|
百川智能开源中英文大模型只需登记即可商用 |
|
作者:佚名 文章来源:本站原创 点击数: 更新时间:2023/7/9 19:27:57 | 【字体:小 大】 |
杨乐乐丝袜日前,由搜狗创始人王小川创立的百川智能方面宣布,推出、并开源拥有 70 亿参数量的中英文预训练大模型 baichuan-7B。据悉,目前 baichuan-7B 大模型已在 Hugging Face、Github 以及 Model Scope 平台发布。
据了解,为验证该模型的各项能力,baichuan-7B 在 C-Eval、AGIEval 和 Gaokao 三个最具影响力的中文评估基准进行了综合评估,并且均取得了优异的成绩,已成为同等参数规模下中文表现最优秀的原生预训练模型。其在中文 C-EVAL 的评测中,baichuan-7B 的综合评分达到了 42.8 分,在 AGIEval 评测里的综合评分达到 34.4 分,在 GAOKAO 评测中的综合评分则为 36.2 分。
据悉,由于秉持开源精神,baichuan-7B 的代码采用了 Apache-2.0 协议,模型权重为免费商用协议,因此只需进行简单登记即可免费商用。而 baichuan-7B 此次开源的内容,则包含推理代码、INT4 量化实现、微调代码,以及预训练模型的权重。其中,微调代码方便用户对模型进行调整和优化,推理代码与 INT4 量化实现则有助于开发者低成本地进行模型的部署和应用,预训练模型权重开源后,用户可直接使用预训练模型进行各种实验研究。
目前,北京大学和清华大学已率先使用 baichuan-7B 模型推进相关研究工作,并计划未来与百川智能进入深入合作,共同推动 baichuan-7B 模型的应用和发展。
对此,清华大学互联网司法研究院院长、计算机系教授刘奕群表示,baichuan-7B 模型在中文上的效果表现十分出色,其免费商用的开源方式也展现出了开放的态度,不仅贡献社区、还能推动技术发展。据其透露,该团队计划正基于 baichuan-7B 模型开展司法人工智能领域的相关研究。
北京大学人工智能研究院助理教授杨耀东认为,baichuan-7B 模型的开源将对于中文基础语言模型的生态建设,以及学术研究产生重要推动作用。同时他表示,将持续关注相关领域探索,并且在中文大语言模型的安全和对齐上进行进一步深入研究。
百川智能 CEO 王小川则表示, 此次开源模型的发布是百川智能成立 2 个月后的第一个里程碑,对百川智能而言是一个良好的开局。baichuan-7B 模型不仅能为中国的 AGI 事业添砖加瓦,也将为世界大模型开源社区贡献新的力量。
|
|
栏目文章
|
|
|