我的位置: 经济 > 流量研究所 > 文章详情
上海人工智能实验室开源书生·浦语20B模型,消费级GPU即可运行
分享至:
 (14)
 (0)
 收藏
来源:上观新闻 作者:查睿 2023-09-20 21:37
摘要:20B量级模型具备更强大的综合能力。

9月20日,上海人工智能实验室等机构发布书生·浦语大模型(InternLM)200亿参数版本InternLM-20B,并在阿里云魔搭社区开源首发、免费商用。

书生·浦语(InternLM)大语言模型由上海人工智能实验室联合多家机构共同推出。今年6月,InternLM千亿参数(104B)语言大模型首次发布,现已经历多轮升级。7月,上海人工智能实验室开源书生·浦语70亿参数的轻量级版本InternLM-7B,且在业内率先开源贯穿数据、预训练、微调、部署和评测的全链条工具体系。本次发布的InternLM-20B是一款中量级大模型,相较于InternLM-7B,其理解能力、推理能力、数学能力、编程能力等都有显著提升。

相比于此前国内陆续开源的7B和13B规格模型,20B量级模型具备更强大的综合能力,复杂推理和反思能力尤为突出,能为实际应用场景提供更有力的性能支持;同时,20B量级模型可在单卡上进行推理,经过低比特量化后,可运行在单块消费级GPU上,因而在实际应用中更为便捷。

相比于此前的开源模型,InternLM-20B能以不足1/3的参数量,测评成绩达到了Llama2-70B的水平,同时支持数十类插件,上万个API接口功能,还具备代码解释和反思修正能力。另外,InternLM-20B在研发训练的过程中,研究团队进行了基于SFT和RLHF两阶段价值对齐,并通过专家红队的对抗训练大幅提高其安全性。

栏目主编:李晔 题图来源:上观题图 图片编辑:雍凯
上一篇: 没有了
下一篇: 没有了
  相关文章
评论(0)
我也说两句
×
发表
最新评论
快来抢沙发吧~ 加载更多… 已显示全部内容
上海辟谣平台
上海2021年第46届世界技能大赛
上海市政府服务企业官方平台
上海对口援疆20年
举报中心
网上有害信息举报专区
关注我们
客户端下载