商汤科技发布“书生 · 浦语”大模型 中文考试超越 ChatGPT
导读:【CNMO 新闻】大模型的热潮正席卷各行各业,据 CNMO 了解,近日,行业领先的人工智能软件公司商汤科技与上海 AI 实验室等发布了 " 书生 · 浦语 " 大模型。
【CNMO 新闻】大模型的热潮正席卷各行各业,据 CNMO 了解,近日,行业领先的人工智能软件公司商汤科技与上海 AI 实验室等发布了 " 书生 · 浦语 " 大模型。
商汤科技
据媒体报道,商汤科技、上海 AI 实验室联合香港中文大学、复旦大学和上海交通大学发布千亿级参数大语言模型 " 书生 · 浦语 "(InternLM)。据悉," 书生 · 浦语 " 具有 1040 亿参数,基于 " 包含 1.6 万亿 token 的多语种高质量数据集 " 训练而成。
从全面评测结果来看," 书生 · 浦语 " 不仅在知识掌握、阅读理解、数学推理、多语翻译等多个测试任务上表现优秀,而且具备很强的综合能力。其在综合性考试中更是表现突出,在多项中文考试中取得超越 ChatGPT 的成绩,其中就包括中国高考各个科目的数据集。
CNMO 获悉,早在今年 3 月,商汤科技便发布了多模态多任务通用大模型 " 书生(INTERN)2.5"。据官方介绍," 书生 2.5" 实现了通过文本来定义任务,并根据给定视觉图像和任务的提示性语句,给出相应的指令或作答,进而具备通用场景下的高级感知和复杂问题处理能力,比如图像描述、视觉问答、视觉推理和文字识别等。此外,其还可根据用户提出的文本创作需求,利用扩散模型生成算法,生成写实图像。
据悉," 书生 2.5" 在图文跨模态领域的性能表现来自于视觉、语言及多任务建模三大模型能力的有效融合。此次最新发布的千亿级参数大语言模型 " 书生 · 浦语 ",想必和 " 书生 2.5" 大模型有一定联系。
版权声明:本文部分来自互联网,由小编精心所写,本文地址:http://www.zhubian88.cn/smbk/90771.html,如需转载,请注明出处!