阿里版 ChatGPT 已进入测试!中文聊天截图曝光,达摩院出品
导读:谷歌硬刚 ChatGPT 消息一出,科技圈全坐不住了。 就在昨晚,阿里百度网易京东一众公司全宣布要推出类 ChatGPT 新产品,战况那叫一个激烈。 阿里内测中的达摩院
谷歌硬刚 ChatGPT 消息一出,科技圈全坐不住了。
就在昨晚,阿里百度网易京东一众公司全宣布要推出类 ChatGPT 新产品,战况那叫一个激烈。
阿里内测中的达摩院版 ChatGPT,也被提前曝光。
竟然连画画技能都具备了?!
ChatGPT 类型的对话功能,同样不在话下。先来个 NBA 话题铺垫:
当被问到 " 乔丹和科比谁更伟大 " 时,开始暴露篮球迷身份,连 " 毋庸置疑 "、" 奉为神迹 " 这种话都出来了:
还是个乔丹死忠粉,能对你老婆的观点提出异议(手动狗头)
看起来这个达摩院版 ChatGPT,不仅有纯文本任务能力,还融合了多模态任务能力。
这究竟采用了什么样的技术?阿里这次内测中的类 ChatGPT 产品,能力如何?
基于通义融合升级
据透露,新产品可实现的功能包括知识问答、AI 绘画、代码生成、小说续写、文案撰写、写诗作词等。
一言以蔽之,不仅 ChatGPT 具备的能力它都能实现,而且多了 "AI 绘画" 这项功能。
能取得这样的多任务、跨模态效果,背后本质上离不开阿里通义大模型的能力。
新达摩院版 ChatGPT,正是基于通义大模型体系进行融合升级。
据报道,推出的通义大模型底座基于统一学习范式 OFA 等底层技术打造,具备了能搞定多种任务的 " 大一统 " 能力:
不引入新增结构,单一模型即可同时处理图像描述、视觉定位、文生图、视觉蕴含、文档摘要等 10 余项单模态和跨模态任务。
升级后,更是可以处理超过包括语音和动作在内的 30 多种跨模态任务。
这里 " 大一统 " 技术的关键,在于提出并实现了三个 " 统一 ":
架构统一。使用 Transformer(encoder-decoder,编解码器)架构,统一进行预训练和微调,无需在应对不同任务时,增加任何特定的模型层。
模态统一。不管是 NLP、CV 这种单模态,还是图文等多模态任务,全都采用同一个框架和训练思路。
任务统一。将所有单模态、多模态任务统一表达成序列到序列(Seq2seq)生成的形式,同类任务的输入几乎就是 " 一个模子里刻出来的 "。
目前推出的通义大模型,在电商跨模态搜索、AI 辅助设计、法律文书学习、医疗文本理解、开放域人机对话等 200 多个场景中应用落地时,均能达到 2%~10% 的效果提升。
从阿里的研发来看,他们实际上于 2020 年左右已经开始布局此类技术研究。
2021 年推出 " 中文版 GPT-3"PLUG,参数量 270 亿,但跟 GPT-3 一样是 " 万能写作神器 "。
例如这是小说续写的效果:
去年,阿里 AliceMind 模型更是在 CLUE 榜单的AI 中文语言理解任务上得分首超人类,获得了 86.685 高分。
CLUE 榜单会从文本分类、阅读理解、自然语言推理等 9 项任务中全面考核 AI 模型的语言理解能力,但参评 AI 模型一直未能超越人类成绩,AliceMind 则一举在 4 项任务中超过了人类水平。
国内厂商纷纷追逐 ChatGPT
所以,此次推出类 ChatGPT 产品,阿里究竟是怎么想的?
其实阿里通义大模型体系中,有不少模型都已经在魔搭社区开源。
魔搭社区由阿里达摩院与 CCF 开源发展委员会共同发起,目前社区内有 300+ 模型上线,其中包括 10 多个大模型和 150+ SOTA 模型,其中三分之一都支持中文。
但据知情人士透露,阿里长期以来的目标依旧没变:
打造中文 ChatGPT 的生态,这个定义对于阿里来说可能窄了一点。相比之下,阿里更希望能引领中文大模型的发展趋势。
不止阿里,包括百度、网易、京东等各科技大厂也都已经坐不住了。
百度正在对类 ChatGPT 产品 " 文心一言 " 进行内部测试,官方宣布测试完成时间在 3 月左右,但是否会因为这波热度提前还不好说。
网易也剧透,未来网易有道可能会推出 ChatGPT 同源技术产品,主要在在线教育一块实现应用。
京东集团副总裁何晓冬则表示,京东是加速 AIGC 和 ChatGPT 规模化落地的最佳场景,未来借助这一系列成果,将加速 AI 在国内的应用落地。
这波国内外厂商的 ChatGPT 热潮,很快就要起来了。
版权声明:本文部分来自互联网,由小编精心所写,本文地址:http://www.zhubian88.cn/smbk/76721.html,如需转载,请注明出处!