谷歌 Bard 被曝直接抄 ChatGPT 数据,BERT 一作投诉 CEO 后投奔 OpenAI
导读:谷歌这回,可真是出大糗了。 Bard 处处不及 ChatGPT 也就罢了,如今竟然被曝出,为了快速训练这个 ChatGPT 竞品,他们直接使用了 ChatGPT 生成的数
谷歌这回,可真是出大糗了。
Bard 处处不及 ChatGPT 也就罢了,如今竟然被曝出,为了快速训练这个 ChatGPT 竞品,他们直接使用了 ChatGPT 生成的数据。。。
数据来自于一个收集 ChatGPT 对话的公开网站,上面的对话数量超过 11 万。
The Information 爆料,这种操作在谷歌内部不是没人反对。BERT 一作就直接向劈柴哥等高管发出警告,并且明确提示:
这种行为违反了 OpenAI 的服务条款,并且会让 Bard 的回答和 ChatGPT 非常相似。
此后,这位大佬迅速从谷歌离职,转投 OpenAI。
ShareGPT 网站的作者,也佐证了这个消息:" 我知道这事儿有一阵子了。"
并且正因为此,ShareGPT 上周关闭了浏览他人聊天记录的探索功能。
这一锤下来,吃瓜网友当场坐不住了,有人直言谷歌这是犯了大忌。
还有人嘲讽,这下谷歌完全成了 OpenAI 的陪衬。
而谷歌这边,也立马被炸了出来,紧急否认三连:
Bard 没有用任何来自 ShareGPT 或者 ChatGPT 的数据训练。
Bard 自己承认 " 浏览过 "ShareGPT
但谷歌用 ShareGPT 数据训练 Bard 这事儿吧,多少是有迹可循。
比如在上周,ShareGPT突然关闭了浏览他人 ChatGPT 对话的功能。
ShareGPT 本来是一个谷歌插件,能方便人们一键分享自己和 ChatGPT 的对话到各种平台。之后开发者又进一步推出了一个探索页面,可以方便大家互相浏览有趣的对话,因此也成为了一个海量 ChatGPT 数据的聚集地。
随着 The Information 的爆料不胫而走,ShareGPT 的开发者也公开喊话:
秘密终究还是藏不住了吧!
再来看谷歌这边的回应,比较因吹斯听。
虽然他们否认使用过 ShareGPT 或 ChatGPT 的任何数据。但在 The Verge 追问之前是否使用过 ChatGPT 数据做训练时,发言人拒绝回答并表示:
很抱歉我能分享的只有我们昨天的声明。
有消息人士说,在BERT 一作雅各布 · 德福林(Jacob Devlin)和谷歌高管发出警告后,谷歌确实停止使用 ChatGPT 数据训练了。
由此 The Verge 猜测,Bard 里或许已经删掉了之前这部分训练数据。
而如果把这个问题直接抛给 Bard 本身,它的回答同样引人深思。
因为它否认使用过 ChatGPT 的数据。
但承认读过 ShareGPT 的对话……
反倒是 ChatGPT 这边的回答很谨慎体面,表示除非 " 谷歌官方或相关研究人员明确承认了 ",否则它没法作答。
实际上,OpenAI 对于能否使用 ChatGPT 输出数据做训练这件事,有明确的条款说明:
竞品,不行。
但如果是非商用的,比如,应该可以。
在 Alpaca 发布时明确提到,团队是通过购买 OpenAI 的 API 来生成数据集。
由此也就不难理解为啥 BERT 一作雅各布老哥,当初知道谷歌操作后反应如此激烈,甚至直接跑去和劈柴哥发出警告,毕竟这可是明目张胆地违反友商条例。
更何况这么做对 Bard 也不是没有坏处,会导致它生成的答案和 ChatGPT 非常相似……
而在给谷歌 " 吹哨 " 后,雅各布选择了马上提桶跑路转投 OpenAI。1 月份离职,都没等 Bard 发布。
不过这还没完,谷歌的操作还在继续——
因为他们居然和 DeepMind" 一笑泯恩仇 ",联手开发新的大模型来应对 ChatGPT 了。
要知道,虽然 DeepMind 从 2014 年就被谷歌收购了,但它一直都保持高度独立运营,和谷歌的开发团队时常保持着竞争关系。
但在 ChatGPT 热潮下,谷歌和 DeepMind 如今的局面都颇为被动。
由此也就看到了这次罕见联手,DeepMind 和谷歌大脑团队合作,共同开发一个名为Gemini(双子座)的大模型。
据悉,这个模型对标 GPT-4,参数量大约在 1 万亿左右。谷歌大脑负责人 Jeff Dean 领衔技术开发,负责代码编写等工作。
网友:暂停大模型研究 6 个月根本不可能
谷歌这一波操作下来,外界也有些目瞪狗呆。
就有网友提出:Gemini 的出现,是不是意味着谷歌已经放弃 Bard 了?
放不放弃不好说,但至少,谷歌内部的 " 赛马 " 已现端倪。
事实上,Gemini 的消息传出之前,在 2 月份 ChatGPT 掀起第一波高潮之时,谷歌和 DeepMind 就已有联手动作:
谷歌旗下专注语言大模型的 " 蓝移团队 "(Blueshift Team)宣布,整体并入 DeepMind。目标就是追赶 ChatGPT 的进度。
此前,谷歌的 5400 亿参数大模型 PaLM 背后,就有蓝移团队成员的贡献。谷歌耗时 2 年发布的大模型基准 BIG-Bench,也有蓝移团队的深度参与。
另外,DeepMind 还手握另一张名为 "Sparrow" 的牌。
这一聊天机器人在去年 9 月就吸引了外界的关注,有评价认为它 " 朝创建更安全、偏差更小的机器学习系统迈出了重要一步 "。
但当时,DeepMind 出于对公共安全的顾虑,并未面向公众发布 Sparrow。
论文的主要作者 Geoffrey Irving 当时解释说:
我们没有部署该系统,因为我们认为它还存在很多类型的偏见和缺陷。
问题在于,你如何权衡机器与人沟通的优势和劣势。我倾向于认为安全更为重要……从长远来看,我认为这是一种工具。
在 ChatGPT 发布并引起广泛讨论之后,据英国《独立报》消息,DeepMind 的 CEO 哈萨比斯(Demis Hassabis)透露,Sparrow 的内测版会在 2023 年年内推出。
种种迹象,让网友不由感慨:什么,都是没谱的事儿。
开弓没有回头箭,尤其对于在这一波浪潮中处处落于下风的谷歌而言,显然没有停下脚步的理由。
毕竟,用户是真的在流失。Similarweb 的数据显示,在过去近一个月时间里,新必应的页面访问量增长了 13.6%,谷歌搜索的访问量则下跌了 2.8%。
而谁也不想做下一个黑莓。
你觉得呢?
参考链接:
[ 1 ] https://www.theverge.com/2023/3/29/23662621/google-bard-chatgpt-sharegpt-training-denies
[ 2 ] https://twitter.com/amir/status/1641219919202361344
[ 3 ] https://twitter.com/steventey/status/1641267979399704576
版权声明:本文部分来自互联网,由小编精心所写,本文地址:http://www.zhubian88.cn/smbk/83041.html,如需转载,请注明出处!