谷歌曾经以一个革新者的姿态登上搜索引擎的舞台,开创了一个崭新的网络时代,甚至将PC时代的王者微软踩在了脚下。风水轮流转,如今谷歌反倒变成了被革新者,成为别人争相超越的目标。
文|圆圆
来自谷歌员工的灵魂拷问
自ChatGPT发布以来,热度持续不减。虽然它还只是个“初生牛犊”,但是许多人却把它和搜索巨头谷歌相提并论,甚至讨论起前者有没有替代后者的可能。谷歌在沉默一段时间后,终于给出回应。
据CNBC的报道,一些人想知道谷歌在创建可以回答用户查询的复杂聊天机器人领域处于什么位置。毕竟谷歌的主要业务是网络搜索,他们长期以来一直吹捧自己是人工智能的先驱,而且也很早就开发出了LaMDA对话语言模型。
在谷歌的一次全体会议上,员工们对公司在人工智能方面的竞争优势表示担忧,最受关注的一个问题就是:“Is this a missed opportunity for google, considering we’ve had Lamda for a while?”大意即是:我们早就有了(类似ChatGPT技术的)LaMDA,(却被OpenAI抢占了先机),谷歌是不是错过了这一机会(失去了竞争优势)?
图1 聊天机器人越来越成为主流应用
图2 聊天机器人不再仅仅是聊天,它几乎可以做到搜索引擎能做的所有事
传统搜索如何应对新威胁
Alphabet(谷歌母公司)CEO桑达尔·皮查伊(Sundar Pichai)和谷歌人工智能部门负责人杰夫·迪恩(Jeff Dean)针对上述问题做出回应,称该公司完全具备类似ChatGPT的能力,但是AI对话生成应用目前还存在不少问题,比如生成的答案可能是错误的不可信的。谷歌如果也这么做的话,出现问题的成本会很大,因为人们必须相信他们从谷歌得到的答案。
皮查伊和迪恩在会议上表示,比起一个“小型初创公司”,谷歌要担负更多的“声誉风险”,每一个决策都需要谨慎。2023年将标志着人工智能用于对话和搜索方式的“拐点”,谷歌既要在这一领域大力发展,但还“有很多”其他的计划,所以需要找到一个平衡点。
谷歌的回应,代表了传统搜索引擎的主流态度。
传统搜索公司对外公开的说法比较保守,而实际上他们内部已经感受到了很大压力。以谷歌为例,随着ChatGPT越来越受欢迎,谷歌管理层已经发出了“红色警报(code red)”。据国外媒体看到的一份内部备忘录和音频记录,谷歌管理层已经指示公司的许多团队重新集中精力解决ChatGPT对其搜索引擎业务构成的威胁。还有一些人员被抽调出来,协助开发类似于OpenAI的DALL-E的图像生成应用。
图3 谷歌早就具有可与ChatGPT相抗衡的LaMDA
图4 搜索引擎市场开启新的起跑线
让谷歌神经绷紧的ChatGPT
从谷歌内部亮出“红色警报”来看,他们对CharGPT的发布非常警惕。那么ChatGPT到底是什么呢?简单来说,ChatGPT就是OpenAI在GPT-3的基础上训练的一个大型生成式对话语言模型,它可以对用户的提问做出预测,然后生成用户希望的答案。从普通用户的角度来看,它就是一个能够理解人类语言,大部分时候能给出令人满意答案的机器人。不过,ChatGPT注定了只是一个过渡产品,所以OpenAI称之为GPT-3.5而不是GPT-4。
图5 ChatGPT于2022年11月30日正式发布
ChatGPT的发展时间线大致如下:
2015年:OpenAI公司成立。
2018年:GPT-1模型发布,参数量1.17亿,预训练数据量约5GB。
2019年:GPT-2模型发布,参数量15亿,预训练数据量约40GB。
2020年:GPT-3模型发布,参数量1750亿,预训练数据量约45TB。
2022年:GPT-3.5模型完成(预计中的GPT-4跳票),GPT-3.5是GPT-3的微调版,两者使用相同的数据集。
2022年11月30日:ChatGPT模型正式上线,它是基于GPT-3.5的一个拓展,用来产生与人类对话的语言模型,解答人类提出的各种问题。
图6 ChatGPT工作原理图
OpenAI对ChatGPT的技术细节透露得很少,不过从其有限的公开信息及其“同胞兄弟”InstructGPT模型的技术文档中,可以大致推断出它的工作原理。
从OpenAI博客的相关文档中,可以了解到ChatGPT实现的主要步骤和方法。第一步,是在人工监督的情况下利用一系列样本问答对GPT模型进行微调训练(SFT,Supervised Fine-Tuning)。第二步,通过强化学习训练一个奖励模型(Reward Model),主要方法是,首先由第一步中训练的模型生成多个答案,再由人工对答案进行优先级排序,效果好的得分高,反之得分低。第三步,前面步骤中有监督训练出的PPO初始模型接受各种输入后生成相应答案,再由奖励模型对生成的答案进行判别,并将结果返回到PPO中继续优化,周而复始。PPO和奖励模型在这个过程中不断优化升级,最终就是我们现在所见到的ChatGPT了。
图7 微软与OpenAI联手
图8 微软除资金外在云计算等软硬件技术上也对OpenAI提供大力支持
当然,ChatGPT的技术并不是最新的,让谷歌头痛的或许还有另外一个原因——OpenAI背后的金主,谷歌的老对手微软。
微软和OpenAI从2019年开始建立了牢固的合作伙伴关系。微软向OpenAI投资了10亿美元,以支持具有广泛经济效益的通用人工智能(AGI)的发展。此外,微软已经成为OpenAI的独家云提供商,两家公司进一步合作,扩展了微软Azure在大规模AI系统中的能力。这些对谷歌的发展来说,都是很大的威胁。
传统搜索进退两难
ChatGPT并没有多么神秘,许多公司都在发展自己的大型语言模型,比如谷歌自己就有LaMDA。LaMDA(Language Model for Dialogue Applications)是谷歌于2021年发布的一款专门用于对话的语言模型。相信不少人还记得不久前的一条新闻:谷歌的一名计算机工程师在和LaMDA对话后,认定LaMDA已经具备人类意识,立即将此事上报,不料谷歌高层对此事不予理睬,于是他便将自己与LaMDA的对话内容公布到网络上,一时引起轰动。后来谷歌以违反保密规定为由将该工程师解雇。一些计算机专家认为,今天的技术还不足以让机器人达到有意识的地步,所谓“LaMDA觉醒”事件就是一场闹剧。
图9 从根本上改变搜索和交谈方式的LaMDA
图10 LaMDA根据输入生成多个候选者,根据分数范围选择最佳候选项
这一事件从侧面说明,LaMDA的语言仿真能力有可能更胜ChatGPT一筹。LaMDA采用无监督学习方法,不需要任何标记的数据集或关于对话主题的先验知识,即可在互动中快速生成响应。LaMDA的一个关键特征是,它不但能够处理单个会话中的多个回合,还会保留不同会话之间的长期上下文记忆,从而能够和用户进行更长、更逼真的对话,这也是它强过ChatGPT的一个方面。
明明自身有着超强的能力,却让ChatGPT大出风头,这或许就是谷歌员工不甘心之处。
谷歌的高层到底在怕什么?
按谷歌高层的说法,传统搜索具有明确的数据来源,而AI生成的内容则是不确定的,甚至还会出现带有偏见或误导性的信息,这会对谷歌的品牌产生负面影响。关于这一点,OpenAI自己也表示承认,这在ChatGPT首页中就有明确说明——“可能偶尔产生不正确的信息”,“可能偶尔产生有害的指示或有偏见的内容”,“有限的世界知识,无法了解2021年后的世界”。
图11 ChatGPT首页
不过真正令谷歌紧张的恐怕不只是技术,还有很重要的商业原因。谷歌的主要营收来自搜索业务,这一业务通过广告和电子商务销售赚钱。而聊天机器人的宗旨是以自然语言的方式直接给出答案,很难在其中集成广告,这无疑扼杀了谷歌的主要赚钱机器。另外,通过清理大量数据池来提供可信答案所需的处理,有着极高的成本,像谷歌这种体量的公司,这些因素也不得不考虑。
总之,诸多原因,使得这个昔日的革新者徒有各种技术却只能裹足不前。这也是各传统搜索引擎面临的困境。
传统搜索和AI搜索的比较
无论谷歌是否愿意,终究阻挡不了技术的发展。虽然现在还不能断言生成式AI搜索引擎必是未来搜索的主流,但它至少会占有极为重要的一席之地。许多网站或明或暗的已经在朝这个方向发展。下面我们就来测试一下,搜索同样的问题,传统搜索和生成式AI搜索会有什么样的结果。
一般生活常识的搜索
我们首先问一个生活常识性的问题,试试各个搜索引擎的反应。问题是:“衣服沾上了墨水怎么办?”传统搜索引擎我们选择百度和必应,AI搜索我们选择Andi和ChatGPT。
百度首先给出的是一个广告链接。接下来是一个方框圈起的重点推荐的答案,这个实际是AI推荐的最贴近用户需要的答案。随后便是一系列包含问题关键词的传统搜索的结果。可以看出传统搜索引擎已经很谨慎地在融入AI技术了。接下来看必应的结果,结构与百度如出一辙,也是先给出广告,再试验性地给出AI推荐的结果,最后是传统的关键词全文搜索的结果列表。与百度略有不同的是,必应的AI推荐结果中,对重点内容还做了加粗处理。
Andi是一个AI搜索引擎,它的结果与传统搜索引擎比较相似,包含了相应的源网页链接。不过它没有广告,而且对搜索到的网页,会以对话的形式给出网页内容摘要,看起来一目了然。最后是ChatGPT的表现,它已经完全颠覆传统搜索的形式,不再给出相应的源网页链接,而是将多个网页中提取到的答案整合到一起,生成了一个全新的直接的答案。
这一轮测试中,传统搜索引擎既有广告干扰用户的判断,而且还需要用户从众多的网页结果中做选择,然后还需要打开网页才能判断是不是自己想要的结果。Andi则清除了所有广告,并对结果做了AI筛选,大大减少了用户的时间成本,效果显然比传统搜索要好些,但Andi的弱势是作为新起的搜索引擎,所拥有的数据量显然无法跟传统搜索引擎相比。
ChatGPT的表现则极为亮眼,它直接给出了完整的答案,这显然就是大部分用户最希望的形式——直接得到想要的内容没有任何的干扰。所以本轮测试中,ChatGPT胜出。不过我们也应注意ChatGPT的几个问题:比如对多语言的支持尚有改进空间,从本示例中可以看出ChatGPT英文的答案要好过中文答案。再有就是,因为ChatGPT需要给用户以确定的回复,所以在答案的多样性上不得不有所牺牲。
图12 百度搜索常识性问题的结果
图13 必应搜索常识性问题的结果
图14 Andi的英文搜索结果比中文搜索更为接近用户的需求
图15 Andi的中文搜索结果
图16 ChatGPT直接给出用户答案
专业性知识搜索
接下来我们测试一些专业领域的问题,比如量子计算,我们设计的问题是“给一个十岁的孩子解释量子计算”。
百度将问题中的关键词“十岁的孩子”转化为关键词“宝宝”,从中可以看出AI技术的一些蛛丝马迹。同样,必应搜索也做到了这一点,另外必应还将知乎上一篇专业的贴文做了详细的提纲摘要,给出的结果更加人性化。这一轮测试中Andi的表现让人大跌眼镜,竟然不识“量子计算”(中英文都是同样结果),可以看出他的数据量实在有些“贫乏”。GhatGPT的表现一如既往,对量子计算给出了中规中矩的介绍。不过不得不说,这个解释,十岁的小朋友很难看得懂。这一轮测试,必应胜出。
图17 百度搜索量子计算的结果
图18 必应搜索量子计算的结果
图19 Andi无法搜索量子计算
图20 ChatGPT对量子计算的解释
结束语:
随着科技的不断进步,搜索引擎在我们的生活中变得越来越重要,它已经成为信息来源的首选,为我们提供了快速访问几乎任何我们想知道的信息。但是搜索引擎技术的未来会是什么样子呢?
通过上面的测试,传统搜索和生成式AI搜索互有胜负,而必应的小胜最终还是跟AI技术应用有关。可以说,未来将属于AI(人工智能)搜索。传统搜索的危机,恰恰标着一个新时代将要开启。
未来,随着AI变得越来越复杂,它将能够提供比以往任何时候都更快的结果和更高的精度。AI可以通过学习用户过去的查询和偏好,帮助用户快速找到相关内容。这可以让用户在网上搜索他们感兴趣的特定主题或产品时,不必自己去筛选不相关的结果,从而获得更流畅的体验。而且,未来的搜索将不会局限于文本,其他如声音的、图像的甚至视频信息,都将进入AI搜索的领域 CF
原文刊登于2022 年 12月1 日出版《电脑爱好者》第 23 期
END