“AI的商业化路线已经清晰” 2023京东“赶考”千亿级产业大模型

2023-05-09 每日经济新闻

每经记者：王郁彪每经编辑：刘雪梅

2023年的春天，AI迫不及待地“破土”了。

英伟达创始人黄仁勋说，我们正处于AI的“iphone时刻”。言语间，难掩兴奋。根据瑞银分析，ChatGPT使用了约1万颗英伟达GPU来训练AI模型。而外界普遍预计，ChatGPT的商业化将需要应用超过3万颗。

此岸彼岸，AI持续澎湃。即便入局的门槛如此之高，大模型的应用与尝试，却还是像颗陨石一样溅落大洋，激起阵阵涟漪。

“AI引发新一轮生产力革命，主要源自多方面的进步。”京东集团副总裁、京东科技智能服务与产品部负责人何晓冬博士在接受《每日经济新闻》记者采访时表示，“包括硬件、摩尔定律和GPU等的进步，算力提升、数据迅速增加，还有像Transformer这样的模型结构的发明。”

两年前，何晓冬在接受记者采访时曾预判，“未来5年是AI落地产业化窗口期”。如今仅过去三年时间，新的想象便提前降临。5月6日，被誉为“中国智能科技最高奖”的吴文俊人工智能科学技术奖颁发，京东云旗下的言犀团队凭借“任务型智能对话交互关键技术及大规模产业应用”斩获科技进步奖，何晓冬获吴文俊人工智能科学技术奖杰出贡献奖。

言犀团队“任务型智能对话交互关键技术及大规模产业应用”获得吴文俊人工智能科学技术奖科技进步奖。图片来源：企业供图

“今年的规划是要发布面向产业的言犀大模型，预计参数量千亿级，会在京东内部生态落地实践后再对外开放。”何晓冬透露。京东做的是生长在数智供应链上的产业AI，和所有人一道，共赴这场AI在春日的圆梦。

人机对话70年飞跃：从ELIZA到ChatGPT

新一轮AI革命的热潮由ChatGPT开启，就像是一场命运的定数。因为人工智能魔方的开启，也要从人机对话说起。

1950年，图灵发表了一篇划时代的论文，文中预言了创造出具有真正智能的机器的可能性。由于注意到“智能”这一概念难以确切定义，他提出了著名的“图灵测试”（注：如果一台机器能够与人类展开对话而不能被辨别出其机器身份，那么称这台机器具有智能。）

受“图灵测试”启发，16年后，1966年，美国麻省理工学院人工智能实验室的约瑟夫·维森鲍姆等人开发了最早的人机对话机器人ELIZA，关于聊天机器人的新时代就此来临。

但当时的ELIZA只是简单模仿人的行为，谈不上智能。到上世纪90年代，人机对话才进入了一个新的发展阶段，大家开始讨论怎么让计算机理解人类意图与执行命令。

记者注意到，2012年以来，苹果的Siri、谷歌的google Assistant、微软小冰、亚马逊的Alexa等为代表的智能对话机器人走进“寻常百姓家”。这些机器人不但能完成人下达的任务，还能逐渐跟用户建立情感上的联系。

而伴随人机对话交互技术的成功应用，其也逐渐成为整个AI赛道绝对炙手可热的领域。

何晓冬从技术演进的角度回顾ChatGPT时表示，这几十年走过了一个比较长的周期，但在最近几年，迎来了爆发式增长。

“上个世纪50年代是基于规则，80年代是基于统计模型，到了本世纪深度学习崛起以后，开始向神经网络、替代模型崛起。特别是到了2017年Google的Transformer发表以后，之后又分出了一个系列，直到今天的GPT4。”何晓冬如此解释。

的确，在过去近10年时间里，人工智能模型经历了从小模型到以Transformer为代表的大模型的转变。

而指数级的增长，速度与规模的递进，更令人震惊。“三年前说大模型，这个‘大’是10亿级别的，现在则已经升至千亿级别。三年之内，关于大模型大的定义已经涨了100倍。”何晓冬表示。

多模态大模型将至 “AI的商业化路线已经清晰”

智能对话技术在过去70年有了巨大的飞跃，从“图灵测试”提出的设想，最后变成了一个真正的产品。

原因何在？何晓冬认为，过去往往是静态数据，都是小规模人工标注的。现在则是在特别复杂的交互场景下的动态数据，如ChatGPT过去四个月积累的数据。此外，过去更加关注单点算法和AI组件，现在则更加关注综合性AI系统、产品生态，以及关注技术能结合什么场景实现大规模落地。

“OpenAI公开表示用的就是Transformer，他并不介意。但他做到了别人做不到的高度，因为在后台完成了一系列的技术创新。多个模型有机结合，协同优化，导致最后呈现出一个非常领先的产品。”何晓冬补充说。

“我们现在讲大模型，更多的是谈语言模型，而在语音、图像、文本等不同模态，诞生了包括多模态数字人、AI艺术创作等多种应用。可以预见的是，大模型理念和技术正在迅速向多模态扩展。”

一次新技术变革不只带来一个工具，而是所有的商业模式都值得围绕技术突破进行重塑。人们从过去低效率地查阅黄页，过渡到搜索引擎时代，又从搜索引擎时代过渡到了智能交互时代，技术突破带来用户体验和商业模式的革命性变迁。

而围绕技术的突破，每一次新的跃动都潜在巨大的机遇。这是无数人为AI狂热的根本所在。

何晓冬告诉记者，就此，AI的商业化路线已经很清晰了。最先突破的是文本生成的商业化，图像会很快进入商业化，或者说某种意义上已经商业化。随后的视频、游戏、3D也会迅速跟上。

AI热潮的余波一轮轮震荡开来。越来越多的公司，预备从不同角度切入大模型的研发与应用尝试。有些抢速度，有些拼技术，甚至有些在入场门槛前徘徊，被资金、技术、人才等各类问题困住脚步。因为大家都知道，赶不上这趟车，可能就没下一列了。

向产业延伸京东将发布千亿级大模型

ChatGPT爆火后，国内多个大厂相继躬身入局。京东是最早的一批，在言犀人工智能应用平台的基础上，京东云也曾发布过K-PLUG、织女等产业大模型。

在通用语言理解基础模型方面，京东探索研究院不久前曾对织女大模型进行了再升级，提出规模更大、性能更强、迁移性更好的Vega v2模型。应用于情感分析、语义匹配、语法纠错、智能问答、常识推理等多种下游自然语言处理任务。

记者了解到，智能服务是京东云“产业AI”的首个落点。何晓冬告诉记者：“客服场景是一个很严肃、很深的任务型对话，我们需要解决真实世界的深度复杂问题，意味着它并不仅仅只是独立的对话。”

“哪怕最简单的对话，比如，你问客服昨天下单的苹果手机今天什么时候送达。意图清晰，但ChatGPT是回答不了的，因为它需要跟物流、订单等整个业务系统串联。”何晓冬说，“某种意义上，京东云做AI的优势，就是基于自身供应链复杂场景沉淀技术能力，再广泛服务产业生态。”

他进一步向记者举例，比如京东云正在做的智能政务热线，数据显示，AI将大同12345的呼入电话接起率提升至100%；智能热线提升了东莞市受理市民诉求办理满意率达到96.8%；

面对京东大模型的推进进程，何晓冬透露，今年的规划是要发布面向产业的言犀大模型，预计参数量千亿级，会优先在零售、金融行业落地，再泛化至其他产业。

AI不是现实世界的复刻，而是人类想象力的延伸。这是David Holz在创办Midjourney时定下的宗旨。

但现阶段，AI先要做好的仍是响应更多现实世界复杂真实的需求，而真正可以预期和进一步想象的空间延伸，也将来源于此。