AI大模型疯狂内卷

2023-08-14 重庆商报

文心一言

通义千问盘古大模型

今年3月开始，国内的AI大模型如雨后春笋般涌现。截至2023年5月底，国内10亿级参数规模以上基础大模型至少已发布79个。在刚刚过去的第六届世界人工智能大会上，大模型同样成为全场的绝对主角，30余款大模型集中亮相，20多场大模型论坛应接不暇。

“百模大战”已经正式打响，AI大模型的创业有多火？

卷数量

国内大模型赛道热闹非凡，涉足AI大模型赛道的“玩家”有以阿里、腾讯、百度等为代表的互联网大厂，还有以商汤科技、科大讯飞等为代表的AI科技公司以及教育类企业孩子王、金融类企业同花顺、房地产类企业我爱我家等为代表的各行业公司。

7月6日至7日，在上海2023年世界人工智能大会召开的2天时间里，据记者不完全统计，有10多款大模型新品发布或宣布即将发布。发布的公司有互联网科技公司、创业公司，还有通信公司；而在大模型新品中，有通用大模型，也有专注细分行业的行业大模型。

已经发布的包括阿里巴巴的绘画大模型“通义万相”、中国电信的类ChatGPT产品“TeleChat大模型”、商汤科技联合香港中文大学和清华大学等推出的“书生通用大模型体系”、第四范式专注企业软件领域的“式说”大模型等。

7月7日下午，华为宣布发布盘古大模型3.0。华为云CEO张平安在PPT最显眼位置写着“不作诗只做事”，他说，盘古大模型聚焦价值场景，致力于深耕政务、金融、制造、煤矿、铁路、制药、气象等行业。

即将发布的主要大模型产品也有不少。

在5月底举行的中关村论坛上，有专家披露，据其统计到当时为止，中国10亿级参数规模以上大模型已发布了79个。如今，随着世界人工智能大会上批量发布的一批大模型，“百模大战”也已经正式打响。

卷垂直

年初ChatGPT在国内爆火后，大模型的热度持续至今。不过，随着人们对大模型认知的增加，大模型的问题也逐渐凸显，成为需要直面的挑战。

图灵奖得主、中国科学院院士、清华大学交叉信息研究院院长姚期智认为，未来大模型应用中最直接影响的就是文书工作，作为生产力工具，许多文书工作可以交由大模型来完成。

作为文书领域的重要玩家，金山办公也发布了他们基于大模型的AI办公产品“wps AI”，可以润色文章，自动制作表格和PPT。用户可以让AI把一篇提纲制作成PPT，并能随意更换PPT风格。

“WPS AI”搭建在MiniMax、百度文心、智谱AI等大模型之上。金山办公CEO章庆元在大会现场表示，金山办公将WPS AI定位为大语言模型的应用方，未来锚定AIGC（内容创作）、Copilot（智慧助手）、Insight（知识洞察）三个战略方向发展。

同样在7月7日当天，语言智能科技企业蜜度发布了专门针对校对垂直行业的大模型，名为“蜜度文修”。蜜度首席技术官刘益东告诉记者，今年ChatGPT火了后，他们尝试做了一个校对领域大模型，训练出来的效果很令人震惊，在垂直领域的效果远远好于通用大模型。

卷进度

新的大模型不断涌现，之前已经发布的大模型公司也不甘示弱，在7月6日、7月7日公布了最新进展。

今年4月10日，商汤发布了通用大模型产品“日日新”。7月7日，“日日新”更新到2.0版，商汤集团联合创始人、董事长兼CEO徐立现场展示了大模型新能力。

徐立用他自己的照片做案例，生成了“一个戴眼镜的男人，弹吉他”的图片，这是他没有做过的事情，生成后发给家人朋友，很多人都信以为真。这些AI生成图片的细节达到了照片级。他还展示了AI绘画的功能，现在商汤大模型可以帮用户补充提示词，比如，一个用户输入了“中国龙，蓝色摆件，珠宝风格”关键词后，AI生成了一条龙的普通图片，大模型可以自动把提示词补充为“一个中国龙的3D渲染图，具有极其精细的图案，龙站在一个蓝色玛瑙海上，添加深度和神秘感……”，AI生成的新图片艺术感增强了许多。

作为国内首个发布大模型的互联网大厂，百度也在人工智能大会上公布了“文心一言”最新进展。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰称，文心大模型3.5效果、功能、性能全面提升，实现了基础模型升级、精调技术创新、知识点增强、逻辑推理增强等，模型效果提升50%，训练速度提升2倍，推理速度提升30倍。

卷算力

与三四月份人们充满期待的科幻想象相比，当下做大模型的人，关注的话题更接近现实。他们发现，数据是难题，算力也是难题，大模型这条路，前景美好但现实艰难。

华为目前正在着手解决算力问题。7月6日，华为宣布旗下算力解决方案昇腾AI集群全面升级，集群规模从最初的4000卡集群扩展至16000卡，为业界首个万卡AI集群。此前，腾讯云也面向大模型发布新一代高性能计算集群，算力性能较前代提升高达3倍。

不过，当前的算力仍有很大挑战。一位大模型创业公司人士表示，大模型的研发成本非常高昂。仅算力一个领域，做训练、推理、数据处理，就需要数千卡并行的能力，这是一套非常复杂、也非常费钱的系统工程。

算力之外，还有其他挑战。一位做智能汽车的创始人苦恼于数据量太大，他们公司刚卖了1万辆汽车，但产生的数据已让他觉得很庞大了，他不敢想象卖到10万辆车时会怎样。硬币的另一面，也有人因为数据不够而感到困难，一位用大模型做生物医药研发的人士说，他们最缺的就是数据，这阻碍了他们研发医药的速度。

腾讯高级执行副总裁汤道生表示，通用大模型一般基于公开信息来训练，在许多专业知识和行业数据积累不足。在策略上，通用大模型有点像“把大海煮沸”，不够聚焦，可以解决80%的问题，但未必能够满足企业某个场景的具体需求。

除此之外，清华大学智能产业研究院院长、中国工程院院士张亚勤提到，当下大模型仍有自己的局限性。比如ChatGPT会有时效性问题，你问它是什么时候发布的，它不知道，因为它使用的是2021年9月前的数据。另外，大模型还有效率低、涉嫌侵犯隐私和知识产权保护问题等，这些问题都将影响大模型的商用。

纵深

落地之路面临诸多阻碍

作为一项仍未完全成熟的技术，行业大模型的落地之路仍面临诸多阻碍。

一方面是监管仍待落地。几乎所有的大模型产品都还没有全面开放API接口服务，如百度、阿里就只供定向邀约客户使用。在接受记者采访时，科大讯飞总裁吴晓如指出，目前在互联网或者公开的开放平台上，还需要等到监管机构发牌以后，大模型才能正式运作。“目前很多开发者只能通过预体验的形式，将他们的应用和我们的系统进行对接。”

与此同时，有大模型销售人员透露，目前不少前来接洽的企业都有着相似的顾虑，其中就包括大模型的不稳定问题。

在世界人工智能大会大模型展区待了大半天、刷遍所有公司推出的大模型应用产品的工程师李捷也有同感。他所在的通信公司想借助大模型实现业务端问答场景的落地，但从这半天的试用结果来看并不乐观。

对于C端用户而言，大模型一本正经胡说八道的“机器幻觉”也常被调侃。但如果要接入金融、医疗、工业制造等严肃B端场景，这一潜在风险就可能造成经济损失或直接威胁生命安全。

“大模型最大的不足就是‘幻觉’，正式商用是不允许有‘幻觉’的。”在头部自动驾驶厂商担任技术经理的张启强调。

市场的另一个关注重点是大模型的数据安全问题。高质量的数据是助力AI训练与调优的关键，足够多、足够丰富的数据，是生成式AI大模型的根基。

据《机器之心》报道，绝大部分企业不可能把敏感的内部数据上传，比如产品设计、技术架构、核心代码、制造工艺、配方、客户隐私、会议纪要、战略文档、业务规划、商业逻辑等，一定要保留在内部，特别是对于国企央企、金融、能源、大型集团企业、先进制造等数据敏感性较高的行业而言。

如此一来，大模型厂商似乎只能采取定制化思路，为企业打造专属大模型。但在张启看来，如果行业大模型要针对企业进行个性化的开发，背后需要付出大量数据和时间去训练，成本很高、难度很大，这笔账很难算得清楚。

如何跨越这些难题，成为大模型是否能够真正落地应用的关键。这一被认为终将改变世界的新技术，目前还走在黎明前夜。

综合经济观察报、时代财经、蓝鲸财经等

AI大模型 疯狂内卷

AI大模型疯狂内卷