华为加入大模型之战

2023-07-09 华尔街见闻

加入收藏

作者｜于惠如编辑｜刘宇

国内大模型之战，华为终于出手了。

7月7日，华为在开发者大会2023（Cloud）上发布盘古大模型3.0。但与此前诸多公司的大模型发布会不同，华为没有在现场展示大模型写诗、作画的能力。

“盘古大模型3.0不写诗，只做事。”华为常务董事、华为云CEO张平安给盘古大模型3.0定调——盘古3.0完全面向行业，意在重塑各行各业，让每个行业、每个企业、每个人都拥有自己的专家助手。

盘古3.0发布的前一天，华为轮值董事长胡厚崑在2023世界人工智能大会上称，此轮人工智能浪潮中，华为的思路是推动人工智能“走深向实”，赋能产业升级。

据张平安介绍，“为B端而生”的盘古大模型目前已经覆盖金融、金融、制造、医药研发、煤矿、铁路等十余个行业，覆盖400多个业务场景。

在“BATH”中，华为是最晚介绍大模型进展的公司。但华为对大模型的探索很早就已开启。

2019年-2020年，盘古大模型投入AI大模型研发；2021年4月，华为云盘古大模型正式对外发布；2022年，盘古大模型落地行业应用。

从盘古1.0至盘古3.0，华为在大模型架构和训练方法上进行了升级，盘古3.0包含“5+N+X”三层架构、多个模型。

在盘古3.0架构中，L0层包括自然语言、视觉、多模态、预测、科学计算五个基础大模型，提供满足行业场景中的多种技能需求。L1层是N个行业大模型，既包括用行业公开数据训练的行业通用大模型，如政务，金融，制造，矿山，气象等大模型；也包括基于行业客户自有数据，在盘古大模型的L0和L1层上训练而来的企业专有大模型。L2层是针对更多细化场景的模型，“开箱即用”。

在发布会后的媒体采访中，张平安透露，对于盘古大模型的下一步计划，华为内部制定非常激进的技术路线。“华为云现在是‘All in盘古大模型’，目标图制定得密密麻麻。”在中国市场成功之后，盘古大模型将继续在海外拓展。

据不完全统计，截至7月，全球已发布数百个大模型，中国有80多个。“百模大战”中，华为为何选择行业大模型作为突破口？

张平安给出的答案是：目前大模型大多数应用都集中在To C领域，在面向行业应用时，由于行业数据获取难，技术与行业know-how结合难，大模型在行业的落地进展较慢。而政企业务的长期积累是华为做行业大模型的优势。

华为云人工智能领域首席科学家田奇表示，目前全球基于大模型开发To B应用的企业不到三分之一，行业中的海量业务场景迫切需要更多专业的大模型和专业的AI应用来解决，弥补通用大模型落地行业的不足。

一位AI领域专家表达了类似的观点：“英雄得有用武之地，科技成果要转化成生产力，还是得有场景，有应用，有商业落地。”

与移动互联网时代的C端客户驱动不同，AI浪潮中大模型技术的变革，动力将由B端客户驱动。不仅仅是华为，其它科技巨头们也已经意识到了这一点，纷纷从最初豪言“打造中国的通用大模型”的状态，将重点转移至行业大模型上。

百度在发布文心大模型后又打造了文心千帆，为企业客户服务；阿里的通义千问在发布之时便宣称要为每一个企业打造专属大模型；腾讯同样发布了行业大模型解决方案。

“大模型发展到现在，‘BATH’的路线其实很相似，成为‘模型底座’，为B端客户提供服务，同时售卖算力赚钱。”上述AI领域专家告诉全天候科技。

以华为为例，在这场大模型竞赛中，华为扮演了“淘金者”和“军火商”的双重身份。

大模型所需要的各项根技术，从底层芯片、数据中心，到上层开发框架、开发平台、工程平台，华为自成一体，形成闭环生态。

同时，华为还升级算力设备、出租算力网络，赚取“军火钱”。盘古3.0发布的同时，华为云推出专门为AI行业建立的昇腾云服务，并在贵安、乌兰察布上线两个新的AI算力中心。

“华为具有典型的To B基因，拥有丰富的与B端客户打交道的经验，懂行业know-how，也积累了足够多的行业数据。从这个角度讲，华为的机会很大。”前述AI领域专家对全天候科技说。

激烈竞争已经开始，谁能在“百模大战”中领先一步，还需要时间验证。