迟来的混元大模型，能为腾讯带来多大能量？

2023-09-12 科记汇

腾讯在9月7日召开的数字生态大会上，正式发布了“混元大模型”。

在大模型竞赛风起云涌的上半场，腾讯的动作并不算快。最早发布大模型的巨头是百度。今年3月16日，百度宣布正式推出文心一言，并开放测试邀请。8月31日，百度大模型文心一言面向全社会开放，个人可在应用商店搜索“文心一言”下载应用。

阿里巴巴则在今年4月紧随百度发布大模型“通义千问”，阿里云随即升级其音频转写平台“听悟”，并配备AI驱动的会议分析能力。7月，阿里云推出生成式AI文生图模型“通义万相”。8月，阿里云开源了通义千问70亿参数通用模型和对话模型，目前这两款模型均开源、免费、可商用。

相比之下，腾讯在去年4月才首次对外披露了混元AI大模型的研发进展。今年2月初，业界有传言称腾讯在研发类ChatGPT对话式产品，成立了混元助手项目组，对此腾讯回应道：“在相关方向上已有布局”，此后便鲜有相关消息。

在今年5月的财报会议上，腾讯曾被股东质疑公司动作相对百度、阿里较为“迟缓”，当时腾讯CEO马化腾回复称，“互联网企业都有很多积累，我们也一样在埋头研发，但并不急于早早做完，把半成品拿出来展示。”

如今亮相的“混元大模型”已然是腾讯的“成品”，那么它究竟如何呢？

对标ChatGPT一直是国内大模型的主要基调，“在口语化文本精确理解、超长记录高效提炼、理解生成实时处理上，腾讯混元大模型中文能力已经超越GPT3.5。”腾讯副总裁蒋杰称，“你可以把混元看作是一个在内部开源的模型，公司的每个业务都可以看到我们发布的所有能力，并基于这个能力去与应用相结合。”

混元大模型的核心卖点在于，它是由腾讯全链路自研的通用大语言模型，可以流畅进行专业领域的多轮对话，具备强大的中文创作能力，复杂语境下的逻辑推理能力，以及可靠的任务执行能力，对行业更重要的是，混元将作为腾讯云MaaS服务的底座，客户可直接调用或作为基底模型构建专属应用。

在数字生态大会上，蒋杰展示了混元大模型“更成熟、更可靠”的能力。

此前，大模型产品经常出现答非所问、胡编乱造的“幻觉”问题，蒋杰通过关羽和秦琼的问答案例，意在说明预训练阶段通过“探真”算法进行事实修正，经过预训练算法及策略的整体优化后，相比其他主流开源大模型，混元大模型降低了30%-50%的幻觉率。在面对各种诱导提问时，腾讯通过强化学习的方法，让混元大模型学会识别陷阱问题，对安全诱导类问题的拒答率提升了20%。

减少AI幻觉和提高防骗能力，都是提高C端用户体验感很重要的两项能力。腾讯宣称腾讯云、腾讯广告、腾讯游戏、腾讯金融科技、腾讯会议、腾讯文档、微信搜一搜、QQ浏览器等超过50个腾讯业务和产品，已经接入腾讯混元大模型测试，并取得初步效果。

从公布的产品矩阵可以看出，混元大模型和其他友商一样，既有面向ToB领域的云、协同办公、文档编辑等业务，也有腾讯广告、腾讯游戏、QQ浏览器等面向大量C端用户的产品。

在ToB领域，采购了混元大模型服务的企业客户可以基于API直接调用大模型相关能力，或基于混元定制专属的行业大模型。收费方面，混元大模型将为每个在白名单中的已实名腾讯云企业账号提供累计10万token的免费调用额度，免费额度用完后，腾讯混元API刊例价是千tokens 0.14元（1token约等于1个中文汉字或3个英文字符），百度为0.012元千tokens，其它大模型为0.018元千tokens。

构建大模型的意义在于行业应用。李彦宏在最近的2023百度云智大会上曾强调，“基于基础大模型开发出来的应用才是模型存在的意义。”

腾讯下一步将如何在旗下业务或产品中实现大模型落地应用，以此促进各项业务的增长，将备受关注。尤其是微信和QQ两大国民级应用，怎么将大模型应用和庞大的C端用户体验结合，将是腾讯最为关键的部分。

虽然如今混元大模型已发布，但其能力依然没有完全展露，腾讯企点分析AI助手在9月只面向大客户开放内测申请，微信上的混元大模型小程序还需申请才能内测，腾讯旗下诸多游戏产品如何结合大模型进行升级，也并未在发布会上详细展现。而就微信和QQ是否以及何时会接入混元大模型，目前也尚不确定