大模型的下一步该怎么走

2023-11-24 新浪网

在近日举办的第六届世界声博会暨2023科大讯飞全球1024开发者节上，科大讯飞股份有限公司（以下简称科大讯飞）正式发布讯飞星火认知大模型V3.0，在文本生成、语言理解、知识问答、逻辑推理、代码能力、数学能力、多模态能力等7个方面较上一个版本进行了智能升级。

面向行业找到刚需应用场景

本次发布会上，除了发布讯飞星火认知大模型V3.0外，科大讯飞还一口气发布了面向工业、法律、金融等12个行业的专属行业大模型。

如何深入行业，一直是困扰大模型发展的难题。科大讯飞董事长刘庆峰认为，面向具体行业，找到刚需的应用场景是推动大模型迈向产业、实现商业价值的重要基础。

科大讯飞此次发布的12个行业大模型，瞄准的正是许多行业中的智能化痛点。

“要做出符合行业特点和需求的大模型，就必须要与真正懂行业、懂应用场景的龙头企业合作。”刘庆峰表示，行业大模型在龙头企业内部打造成功后，可以对全行业进行赋能，所以合作企业要有开放的精神。

刘庆峰认为，一整套方便易用的训练工具能对行业专属内容进行高效训练。这对于大模型在行业中落地至关重要。“我们需要开发出定制化工具，让企业自己‘拖拖拽拽’就能解决问题。”他说。

针对行业定制大模型成本居高不下的现状，刘庆峰认为，大模型要先找到典型应用场景，和行业龙头企业一起做好共性场景的应用。在大模型具备一定的行业通用能力后，需要定制的内容会越来越少，成本自然会下降。

此外，他还表示，大模型要想真正赋能千行百业，需要实现从多轮对话、主动对话再到启发式对话的跨越。大模型不仅要能回答问题，还要能像人一样主动提问。

着眼于此，讯飞星火认知大模型在此番更新中便新增了个性化AI人设功能。该功能可以为讯飞星火认知大模型形成一个初始“性格”，使大模型具备长期稳定的记忆力、多样化的个性和丰富的情感，再结合特定知识学习、对话记忆学习，形成一个更个性化的AI人设。

找到方向形成完整自主生态

大模型的训练和应用离不开由显卡搭建的算力平台，这让算力再次成为中国人工智能发展过程中的焦点。在此次发布会上，除了讯飞星火认知大模型V3.0，最受关注的便是科大讯飞与华为联合发布的国产算力平台“飞星一号”。刘庆峰表示，讯飞星火认知大模型V3.0正是在国产算力平台上训练出来的大模型。

华为轮值董事长徐直军在发布会现场表示，华为的使命和愿景是让每个人、家庭、组织畅享数字世界，构建万物互联的智能世界。在全面智能化战略的指引下，华为将持续打造坚实的算力底座，最终让所有对象可联接，所有决策可计算，让大模型真正赋能千行百业。

徐直军透露，讯飞星火认知大模型V3.0在“飞星一号”平台上训练效率翻番，能够实现更为高效稳定的训练迭代。接下来，华为还将为更大参数的讯飞星火认知大模型V4.0版本提供有力支撑。

自主创新的算力底座是中国大模型发展的重要基础。刘庆峰表示，虽然目前使用国产化算力平台仍然存在一定迁移成本，但这一步是必须迈出的。

接下来，科大讯飞将在“飞星一号”平台的基础上，启动对标GPT-4的更大参数规模的讯飞星火认知大模型V4.0的训练。刘庆峰表示，这对于科大讯飞来说，绝不仅仅是一个简单的技术对标问题。“我们要走出自己的技术路线，走出自己的产业方向，形成自己完整的生态。”他说。