你还不知道什么是AI大模型？

2023-07-29 界面新闻

当前，人工智能（AI）正在成为新一轮科技进步和产业变革的关键要素。工业和信息化部副部长徐晓兰在日前召开的“2023世界AI大会”上表示，我国AI产业体系逐步完善，核心产业规模已达5000亿元，企业数量超过4300家，智能芯片、开发框架、通用大模型等创新成果不断涌现。

随着ChatGPT这一现象级产品横空出世，“AI大模型”一词进入更多人的视野，同时拉开了大模型产业和生成式AI产业蓬勃发展的序幕。

除了海外的OpenAI、微软、谷歌、Meta，国内市场也出现了百花齐放的现象。3月，百度率先发布了新一代大语言模型“文心一言”，成为中国第一家正式推出对标ChatGPT产品的企业。此后，阿里、华为、腾讯、字节跳动等巨头厂商开始陆续发布自己的大模型产品。

AI模型可以分为浅层模型和深度学习模型两大类。大模型属于深度学习模型，是一个庞大、复杂的神经网络，需要通过存储更多参数来增加模型的深度和宽度，从而提高模型的表现能力。参数量一般从百亿起步，对大量数据进行训练并产生高质量的预测结果。最著名的AI大模型莫过于OpenAI的GPT-3模型，参数规模达1750亿，谷歌的PaLM-E模型的参数规模更是达到了5620亿。

一般来说，大模型具有更好的通用性、精度和效率，可以通过预训练或其他方式在大型数据集上进行学习，再通过微调，最终高效地完成自然语言处理、图像识别、语音识别等复杂任务。

用百度CEO李彦宏的话来说，就是过去的AI是人类想让机器学会什么技能，就教它什么技能。教过的技能，它有可能会，没教过的就不会。大模型出现后，以前没教过的技能，它可能也会，这种现象被称为“智能涌现”。同时，大模型让AI发展方向从辨别式走向了生成式。搜索引擎就是典型的辨别式，而用AI进行文学创作、写报告、绘制海报等就被称为生成式。

现在，行业内有一种说法，那就是大模型时代来临了，每一个产品都值得重做一遍。

大模型带来了哪些改变？首先，大模型再度改变了人机交互的方式。过去几十年里，人机交互方式发生了几次变化。从一开始用键盘输入文字命令到后来的图形用户界面，也就是现在人们常用的在电脑中点开对应的菜单和选项进行指令的输入，这种方式比第一种方式要友好得多，大部分人很快就能上手，但它不是最直接的输入方式。后来，人们可以通过自然语音与机器进行一些简单的输入和交互。如今，当你用自然语言与机器进行交互时，它能够处理更加复杂的工作。

比如，你想查询“今年上半年，公司有哪些产品的毛利率超过了新冠疫情爆发前的水平？”这件事，过去需要人工花费半天到一天时间才能获得结果。如今，在大模型的加持下，计算机有可能在几秒钟以内就能给你一个表格。

此外，大模型的出现让IT技术栈发生了根本性变化。过去，无论是PC还是移动时代，IT技术栈都是三层，即芯片层、操作系统层、应用层。

大模型时代，IT技术栈变成了四层：底层仍然是芯片层。芯片层之上是框架层，就是深度学习框架，比如ChatGPT的框架层Transformer、Meta的PyTorch，以及谷歌的TensorFlow都是深度学习框架。框架层之上是模型层，ChatGPT、文心一言都属于模型层。最上面的一层才是应用层。

现在，大模型已经让开发者有能力推出并将催生出更多AI原生应用。比如，DoNotPay是一个用AI帮助人们打官司、写法律文书的应用，AI能帮你把不该付的钱要回来。Jasper是一个通过AI帮助企业和个人写营销推广文案的应用。

“大模型本身是实现产业价值的工具，真正实现自己的价值一定是在产业的应用中。”京东集团CEO许冉曾表示，大模型的价值等于算法×算力×数据×产业厚度的平方，前三个指标固然重要，但技术在产业场景落地应用，创造实际价值才是关键。

目前，除了前文提到的几个例子以外，还有几个行业的大模型应用受到了比较多的关注：一是在医疗领域可以开发针对疾病及其症状的大模型，帮助医生更好地诊断和治疗疾病；二是在金融领域可以开发针对股票和市场行情的大模型，帮助投资者更好地做出决策。

再者是汽车领域，自动驾驶是AI应用的热门场景。根据艾媒咨询提供的数据，到2025年，我国自动驾驶汽车行业规模预计将从2015年的30.5亿元增长至267.6亿元。开源证券指出，大模型在自动驾驶中应用趋势明确。

大模型的自学习算法能力在汽车驾驶过程中发挥的关键作用，主要体现在感知和决策层面。就感知层面而言，以往自动驾驶感知使用的都是各个小模型“堆叠”的方式，识别的原理就是自己先看，然后到知识库里进行比对，如果以前没有学习过，那就无法准确识别出来。这种方法对于感知能力的提升是有限的，因为路况的变化是日新月异的。此前，特斯拉自动驾驶汽车高速撞上侧翻的白色货车，就有可能是将侧翻的车厢误判为天空或者强反光地面。而有了AI大模型后，可以在有限的标注数据前提下，找到相似障碍物之间的相关性。

AI大模型上车后，还有一个很重要的提升点，那就是智能座舱的进一步智能化。以往，车载语音助手只是单纯地执行用户的指令，属于命令式交互。而在大模型的加持下，未来车载语音助手有望转变成能和用户闲聊的伙伴。此前，东风日产、红旗、长城，以及吉利银河等近10家车企或品牌宣布接入百度的文心一言；阿里巴巴也宣布，AlIOS智能汽车操作系统已接入通义千问大模型进行测试。

自3月以来，国内大模型呈现“井喷”状态。从互联网巨头到IT企业，从科研机构到科创企业，大家对大模型趋之若鹜，在短时间内纷纷推出自有的大模型产品。

据科技部新一代AI发展研究中心于5月底发布的《中国AI大模型地图研究报告》显示，我国已发布79个10亿参数规模以上的大模型，即将迎来“百模大战”。

北京、上海和深圳等地接连出台政策举措，积极布局AI产业。日前，《上海市推动AI大模型创新发展的若干措施》公布，并发布了“模”都倡议。据介绍，上海破解大模型发展瓶颈的三项计划是：一是大模型创新扶持计划，重点支持上海市创新主体研发具有国际竞争力的大模型；二是智能算力加速计划，强化大模型智能算力建设力度，建立绿色通道；三是示范应用推进计划，加强大模型在特定领域的深度应用和标杆场景打造。

在ChatGPT引发的大模型浪潮中，巨头厂商、国内科技企业的入局，加之政策的推动，使国内大模型领域遍地开花。大模型作为人工智能技术的重要组成部分，可以在各个领域发挥巨大的作用。但AI大模型也存在一些问题和挑战。由于AI大模型的复杂性，可解释性（表示模型能够使用人类可认知的说法进行解释和呈现）有可能相对较低，会给人类带来一定的困惑和不确定性。此外，由于AI大模型的使用涉及隐私和安全等问题，需要加强相关的法律法规和管理措施。