懂图片的GPT-4来了国内AI企业如何接招？

2023-03-16 每日经济新闻

每经特约评论员盘和林

3月15日，OpenAI发布了GPT-4，并迅速成为热点，引发大量关注。GPT-4核心提升可总结为两点：一点是基本智能水平提升。举例说，GPT3.0在全球多项考试中排名在倒数10%，而如今GPT-4在这些考试中能够战胜90%的人类，这种进步源自于数据训练和参数的积累。另一点是多模态模型，ChatGPT过去只能文本交流，现在用户可以发张图片给ChatGPT，而ChatGPT将以文字回应。另外，GPT-4的参数量是GPT3.0的10倍，参数达到百万亿级别，这为GPT-4的用户体验优化提供了保障。

识图能力应用前景广阔

之前上市的ChatGPT实质上等同于GPT3.5，未来，GPT-4的功能将以plus订阅的方式开展。新版本激发了用户热情，付款订阅渠道一度被挤爆。但实际上OpenAI在技术上仍有保留，外界不禁感慨：OpenAI到底领先对手几个身位？

之所以说OpenAI保守，主要是两个原因：

其一是ChatGPT在去年底推出的时候本身是旧版本，很多人发现ChatGPT无法回答2021年以后的问题，原因是ChatGPT2021年就发布了GPT3.0，而ChatGPT只是在GPT3.0的基础上略作优化的GPT3.5版本，而2021年以后新数据都去训练GPT-4，当然就无法覆盖这部分新知识。而GPT-4其实在2022年年中就基本完成，足见ChatGPT的发布是一个保守做法。

其二是GPT-4也是有保留的。原因是OpenAI有另一个热点AI产品，也就是DELL-E2。DELL-E2的功能是你输入一段文字，它生成一张图片。而GPT-4的功能是，你输入一张图片，它生成一段文字答案。如果两项AI功能结合，GPT将同时获得图片理解能力和图片表达能力。可以说NLP自然语言处理只是OpenAI在人工智能领域的一块业务，未来整合旗下的多个AI，功能内容还将进一步丰富。

当前GPT-4的识图能力应用前景也非常广阔。比方说医学影像资料本身是图片，未来普通人可以通过ChatGPT来实现医学影像自检，自己发现疾病。当然，这只是其中一项可能性。在很多行业领域，看懂图片是需要专业能力的，而GPT-4降低了这种识图门槛，比如医学影像、设计图纸、数学模型等，让普通人能够通过AI辅助介入到专业领域当中，所以GPT-4未来很可能成长为生产力工具。

国内企业要“结硬寨”

中国大模型生成式AI企业怎么办？

首先，国内生成式AI企业要走积累的路子。生成式AI需要持续大规模算力投入，微软为GPT提供超过3万张A100芯片的算力支持，一张A100价格要20多万元人民币，而算力训练每次都要消耗大量能源。GPT-4百万亿的参数也需要投入大量人力财力来完成积累。而在数据方面投入的价值也很高，GPT从一开始就重视“小数据”，也就是高质量数据，而高质量数据是GPT领先于其他生成式AI的核心竞争力。与之相对应的，数据质量提升是需要钱的。综上可以看出，算力、数据、算法调参这三个方面，OpenAI前期烧钱的规模是海量的，而GPT-4也是一步步技术积累的最终结果。所谓台上一分钟，台下十年功，一点也不夸张。

其次，国内生成式AI企业要在基础科学上做积累。大模型算法的道理并不复杂，复杂的是算法细节，自从微软收购OpenAI后，OpenAI的算法不可能开源，所以“等、靠、要”的做法已经行不通，国内AI企业要在算法技术上投入研发，构建中国AI企业自身的算法能力，然而算法的精益也要依靠基础科学的进步，比如基础数学研究。所以要积极在学术上加强投入，而不应该仅仅聚焦在应用科学层面。

再者，国内生成式AI企业不要盲目地推出对标产品。前车之鉴就是谷歌，在OpenAI推出产品后，谷歌匆忙应战，结果发布会的若干个小瑕疵导致谷歌股价暴跌。国内生成式AI企业要清楚认识到，这一次ChatGPT的成功和过去其他概念有所不同，其成功基础在于用户的认可，用户是会拿着ChatGPT和其他竞品比较的，这就让后来者实际上更难做，要求也更高。如果生成式AI方面没有达到ChatGPT的效果，则往往会暴露自己能力上的短板。反过来说，国内生成式AI企业也可以另辟蹊径，GPT-4并不是万能的，在其短板领域完全可有一番作为。

综上，国内AI企业还是要重视积累，包括参数积累、数据训练积累以及算力积累。科技的道路，弯道超车的机会有，但不多，诸如新能源车我国就实现了弯道超车，但大多数科技领域开展的是阵地战，要尝试“结硬寨，打呆仗”的做法，夯实中国生成式AI发展的基础，推出成熟度较高的产品。

(作者系浙江大学国际联合商学院数字经济与金融创新研究中心联席主任、研究员，工信部信息通信经济专家委员会委员）

懂图片的GPT-4来了 国内AI企业如何接招？

懂图片的GPT-4来了国内AI企业如何接招？