开源和闭源,一直是大模型时代讨论的焦点。
当地时间4月18日,Meta推出开源大模型Llama 3系列,发布8B和70B两个版本。Meta CEO扎克伯格在同一天宣布,基于Llama 3,Meta的AI助手现在已经覆盖Instagram、WhatsApp、Facebook等全系应用,并单独开启了网站。
当晚,猎豹移动CEO傅盛发视频称,Llama 3性能大炸裂,成倍提高数学能力,甚至超越部分闭源模型。在他看来,“开源社区终将战胜闭源。”
而早在4月11日晚,百度创始人李彦宏的内部讲话曝光,直言大模型开源的意义不大,这些开源模型都是在外头零零散散小规模地去做各种各样的验证应用,它没有经过大算力的验证。而且模型开源也不是一个众人拾柴火焰高的情况。“反观闭源,是有真正的商业模式的,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才。”
两日后,360董事长周鸿祎在哈佛中国论坛的演讲中称:“我一直相信开源的力量,网上有些人胡说八道,你们也别被他们忽悠了,说开源不如闭源好。一句话,今天没有开源,就没有linux、没有互联网,连说这话的公司自己都是借助了开源的力量才成长到今天,开源社区聚集的工程师和科学家的数量是闭源的数百倍。我觉得未来一两年内,开源的力量很有可能会达到或者超过闭源的水平”
Llama 3引发云厂商轰动
此次Llama 3开源了2个版本的模型,据Meta介绍,指令微调的Llama 3 8B在五项基准上得分超Gemma 7B-1t和Mistral 7B Instruct,Llama 3 70B三项基准超过Gemini Pro 1.5和Claude 3 So.NET。
这两个开源模型发布后,业界不少人士相继发表了自己的看法。360创始人周鸿祎认为,这两个开源模型性能很强,应该远远超过GPT-3.5,Llama问世再次验证了其对开源的信心。
传奇研究员,AI开源倡导者吴恩达表示:Llama 3的发布是自己这辈子收到过的最好的礼物,谢谢你Meta!
Llama 3这两个版本,也很快登录云供应商。4月19日,百度智能云千帆大模型平台宣布已成为国内首家推出针对Llama 3全系列版本训练推理方案的云厂商。同日,亚马逊云科技也宣布,Meta Llama 3 基础模型已可通过 Amazon SageMaker JumpStart来部署和推理运行。
4月22日,阿里云称魔搭社区第一时间上架全部4款模型,并宣布百炼大模型服务平台在国内推出针对Llama 3系列的限时免费训练、部署、推理服务,且限时免除模型开发和调用的算力费用。腾讯云也宣布腾讯云TI平台成为国内首批支持Llama 3全系列模型的平台之一。
云厂商绑定大模型公司以锁定算力乃至芯片需求,以往并不少见。据第一财经报道,OpenAI背后站着的投资方是微软,ChatGPT就运行在微软Azure上。有“OpenAI最强对手”之称的Anthropic,身后则站着亚马逊。
由此,云厂商也获得了可观的利润。截至2023年12月31日的2024财年第二季度,微软智能云营收259亿美元,剔除汇率影响后同比增长19%,AI为Azure云贡献了6个百分点的增长,其中绝大部分增量来自OpenAI在Azure云上的推理调用。
亚马逊云服务AWS则在2023财年第四季度获得242.04亿美元营收,同比增长13%。亚马逊首席财务官布奥尔萨夫斯基表示,客户对AWS生成式AI产品表现出很大兴趣,虽然生成式AI服务体量相对较小,但公司相信其在未来几年将带来价值数百亿美元的收入。
国内云厂商则在自研大模型的同时,也提供平台支持第三方模型的接入。比如百度的千帆、阿里云的魔塔社区、腾讯云的TI平台。相比推理训练更具中心化特点的闭源模型,诸多云厂商都有机会拼抢算力分散的开源模型部署需求。
英伟达高级科学家Jim Fan认为之后可能会发布的Llama 3-400B以上的版本将成为某种“分水岭”,开源社区将能用上GPT-4级别的模型。据第一财经称如果Llama 3 参数量超4000亿版本可以获得媲美GPT-4的性能,部署该模型的需求攀升,接入Llama 3的云厂商能吃到的算力红利可能不低于微软。
开源好还是闭源好?
Llama3的发布,引发了云厂商的轰动,同时也让业内相关人士惊叹。AI领域KOL“数字生命”发文称这个消息的振奋程度,对于AI圈来说,甚至不亚于所谓的GPT4.5。圈内甚至将Llama3的发布,定义为一夜重回开源大模型铁王座。
与此同时,业内关于“开源”和“闭源”之争水涨船高。
起初,百度李彦宏的一封内部信曝光,在信中他提到,闭源模型在能力上会持续地领先,而不是一时地领先;模型开源也不是一个众人拾柴火焰高的情况。这跟传统的软件开源——比如Linux、Android/ target=_blank class=infotextkey>安卓等很不一样。
李彦宏还表示,闭源,是有真正的商业模式的,是能够赚到钱的,能够赚到钱才能聚集算力、聚集人才。闭源在成本上反而是有优势的,只要是同等能力,闭源模型的推理成本一定是更低的,响应速度一定是更快的。
此外,李彦宏提到,无论中美,当前最强的基础模型都是闭源的。通过基础模型降维做出来的模型也是更好的,这使得闭源在成本、效率上更有优势。对于AI创业者来说,核心竞争力本就不应该是模型本身,这太耗资源了,而且需要长时间的坚持才能跑出来。
而360周鸿祎则公开称自己是开源信徒。4月13日,他在哈佛的演讲中强调了开源的重要性,并指出如果没有开源文化,就不会有Linux、php、MySQL等众多重要的技术成果,甚至互联网的发展也会受到极大的限制。周鸿祎认为,开源不仅推动了技术的发展,更是促进了整个产业的繁荣。
另据媒体报道,4月上旬,针对大模型开源闭源的路线选择,百川智能CEO王小川在微信群中表示,开源和闭源并不像手机中IOS或者安卓操作系统只能二选一,开源确实容易“建立人品”,“朋友多多的”,也是为商业化做准备。从To B角度,开源闭源其实都需要。未来80%的企业会用到开源的大模型,因为闭源没有办法对产品做更好地适配,或者成本特别高,闭源可以给剩下的20%提供服务。二者不是竞争关系,而是在不同产品中互补的关系。
近日在各大AI相关的论坛上,投资人、行业从业者也针对开源和闭源的问题展开了“辩论”。生数科技联合创始人兼CEO唐家渝在4月18日举行的“2024中国生成式AI大会”上,认为开源和闭源各有合适的商业路径,开源的最大价值在于生态建设,但从模型能力提升来看,闭源还是会走在开源前面。
启明创投合伙人周志峰则认为,“开源闭源在过去几个大浪潮当中没有很大的冲突,我不太理解为什么很多人愿意把闭源、开源在AI时代看成对立”。但他也提到,从技术角度,开源模型及背后的公司更容易统一资源训练出符合“Scaling Laws”的模型。
昆仑万维董事长方汉的观点是,开源模型与闭源模型之间的差距正在不断缩小。4月16日,方汉在接受媒体采访时表示:“闭源模型的确(是)第一,但是开源大模型的接近程度在2023年到今年这一年间,从落后两年以上,已经进化到落后4—6个月以上。”
综合自百度、360、每日经济新闻、第一财经等。