<返回更多

对话阿里云CTO周靖人:“炼出”一个大模型应用,最快需要多久?

2023-11-03  新浪科技  
加入收藏
对话阿里云CTO周靖人:“炼出”一个大模型应用,最快需要多久?

文 丨 新浪科技 周文猛

在2023云栖大会上,阿里云宣布将升级云计算体系,打造一朵AI时代最开放的云。

阿里云CTO周靖人在接受新浪科技《科创100人》采访时表示,模型已经成为业务系统开发和云计算当中一个非常重要的生产元素,所有人都正在围绕着模型来重新开发设计自己的开发系统,甚至是业务系统。

那么,若要开发一个大模型应用,到底需要多久?

“不能只关注模型”

作为本轮AI浪潮的核心技术,大模型基础模型的质量很大程度决定了AI产业化的前景。训练大模型是囊括了算力底座、网络、存储、大数据、AI框架、AI模型等复杂技术的系统性工程,只有强大的云计算体系才能训练出高质量的大模型。

“2009年阿里云就提出‘数据中心是一台计算机’的理念,今天,AI时代更加需要这样的技术体系。”周靖人指出:“作为一台超级计算机的云计算,可高效连接异构计算资源,突破单一性能芯片瓶颈,协同完成大规模智能计算任务。”

“虽然我们今天关注模型,但模型它只是今天我们业务系统开发中的一环,我希望不能只关注模型,包括模型下面的数据、存储、网络等能力,也是今天做科技创新所必需的。”在他看来,“如今大模型已经成为业务系统开发和云计算当中一个非常重要的元素,不容缺失。”

此外,周靖人透露表示,“目前中国一半大模型公司,都跑在阿里云上,百川智能、智谱AI、零一万物、昆仑万维(31.430, -0.02, -0.06%)、vivo、复旦大学等大批头部企业及机构,均在阿里云上训练大模型。”

随着AI产业化逐步深入,必将迎来大规模智能算力需求的爆发。周靖人说,目前阿里云已在全球30个地域建设了89个云计算数据中心,提供3000余个边缘计算节点,充足的计算节点,进一步发挥出了云计算低延时、高弹性的优点。

“模型将成为重要的生产元素”

2022年底,周靖人首次提出MaaS(Model as a Service 模型即服务)理念。在他看来,“模型即服务”既代表着基础架构的升级,也代表了今天围绕着模型的一系列开发范式转移。他对新浪科技介绍表示:“其实今天很多的开发模式,更多地是以模型为中心,模型已经成为一个重要的生产的元素”。

“我们的开发者有的是做模型本身的创造,在有了模型研发的抽象过后可以很好地提供给其他业务系统开发者使用,业务系统开发者则更多的是使用者,他们围绕着模型去使用并配置业务场景。其实模型在很大程度上是这两拨人,或者说很多这样的技术专家‘握手’交接的环节。”他强调指出,“今天所有的人,都会围绕着模型来重新设计自己的开发系统,甚至设计自己的业务系统。”

当千行百业都想借助大模型实现生产和服务方式的变革之时,大模型使用的高门槛却把大部分人挡在了技术浪潮外。无论是定制专属大模型,还是基于大模型构建创新应用,都有很高的人才、技术、资金要求。

云栖大会现场,周靖人发布一站式大模型应用开发平台——阿里云百炼,该平台集成了国内外主流优质大模型,提供模型选型、微调训练、安全套件、模型部署等服务和全链路的应用开发工具,为用户简化了底层算力部署、模型预训练、工具开发等复杂工作。开发者可在5分钟内开发一款大模型应用,几小时即可“炼”出一个企业专属模型,开发者可把更多精力专注于应用创新。与此同时,为推动大模型更易在千行百业集成落地,阿里云基于通义推出了8个行业大模型。 

“今天阿里云的定位是,要服务好智能时代期待利用数字创新或者人工智能的方式,去做科技创新的这些开发者,这些企业都是我们的客户,我们希望以完善的一个产品矩阵有效地去支持好他们,这是我们当前的定位。”周靖人表示。在推出通义千问等自研大模型的同时,阿里云也希望通过自己的技术能力,去服务好更多的大模型企业,“打造AI时代最开放的云”。

关键词:大模型      点击(13)
声明:本站部分内容来自互联网,如有版权侵犯或其他问题请与我们联系,我们将立即删除或处理。
▍相关推荐
更多大模型相关>>>