作者 | Anirban Ghoshal
策划 | 云昭
出品 | 51CTO技术栈(微信号:blog51cto)
“Generative AI”可谓是re:Invent 2023的口号,不管是AWS推出了新的芯片、基础模型、基于生成AI的应用程序构建服务Amazon Bedrock的更新,还是一款名为Amazon Q的新生成AI助手,支持向量数据库和零ETL集成。
在上周的AWS re:Invent会议上,一切的焦点都集中在人工智能上,新的生成AI助手Amazon Q首次成为会议上的“明星”。但还有很多其他发布,激发了数据库经理、数据科学家、数据工程师和开发人员的兴趣,包括新的提取、转换、加载(ETL)服务、新的成本优化中心,以及AWS基于云的开发工具(称为Amazon CodeCatalyst)的企业定价层改进。以下是大会的七个看点。
AWS作为云服务供应商,自去年以来一直在增加基础设施功能和芯片的投入,以支持具有增强能效的高性能计算,并宣布了其Graviton和Trainium芯片的最新迭代。
根据AWS的数据,Graviton4处理器比当前一代Graviton3处理器提供了高达30%的计算性能、50%的内核和75%的内存带宽。
另一方面,Trainium 2的训练速度是第一代Trainium芯片的四倍。在J今年的re:Invent,AWS还扩展了与英伟达的合作伙伴关系,包括对DGX Cloud的支持,一个名为Ceiba的新GPU项目,以及支持生成AI工作负载的新实例。
英伟达还分享了将其NeMo Retriever微服务集成到AWS的计划,以帮助用户开发聊天机器人等生成性人工智能工具。NeMo Retriever是一种生成型人工智能微服务,使企业能够将自定义的大型语言模型(LLM)连接到企业数据,因此公司可以根据自己的数据生成适当的人工智能响应。
此外,AWS表示,它将成为第一家将英伟达GH200 Grace Hopper超级芯片带到云端的云提供商。
Bedrock中添加的更新型号包括Anthropic的Claude 2.1和Meta Llama 2 70B,这两款产品都已上市。亚马逊还将其专有的Titan Text Lite和Titan Text Express基础模型添加到Bedrock中。此外,这家云服务提供商在人工智能应用程序构建服务中添加了一个预览模型,即亚马逊泰坦图像生成器。
AWS还在Bedrock中发布了一项新功能,允许企业评估、比较和选择适合其用例和业务需求的最佳基础模型。
该公司表示,该功能在Amazon Bedrock上被称为模型评估,目前正在预览中,旨在简化多项任务,如确定基准、设置评估工具和运行评估,并补充说,这节省了时间和成本。
为了帮助企业高效地训练和部署大型语言模型,AWS在其亚马逊SageMaker人工智能和机器学习服务中推出了两种新产品——SageMaker HyperPod和SageMaker推理。
该公司表示,与手动模型训练过程相比,HyperPod消除了为训练模型构建和优化机器学习基础设施所涉及的繁重任务,将训练时间减少了40%,而手动模型训练容易出现延迟、不必要的支出和其他复杂情况。
另一方面,SageMaker推理旨在帮助企业降低模型部署成本,减少模型响应的延迟。为了做到这一点,推理允许企业将多个模型部署到同一个云实例,以更好地利用底层加速器。
AWS还更新了针对商业分析师的低代码机器学习平台SageMaker Canvas。
AWS数据库、分析和机器学习服务主管Swami Sivasubramanian表示,分析师可以使用自然语言在Canvas中准备数据,以生成机器学习模型。无代码平台支持来自Anthropic、Cohere和AI21实验室的LLM。
SageMaker现在还具有模型评估功能,现在称为SageMaker Clarify,可以从SageMaker Studio中访问。
上周二,AWS首席执行官Adam Selipsky首次展示了这家云巨头的re:Invent 2023会议的明星:Amazon Q,这是该公司对微软GPT驱动的Copilot生成人工智能助手的回应。Amazon Q可供企业用于各种功能,包括开发应用程序、转换代码、生成商业智能、充当商业应用程序的生成AI助理,以及通过Amazon Connect服务帮助客户服务代理。
这家云服务提供商宣布了一项名为“Amazon Braket Direct”的新计划,为研究人员提供量子计算机的直接私人访问。该项目是AWS托管量子计算服务的一部分,名为Amazon Braket,Amazon Bracket Direct于2020年推出。
亚马逊表示,它允许企业的研究人员在没有任何等待时间的情况下私人访问各种量子处理单元(QPU)的全部容量,还提供了从亚马逊量子计算专家团队获得其工作负载专家指导的选项。
目前,Direct计划支持保留IonQ Aria、QuEra Aquila和Rigetti Aspen-M-3量子计算机。IonQ的价格为每小时7000美元,QuEra Aquila的价格为2500美元。Aspen-M-3的价格略高,为每小时3000美元。
re:Invent上宣布的更新包括一个新的AWS计费和成本管理功能,称为AWS成本优化中心,使企业能够轻松识别、过滤、汇总和量化AWS成本优化建议的节约。
据云服务提供商称,新的Hub将AWS云财务管理(CFM)服务中的所有成本优化建议行动收集在一个地方,包括AWS成本资源管理器和AWS计算优化器。AWS补充道,它将特定于客户的定价和折扣纳入了这些建议中,并消除了重复的发现和节省,从而对企业的成本优化机会提供了一个综合的视图。
该功能可能有助于FinOps或基础设施管理团队获得更多成本优化的可能性。
AWS继续努力实现数据仓库服务的零ETL,宣布了与Amazon Aurora PostgreSQL、Amazon DynamoDB和Amazon RDS for MySQL的新的Amazon RedShift集成。
企业通常使用提取、转换、加载(ETL)将来自多个源的数据集成到单个一致的数据存储中,以便加载到数据仓库中进行分析。
然而,大多数数据工程师声称,从不同来源转换数据可能是一项困难而耗时的任务,因为该过程涉及到清理、过滤、重塑和汇总原始数据等步骤。AWS表示,另一个问题是为运行分析准备数据管道的团队的维护成本增加。
相比之下,根据该公司的说法,新的零ETL集成消除了在Aurora PostgreSQL、DynamoDB、RDS for MySQL和RedShift之间执行ETL的需要,因为这些数据库中的事务数据几乎可以立即复制到RedShift中,并可以运行分析。
re:Invent的其他生成AI相关更新包括对Amazon Bedrock向量数据库的更新支持。这些数据库包括AmazonAurora和MongoDB。其他受支持的数据库包括Pinecone、redis Enterprise Cloud和Vector Engine for Amazon OpenSearch Serverless。该公司还在其基于云的开发工具中添加了一个新的企业定价层,Amazon CodeCatalyst。
参考链接:https://www.infoworld.com/article/3711385/aws-reinvent-2023-7-takeaways-from-the-big-annual-event.html