// 人工智能有望加速迈进“通感”时代 //
上周,谷歌正式推出大语言模型Gemini 1.0。谷歌表示Gemini模型预计将在超过170个国家和地区提供服务。谷歌认为Gemini未来有望帮助人类通过阅读、过滤和理解海量信息,在科学研究金融等许多领域的应用实现突破,同时高质量代码的生成能力使其有望在代码助手领域的能力进一步扩充。
google CEO表示“Gemini将影响几乎所有Google产品”。目前谷歌已推出由 Gemini支持的AlphaCode 2,解决问题能力提升近2倍,并可以处理复杂编程任务,未来几个月Gemini将陆续集成到搜索、广告、Chrome和Duet AI中,谷歌有望开启Gemini时代。
(图片来源:海洛创意)
开源证券指出Gemini为原生多模态大模型,由多模态数据集训练而来,可以处理跨文本、图像、音频、视频和代码的复杂任务,在多模态任务上表现优秀,OpenAI则是单独训练了支持图像和语言的模型DALL-E和Whisper。多模态能力将是未来大模型厂商技术发展重点,谷歌、OpenAI、Adobe等巨头纷纷发力多模态,人工智能有望加速迈进“通感”时代,应用场景和生态也将进一步丰富。
华创证券表示谷歌发布多模态大模型Gemini可以理解视频。Gemini 的初始版本,微调后的Gemini Pro已经可以在Bard中体验,开发人员版本将于12月13日通过Google Cloud的API提供,而最强版本Gemini Ultra或将于2024年推出。Gemini在视频演示中呈现出多模态大模型强大的输出能力,或有望进一步拓宽应用场景,并能带来一定程度的算力需求的提升。
// 新的三大AI机会方向 //
值得注意的是芯片方面,10月高通、联发科分别发布支持AI大模型的移动平台第三代骁龙8和天玑9300,支持百亿级大模型在手机端侧运行,目前已和多家手机厂商合作。软件层面,Android/ target=_blank class=infotextkey>安卓推出新的系统服务AICore,负责模型的管理、运行和安全功能大模型可以轻松部署并且支持硬件加速。开源证券认为,目前AICore支持高通、三星、联发科等芯片,未来将支持更多芯片和设备,端侧AI有望加速推进。
国海证券表示看好原生多模态大模型的投资机会。相较于“拼接型”多模态大模型,原生大模型可能是更优解,其能帮助解决更为复杂的推理任务,从而实现真正意义上的AGI。如果谷歌将旗下产品全面接入Gemini,其搜索引擎和办公软件将能够与微软的New Bing及Microsoft 365 Copilot对垒。此外,谷歌亦有可能在搭载Android系统的移动设备上推出类似于windows Copilot的AI助手充分发挥其在2C端的用户优势,顺应当前AI手机的发展潮流。
(图片来源:海洛创意)
民生证券指出多模态AI应用、算力国产化、AI终端重构是新的三大AI机会方向,恰是Gemini大模型此次发布所代表的新趋势。
(1)多模态AI应用,Gemini大模型最核心亮点在于对视频多模态的理解能力,拥有视频数据与应用卡位的企业或有重估机遇。
(2)算力国产化,Gemini并没有依赖英伟达芯片算力,是由 Google 自研TPU v4 和 TPU v5e 训练出来的大模型,值得关注的是谷歌设计的TPU细节的论文《数据中心的 TPU效能解析》大量引用、致敬我国寒武纪的研究工作。一方面给予我们国产算力崛起的信心,另一方面国内真正大客户互联网巨头开始批量采购华为升腾、寒武纪为代表国产AI芯片拐点已经到来。
(3)AI终端重构,谷歌同时发布Gemini Nano这一专门为移动设备训练的模型。针对不同内存的设备,训练了两个版本,参数量分别是18亿和32.5亿大模型重构各类终端的趋势再度确认,我们将迎来前所未有终端硬件创新潮。
Wind用户在金融终端输入
万得3C会议