「中国人工智能研究论文总数已经超过了美国,成为全球第一」
「人工智能初创企业获得的资本青睐越来越少」
「主流NLP系统也存在种族歧视」
这些话题都出自斯坦福大学Human-Centered人工智能研究所近期发布的「2021年人工智能指数报告」。报告内容覆盖AI研发、技术性能、经济、教育、道德、多样性以及各国相关政策和国家战略等大量内容。
这份报告长达222页,包含大量数据和图表,我们从中精选了15份图表,带你速览这份斯坦福「2021年人工智能指数报告」,了解2021年人工智能发展现状。
作者 | Eliza Strickland
编译 | 机器之能
「2021年人工智能指数报告」由斯坦福大学Human-Centered人工智能研究所,以及来自哈佛大学,经济合作与发展组织,the Partnership on AI合作组织和SRI International的11名专家组成的指导委员会共同编制。这份报告引用了大量AI研究数据,引用了包括:arXiv的AI研究数据,Crunchbase的资金数据,以及对Black in AI和Queer in AI等团体的调查。
报告对2021年度人工智能最新的研究趋势和进展进行了总结,并分析了资本、政策对AI技术的影响,以及深度学习、图像识别、语言识别等AI主要子领域的研究。
人工智能研究工作正处在爆炸增长期:2019年全球发布了超过12万篇人工智能研究领域的同行评审论文。自2000年以来,人工智能领域论文在同行评审论文中的占比,从0.8%一路攀升至2019年的3.8%。
自2017年中国研究人员发表的同行评审论文首次超过欧洲以来,中国的人工智能研究论文数量持续上升。到2020年,中国研究人员发布的人工智能研究论文在权威期刊的引用率已经领先全球。
AI指数指导委员会联合主任Jack Clark表示,这些数据对中国来说似乎是「学术成功的指标」,也在一定程度上映射出不同国家在人工智能生态体系建设方面的现状。他认为研究论文更像是一种学术权威认证,一个领域的学术性越弱,其行业实用性可能会越强。他指出:「中国有获得期刊出版物的明确政策,政府机构在研究中发挥更大的作用,而在美国,大部分这方面的研发主要集中在企业内部。」
MLPerf以训练速度与硬件的关系为基础,分析了机器学习的系统性能,客观地对机器学习系统性能进行排名。通过对各种图像分类器系统在标准ImageNet数据库上进行培训,并根据训练时间进行排名。2018年,训练最佳系统需要6.2分钟;2020年,培训最佳系统需要47秒。这一进步也得益于近年来机器学习专用芯片的快速发展。
报告认为,硬件加速对机器学习的影响至关重要。系统训练耗时几秒和几小时的差别巨大,这种差异直接影响着研究人员的想法,以及研究的类型和数量,以及它可能影响到的研究风险。
在过去的几年里,人工智能在静态图像识别方面的进展突飞猛进,而计算机视觉未来必将朝着视频识别的方向发展。研究人员正在构建可以从视频剪辑中识别各种活动的系统,因为如果将机器视觉应用到现实世界(例如自动驾驶汽车、监控摄像头等),这种类型的识别可能会大有用处。计算机视觉性能的基准之一是ActivityNet数据集,其中包含来自2万个视频的近650小时镜头。在其中显示的200项日常生活活动中,人工智能系统在2019年和2020年都很难识别「喝咖啡」这项活动。这似乎是一个主要问题,因为喝咖啡是所有其他活动的基本活动。无论如何,这是未来几年值得关注的领域。
自然语言处理(NLP)的迅速崛起似乎遵循了计算机视觉的轨迹,在过去十年中,计算机视觉从学术领域的分支专业发展成为广泛的商业部署。今天的NLP也由深度学习驱动,Jack Clark认为,NLP继承了计算机视觉工作的策略,例如对大型数据库的训练和特定应用程序的微调。他说:「我们看到这些创新非常迅速地流向人工智能的另一个领域。」
Jack Clark表示,衡量NLP系统的性能正在变得很棘手,学术界一直在研发更为困难的AI测试系统和指标,但无论何种系统总会在六个月内出现新的AI击败它。这份图表显示了两个版本的阅读理解测试SQuAD的表现,人工智能语言模型必须根据一段文本回答多项选择题。2.0版通过包含无法回答的问题来使任务更加困难,模型必须识别这些问题,并且不回答。一个模型在第一个版本上花了25个月才超过人类的性能,但另一个模型只花了10个月就完成了更艰巨的任务。
语音识别和文本生成等任务的语言模型总的来说已经非常完善了。但即便在主流的成熟商业NLP系统中仍存在认知偏差,如果这些问题不得到解决,则可能会严重影响这些技术的商业应用。
例如AI系统也存在种族歧视问题,图表显示了几款较为成熟的商业化语音识别程序的错误率。
虽然系统存在认知偏差,但大多数研究人员只注重系统性能,而很少有人会去注意到这种偏差。这个问题在未来很可能会阻碍各种形式的人工智能发展,包括计算机视觉和决策支持工具。
据LinkedIn数据显示,从2016年到2020年,巴西、印度、加拿大、新加坡和南非的人工智能岗位增长最快。而这并不意味着这些国家的绝对就业机会最多(美国和中国仍占据AI就业机会的首位),但这些国家对人工智能的投入将会对人工智能技术以及整个社会的发展产生积极影响。LinkedIn发现,2020年的全球疫情并未对AI领域的工作岗位招聘造成丝毫影响。
值得注意的是,印度和中国的人才对LinkedIn的应用并不广泛,因此这些国家的人才市场状况在LinkedIn上的数据并不具有充分的代表性。
自2015年以来大量资金持续涌入人工智能领域。2020年,全球企业对人工智能的投资飙升至近680亿美元,比前一年增长40%。
从前面一张图表可以看出,AI领域的企业投资持续增长,但在增长的背后,却是增速逐年放缓。这张图表显示,AI初创企业得到的投资越来越少。虽然疫情可能对初创企业的活动产生了影响,但AI初创企业数量下降的明显趋势始于2018年,从好的方面来看,这似乎是行业正在逐步走向成熟的信号。
虽然人工智能的许多趋势在很大程度上没有受到全球疫情的影响,但这张图表显示,2020年的AI投资更偏向于全球应对新冠病毒中发挥重要作用的单位。制药相关公司投资的激增就很好的说明了这一点。而对教育技术和游戏的投资增长,也与2020年疫情隔离导致人们把更多时间花费在电脑前有直接关系。
大量企业在电信、金融服务和汽车等行业稳步增加人工智能工具的应用。然而,大多数公司似乎不知道或不关心这项新技术带来的风险。麦肯锡在一项研究中调查了企业对AI应用相关风险的认知,只有网络安全风险受到了半数以上受访者的关注。与人工智能相关的伦理问题,如隐私和公平,是当今人工智能研究领域最热门的话题之一,然而这些问题并未引起企业的足够重视。
AI领域的学术工作有限,虽然高校增加了本科生和研究生级别的人工智能相关课程,终身制教师职位也相应增加,但学术界仍然无法吸收逐年新增的AI博士。这份图表仅代表北美地区的AI博士毕业生,这些毕业生中的绝大多数正在流向AI企业。
如前所述,很多公司对人工智能的伦理问题重视程度不足,但研究人员对此越来越关心。许多团体正在研究人工智能系统的不透明决策(称为可解释性问题),嵌入偏见和歧视,以及隐私入侵等问题。这份图表显示了人工智能会议上伦理问题的相关论文正在逐年增加,Jack Clark认为这非常值得高兴。他指出,由于有这么多学生参加这些人工智能会议,几年后,将有大量关注AI伦理的从业者进入行业。
然而,除了会议文件的增加外,在这一问题上业界并没有其他突出的进步。报告强调,人工智能系统中的偏差量化测试才刚刚开始出现。Jack Clark说,「这些评估体系,就像人工智能科学领域的一个新分支。」
解决人工智能系统中嵌入的偏见和歧视的一种方法是确保构建人工智能系统的群体的多样性。这不是一个激进的概念。然而,报告称,在学术界和行业,人工智能劳动力「仍然以男性为主」。这张图表来自美国计算机研究协会年度调查,数据显示,在北美人工智能相关的博士课程的毕业生中,女性仅占约20%。
来自同一调查的数据讲述了一个关于种族/民族身份的类似故事。这个问题在即将毕业的博士生中似乎相当明显,有许多优秀的科学、技术、工程和数学项目都以女孩和少数族裔为重点。这使我们想到了AI4ALL组织,或许社会可以更加关注这些群体,给他们更多的资助,或者以某种方式参与其中。
参考链接:
https://aiindex.stanford.edu/wp-content/uploads/2021/03/2021-AI-Index-Report_Master.pdf
https://spectrum.ieee.org/tech-talk/artificial-intelligence/machine-learning/the-state-of-ai-in-15-graphs