Science:AI竞赛,学界正在输给业界

学术头条在不改变文章原意的前提下,对原文进行了精简与编译 。
几十年来,AI 研究在学界和业界并存,但随着深度学习成为该领域的领先技术,平衡正在向业界倾斜 。我们常常看到业界 AI 的成功,如 DALL·E 2、、new Bing 等 。
然而,这些头条新闻预示着一场更大、更系统的变革:业界正在占据 AI 研究的主导地位,从大型数据集、计算能力和高技能研究人员三方面支配着 AI 投入 。这种支配正在转化为一系列研究成果:业界在学术出版物、尖端模型和关键基准方面的影响力越来越大 。尽管消费者能够从中受益,但伴随而来的是全球决策者的担忧——重要 AI 工具的公共科技替代品可能会越来越稀缺 。
业界的投入优势:数据、算力与人才
业界长期以来更能够访问大型、具有经济价值的数据集,因为大量用户与设备交互时会自然而然地产生数据 。例如,在 2020 年,美国用户每天发送大约 1000 亿条消息 。然而,业界的主导地位除了凸显在数据之外,更是扩展到了现代 AI 的其他关键投入:人才和计算能力 。
在过去十年中,AI 人才的需求骤升导致了 AI 人才竞争的加剧 。然而,业界正在赢得这场竞赛 。来自北美州的众多大学的数据显示,专门研究 AI 的计算机科学(CS)博士毕业生正以前所未有的数量进入业界 。2004 年,只有 21% 的 AI 博士进入业界,但到 2020 年,这一数量占比高达 70% 。
专门研究 AI 的 CS 研究人员也从大学被聘请到业界工作 。自 2006 年以来,这一招聘人数增长了 8 倍,远高于 CS 研究人员的整体增长 。这种担忧并不局限于美国的大学 。在英国,华威大学国王十字校区院长表示,“顶尖的科技公司正在汲取大学的精华” 。
学界和业界的算力使用也呈现出越来越大的差距 。在图像分类中,业界使用的算力比学界或业界-学界合作使用的更大,并且增长更快 。研究运用参数数量(所需算力的关键决定因素之一)来代替模型中使用的计算能力 。2021 年,业界模型的平均规模是学界的 29 倍,突显出两组计算能力的巨大差异 。
业界雇佣人才和利用更大算力的能力很可能是造成 AI 研究成果差异的原因 。虽然公共和私营部门在 AI 方面的投资都在大幅增加,但业界的投资更大、增长更快 。2021 年,非国防的美国政府机构在 AI 行业拨款 15 亿美元 。同年,欧盟委员会计划支出 10 亿欧元 。

Science:AI竞赛,学界正在输给业界

文章插图
【Science:AI竞赛,学界正在输给业界】相比之下,同年全球范围内,业界在 AI 上的支出超过了 3400 亿美元,大大超过了公共投资 。例如,2019 年,谷歌母公司在其子公司上花费了 15 亿美元,这只是其 AI 投资的一部分 。在欧洲,这一差距较小,但仍然存在;AI Watch 估计,“私营和公共部门分别占欧盟 AI 投资的 67% 和 33%” 。
开展 AI 研究所需资金规模的一个例子来自,它最初是一个非营利组织,声称“不受产生财务回报的约束”,旨在“造福整个人类” 。四年后,将其定位改为“有上限的营利组织”,并宣布这一改变将使他们“迅速增加对算力和人才方面的投资” 。
业界在 AI 研究中日益占据主导地位
如今,业界对 AI 输入的主导地位表现在 AI 成果的日益突出,尤其是在研究发布、创建最大模型和超越关键基准方面 。在主要 AI 会议上,由一位或多位业界联合作者撰写的研究论文从 2000 年的 22% 增长到 2020 年的 38%;业界在最大的 AI 模型中所占份额已从 2010 年的 11% 上升到 2021 年的 96% 。
在 AI 基准方面,纵观图像识别、语义分析、语言建模、语义分割、对象检测和机器翻译 6 个方面,以及涵盖机器人和常识推理等领域的另外 14 项基准,在 2017 年之前,业界单独或与大学合作,有 62% 的时间处于领先地位 。自 2020 年以来,这一比例已上升到 91% 。