大模型“云上经济”之权力游戏( 二 )


这就好比预装在手机里的APP,优势占了一大截 。
云厂商形势颇为严峻 。
假如没有大模型,阿里巴巴在中国会遇到不少于以下三种严峻而又强势的挑战 。
一、狙击 。
独立大模型开发商拿走云上AI计算业务的利润 。这是结果,但过程绝不会简单,短时间也完成不了 。

大模型“云上经济”之权力游戏

文章插图
二、截胡 。
国内数据中心,尤其是智算中心 。当智算中心拥有大模型后,可以直接输出AI大模型能力,背后就是算力的输出 。
三、连锅端 。
独立大模型开发者和国内智算中心合力,联合围剿国内云厂商 。
阿里巴巴会坐以待毙吗?
答案显然是否定的,尽管阿里大模型出发的时候对标的是谷歌 。
谷歌有TPU,阿里有平头哥 。
平头哥虽然不是天下第一,但是它能让阿里云成本降低,且不论全部替代,想想那些不能降成本的竞争对手 。
谷歌的AI生态建设得非常完整和领先,包括AI芯片TPU,端到端开源深度学习框架 。
与传统的CPU+GPU组合相比,TPU这类专业芯片在搜索、翻译、语音助手、图像识别等AI任务上有数量级的性能提升 。
百度也想全套对标,还比不上谷歌 。
结果,晴天里一个大霹雳,谷歌大模型输给了微软(和)战队,尽管Bert模型对谷歌搜索引擎上的每一个基于英文的查询提供支持,效率提升10%以上 。
别人家大模型赢了,谷歌吃尾气了,还让大家都看到了 。虽遭重击,但谷歌比别人更有翻盘的机会 。
以前都无法想象谁会超越谷歌的AI 。
我们聊回阿里巴巴 。
说阿里巴巴在NLP(自然语言处理)等前沿科研领域布局多年,这话没人反驳吧?
阿里达摩院在2018年底启动研发,在超大模型、语言及多模态能力和训练、平台化服务、落地应用等多个方面,为中文大模型的发展做了一些前沿性、引领性的工作 。
- 2019年
发布大规模预训练语言模型并登顶全球NLP权威榜单GLUE;
- 2021年
先后发布国内首个超百亿参数的多模态大模型M6及语言大模型PLUG;
- 2021年8月
阿里大模型在全球机器视觉问答榜单VQA上首超人类得分;
- 2021年10月
阿里探索较低能耗训练全球首个10万亿参数大模型M6;
- 2022年2月
M6可同时完成10余项单模态及多模态任务 。
这些非技术背景的读者看上去意义不大的事情,如今都成了大模型的“史料” 。
阿里大模型的品牌统一在“通义”之内,那些曾经被我来回理解的大模型都有了一个共同的名字 。
近日,阿里“通义千问”语言大模型邀请测试,阿里成为全球较早研发并开放GPT-like大模型的科技公司之一 。
谭老师我的大模型技术启蒙是阿里巴巴给的 。
跟着阿里学习大模型这些年,我获得一个测试邀请码不过分吧?
所以,通义千问测(翻)试(车),我们放在文章最后 。
整体来看,阿里在大模型领域与引领者尚有差距 。但总体来说,阿里处于全球领先的大模型研发梯队,具备语言大模型、多模态大模型、大模型底层训练平台的完整布局 。
应当承认,已是全球大模型的引领者,是非常优秀的模式,GPT-4在推理、数学等方面有了非常不错的表现,是当前通义千问尚不能及的 。
通义千问目前在效果上与还存在一定差距,仍在学习和成长 。当然,通义千问也有自己较为擅长的领域,比如在文本对话、阅读理解等方面 。
好消息是,阿里应该比谭老师我更理解为何重视大模型 。
就算全中国只有三个公司出手大模型,其中一个必须是阿里巴巴 。