大模型“云上经济”之权力游戏( 二 ) _人工智能

这就好比预装在手机里的APP，优势占了一大截。
云厂商形势颇为严峻。
假如没有大模型，阿里巴巴在中国会遇到不少于以下三种严峻而又强势的挑战。
一、狙击。
独立大模型开发商拿走云上AI计算业务的利润。这是结果，但过程绝不会简单，短时间也完成不了。

文章插图
二、截胡。
国内数据中心，尤其是智算中心。当智算中心拥有大模型后，可以直接输出AI大模型能力，背后就是算力的输出。
三、连锅端。
独立大模型开发者和国内智算中心合力，联合围剿国内云厂商。
阿里巴巴会坐以待毙吗？
答案显然是否定的，尽管阿里大模型出发的时候对标的是谷歌。
谷歌有TPU，阿里有平头哥。
平头哥虽然不是天下第一，但是它能让阿里云成本降低，且不论全部替代，想想那些不能降成本的竞争对手。
谷歌的AI生态建设得非常完整和领先，包括AI芯片TPU，端到端开源深度学习框架。
与传统的CPU+GPU组合相比，TPU这类专业芯片在搜索、翻译、语音助手、图像识别等AI任务上有数量级的性能提升。
百度也想全套对标，还比不上谷歌。
结果，晴天里一个大霹雳，谷歌大模型输给了微软（和）战队，尽管Bert模型对谷歌搜索引擎上的每一个基于英文的查询提供支持，效率提升10%以上。
别人家大模型赢了，谷歌吃尾气了，还让大家都看到了。虽遭重击，但谷歌比别人更有翻盘的机会。
以前都无法想象谁会超越谷歌的AI 。
我们聊回阿里巴巴。
说阿里巴巴在NLP（自然语言处理）等前沿科研领域布局多年，这话没人反驳吧？
阿里达摩院在2018年底启动研发，在超大模型、语言及多模态能力和训练、平台化服务、落地应用等多个方面，为中文大模型的发展做了一些前沿性、引领性的工作。
- 2019年
发布大规模预训练语言模型并登顶全球NLP权威榜单GLUE；
- 2021年
先后发布国内首个超百亿参数的多模态大模型M6及语言大模型PLUG；
- 2021年8月
阿里大模型在全球机器视觉问答榜单VQA上首超人类得分；
- 2021年10月
阿里探索较低能耗训练全球首个10万亿参数大模型M6；
- 2022年2月
M6可同时完成10余项单模态及多模态任务。
这些非技术背景的读者看上去意义不大的事情，如今都成了大模型的“史料” 。
阿里大模型的品牌统一在“通义”之内，那些曾经被我来回理解的大模型都有了一个共同的名字。
近日，阿里“通义千问”语言大模型邀请测试，阿里成为全球较早研发并开放GPT-like大模型的科技公司之一。
谭老师我的大模型技术启蒙是阿里巴巴给的。
跟着阿里学习大模型这些年，我获得一个测试邀请码不过分吧？
所以，通义千问测（翻）试（车），我们放在文章最后。
整体来看，阿里在大模型领域与引领者尚有差距。但总体来说，阿里处于全球领先的大模型研发梯队，具备语言大模型、多模态大模型、大模型底层训练平台的完整布局。
应当承认，已是全球大模型的引领者，是非常优秀的模式，GPT-4在推理、数学等方面有了非常不错的表现，是当前通义千问尚不能及的。
通义千问目前在效果上与还存在一定差距，仍在学习和成长。当然，通义千问也有自己较为擅长的领域，比如在文本对话、阅读理解等方面。
好消息是，阿里应该比谭老师我更理解为何重视大模型。
就算全中国只有三个公司出手大模型，其中一个必须是阿里巴巴。