新基建风向标:关于ChatGPT,必知10件事!

进入2023年以来,大火 。朋友圈里充斥着关于的各种消息,从GPT-1到GPT 3.5,再到Chat GPT和GPT-4,从和微软到各种创业和项目,仿佛一夜之间跨入了人工智能新基建时代 。那么,对于普通老百姓和超级繁忙的职场人来说,都有哪些关于的知识点,需要掌握呢?
是什么?
本质上来说,是一种面向NLP自然语言理解的预训练大模型 。NLP自然语言理解就是让计算机理解人类的语言,而不是理解程序代码或0101二进制代码 。之前,一个神经元网络程序只能解决一个NLP自然语言理解的问题或任务 。因此,就需要为每一个自然语言理解问题或任务而定制一个神经元网络程序 。预训练大模型的出现,改变了这一格局 。
预训练大模型用一个超大规模的神经元网络表达自然语言中的通用知识,而针对每一个特定的自然语言理解问题或任务,只需要在预训练大模型的基础上进行微调/精调,就能够很好地解决相应的问题或任务,这就是预训练大模型的价值 。简单理解,就是将之前的一个神经元网络拆解为预训练大模型+微调/精调方法,从而轻松适配不同的NLP任务 。
对于用户来说,不需要为了自己的NLP需求,例如开发一个客服机器人,而要从头开始开发一个完整的人工智能程序,用户只需要在大模型的基础上针对本企业/行业特点进行微调/精调,即可很快获得一个适合本企业/行业的客服机器人——面向金融行业的客服机器人要加上金融行业的知识、业务和术语,面向某地区银行的客服机器人还要加上当地的知识、业务和术语,甚至文化与方言等等 。
当然,预训练大模型相当于学习人类的知识,例如语言类预训练大模型就在学习人类的语言和知识,那么就跟课本知识一样有时效 。的人类语言知识截止到2021年,也就是说并不具备2021年以后的人类语言知识,例如播放于2023年的电视剧《狂飙》,就毫不知晓 。因此有网友问关于《狂飙》的知识,就无法回答 。
众所周知,基于GPT-3.5,相比于GPT-1、GPT-2、GPT-3等前代大模型,加入了生成式AI算法,让对外输出能力有了质的飞跃,不仅具备了海量人类语言知识,也能与人类进行各种聊天和对话 。因此,对外又以API和聊天机器人的方式提供服务,例如微软将嵌入到搜索引擎中成为对话机器人,也通过互联网直接对外提供对话以及接入 API 。因此,也代表了基于大模型的聊天机器人、API以及相关互联网和云服务 。
为什么与众不同?
之所以大火,因为它走了生成式AI这个方向 。人工智能是一个庞大的领域,其中包括了很多算法的交叉使用,基于深度神经元网络的机器学习是人工智能的一个重要方向 。神经元网络算法的组成部分主要就是“参数”,所谓“参数”主要指的是每层神经元网络的节点和节点与节点之间的权重连接,当然不同神经元网络引入了不同的算法组合,也具有更多的“参数” 。所谓大模型,指的就是具有百亿、千亿级参数的模型 。
在人工智能处理的任务方向上,有决策式AI与生成式AI两种 。在之前,决策式AI是主要的AI任务方向 。所谓决策式AI,也就是回答选择题 。无论是赢了电视问答“边缘游戏”的IBM深蓝,还是战胜了人类围棋冠军的,本质上都是在做“选择”,也就是问答机器人 。目前,众多的人工智能应用都属于问答机器人,包括Siri、、Alexa、小艾、小度等 。
生成式AI是另一个人工智能任务方向,也就是大家所期待的“聊天”机器人 。此前,很多问答机器人都被标榜为聊天机器人,但实际上都被诟病为人工“智障” 。的出现,让人们看到了真正实现聊天机器人的可能 。在中引入了新的AI算法,包括情景学习、思维链、自然指令学习、指示学习等,这些新算法的引入让走上了新道路,不仅能够与人类展开真正的对话,还能生成各种高质量的内容,例如撰写新闻稿等 。