胡扯系列之私人AI助手系统的分析与设计

背景
随着时代的发展,计算机算力的提升和近些年来AI模型的井喷以及发展 。人工智能应用已经深入我们的日常生活 。如人脸识别,无人驾驶等等,同时为了更好地与用户进行交互,完成特定功能,智能对话助手应运而生 。如今大量智能移动设备已经搭配具备对话,实现特定功能的AI助手用于提高用户使用体验 。但目前大量的AI助手只是具备简单的对话和应用操作等基本功能,并不能对使用者的操作习惯,会话习惯等进行自适应调节,使得助手更加适配与当前使用者 。因此作者期望能够设计一款,能够在移动设备或其他终端设备中运行,并且能够根据用户习惯行为做出自适应调整的AI助手 。实现在“一千个用户中,有一千个不同的AI助手” 。
问题描述及分析 问题描述
本文标题为“私人AI助手系统的分析与实现”,其目的是实现一个能够在基础AI助手,对话,特定功能操作的基础上 。能够自适应用户操作习惯的助手,即达成用户与AI助手相互反馈最终实现助手自适应调节,同时能够支持算力较低的终端设备,在终端设备中完成一系列自主适应 。
AI助手
分析:通过对本文目标进行简单概括,可以提取出如下关键词:AI助手,自适应,低算力 。AI助手是基本的功能,也是为用户提供服务的门户 。自适应是对AI助手的进一步优化,如何让AI助手实现自调整,之后能够在算力资源更低的情况下完成所有操作是本文中的重点 。因此需要解决的问题为两个方向的和一个低算力约束的大问题 。因此在实现时,需要选择算力消耗更小的架构实现以及算法模型 。所以针对第一个问题,即实现基本AI助手上,将通过多个小模型来完成基本功能的实现,同时由于大部分终端都提供语音识别功能,因此在助手设计上,可先通过设备提供的语音识别功能将用户输入语音转化为文本,之后对文本进行操作分析,最终实现操作 。大致流程如图(1)所示:
图1 AI助手大致执行流程图
因此在这部分中的主要技术是于文本的处理 。由于一开始就确定使用小模型来完成目标,因此对AI助手本身组成的模块又可以分为图(2)所示,拆分为三个小模块 。
图2 AI助手模块图
所涉及到的技术就主要为文本对话生成,文本内容识别分类 。完成用户的聊天和具体操作,从而完成基本AI助手实现 。
自适应
【胡扯系列之私人AI助手系统的分析与设计】第二个需要解决的问题是如何能够完成自适应 。结合对应AI助手的基本设计,可以发现如果需要完成自适应,那么重点是如何调整意图分类识别和Chat网络之间的权重 。从而完成自适应调节 。而能够对权重进行调节的方式除了直接进行训练外,还有通过强化学习[1]方法或者GAN[2]方法进行权重修改训练 。第一种方式需要将用户与AI助手交互的数据进行收集,例如对Chat模块进行自适应,那么就需要将用户与助手聊天产生的数据自动制作为数据集,送入模型重新训练 。第二种则依托于强化学习方法,需要用户与助手在交互过程中,由用户主动基于反馈,也就是基于当前模块网络评分,之后通过强化学习方法对模型进行调整 。第三种方案是在第二种方案的基础上,在采用第二种方法时用户需要给予反馈可能会导致用户体验下降,但是在第二种的权重修改过程中又需要优化给予及时反馈来指定完成调节 。因此使用Gan中的评判网络模型可以模拟当前用户给予辅助第二种方式进行训练调节,最终完成助手的自适应调节 。为了更好地完成自适应,当前更好的方案显然是将上述方案进行整合,相互结合使用 。大体流程如图(3)所示