五对混合推荐系统的思考( 七 )


针对上面提到的问题,一般可以采用分支混合的推荐策略,对于没有操作行为的刚进入的新用户可以采用默认的热门推荐或者通过编辑人工精选的多样性的内容作为推荐,而对于有少量用户行为的用户,这时可以采用基于内容的推荐(如基于标签的推荐),当用户的行为足够多时采用矩阵分解等协同过滤推荐算法(参考下面图6) 。对于离线推荐产品,一般这三类算法都是为用户事先计算好的(矩阵分解等推荐算法默认给一段时间的活跃用户,比如过去3个月活跃的用户计算推荐结果,如果某个用户行为不够多,矩阵分解是无法为该用户计算推荐的,或者推荐出的数量不足需要推荐的量,这时只能忽略该用户的推荐,因此该方法无法为该用户生成推荐结果,对于基于内容的推荐原理也一样),当用户请求推荐服务时,推荐接口服务先获取用户的协同过滤推荐结果,如果没有,再去取用户的基于内容的推荐结果,如果还没有,最后就用户热门默认推荐(这个肯定是有的),之所以按照这个顺序取,是因为一般来说,协同过滤算法效果好于基于内容的推荐,基于内容的推荐效果好于默认的热门推荐 。

五对混合推荐系统的思考

文章插图
图6:用户从刚注册到老用户过程中的可行推荐策略
除了上面的分支混合策略外,还可以采用掺杂加权的策略,就是将上面3中方案计算出来的推荐结果(如果有的话)混合推荐,这里不再赘述 。

对混合推荐系统的思考
混合推荐算法提出的目的主要是希望通过多个算法的有效配合避免单个算法存在的问题,提升推荐的整体质量,前面第三节中提到的几种混合方式是从算法的角度来说明几种可行的混合方案,这7种混合方案是在2002年提出来的,历史比较久远了,虽然现在还很有代表性,但是这几年整个推荐系统在算法、工程实践、应用场景上都有较大发展和变化,有很多情况可能是这7种混合方式没有覆盖到的,另外,这7种混合方式只是从算法的角度来进行介绍的,而从更广义的角度来看,推荐系统的混合不光有算法的混合,还有数据源的混合、多类别标的物的混合、应用场景的混合等等,在本节我根据自己对推荐系统的未来发展的理解,试图对混合推荐系统可能的重点发展方向进行简单介绍,给大家提供一些新的思考问题的视角 。
1
整合实时推荐中用户短期和长期兴趣
实时个性化推荐可以快速响应用户请求,让用户实时获得优质推荐服务,帮助用户及时获取信息对用户来说是非常有价值的事情 。
怎么整合用户实时兴趣和长期兴趣对提升用户体验是非常关键的,前面一节已经提到了一些简单的整合用户实时兴趣的方法,这个方法还非常简单粗暴,更好更加有效的方法还需要算法和工程上的突破 。
实时个性化推荐一定是未来的重点方向,特别是随着5G时代的到来,网速有极大的提升,谁能更快更好地服务用户,谁就能拥有用户 。
2
利用单个复杂模型建模多源信息
传统的基于内容的推荐、协同过滤等算法一般只利用部分相关数据来构建推荐模型,由于利用的数据有限,模型相对简单,因此单个算法可能存在一些问题(我们在第二节中已经对各个算法可能存在的问题进行过简单介绍),利用我们第四部分介绍的混合推荐策略可以避免部分相关问题 。那是否可以利用其它的方案来解决这些基础模型存在的问题呢?确实是可以的 。现在随着深度学习等复杂模型的流行,有很多学术研究和工业实践利用深度学习、强化学习等技术整合多种信息来获得更好的推荐效果,这种从模型层面整合多种信息的方法,可以更好地学习多数据源之间的内在关系,所以一定是未来的一个重要的研究和实践方向 。