3. YouTubeDNN排序模型细节剖析( 六 )


首先解决怎么做的:如何把目标变成优化平局怒观看时长呢?关键在于训练样本的权重,paper做的时候,是所有负样本的权重的都是1,而正样本的权重是点击后的视频观看时长T_i,模型最后计算损失的时候,是使用了加权交叉熵:
这里的T_i是观看时长 。由于逻辑回归的表达式:
线上使用的时候,选取了值e^(f(xi))最大的那些视频进行推荐 。
那么为什么优化这样的加权loss,就是近似优化平均观看时长呢?简单做下解释:
首先,我们熟知的大名鼎鼎的函数并不是无脑拍出来的,而是由对数线性模型推导出来的 。
采用e^(Wx+b)这个形式预测就近似用户观看视频时长的期望,用该指标排序后推荐,符合推荐场景和以观看时长为优化目标
模型的内容就整理这么多 。
AI上推荐 之 模型(工业界推荐系统的灯火阑珊)
王喆:重读深度学习推荐系统论文,字字珠玑,惊为神文