- MATACHING 这里主要是使用类似于W2V的方法来生成用户的向量; 输入: 包含了使用W2V生成的商户向量,和用户的其他信息拼接成的。其中用户的其他信息使用了归一化处理(具体实现是参考变量的统计性描述,积分归一化)。用户的其他信息使用了超线性和次线性的处理。 标签: 包含用户点击的商户的序列,注意每一个用户给出近似相同的点击序列,目标是为了降低高活跃用户的影响,类似于W2V中的高频停用词的影响。
训练过程采用的是类似于随机负采样的方式。得到对应的用户向量。 最后训练出来的向量采用LSH 向量化平台做粗排召回
- RANKING