神马搜索开户场景下的转化延迟解决方案有哪些?

Connor 币安币BNB 2023-07-03 187 0

在今天的互联网营销场景下,广告的投放模式变得越来越精细化,从之前的CPC模式,逐步演进为oCPC,甚至oCPX等效果广告商业模式神马搜索。从广告主的视角,不再是简单的获取广告展现和点击量,而是要更精准的投放到可能产生转化的用户,给客户带来实际的业务价值。神马搜索开户平台着力于搭建支持多行业,多转化链路的统一广告平台,且转化目标可以支持非常深的后端转化。但转化数据的反馈天然存在一定的延迟,且在多转化目标的场景下,不同转化类型的延迟率不同,通常越深的节点,转化延迟概率越大。我们构建了一套统一的延迟反馈解决方案,独辟蹊径地从数据反馈链路上进行延迟转化的补偿建模工作,取得了不错的业务效果。

一、在考虑转化延迟的情况下神马搜索,转化率预估模型的样本逻辑变得非常复杂:

1)转化真负样本(集合A):用户没有发生转化

2)转化假负样本(集合B):用户发生了转化神马搜索,但没有在模型训练前到达

3)转化正样本(集合C):用户发生了转化神马搜索,并在模型训练前到达

二、业界对于转化延迟问题的解决方案神马搜索,主要包括两大类:

1)窗口等待方案:根据延迟概率的分布,设置一个转化label的等待窗口,在窗口内到达转化则当做正样本,否则为负样本神马搜索。等待窗口的设置一般要保证绝大部分的转化能到达,因此不同的转化类型窗口可能会不一样。

2)延迟补偿方案:使用一个延迟率预测模型预估转化延迟概率(Delay Rate,DR),然后在CVR预估的任务中根据延迟概率进行样本权重调整,从而保证CVR模型学习的分布服从期望转化概率分布神马搜索

展开全文

窗口等待方案会牺牲模型的时效性,特别是对延迟率大的深度转化类型,时效性损失更大;而且在神马搜索开户平台的多转化类型统一建模场景下,需要对不同转化类型设置不同的等待窗口,会导致建模流程非常复杂神马搜索

延迟补偿方案,则是以样本的展现时间进行样本对齐,通常也需要设定一个窗口来计算延迟率,然后根据延迟率调整模型训练的正负样本权重神马搜索。在这种窗口机制下,后续延迟到达的转化(假负样本)不能及时被模型学习到,从而影响模型的准确性。

从另外一个角度思考,在效果优化广告平台中,最重要的数据其实是转化数据,因此转化率模型设计的目标首先要保证所有转化数据都能及时地进入模型训练,且保证转化率分布服从期望分布神马搜索。因此我们从转化样本的时间对齐角度重构了模型样本流和模型训练算法,提出基于转化时间对齐的延迟反馈解决方案,在“全场景、全链路、智能获客”的场景下,统一解决了转化延迟反馈优化问题,并取得了不错的业务效果。

评论