互联网广告平台分析所用的技术从本质上来说是数学原理的使用,通过大量数据的统计、分析和反馈,从而实现广告系统中的诸多功能。
1统计学与概率论
在广告平台中用得最多的最基本的理论便是统计学和概率论,在分析互联网用户行为的时候我们通常要记住两个前提:
l用户是均匀的,从随机抽样来看,当媒体的访问量在千万甚至亿的级别以上来看,当我们随机抽取其中一部分用户,对其用户属性和行为来进行分析,所得出的结论是可以代表全体用户的。这是统计学的基本原理。
l反向推知,当我们将通过统计得到的结论应用到单个用户身上的时候,我们并不能够精确的判定用户的属性和行为,而是只能判断有多大的概率该用户可能会符合我们通过统计分析而对该用户产生的预期。
在遵循以上两个前提的思路下,我们对广告投放的策略和由此产生的效果进行分析,可以得到一些很有意思的结论,例如:
l在广告库存量足够的前提下,广告投放的优先级其实对于广告的执行并无实质性的影响,不做频次控制的广告还是如此,也比较好理解,但实际上做频次控制的广告也会遵循以上结论,如果因为频次控制而导致某只广告无法有效释放,而同时还有一定剩余广告库存的话,那么调整该广告的优先级仍然是无法使该具有频次控制的广告释放完的。
l在有剩余流量的前提下,对进行频次控制的广告做频次追投意义并不大,原因同上,因为这个时候考核的其实是独立用户数而非广告总库存。
l如果我们将未达频次上限的用户和达到频次上限的用户进行区分的话,我们会发现在频控周期内,虽然达到频次上限的用户呈上升趋势,而未达到频次控制的用户呈下降趋势,但从整体投放量来看,其实每天的整体投放量是平均的,而且因为具体到每个用户身上,在剩下有限的时间内能否达到频次上线只是一个概率时间,因而实际上无法通过分析判断某个具体用户的可能行为而确定是否适合投某个频次控制广告。
l当然,如果对用户进行进一步的分析,我们也许可以得出一些概率上的结论,例如某个用户在近期访问本媒体比较频繁,那么在未来也可能会继续频繁访问,而如果过去一段时间来的次数比较少,那么在未来一段时间内也可能不太会频繁访问。等等。但这些仍然是一个概率性的结论。
2回归分析
回归分析法是在掌握大量观察数据的基础上,利用数理统计方法建立因变量与自变量之间的回归关系函数表达式(称回归方程式)。
在广告平台中,因为对于资源非常敏感,因此在其中会涉及到大量的有关资源预测的需求,例如对于媒体访问量的预测、对于广告库存量的预测、对于独立用户数的预测等等,这些预测都会需要用到回归分析技术。
既然是应用过去来预测未来,那么其得到的结果必定不会是完全精确的,在实践过程中我们通常需要采取一些措施来对预测结果进行优化,其措施一般有:
1.对回归算法进行优化,例如加入季节性因素,通常对于互联网媒体而言需要考虑的季节性因素包括:周末与平时、月度因素、寒暑假、节假日等等。
2.通过以上方式仍然不能够应对一些特殊情况的发生,这个时候就需要人为对预测结果进行干预,需要人为进行干预的因素主要有:突发事件、突发社会热点等,如果是对于互联网视频媒体而言,则还需要考虑可能的热播大剧等等因素在内。
3反馈
关于反馈技术,我们可以参考一下电子电路中的功率放大器,其原理是将输出端的信号一部分再反馈到输入端,从而实现功率等比放大。
将该技术应用到广告平台中,我们可以在广告投放引擎中根据广告实际投放效果来控制后续的投放计划。
例如当一天中的某个时间点,在该时间点之前的投放效果如果没有达到预期,则将自动调整该时间点之后的投放计划,从而使得投放效果尽量向预期靠近。
在这样的一个基于反馈的广告调度服务中,调度服务会定期从监测服务中获取广告监测计数数据,并与到该时间点为止的计划量相比对,计算出差异量,然后将差异量加入到当天尚未投放的计划量中,统筹按照一定的规则分配到剩下的时间里,然后由广告投放服务按照该计划进行投放。广告投放到广告前端,在前端发生曝光或其他行为时发送相应的监测请求到监测服务,从而形成闭环。通过该闭环,广告投放引擎模块不断的调整自己的广告投放行为,从而使广告活动达到最优。
4决策树
在售前计划管理模块的投放推荐功能和投放引擎的优选投放机制中,我们随处都可以看到决策树算法的身影。
在售前计划管理的投放推荐功能中,我们需要根据各频道或板块、各广告位的历史数据,包括频道或板块的访问用户的年龄、地域、时间、性别、职业等分布和广告位的曝光量、点击转化率等,再对比广告活动的需求如期望曝光量、期望点击转化率、产品类别、目标人群等等信息,根据每项条件计算出匹配度,然后按照一定权重将以上条件匹配度进行加权统计,最终计算出若干个比较契合的候选方案供用户选择。
在投放引擎中,根据媒体用户浏览时发来的请求信息,在经过排除筛选之后还会有一些广告都是符合条件可以投放给用户的,这时为了筛选出更加匹配或者价值更要的一只广告,同样需要使用决策树算法。举个例子,对于一位来自江苏南京的网友,有两只广告一只定投南京另一只定投江苏,这时显然定投南京的那只广告会更加匹配这个用户一些。而对于视频媒体而言,单价15元15秒的贴片广告显然比单价25元30秒的贴片广告单位价值更高,尽管后者的成交价更高一些。因此,在这个时候,经过了所有排除筛选之后仍然剩下的广告,需要综合考虑以上各种因素通过决策树算法来选出最适合的一只广告投放给用户。
5聚类分析
对于媒体用户的行为分析,就必须要用到聚类分析技术了。
当需要做人群定向投放时,我们需要做一系列的数据准备工作,通过线上或线下的方式对人群进行调查,了解其基本属性信息,以及这些人群在媒体上的行为,例如经常上网的时间、地点、常浏览的频道或板块,停留时间等等。然后对这些信息进行聚类分析,找出其模式,定义出规则之后再应用这些规则进行测试,以验证分类规则的准确性。在经过反复的修正之后,可以使用该规则对媒体的其他访问用户进行快速分类,并投放人群定向广告。
由于涉及到第三方监测的问题,这一类的人群定向广告活动通常与第三方监测机构合作进行。其方法如下:
1.第三方监测机构向市场调研公司购买样本人群,例如每月几十万或上百万份样本。这些样本的属性信息通过线上或线下调研得来,通常包容诸如性别、年龄、职业、收入、兴趣爱好等信息。
2.媒体购买上述样本的其中一部分并和第三方监测公司将这些样本通过CookieMapping的方式与自己媒体的用户进行映射。
3.媒体对这些样本进行聚类分析并制定快速分类规则。然后按照这个快速分类规则判断访问媒体的其他用户并投放广告。
4.第三方监测机构接收广告监测数据并与自己的样本库进行匹配。
5.查看和样本库匹配上的这一部分用户中符合广告投放TA要求的用户数。并计算占匹配样本数的比例。
6.反推整个广告活动中符合TA要求的用户数大概可能是多少。
举个例子:某媒体在一次广告活动投放中,共覆盖了万个独立用户,其中第三方监测机构监测到有1万个观看过该广告的用户是参加过样本调研的,也就是说这1万个用户是样本用户,而这1万个用户在调研中已知晓其中人是本次广告活动所针对的目标用户。那么本次活动的人群定向命中率大约是30%,反推下来就是本次广告活动投放覆盖的万个独立用户中大约有30万独立用户是目标用户。
转载请注明:http://www.0431gb208.com/sjszjzl/1675.html