增长产品中,量化数据分析的几个方法

来源:TECHWEB  责任编辑:小易  

数据分析,是认识事物的重要方式之一,它的特点是定量的非定性的、过去的非未来的、相关的非因果的,有其适用范围,但一定是所有业务人必须掌握的能力www.zgxue.com防采集请勿采集本网。

 增长为什么要做量化

具体步骤如下:1.用SPSS提取出两个主成分,Z1,Z2;2.用Z1,Z2对Y做多元线性回归;3.分析前将数据用SPSS标准化是为了解决不同自变量(比如人民币汇率,国民生产总值)的单位不一样没有办法综合在一起的这个问题;4.最后模型里把数据代回来(求出原

做增长产品的数据分析,和其他的数据分析,个人认为最大的特色在于量化,为什么要做量化?因为,做增长,是个强数据驱动的方法,要把有限的资源发挥出最大的价值,所以必须准确计算出每个Driver的ROI,才能更有效分配资源,做到效率最大化,把好钢用在刀刃上。

你好!首先是自己要先建立一个评价模型,由几个要素组成(简称KPI指标),具体选取哪些要素是根据企业的特点来定;然后进行加权计算,每个KPI的加权系数是根据其重要性来分配(总和为100%)。按此可以逐步分解下去了。上述建模方法是一种最简单

举例几个场景:

Python是一种脚本语言,就是程序员用的代码语言。 Python的功能不可以说不大,在金融数据分析里面有着很方便的应用。 但是需要你专门去学Python,不然看到一堆代码只会懵逼。

每次拉新,不但要量化拉新人数,还要量化后续的持续贡献价值

这个问题也是学员经常问到的。这里我做一个详细的区分。关于CPDA,CPDA全名叫项目数据分析师,在国内做培训比较早,课程内容主要针对的是基于传统企业在投资管理领域的项目分析,类似MBA,以数据支持来进行业务层面的管理和分析,课程包括《量化

每次拉活,同样,老板关心后续的持续价值

目前上四门课程,考试考三门 《战略管理》、《数据分析基捶、《量化投资》、《量化经营》 考试课程:《数据分析基捶、《量化投资》、《量化经营》 sc-cpda 公众交流平台

每次活动,老板不但会问,这次活动有多少人参与,还会问,这次活动贡献了多少增量贡献,如果没有这次活动,DAU会是多少?

上线新模块,和活动类似,老板会关心这个模块为大盘带来了多少增量贡献?

可以看出,我把增长产品的量化规为2大类,外部拉量(拉新、拉活)和促进活跃:

外部拉量:拉新方面,业界有比较成熟的LTV模型,难点在于对LTV模型的预估,拉活方面,一般我们只计算当次(当然不严谨,拉活的后续持续贡献非常复杂)

促进活跃:例如做了运营活动,上线新功能、新模块,本质上都是在促进活跃,这里问题的关键就在于,到底促进了多少活跃,后续滚动下来有多大收益?往往,促进活跃投入的资源是非常大的,准确量化增量贡献不易,此部分也是本文讨论的重点。

拉新拉活的量化

这部分,只简单谈一下,因为我的业务范围拉新拉活量化比较少,没有经验,借鉴下比较基础的量化方法

拉新,采用y = ax^b分渠道量化预估,虽然还有很多高大上的算法,但是这个公式实现成本最低的,方法还不错

拉活,对于DAU的贡献,只计算当日首次启动,对于使用时长的贡献等等,按每个session计算

促活贡献的简单量化方法

促活方面,有几个简单的量化方式,虽然不好,但是较为简单,可以参考,后续将会讨论2种比较复杂的量化方式

染色法:对于参与或深度参与的,设定一个阈值,认为是带来的

对比法:对比渗透与未渗透的用户,对比一个周期内活跃天,或周期内总使用时长,作为贡献,但是此方法有严重的幸存者偏差,需要对渗透有着较为严格的定义,例如有一定深度的阈值

时间对比法:对小部分用户做强刺激的时候,常采用对比法,时间上对比,例如对某个渠道做了某些特殊的承接,可以对比渠道不同时间的留存。此方法看似不严谨,但是其实想一想,这是我们应用最多的方法,资本市场,每个Q的财报,常用的同比、环比,本质上就是这种方法;一般公司对部门定的KPI或OKR,都是这种方式,公司不会给一个对照组,用绝对值量化贡献。

AB实验法:我认为AB实验的对比,是比较好的方法。这里,要注意2点,第一,有的时候AB实验会层层叠加,简单的AB实验无法量化出短期贡献和长期贡献,第二,有一些时候,因为网络效应的存在或者开发排期的原因,不是所有的产品都有AB实验能力。

多层域AB实验法——准确量化短期和长期贡献

以我负责的模块为例,老板们会关心

长期以来贡献了多少DAU?

每次产品迭代,提高了多少?

严谨一点,我们采用了AB实验的方式核算,最终可能会发现一个问题:短期迭代贡献,不等于长期贡献,为什么呢?(本文重点讲述AB实验,对于1+1≠2话题,详细请看本人的文章《数据分析中,为什么1+1不等于2?》)

有的时候,迭代A和迭代B,有着相互放大的作用,这个时候就会 1+1 > 2

还有的时候,迭代A和迭代B,本质上是在做相同的事情,这个时候就会 1+1 < 2

有些场景,我们的业务需要和去年或上个季度的自身对比,同时业务还不断在多个方面运用AB Test迭代

这个时候,我们准确量化一个长期产品模块的贡献,就需要一个【贯穿】所有活动的对照组,在AB实验系统中通俗称作贯穿层

(说明:实验中,各层的流量是正交的,简单理解,例如,A层的分流采用用户ID的倒数第1位,B层的分流采用用户ID的倒数第2位,在用户ID随机的情况下,倒数第1位和倒数第2位是没有关系的,也称作相互独立,我们称作正交。当然,AB Test实验系统真实的分流逻辑,是采用了复杂的hash函数、正交表,能够保证正交性。)

这样分层后,我们可以按照如下的方式量化贡献:

   计算长期的整体贡献:实验填充层-填充层填充组 VS 贯穿层2-贯穿层填充

    每个小迭代对整个系统的贡献:实验层中的实验组 VS 对照组

    周期内,系统全部迭代与上个周期的比较:实验填充层 VS 贯穿层1

类似与上面这种层次设计,在推荐系统中较为常见,在某一些产品或系统中,贯穿层不能够完全没有策略,那么采用去年或上个季度的策略,代表着基准值,从而量化新一个周期的增量贡献

详细可参看《浅谈AB Test实验设计和数据分析(二)——层域模型的设计》 ,https://mp.weixin.qq.com/s/SSRlELhzy3nOkjeYI1nmXg

没有AB实验能力,如何尽量评估贡献?

AB实验固然好,但是有的时候,因为各种各样的原因,特殊时期,没有AB实验,产品上线了。上线后,数据分析师依然有职责量化出贡献,以我负责业务为例,2020的微视集令牌活动,如何量化贡献?

我们思考过程如下:

首先,采用对比法,对比参与活动与未参与活动的活跃天差别。(此步,考虑到了有幸存者偏差)

接下来,为了解决幸存者偏差,分别对比了下两组用户在之前的活跃程度,做了下差分比较。(此步,有考虑同期的其他活动,会因为用户交集太大,无法分离)

最后为了区分同期的其他用户,将是否参与其他用户也做了分组,同时做对比差分。

做了上面的处理,我还存在疑问:

幸存者偏差仍存在,到底还存在多少?

排除幸存者偏差、红包的干扰,依赖主观判断,还有没有其他因素的干扰?如何证明?

评估方法个性化,可否抽象为通用方法?

思考:差分计算和按红包分组,本质上排除各种因素干扰,尽可能构建平行世界,说白了,我们在寻找特征相同的用户群,因此,在方法层面也许可以统一

按照上面的思路,我们引入了协变量的概念,这个概念借鉴了因果推断算法

方法如下:

通过多种特征,寻找特征相同的用户群(寻找协变量,协变量非常关键,后文会提到几个原则)

每个群内,按照是否参与活动分为2组(构建平行世界),对比参与与未参与的差异,计算每个群组的贡献

为了增强可解释性和可读性,简化分组,例如:合并小的分组(如合并同特征分段),较少部分特征,原则是简化分组不影响整体结论,同时简化分组也有利于解决过拟合问题

对于部分分组,仍存在较强的幸存者偏差,做特殊标注(这样至少可以量化得到范围)

将各个分组的贡献相加,得到量化贡献范围(说明,虽结果不准确,但有一定的范围,也可以供部门决策,数据分析的很重要作用就是辅助决策)

核心流程如下:

说明下寻找协变量的原则,这个非常关键:

选择与评估时间尽可能近的特征,目的是分群尽可能公平,为了构建平行世界,例如:活动前7天的活跃天、使用时长、画像等

选择需要解耦合的业务特征,例如:同期是否领取红包、是否参与其他活动等

不能选择与评估指标有因果性的特征,例如:不能按活动期间的活跃天分群,同时要注意选择解耦合业务的特征,尽可能降低与评价指标的因果性,尽可能用轻度参与特征,例如:是否参与过(1次就算),不能选择“参与的天数”,因为“参与的天数”本身和我们评价的指标活跃天存在因果性。

总的来说,我还是推崇用AB实验衡量贡献,特殊情况下,上面的方法我认为虽然不严谨,这种方法有2点优势,并且我们也在其他业务中推广

统一经验方法,形成通用方法论,解决平行世界构建和业务间解耦合问题

有一定理论支撑(借鉴因果推断思想),可评估误差范围

 

大讲2113台数据分析培训为你解答:首先数据分析师的5261工作就是4102为你所在的单位或企业1653做相关的数据分析工作。数据分析师指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。数据分析师发展前景:越来越多的政府机关、企事业单位将选择拥有数据分析师资质的专业人士为他们的项目做出科学、合理的分析、以便正确决策;越来越多的风险投资机构把项目数据分析师所出具的数据分析报告作为其判断项目是否可行及是否值得投资的重要依据;越来越多的高等院校和教育机构把数据分析师课程作为其中高管理层及决策层培训计划的重要内容;越来越多的有志之士把数据分析师培训内容作为其职业生涯发展中必备的知识体系。需要掌握的知识:最基本的就是统计学的知识,会运用各种分析方法论、分析技巧、掌握基本的数据分析思维 ,会使用相关的工具软件,如:excel,SPSS懂得所从事的行业、专业知识:比如,战略管理、营销管理、等等,大讲台数2113据分析培训为你解答:首先数据5261分析师的工作就4102是为你所在的单1653位或企业做相关的数据分析工作。数据分析师指的是不同行业中,专门从事行业数据搜集、整理、分析,并依据数据做出行业研究、评估和预测的专业人员。数据分析师发展前景:越来越多的政府机关、企事业单位将选择拥有数据分析师资质的专业人士为他们的项目做出科学、合理的分析、以便正确决策;越来越多的风险投资机构把项目数据分析师所出具的数据分析报告作为其判断项目是否可行及是否值得投资的重要依据;越来越多的高等院校和教育机构把数据分析师课程作为其中高管理层及决策层培训计划的重要内容;越来越多的有志之士把数据分析师培训内容作为其职业生涯发展中必备的知识体系。需要掌握的知识:最基本的就是统计学的知识,会运用各种分析方法论、分析技巧、掌握基本的数据分析思维 ,会使用相关的工具软件,如:excel,SPSS懂得所从事的行业、专业知识:比如,战略管理、营销管理、等等本回答被网友采纳,数据分析师主要工作2113就是通过数5261据去解决企业实际遇到的问题,包括根4102据数据分析的原因和结果推1653理以及预测未来进行制定方案、对调研搜集到的各种产品数据的整理、对资料进行分类和汇总等等发展前景很好,毕竟数据分析这一行在国内才刚刚起步,很多企业都需要这方面的人才,是很有潜力的,这一行偏商科,技术辅助。真正的大牛不是数据分析工具技术,而是用数据帮助企业在产品、价格、促销、顾客、流量、财务、广告、流程、工艺等方面进行价值提升的人。像我本人就是自学的数据分析师然后毕业后去了决明工作,现在基本实现了财务自由,但想成为大数据分析师的话,需要日积月累坚持沉淀下去,相信你总有一天也能达到这个层次内容来自www.zgxue.com请勿采集。


  • 本文相关:
  • 量化分析师还是大数据分析师好
  • 数据质量有量化标准么,比如正确率达到多少百分比...
  • 完全不懂金融,想学习量化投资需要学习哪些金融科目
  • 定性分析与定量分析的异同及优缺点
  • 主成分分析中原始数据是如何量化的
  • 如何根据调查问卷得出的数据进行量化模型分析
  • Python和金融分析的关系?量化交易内容深度?
  • CPDA项目数据分析师和CDA数据分析师有什么区别?
  • 项目数据分析师都需要考哪几科啊?
  • 哪位推荐一个能够做量化投资的软件吗
  • 免责声明 - 关于我们 - 联系我们 - 广告联系 - 友情链接 - 帮助中心 - 频道导航
    Copyright © 2017 www.zgxue.com All Rights Reserved