Press "Enter" to skip to content

硬核干货|如何利用逻辑回归模型,实现用户增长?

技术派是如何利用逻辑回归模型实现用户增长的

 

 

黄天文将用户增长分为三大流派,分别是 市场营销派 、 实验增长派 和 技术派 ,下面简单介绍下这三大流派:

 

1、市场营销派——做品牌和花钱买流量

 

市场营销派做不好,叫流量获取,这活谁都能干,只要给钱就有量;做的好才叫用户增长,通过对渠道精细化运营来调控获客成本和质量。

 

2、实验增长派——提出增长假设,做实验

 

即,发现问题、提出想法、预期效果、测试、复盘,这5步称之为一个增长周期,不断循环这5步,致使数据达到增长目标。

 

3、技术派——就是大家常说的“增长黑客”,运用技术套利,实现低成本增 长。

 

市场营销和实验增长派在之前的文章里已经介绍过(详见本人之前的文章 《如何用更少的钱,带来更优质的量? | 渠道质量评估模型》《没有护城河的流量池,用户来得快,流失更快》 ),所以今天就来个技术派跟大家分享一下。

 

真正做到know your customer(不是反洗钱的KYC哦),要像个“跟踪狂”一样,跟踪用户的关键行为,这个用户看了首页、又看了视频页、看了13篇文章、分享了1篇文章、点击下单按钮了、最终购买了某件商品。

 

从第一次启动APP到购买的整个过程,都是你监控的范围。 甚至能通过购买前的一些行为,来预测用户的购买概率,从而推动成交量的增长。

 

其实技术派的例子也是屡见不鲜:

 

如网飞(Netflix)通过分析客户观看的电影和节目,发现凯文史派西参演的电影和政治题材的电视剧都非常受用户欢迎,所以才有的网飞制作电视剧《纸牌屋》;

 

商务智能公司RJMetrics的团队发现,在使用其免费产品期间,用过软件编辑图表的用户与没用过此功能的用户相比,转化率高出一倍之多,随后每多使用一次,其购买的可能性就会提高。

 

通过以上几个例子,大家可以知道, 大体逻辑就是基于用户的行为,来判断用户另外一种行为的概率。 纸牌屋的例子是通过用户的观看习惯,来推断新产品是否受欢迎。RJMetrics公司是通过购买前的某些行为,来判断用户是否购买产品。

 

因此,我们就引出今天的主题: 技术派是如何利用逻辑回归模型实现用户增长的 ——这也是增长三部曲的最后一部。

 

虽然在当下,深度学习模型已经成为时尚,但逻辑回归仍然坚守在第一线,靠的就是其高时效性与高准确度性。许多银行和金融平台利用此模型预测借款人违约的概率,在金融领域都能站住脚,足以看出逻辑回归的江湖地位。

 

很多运营同学听到逻辑回归模型都会大惊失色,觉得难度系数过高,所以 下 文提供了难易两条路线供大家参考。 第一条是“懒人”路线,第二条是“挑战”路线。

 

“懒人”路线就是按照下文的步骤,把需求提给技术,也就是建模的过程交给技术(别跟我说技术不会逻辑回归模型,只可能是你魅力不够~~),在技术的辅助下,将模型结果拿来用就OK,适合所有运营人士;

 

“挑战”路线则是自己建模分析,有时候人不逼一下自己怎幺能行呢!没准从此走上了用数据说话的道路,告别“数据神棍”。另外告诉大家一件事,数据运营比运营更来钱,运营的同学还在等什幺,赶紧往数据转吧哈哈哈~~

 

今天来跟大家分享的题目是, 如何运用逻辑回归模型促成交,提高GMV。

 

在做模型之前,确立自己的目标是什幺?那就是让用户下单,重点放在没有下单的用户身上。如何去做?根据用户行为,构建模型,找出下单用户画像。之后呢?我们要做两件事。第一,引导没有下单但已经具备下单潜质的用户(预下单用户)下单。第二,引导用户成为预下单用户。

 

一、模型搭建

 

 

选出你认为对下单有影响的变量,然后给到技术,让技术算法大神根据这些行为list(变量)和最后是否下单(因变量)做一个模型,并告诉你模型的可行性和筛选后剩下的变量。如下图:

 

 

用户行为list图

 

最后告诉你这个模型O不OK就搞定,OK就进入下一环节,不OK再继续改善模型,直到模型成功为止。

 

 

有想挑战的同学,推荐的建模工具有SPSS和python,如果是初学者的话,建议使用SPSS,操作简单,不需要编程能力,网上有大量的逻辑回归模型的教学视频,快的一周,慢的一个月怎幺也玩明白了。

 

简单的说, 逻辑回归模型其实就是: 将历史用户在下单前或者未下单前的行为,放进模型中,模型会模拟出一个方程,之后我们根据方程套用到新的用户身上,来判断哪些用户下单的概率高,哪些行为对用户下单影响较大,最后根据模型来做后续的策略。

 

下面我们就来简述一下建模过程。

 

(1)  数据预处理

 

如下图所示,红色的“是否下单”这一列是目标值,指的是历史用户最终是否下单;蓝色的各列是用户下单前的行为。

 

下图可以这样解读,每一行就代表着用户从进入平台到下单(未下单)的全路径行为。

 

 

样本数据图

 

如上图所示,模型中分为两种变量,一种是连续变量,比如“浏览页面数”,是按照自然数统计的;另外一种是哑变量,比如“是否下单”,1代表下单,0代表未下单。

 

到此为止样本数据都已经处理完成,接下来就把这些数据导入到模型中,模型会给出相应的反馈结果。

 

(2)  检验模型

 

不是把数据扔进模型后就完事了,还要看一下模型拟合优度,说白了就是模型能不能用。如下图

 

 

模型评估

 

这里只看步骤二红框里的几个数字就可以。

 

第一个是-2对数似然值,这个值越低越好,在100以下就算可以接受,1000以下嘛也将将可以。第二个就是卡方&显着性(Sig),卡方一般小于100,Sig<=0.05即可,说明模型当中的变量(用户行为)对下单有显着影响。

 

看完这3个数,就证明模型拟合优度OK,可以使用。当然除了统计学外,也可以通过AUC值作为模型的评价标准。

 

二、结果解读

 

 

劳烦技术大神或算法大神把下单用户的行为告诉你,并且把倍数关系告诉你,如下图:

 

 

倍数关系图

 

上图的“是否注册”为2.909,表示注册的用户,其下单的概率是未注册用户的2.909倍,换而言之,注册比不注册下单率高了近3倍。

 

再看 “生命周期”,生命周期长与生命周期短的比值0.998,说明生命周期越长,下单的概率越小。

 

至此第二阶段就已经完成了,开始进入第三阶段,模型应用篇。

 

 

将上面(一)中的数据输入到模型中,待模型通过检验后,反馈给我们的数据,就是今天的重点。

 

 

模型方程变量图

 

上图的B代表逻辑回归的系数,SE为标准误,Wald是Wald卡方值,df为自由度,Sig是显着程度,Exp(B)代表概率。

 

模型采用的是向后Wald法,筛选变量,步骤1中,模型发现是否“完成任务”对下单影响不显着,所以在步骤2时,剔除掉此变量,留下的变量都是Sig<0.05的显着变量。

 

通过B值构建逻辑回归模型:

 

1.069是否注册+0.93浏览新闻视频数+0.06APP停留时长+0.076主页停留时长+0.052启动次数+0.004浏览页面数+0.194看过页面A+0.767看过成交页-0.02生命周期-3.571

 

通过Sig我们可以知道:

 

当Sig<0.05时,该变量十分显着,经过筛选(步骤2),这些变量的Sig全部小于0.05,说明我们选取的行为对下单的影响是非常显着的。

 

通过EXP(B)我们可以得到的结论是:

 

有过该行为的用户是没有该行为用户下单率的倍数。以“是否注册”为例,在其他变量不变的情况下,注册用户的下单概率是非注册用户的2.909倍。看过页面A的用户是没看过页面A用户的1.214倍。

 

模型结果解读后,是不是觉得有很多东西值得我们去做的,模型虽好但若不能落地等于没做,还是那句老话,不能将数据分析落地执行的业务需求都是耍流氓,所以我们这就开始讲解模型的应用场景。

 

三、模型的应用

 

这一步开始“懒人”路线和“挑战”路线就合并了,我也终于从“精神分裂模式”回归成一个人了,不论是运营还是数据运营都可以完成本章内容,这一章可千万别懒了。

 

下面列举几个应用场景,供大家参考。

 

应用场景一 模型触达用户

 

触达可以分为两种,全自动触达和半自动触达:

 

(1)全自动触达:

 

通过上述回归模型,在程序内可以将每一个用户的下单概率算出来,筛选出下单概率高的用户,自动触发短信、PUSH或者红包。

 

(2)半自动触达:

 

半自动指的是我们并不用上述模型计算概率的方法选择触达用户,而是将模型输出的行为(变量)倍数关系作为参考,手动去选择行为的阈值,这样做可能会比全自动化计算出来的用户多一点,在预算不吃紧的情况下可以用这种方式进行触达。如下图红框所示:

 

 

半自动阈值图

 

应用场景二 产品化即时弹窗

 

当用户满足上面提到的行为时,自动触发弹窗,引导用户下单。

 

这种方法其实要比场景一的转化率高很多,因为触达短信属于后置动作,用户在收到短信时,可能已经错过最好转化时机。而自动弹窗,会在用户意愿值最高时,及时提醒并转化。

 

这种产品化弹窗并不少见,比如腾讯的和平精英游戏,会在你获得胜利(吃鸡)时,弹出窗口,提醒你去应用商店给游戏打分。这样做不仅能够提高用户评分率,还能保证好评率,是一种经典的产品运营方式。

 

应用场景三 产品化调整

 

通过模型我们知道提高下单转化的三个重点指标依次为 注册 、 看过页面A 和 看过成交页 。

 

那幺我们从产品层面,要做一些调整,比如通过强制注册或者调小注册页的跳过按钮来提高注册率;调整成交页的下单按钮的大小、位置和颜色;改变页面A的入口深度,让用户更容易进入该页等等;不要小看这些操作,比如下图,将注册页由表单形式改成分布式,注册率就能提升7%,如下图所示:

 

 

产品改动提升注册率图

 

总而言之,我们通过改动产品,带动重点指标增长,从而提高下单转化率,是一种“曲线救国”的方法。

 

四、模型的拓展

 

模型的拓展主要分为两个方面,自身优化和横向拓展。自身优化主要是针对下单模型如何进一步优化,提高准确度;横向拓展是将模型套用到其他业务上,不光下单可以使用该模型,用户留存、UGC互动行为等都可套用。

 

至此,整个逻辑回归模型流程已经介绍完毕,后续还有多种分析方法以及策略,在这里只是抛砖引玉,就不多赘述了。

 

今天讲的逻辑回归模型可能有些硬核, 其实模型原理很简单,就是根据用户的行为,去推断用户另一种行为的概率。 逻辑回归模型是一线机器学习工程师最爱模型,并非浪得虚名,熟练掌握此模型会对业务有非常大的帮助。

 

最后,我们就把今天分析的过程捋一捋:

 

 

模型流程图

 

(1)确定增长目标

 

(2)用户行为数据准备

 

(3)模型调试

 

(4)模型结果解读

 

(5)模型的应用(产品层、技术层、运营层)

 

今天给大家介绍的技术派用户增长之逻辑回归模型就到这里了,这也是用户增长三大流派中最难的一种,但也并非可遇不可求,相信自己,只要努力没有什幺事情是你搞不砸的,玩笑玩笑哈哈~~

 

写在后面:希望这篇文章可以帮助广大的运营人士,也能够让用户了解平台运营方式,同时欢迎同行与爱好者一起交流学习,提出您宝贵的意见。

Be First to Comment

发表评论

电子邮件地址不会被公开。 必填项已用*标注