APP推广合作
联系“鸟哥笔记小乔”
硬核干货|如何利用逻辑回归模型,实现用户增长?
2019-08-13 11:40:26

黄天文将用户增长分为三大流派,分别是市场营销派实验增长派技术派,下面简单介绍下这三大流派:

1、市场营销派——做品牌和花钱买流量

市场营销派做不好,叫流量获取,这活谁都能干,只要给钱就有量;做的好才叫用户增长,通过对渠道精细化运营来调控获客成本和质量。

2、实验增长派——提出增长假设,做实验

即,发现问题、提出想法、预期效果、测试、复盘,这5步称之为一个增长周期,不断循环这5步,致使数据达到增长目标。

3、技术派——就是大家常说的“增长黑客”,运用技术套利,实现低成本增长。

市场营销和实验增长派在之前的文章里已经介绍过(详见本人之前的文章《如何用更少的钱,带来更优质的量?| 渠道质量评估模型》《没有护城河的流量池,用户来得快,流失更快》),所以今天就来个技术派跟大家分享一下。

真正做到know your customer(不是反洗钱的KYC哦),要像个“跟踪狂”一样,跟踪用户的关键行为,这个用户看了首页、又看了视频页、看了13篇文章、分享了1篇文章、点击下单按钮了、最终购买了某件商品。

从第一次启动APP到购买的整个过程,都是你监控的范围。甚至能通过购买前的一些行为,来预测用户的购买概率,从而推动成交量的增长。

其实技术派的例子也是屡见不鲜:

如网飞(Netflix)通过分析客户观看的电影和节目,发现凯文史派西参演的电影和政治题材的电视剧都非常受用户欢迎,所以才有的网飞制作电视剧《纸牌屋》;

商务智能公司RJMetrics的团队发现,在使用其免费产品期间,用过软件编辑图表的用户与没用过此功能的用户相比,转化率高出一倍之多,随后每多使用一次,其购买的可能性就会提高。

通过以上几个例子,大家可以知道,大体逻辑就是基于用户的行为,来判断用户另外一种行为的概率。纸牌屋的例子是通过用户的观看习惯,来推断新产品是否受欢迎。RJMetrics公司是通过购买前的某些行为,来判断用户是否购买产品。

因此,我们就引出今天的主题:技术派是如何利用逻辑回归模型实现用户增长的——这也是增长三部曲的最后一部。

虽然在当下,深度学习模型已经成为时尚,但逻辑回归仍然坚守在第一线,靠的就是其高时效性与高准确度性。许多银行和金融平台利用此模型预测借款人违约的概率,在金融领域都能站住脚,足以看出逻辑回归的江湖地位。

很多运营同学听到逻辑回归模型都会大惊失色,觉得难度系数过高,所以文提供了难易两条路线供大家参考。第一条是“懒人”路线,第二条是“挑战”路线。

“懒人”路线就是按照下文的步骤,把需求提给技术,也就是建模的过程交给技术(别跟我说技术不会逻辑回归模型,只可能是你魅力不够~~),在技术的辅助下,将模型结果拿来用就OK,适合所有运营人士;

“挑战”路线则是自己建模分析,有时候人不逼一下自己怎么能行呢!没准从此走上了用数据说话的道路,告别“数据神棍”。另外告诉大家一件事,数据运营比运营更来钱,运营的同学还在等什么,赶紧往数据转吧哈哈哈~~

今天来跟大家分享的题目是,如何运用逻辑回归模型促成交,提高GMV。

在做模型之前,确立自己的目标是什么?那就是让用户下单,重点放在没有下单的用户身上。如何去做?根据用户行为,构建模型,找出下单用户画像。之后呢?我们要做两件事。第一,引导没有下单但已经具备下单潜质的用户(预下单用户)下单。第二,引导用户成为预下单用户。

一、模型搭建

选出你认为对下单有影响的变量,然后给到技术,让技术算法大神根据这些行为list(变量)和最后是否下单(因变量)做一个模型,并告诉你模型的可行性和筛选后剩下的变量。如下图:

用户行为list图


最后告诉你这个模型O不OK就搞定,OK就进入下一环节,不OK再继续改善模型,直到模型成功为止。

有想挑战的同学,推荐的建模工具有SPSS和python,如果是初学者的话,建议使用SPSS,操作简单,不需要编程能力,网上有大量的逻辑回归模型的教学视频,快的一周,慢的一个月怎么也玩明白了。

简单的说,逻辑回归模型其实就是:将历史用户在下单前或者未下单前的行为,放进模型中,模型会模拟出一个方程,之后我们根据方程套用到新的用户身上,来判断哪些用户下单的概率高,哪些行为对用户下单影响较大,最后根据模型来做后续的策略。

下面我们就来简述一下建模过程。

(1)  数据预处理

如下图所示,红色的“是否下单”这一列是目标值,指的是历史用户最终是否下单;蓝色的各列是用户下单前的行为。

下图可以这样解读,每一行就代表着用户从进入平台到下单(未下单)的全路径行为。

样本数据图


如上图所示,模型中分为两种变量,一种是连续变量,比如“浏览页面数”,是按照自然数统计的;另外一种是哑变量,比如“是否下单”,1代表下单,0代表未下单。

到此为止样本数据都已经处理完成,接下来就把这些数据导入到模型中,模型会给出相应的反馈结果。

(2)  检验模型

不是把数据扔进模型后就完事了,还要看一下模型拟合优度,说白了就是模型能不能用。如下图

模型评估

这里只看步骤二红框里的几个数字就可以。

第一个是-2对数拟然值,这个值越低越好,在100以下就算可以接受,1000以下嘛也将将可以。第二个就是卡方&显著性(Sig),卡方一般小于100,Sig<=0.05即可,说明模型当中的变量(用户行为)对下单有显著影响。

看完这3个数,就证明模型拟合优度OK,可以使用。当然除了统计学外,也可以通过AUC值作为模型的评价标准。

二、结果解读

劳烦技术大神或算法大神把下单用户的行为告诉你,并且把倍数关系告诉你,如下图:

倍数关系图 

上图的“是否注册”为2.909,表示注册的用户,其下单的概率是未注册用户的2.909倍,换而言之,注册比不注册下单率高了近3倍。

再看 “生命周期”,生命周期长与生命周期短的比值0.998,说明生命周期越长,下单的概率越小。

至此第二阶段就已经完成了,开始进入第三阶段,模型应用篇。

将上面(一)中的数据输入到模型中,待模型通过检验后,反馈给我们的数据,就是今天的重点。

模型方程变量图

上图的B代表逻辑回归的系数,SE为标准误,Wald是Wald卡方值,df为自由度,Sig是显著程度,Exp(B)代表概率。

模型采用的是向后Wald法,筛选变量,步骤1中,模型发现是否“完成任务”对下单影响不显著,所以在步骤2时,剔除掉此变量,留下的变量都是Sig<0.05的显著变量。

 通过B值构建逻辑回归模型:

1.069是否注册+0.93浏览新闻视频数+0.06APP停留时长+0.076主页停留时长+0.052启动次数+0.004浏览页面数+0.194看过页面A+0.767看过成交页-0.02生命周期-3.571

通过Sig我们可以知道:

当Sig<0.05时,该变量十分显著,经过筛选(步骤2),这些变量的Sig全部小于0.05,说明我们选取的行为对下单的影响是非常显著的。

通过EXP(B)我们可以得到的结论是:

有过该行为的用户是没有该行为用户下单率的倍数。以“是否注册”为例,在其他变量不变的情况下,注册用户的下单概率是非注册用户的2.909倍。看过页面A的用户是没看过页面A用户的1.214倍。

模型结果解读后,是不是觉得有很多东西值得我们去做的,模型虽好但若不能落地等于没做,还是那句老话,不能将数据分析落地执行的业务需求都是耍流氓,所以我们这就开始讲解模型的应用场景。

三、模型的应用

这一步开始“懒人”路线和“挑战”路线就合并了,我也终于从“精神分裂模式”回归成一个人了,不论是运营还是数据运营都可以完成本章内容,这一章可千万别懒了。

下面列举几个应用场景,供大家参考。

应用场景一 模型触达用户

触达可以分为两种,全自动触达和半自动触达:

(1)全自动触达:

通过上述回归模型,在程序内可以将每一个用户的下单概率算出来,筛选出下单概率高的用户,自动触发短信、PUSH或者红包。

(2)半自动触达:

半自动指的是我们并不用上述模型计算概率的方法选择触达用户,而是将模型输出的行为(变量)倍数关系作为参考,手动去选择行为的阈值,这样做可能会比全自动化计算出来的用户多一点,在预算不吃紧的情况下可以用这种方式进行触达。如下图红框所示:

半自动阈值图

应用场景二 产品化即时弹窗

当用户满足上面提到的行为时,自动触发弹窗,引导用户下单。

这种方法其实要比场景一的转化率高很多,因为触达短信属于后置动作,用户在收到短信时,可能已经错过最好转化时机。而自动弹窗,会在用户意愿值最高时,及时提醒并转化。

这种产品化弹窗并不少见,比如腾讯的和平精英游戏,会在你获得胜利(吃鸡)时,弹出窗口,提醒你去应用商店给游戏打分。这样做不仅能够提高用户评分率,还能保证好评率,是一种经典的产品运营方式。

应用场景三 产品化调整

通过模型我们知道提高下单转化的三个重点指标依次为注册看过页面A看过成交页

那么我们从产品层面,要做一些调整,比如通过强制注册或者调小注册页的跳过按钮来提高注册率;调整成交页的下单按钮的大小、位置和颜色;改变页面A的入口深度,让用户更容易进入该页等等;不要小看这些操作,比如下图,将注册页由表单形式改成分布式,注册率就能提升7%,如下图所示:

 产品改动提升注册率图


总而言之,我们通过改动产品,带动重点指标增长,从而提高下单转化率,是一种“曲线救国”的方法。

四、模型的拓展

模型的拓展主要分为两个方面,自身优化和横向拓展。自身优化主要是针对下单模型如何进一步优化,提高准确度;横向拓展是将模型套用到其他业务上,不光下单可以使用该模型,用户留存、UGC互动行为等都可套用。

至此,整个逻辑回归模型流程已经介绍完毕,后续还有多种分析方法以及策略,在这里只是抛砖引玉,就不多赘述了。

今天讲的逻辑回归模型可能有些硬核,其实模型原理很简单,就是根据用户的行为,去推断用户另一种行为的概率。逻辑回归模型是一线机器学习工程师最爱模型,并非浪得虚名,熟练掌握此模型会对业务有非常大的帮助。

最后,我们就把今天分析的过程捋一捋:

模型流程图

(1)确定增长目标

(2)用户行为数据准备

(3)模型调试

(4)模型结果解读

(5)模型的应用(产品层、技术层、运营层)

今天给大家介绍的技术派用户增长之逻辑回归模型就到这里了,这也是用户增长三大流派中最难的一种,但也并非可遇不可求,相信自己,只要努力没有什么事情是你搞不砸的,玩笑玩笑哈哈~~

写在后面:希望这篇文章可以帮助广大的运营人士,也能够让用户了解平台运营方式,同时欢迎同行与爱好者一起交流学习,提出您宝贵的意见。

关键词
运营那些事儿
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
运营那些事儿
运营那些事儿
发表文章43456
确认要消耗 羽毛购买
硬核干货|如何利用逻辑回归模型,实现用户增长?吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接