很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
层次分析法(Analytic Hierarchy Process,简称AHP)定义:是将与决策总是有关的元素分解成目标、准则、方案等层次,在此基础之上进行定性和定量分析的决策方法。关于层次分析法的具体解释大家可以使用搜索引擎搜索,篇幅有限,我们暂不展开。
现实场景:一个用户经常光顾你的网站,有时只是来看看,有时候顺便买点东西,在计算这个用户的价值的时候,应该怎么做?是看TA最近一次购买行为,还是考虑用户在整个时间段内的表现?老祖宗早就告诉我们了,“日久见人心”。显然,用户行为错综复杂,一次网站会话行为可能只是管中窥豹,观察期留的长一些,才能建立更合理的评分模型。
本文的目旨在电商网站的用户建立起一个评分模型,动态计算出每个User的价值得分。我们从目标-用户评分出发,综合短期和中长期两个角度抽象出影响用户得分的因素作为准则层,然后选择准则层相应的指标层数据,建立一套科学的评分模型。
从短期来看,我们会关注用户活跃在在网站/APP上发生的一系列细致动作,浏览重点页面,点击预购等。因此,我们将影响目标层用户得分的第一个因素称之为“活跃度”。从中长期角度来看,用户的“忠诚度”和“购买能力”对用户得分影响至关重要。至此,我们确定了目标层为“用户价值得分”,影响目标层的准则层包含“活跃度”,“忠诚度”和“购买能力”。
准则层确定后,就涉及到选择衡量“活跃度”,“忠诚度”和“购买能力”关键指标。有几个重要的原则可以参考:
可量化:能被衡量的,才能被改进,目前电商网站大多通过JS,SDK埋点或者服务器日志分析,所以基本的量化数据能够拿到;
有效性:要覆盖重要的数据维度,且在合理可以调控的范围内;
相互独立:指标间尽量保持不相关。
笔者和团队小伙伴共同讨论了一下,选定的适合我司电商用户的指标内容如下:
浏览页面数
停留时间
浏览商品数
主动下单数:一些真正购买前的微转化,如点击“立即购买”,“立即开团”按钮等动作
最近访问时间
用户访问频率
主动评价数
单次最高购买金额
平均每次购买金额
购买次数
时间选择上,我们选择先选取近3个月的用户行为数据进行研究,因此“活跃度”对应的时间是“近三个月最后一次活跃的时候,即最近1天”,“忠诚度”和“购买能力”看的是“最近3个月”这个中长期时间段。实际业务中,按照已有的规则建立好数据表,每一天的数据自动入库,用户的评分是呈现随日期滑窗积累的效果,因此我们前面提到的是动态计算用户得分。至此,我们的用户综合评分模型如下:
目前,市面上可以搜到很多解决层次分析问题的软件,但是笔主认为思维比工具更重要,因此本文采用大家电脑里都有的Excel来解决这个问题,这样我们能把主要精力集中在实现方法上,而不是工具操作上。在用Excel实现AHP方法的时候,有两个重要问题需要解决:
构造判断矩阵:常见方法是小组投票,给出两两因素(例如A和B)间的比较值,1表示:A和B一样重要;3表示:A比B重要一些;5表示:A比B重要;7表示:A比B重要的多;9表示:A比B极其重要。这样,通过两两比较给出比较值,判断矩阵就出来了。如下图:可以看到“活跃度”,“忠诚度”和“购买能力”的判断矩阵
一致性检验:什么是一致性检验?举个例子,当两两比较认为A比B重要,B比C重要时,轮到A和C比较了,你给出C比A重要的比较值,此时就叫做“不一致”。层次分析法的计算不是简单得到一个结果,而是要得到一个令人满意的一致性的结果。
一致性的检验是通过计算一致性比例CR 来进行,其中CR=CI/RI,当CR<=0.1 时,认为判断矩阵的一致性是可以接受的,否则应对判断矩阵作适当修正,甚至推倒重做。
另外,公式中另外两个参数CI是一致性指标,RI是随机一致性指标,通过查表可以找到三阶矩阵的RI=0.5149,四阶矩阵的RI=0.8931。
这部分是数学知识,大家理解文章后可以直接拿来用,我们后面直接以下图“准则层”为例,阐述如何用Excel构建判断矩阵及单排序和一致性检验,想了解更多的,可以搜索引擎搜索一下。
判断矩阵构造:对角线上表示“活跃度”比“活跃度”,“忠诚度”比“忠诚度”,“购买能力”比“购买能力”,因此全部值都是“1”,然后左下角,将团队投票的两两比较值填入,右上角做倒数映射即可;
按行相乘:F6=PRODUCT(C6:E6),下拉
开n次方:G6==POWER(F6,1/3),下拉,而G9=SUM(G6:G8)
权重Wi: H6=G6/$G$9,下拉
分向量AWi:I6==C6*$H$6+D6*$H$7+E6*$H$8
AWi/Wi =I6/H6,而J9=AVERAGE(J6:J8)
CI=(人-n)(n-1) , 这里面“人”其实是希腊字母“兰姆达”,其实就是J9单元格的数字,我打不出这个字母,希望你们understand 我,谢谢!n代表变量数,准则层的n=3,经过计算CI=0
三阶矩阵RI=0.5149
CR=CI/RI=0
至此,我们构造的判断矩阵,一致性检验通过。红色标记的Wi即为相应的权重,即准则层相对目标层有如下公式:用户价值得分=0.4*活跃度 + 0.4*忠诚度 + 0.2*购买能力。
指标层相应的判断矩阵及单排序和一致性检验如下图,请大家参考。
我们前面选定了每个准则层对应可以量化的指标,这些指标的数量值和单位不尽相同,我们需要将其采用同一种计量方法,这样才能进行比较。我们本次采用的是5分制,即要把所有的指标数据,不管是“浏览页面数”,“停留时间”,还是“单次最高购买金额”,都标准化到[0,5]。
如下图,我们拉取最近个月的用户数据,通过对原始数据进行分析,最后建立的标准化规则,不同网站/APP的具体标准化规则可能不同,需要依据原始数据来定。
第一行{0,1,2,3,4,5}表示标准化得分,即要把所有的指标数据映射到数据集里
黄色行表示实际原始数值
灰色字体行表示累计占比
以“浏览页面数”为例,首先拉取近三个月的原始数据,选择用户“最近1天”的在网站/APP上的活跃数据,如下图所示,左列表示用户id,右侧表示每个id在“最近1天”浏览的页面数。其次,按照PV进行从小到大的升序排列。第三,做截止到XXX-id为止的用户累计占比。因为是5分制,因此,理论上,找到累计占比约为“20%,30%,60%,80%”的,把相应的PV作为标准化后“1,2,3,4”数值的分割点即可。
有一点需要提醒,要尽可能保持原始数据被均匀标准化到[0,5],但是有的指标起点就非常高,比如“浏览商品数”指标,50.7%的用户没有浏览商品,那么接下来就要尽量在50%-100%之间均匀标准化。具体标准化过程,大家可以在实践中自己体会。
前面工作顺利的话,应该会有如下图所示的一张表,以“客户ID”作维度,显示每一个客户对应“指标原始数据”,“准则层得分”以及“目标层得分”的数据。
我们使用tableau制图,进行数据分布的验证。如下图,当准则层,指标层权重系数确定,当指标标准化完成后,电商用户的价值得分出现如图所示的完美长尾分布。实际过程,从确定权重,要指标标准化这个过程,笔者和团队小伙伴进行了多次调参,和多次推到重做。所以,如果大家借鉴本文做其它平台用户综合评分模型,一定要有耐心。
Tableau图表中,我们用数据桶表示最终得分,纵坐标表示客户ID不重复计数,横坐标是标准化后的得分,横坐标为0.0的数据桶解读为“得分在[0,0.2)的客户占比为0.2%”,横坐标为0.2的数据桶解读为“得分在[0.2,0.4)的客户占比为16.64%”,依次类推。
由于本文重点是给大家介绍建立电商用户综合评分模型的方法,针对应用场景和意义,笔者仅做抛砖引玉,欢迎大家主动思考,以及评论,同笔者交流。
首先,根据上一部分用户最终得分分布图,可以找到高价值用户(比如定义得分大于3分的用户),极低价值用户(比如定义得分小于0.2的用户)等等,不同类别的用户,做针对性的营销,甚至一对一的沟通和客户管理。
第二,目标层由指标层决定,我们用“活跃度”,“忠诚度”和“购买能力”三个维度,每个维度以中位数为分界线,得到2*2*2八大类用户集合。如下图所示为使用Tableau绘制的八大类用户占比情况。然后根据不同准则层的表现制定不同的沟通策略。
如下图为不同用户的沟通策略。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)