很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
用户画像,大数据时代老生常谈且又长久不衰的话题,公司都在搞,文章满天飞,在这个人人都喊“数据驱动业务”的时代,你不懂用户画像,不搞用户画像,你都不好意思跟别人聊(chui)业(niu)务(pi)。
但是,用户画像是不是一定要搞?为什么要搞?不搞可不可以?如果一定要搞,用户画像耗时耗力,怎么才能把它真正落地到业务?而不是开发了N多的标签,放在数仓里吃灰?搞之前多问几个为什么,你会发现落地的可能性就大了很多。
在写这篇文章之前,我也拜读了不少用户画像相关的文章,但是很可惜,很多文章可能搞错了一点,那就是用户画像是业务,不是技术!用户画像一定是来源于业务,并且最终落地到业务上去的。那些不管业务需求、标签体系,上来就是用户画像怎么实现的,这无异于吃饭点了一盘土豆丝,大厨埋头给你搞了一道佛跳墙,然后跟你巴拉巴拉扯做佛跳墙牛叉的108步骤,呵呵,只能说,技术自嗨,最为致命,一切不以需求为出发点的应用,都是在耍流氓。
这也是写这篇文章的初衷,用户画像是什么?一般在什么场景下会用?我们的业务场景是不是真的需要这个费时费力的大家伙?如果真的需要,业务需求是什么样的?标签体系如何搭建和开发?开发后如何使用和进一步迭代优化?只有把这一步步想清楚做仔细,才能最终落地到实际的业务中,发挥用户画像真正的价值。
用户画像是指根据用户的基本属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。每一个标签及标签权重是表征用户偏好的一个向量,一个用户可以理解为多个偏好向量(标签)的和。
--来自某度的看不懂的解释
说人话!!!用户画像是基于你在互联网上留下的种种数据,将这些数据在你知情或者不知情的时候,通过数据加工,产生的一个个刻画你兴趣偏好的标签组,这就是用户画像。
那么接下来的问题就是:用户画像的使用场景有哪些?
分群运营是用户画像最常用的场景,通过用户画像的标签筛选,筛选出不同的用户群,通过push或弹窗配置平台,对不同的用户群实现精细化运营。
比如我们可以把过去30天购买金额大于500、活跃天数大于10天、最近一次活跃间隔在5天以内的用户定义为高付费潜力用户群,进而对这部分高潜用户进行精细化运营。
分层越来越精细,用户群的粒度会越来越小,最后会小到一个个体。我们针对每个个体去做push或者弹屏,运营效率还是太低了。基于用户画像的自动化触达就发挥了作用。比如针对上一步我们创建的高付费潜力用户群,我们通过App Push的方式发送一张满200减40的优惠券。
以用户画像为基础构建推荐系统、搜索引擎、广告投放系统,可以有效提升转化率。我们先看一下用户画像的用户偏好表存储表(用户画像有很多这种标签,下面我们会详细展开具体讲解):
当我们购买完成一个带有标签1,标签2,标签3的商品后,一般在购买完成页会有交叉销售场景,我们通过用户偏好表的标签及权重,基于用户相似或商品相似的协同过滤算法,推荐用户可能喜欢的其他商品。
根据用户的属性、行为特征对用户进行分类后,统计不同特征下的用量、分布,分析不同用户画像群体的分布特征和走势等。
另外,还可以通过用户画像分析可以了解行业动态,比如人群消费习惯、消费偏好分析、不同地域品类消费差异分析。比如我们经常听到马爸爸拿一些标签,说这个地方人喜欢买什么?为什么喜欢买?那个地方人都是买什么型号?
大学刚毕业时,初到一家互联网公司做数据运营,某天领导突然给我一个任务:做一个APP用户画像报告。当时我有点懵,一是我以前确实没接触过用户画像,概念不太清楚;二是接到领导的任务后我只知道要做一个用户画像,至于这个用户画像到底用来做什么我并不清楚。
在这个情况下,我查阅各种资料,问同学、问朋友,还找了一些高大上作图工具,最后总算是完成了任务,得到了公司认可。但用户画像到底给公司带来了什么价值,给运营决策起到了什么作用并不清楚,这其实就是典型的随大流,为了做而做。
这种面子工程非常常见,大家可以看看自己公司的情况对号入座,因为大家都在谈论用户画像,于是很多领导也开始要求做用户画像,别人有我们不能没有,但用户画像到底为了解决什么问题并不清楚,自然而然就没有落地的可能性,更不可能产生价值。
所以为了解决这个问题,在最开始的时候就要想清楚,我们是否真的需要用户画像?只要想清楚一下三个问题,就可以得到答案。
1、我们业务中是否有能用到用户画像的场景?比如用户分层、智能触达和个性化推荐。
2、如果有使用场景,是否一定要通过用户画像实现?用户画像本身是一个非常浩大的工程,十分耗时耗力,我们有没有其他替代的方案?
3、如果必须要搞,那我们给用户打了标签进行分层后,我们有没有对应的产品服务或运营方案?分层后没有对应的action,用户画像还是难以落地闭环。
以上问题如果没有想清楚,就盲目搞用户画像,结果很可能就是弄出来的用户画像远离业务,没有实用价值、无干货,被业务部门讥讽为“大而无用”的鸡肋产品。
所以,在规划用户画像平台时,一定要有目的性和场景感,不能只做表面文章,而不重视实际应用价值。
这里需要强调的一点是:不是因为我有了用户画像,才能驱动和提高业务。而是为了驱动和提高业务,才需要去建立用户画像。这是很容易犯的因果倒置的错误!
以上问题没有想清楚,千万不要动手开发,如果以上的问题想清楚后,还是要搞,那我们就要认真筹划,用户画像怎么做才有价值。
已经确定要搞用户画像,接下来就要思考:怎么搞才能业务落地?怎么搞才能产生价值?
刚开始做用户画像的时候,业务部门摇头晃脑的说:“我们要基于用户画像,详细深入的了解用户,比如用户性别,年龄,地域,喜好,消费习惯,……这样我们就能精细化决策了”。然后数据部门夯吃夯吃搞了几个月,打了30000个用户标签,还得意洋洋的跟领导汇报:“我们的用户画像大数据建设取得长足进步”。
然后项目第一期汇报会上,数据部门得意洋洋的讲到:
我们的用户男女比例6:4
华南地区占比30%
华东25%购买A产品占比50%
巴拉巴拉巴拉......
业务部门一个白眼抛过来,
我早知道了!
我们的用户都是这样的呀!
然后呢?
你做这有啥用?......
当然还有更惨的,
就是你贴个“忠诚用户”的标签,
业务方说:哦,既然那么忠诚,就不做啥动作了。结果丫下个月不消费也不登录了!
你贴了“A产品爱用者”的标签,业务方推了A产品,丫没有买!
业务方怒气冲冲找来算账:“这用户画像一点都不精准嘛!”
于是,项目彻底凉凉。问题到底出在哪里呢?你丫的根本没有了解业务的需求啊,业务方想吃个简单的酸辣土豆丝,你吭哧吭哧跟业务方扯佛跳的108道工艺,或者虽然你了解了业务方的需求,但是这个标签你打的不准啊,我要的是酸辣土豆丝,不是青椒土豆丝......
所以要想用户画像能落地,以下几个步骤尤为关键。
在规划用户画像时,一定要有目的性和场景感,不能只做表面文章,而不重视实际应用价值。再次强调:不是因为我有了用户画像,才能驱动和提高业务。而是业务有需求,才需要去建立用户画像!
第一步也是最为关键的一步,一定要搞清楚业务方的需求是什么?要解决的问题是什么?
举个栗子,一个内容型社区近期准备上线一个知识付费模块,通过该模式进行商业变现,想通过用户画像将精准的内容推荐给精准的人,进而促进付费变现。基于此,可以把业务目标和要解决的问题梳理如下:
需要选择哪些标签?为什么要选择这些标签?其他的标签为什么不可以?选择标签有哪些误区?
我们都知道有用户基础属性的标签,也有用户的各种行为标签,我们需要在这个大的框架下不断细分完善标签体系。但是为什么要选择这些标签,比如用户的购买行为标签中,为什么选择新、老用户这个标签呢?因为我们的店铺针对未消费的新用户会有新人红包进行引导消费,所以要区分新老。对于老用户,我们为什么要选择最近一次购买时间,购买频次和交易金额作为标签呢?因为可以通过RFM对用户价值进行分层,进而进行精细化运营。
具体的标签体系搭建步骤我们会在第三部分中具体介绍,这里先不展开。
不同标签将用户划分为不同的用户群,但只有对不同的用户群制定针对性的运营策略,用户画像才能落地有价值。
举个栗子,在RFM模型中,有的同学不清楚用户交易金额M如何确定阈值,进而划分为高和低呢?是消费1000元算高还是10000元算高,有些同学因为这个纠结不已,为什么不反过来想呢?阈值设为1000或者2000我对应策略是什么?如果没有对应的策略,我划分了高低有何用处呢?这个时候不妨问问产品和运营的同学,你会发现运营上为了促进价格敏感的低客单价用户有满1000减200的满减活动,对于购买能力较强的金主爸爸,有满2000送独家定制的钻石会员卡,可以享受超级VIP待遇,以终为始,这个时候用户画像是不是更容易落地了?
已经明确了业务需求以及不同画像用户的对应策略,下面就可以开始用户画像
的构建了,主要分为标签体系搭建和标签权重计算,简单来说,就是用哪些标标签表征用户,用户在各个标签上的偏好程度如何。
理解用户画像,最直接的方式便是将画像信息标签化。信息标签化是用户画像系统用信息化手段刻画用户全貌的手段,也是用户画像系统中最核心的环节之一。我们通过构建丰富的标签,获取相关的标签数据,才能够刻画和洞察用户的兴趣和偏好。
1)标签体系的构建方法
构建标签体系的主要有两种方法:
方法一:结构体系化构建(常用)。通过划分标签类别和维度,从刻画用户的完整维度出发构建维度体系。这样的划分方式结构清晰、逻辑性强,能够比较全面的梳理出所有的信息维度,但受限于实际数据,落地较困难。
方法二:场景效果化构建。结合人群定向的实际需求,通过用户在不同行业领域或平台上的行为记录,对用户的心理需求和倾向性进行描述。这种方式目的性强,人群定向也较为精准,容易跟实际应用场景接轨,落地到具体的业务目标,跟实际数据结合较好,但标签会跟随消费趋势、娱乐热点等的变化波动。
2)标签维度的设计思路
标签维度设计上不仅需要清晰直观,还需要考虑多个场景化使用需求,同时兼顾多种产品运营需求及商业化投放需求。
标签设计上需要在了解业务方规划前提下,对标签的使用上有前瞻性的设计。
画像数据的来源一般有:用户调研、用户行为数据获取、客户端/服务端数据内容上报、第三方数据平台、基础数据及爬取第三方数据等。
ps:此处需要特别关注以下两个方面:
标签粒度:粒度过粗不利于运营使用推广,很容易脱离业务本身,对行为数据进行过度提炼造成信息丢失;而粒度过细则会导致标签覆盖率过低、耦合运营业务推广。
标签数据:标签数据的获取直接关系到实际使用价值,需要在可获取的数据范围内进行,扩宽数据源难度较大,通常需要优先进行数据可行性的统计。
3)标签体系的基础框架
不同业务的画像标签体系并不相同,需要我们针对性的提炼出来。有一种比较简易的方式是:我们可以先找出一些通用类画像标签,然后再根据实际场景和需求补充业务类画像标签。这样得到的标签体系会相对比较完整,也能够随业务变动及时调整优化。
通用类画像标签体系(参考):
业务类画像标签体系(以某电商公司为例,参考):
按照以上的框架将用户画像信息标签化,能更好的根据实际需求去获取相关的用户画像数据。但是,需要注意的,产品用户画像的分析并不是要用到所有的标签数据,并且越是完整的标签体系,落地是越是困难。而且,更大的难度在于如何精准描述用户特征。因为只有用户特征描述越精准,我们得到的用户画像才会越清晰,在实际应用过程中的帮助越大。所以如何精确计算出用户的标签的权重就成为重中之重。
用户在不同标签上的偏好是通过权重来反映的,权重越高,说明用户在该标签上的偏好越强,反之亦然。而且,这个权重会随着时间变化而变化,标签权重的计算主要通过TF-IDF算法。
1)TF-IDF算法思想
用户标签权重,是由该标签对用户本身的重要性(TF-IDF权重)与该标签在业务上对用户的重要性(业务权重)两者共同决定的,
即:用户标签权重 = 业务权重* TF-IDF权重。
TF-IDF权重是通过TF-IDF计算得到的,业务权重是通过用户对标签的行为来决定的,
即:业务权重=行为类型权重 * 行为次数 * 时间衰减
2)简单理解
就是用户对一个标签的重要程度,会用不同行为来表达,不同的行为有不同的难度,比如:对于电商用户的行为难度来说,支付>收藏加购>分享>浏览>点击。不同行为就会有不同的权重,行为越难代表越喜欢,权重越高,同理行为次数越多也代表越喜欢。
标签对这个用户来说越稀有代表越喜欢,喜欢程度会随着时间的增加而逐渐降低,通过这个公式计算标签权重。
3)行为类型权重
用户浏览、点击、搜索、收藏、分享、下单、购买等不同行为对用户而且有不同重要性,一般根据业务经验或者使用层次分析法定义一个基本行为权重。
4)行为次数
这里的行为次数表示每一种行为的次数。
5)时间衰减
时间衰减是指用户的行为会随着时间的流逝,用户偏好会不断减弱。在建立与时间衰减相关的函数时,我们可套用牛顿冷却定律数学模型。
牛顿冷却定律:较热物体的温度F(t)是随着时间t的增长而呈现指数型衰减,其温度衰减公式为:
F(t)=T*exp(-α*t)。
T:初始温度
α:衰减常数即冷却系数,是自己定义的数值,一般通过回归可计算得出
t:时间间隔
冷却系数如何计算呢?
冷却系数是自己定义的数值,一般通过回归可计算得出。例如:初始偏好设置为1,1天后的偏好为0.85,即 0.85=1*exp(-α*1),求得α=0.16,这个就是标签的冷却系数。
在这里我们用Python语言来模拟一下这个冷却曲线:
import numpy as np
import matplotlib.pyplot as plt
import math
t = np.arange(0,100)
plt.plot(t,1*np.ma.exp(-0.16*t))
plt.title('偏好度冷却趋势')
plt.ylabel('偏好度')
plt.xlabel('时间(天)')
plt.show()
6)举个栗子
用户“小美”,对于标签“口红”的权重计算:假设我们之前定义冷却系数α=0.16,基于业务经验或通过层次分析法假设行为类型权重:点击(0.1)、浏览(0.2)、分享(0.5)、收藏加购(0.6)、支付(0.9)。
小美的每日行为表:
2021-05-01:
2021-05-02:
2021-05-03:
用户“小美”对标签“口红”每天的权重:
2021-05-01:2*0.1+2*0.2+3*0.6+1*0.5+1*0.9=3.8
2021-05-02:3.8 *exp(-α*1)+1*0.1+1*0.2+2*0.6+1*0.5+0=5.06
2021-05-03:5.067718*exp(-α*1)= 4.32
这样算下来是不是就很清晰了。
在初步形成了用户画像后,并不能直接交给运营、业务人员直接使用,还需要评估用户画像的准确性,以及交付使用后不断迭代用户画像,以获得更加精准的用户画像。
评估方式主要分为3种:逻辑验证、A/B test、用户回访。
逻辑验证:也叫做交叉验证,在完整的用户画像标签体系中,一些标签往往会存在一些相关性;比如用户的累计在线时长越长,订单量通常会越高;比如购买3C产品的用户群中,男性用户数通常大于女性用户数;另外,如果公司购买了第三方机构的数据,也可用于交叉验证。
A/B test:也叫做灰度测试,以上述的忠诚度为例,保证对照组、实验组的流量相同;对实验组的用户,进行提升忠诚度的运营策略(促销活动、积分奖励等);如果实验组的用户,忠诚度相比对照组用户,有一定提升,则可以认为用户画像比较精确。
用户回访:最朴实的评估方法,比如用户画像系统,定义了10万用户为低忠诚度用户;此时从中随机抽取1000人,交给客服,进行回访。根据回访结果,判断用户画像结果是否准确;甚至可以对回访结果进行文本挖掘,形成词云,查看消极词的占比。
本文很长,所以最后还是要做个总结,区别于其他文章单纯阐述如何构建用户画像,这篇文章系统而全面的分析了用户画像是什么?是否一定要搞?怎么搞?层层递进地说明了:什么是用户画像?→ 什么场景会用到用户画像?→ 我们是不是真的需要用户画像?→ 用户画像怎么搞才能落地?→ 能落地的用户画像的构建步骤 → 用户画像的效果评估&迭代。
希望我们在做用户画像的时候都能多问几个为什么?知道为什么要做远比知道怎么做更重要,只有这样,才能做出落地且有价值的用户画像。
以上就是数据分析思维—用户画像部分的内容,更多数据分析思维的文章持续更新中,敬请期待,如果觉得不错,也欢迎分享~
-END-
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)