01 写在前面

用户画像，大数据时代老生常谈且又长久不衰的话题，公司都在搞，文章满天飞，在这个人人都喊“数据驱动业务”的时代，你不懂用户画像，不搞用户画像，你都不好意思跟别人聊（chui）业（niu）务（pi）。

但是，用户画像是不是一定要搞？为什么要搞？不搞可不可以？如果一定要搞，用户画像耗时耗力，怎么才能把它真正落地到业务？而不是开发了N多的标签，放在数仓里吃灰？搞之前多问几个为什么，你会发现落地的可能性就大了很多。

在写这篇文章之前，我也拜读了不少用户画像相关的文章，但是很可惜，很多文章可能搞错了一点，那就是用户画像是业务，不是技术！用户画像一定是来源于业务，并且最终落地到业务上去的。那些不管业务需求、标签体系，上来就是用户画像怎么实现的，这无异于吃饭点了一盘土豆丝，大厨埋头给你搞了一道佛跳墙，然后跟你巴拉巴拉扯做佛跳墙牛叉的108步骤，呵呵，只能说，技术自嗨，最为致命，一切不以需求为出发点的应用，都是在耍流氓。

这也是写这篇文章的初衷，用户画像是什么？一般在什么场景下会用？我们的业务场景是不是真的需要这个费时费力的大家伙？如果真的需要，业务需求是什么样的？标签体系如何搭建和开发？开发后如何使用和进一步迭代优化？只有把这一步步想清楚做仔细，才能最终落地到实际的业务中，发挥用户画像真正的价值。

02 什么是用户画像？

用户画像是指根据用户的基本属性、用户偏好、生活习惯、用户行为等信息而抽象出来的标签化用户模型。每一个标签及标签权重是表征用户偏好的一个向量，一个用户可以理解为多个偏好向量（标签）的和。
--来自某度的看不懂的解释

说人话！！！用户画像是基于你在互联网上留下的种种数据，将这些数据在你知情或者不知情的时候，通过数据加工，产生的一个个刻画你兴趣偏好的标签组，这就是用户画像。

那么接下来的问题就是：用户画像的使用场景有哪些？

1、用户分群运营

分群运营是用户画像最常用的场景，通过用户画像的标签筛选，筛选出不同的用户群，通过push或弹窗配置平台，对不同的用户群实现精细化运营。

比如我们可以把过去30天购买金额大于500、活跃天数大于10天、最近一次活跃间隔在5天以内的用户定义为高付费潜力用户群，进而对这部分高潜用户进行精细化运营。

2、自动化触达

分层越来越精细，用户群的粒度会越来越小，最后会小到一个个体。我们针对每个个体去做push或者弹屏，运营效率还是太低了。基于用户画像的自动化触达就发挥了作用。比如针对上一步我们创建的高付费潜力用户群，我们通过App Push的方式发送一张满200减40的优惠券。

3、个性化推荐

以用户画像为基础构建推荐系统、搜索引擎、广告投放系统，可以有效提升转化率。我们先看一下用户画像的用户偏好表存储表（用户画像有很多这种标签，下面我们会详细展开具体讲解）：

当我们购买完成一个带有标签1，标签2，标签3的商品后，一般在购买完成页会有交叉销售场景，我们通过用户偏好表的标签及权重，基于用户相似或商品相似的协同过滤算法，推荐用户可能喜欢的其他商品。

4、用户统计&行业研究

根据用户的属性、行为特征对用户进行分类后，统计不同特征下的用量、分布，分析不同用户画像群体的分布特征和走势等。

另外，还可以通过用户画像分析可以了解行业动态，比如人群消费习惯、消费偏好分析、不同地域品类消费差异分析。比如我们经常听到马爸爸拿一些标签，说这个地方人喜欢买什么？为什么喜欢买？那个地方人都是买什么型号？

03 到底需不需要用户画像？

大学刚毕业时，初到一家互联网公司做数据运营，某天领导突然给我一个任务：做一个APP用户画像报告。当时我有点懵，一是我以前确实没接触过用户画像，概念不太清楚；二是接到领导的任务后我只知道要做一个用户画像，至于这个用户画像到底用来做什么我并不清楚。

在这个情况下，我查阅各种资料，问同学、问朋友，还找了一些高大上作图工具，最后总算是完成了任务，得到了公司认可。但用户画像到底给公司带来了什么价值，给运营决策起到了什么作用并不清楚，这其实就是典型的随大流，为了做而做。

这种面子工程非常常见，大家可以看看自己公司的情况对号入座，因为大家都在谈论用户画像，于是很多领导也开始要求做用户画像，别人有我们不能没有，但用户画像到底为了解决什么问题并不清楚，自然而然就没有落地的可能性，更不可能产生价值。

所以为了解决这个问题，在最开始的时候就要想清楚，我们是否真的需要用户画像？只要想清楚一下三个问题，就可以得到答案。

1、我们业务中是否有能用到用户画像的场景？比如用户分层、智能触达和个性化推荐。

2、如果有使用场景，是否一定要通过用户画像实现？用户画像本身是一个非常浩大的工程，十分耗时耗力，我们有没有其他替代的方案？

3、如果必须要搞，那我们给用户打了标签进行分层后，我们有没有对应的产品服务或运营方案？分层后没有对应的action，用户画像还是难以落地闭环。

以上问题如果没有想清楚，就盲目搞用户画像，结果很可能就是弄出来的用户画像远离业务，没有实用价值、无干货，被业务部门讥讽为“大而无用”的鸡肋产品。

所以，在规划用户画像平台时，一定要有目的性和场景感，不能只做表面文章，而不重视实际应用价值。

这里需要强调的一点是：不是因为我有了用户画像，才能驱动和提高业务。而是为了驱动和提高业务，才需要去建立用户画像。这是很容易犯的因果倒置的错误！

以上问题没有想清楚，千万不要动手开发，如果以上的问题想清楚后，还是要搞，那我们就要认真筹划，用户画像怎么做才有价值。

04 用户画像怎么才能落地？

已经确定要搞用户画像，接下来就要思考：怎么搞才能业务落地？怎么搞才能产生价值？

刚开始做用户画像的时候，业务部门摇头晃脑的说：“我们要基于用户画像，详细深入的了解用户，比如用户性别，年龄，地域，喜好，消费习惯，……这样我们就能精细化决策了”。然后数据部门夯吃夯吃搞了几个月，打了30000个用户标签，还得意洋洋的跟领导汇报：“我们的用户画像大数据建设取得长足进步”。

然后项目第一期汇报会上，数据部门得意洋洋的讲到：

我们的用户男女比例6:4
华南地区占比30%
华东25%购买A产品占比50%
巴拉巴拉巴拉......

业务部门一个白眼抛过来，

我早知道了！
我们的用户都是这样的呀！
然后呢？
你做这有啥用？......

当然还有更惨的，

就是你贴个“忠诚用户”的标签，
业务方说：哦，既然那么忠诚，就不做啥动作了。结果丫下个月不消费也不登录了！
你贴了“A产品爱用者”的标签，业务方推了A产品，丫没有买！
业务方怒气冲冲找来算账：“这用户画像一点都不精准嘛！”

于是，项目彻底凉凉。问题到底出在哪里呢？你丫的根本没有了解业务的需求啊，业务方想吃个简单的酸辣土豆丝，你吭哧吭哧跟业务方扯佛跳的108道工艺，或者虽然你了解了业务方的需求，但是这个标签你打的不准啊，我要的是酸辣土豆丝，不是青椒土豆丝......

所以要想用户画像能落地，以下几个步骤尤为关键。

1、明确业务需求

在规划用户画像时，一定要有目的性和场景感，不能只做表面文章，而不重视实际应用价值。再次强调：不是因为我有了用户画像，才能驱动和提高业务。而是业务有需求，才需要去建立用户画像！

第一步也是最为关键的一步，一定要搞清楚业务方的需求是什么？要解决的问题是什么？

举个栗子，一个内容型社区近期准备上线一个知识付费模块，通过该模式进行商业变现，想通过用户画像将精准的内容推荐给精准的人，进而促进付费变现。基于此，可以把业务目标和要解决的问题梳理如下：

2、标签选择

需要选择哪些标签？为什么要选择这些标签？其他的标签为什么不可以？选择标签有哪些误区？

我们都知道有用户基础属性的标签，也有用户的各种行为标签，我们需要在这个大的框架下不断细分完善标签体系。但是为什么要选择这些标签，比如用户的购买行为标签中，为什么选择新、老用户这个标签呢？因为我们的店铺针对未消费的新用户会有新人红包进行引导消费，所以要区分新老。对于老用户，我们为什么要选择最近一次购买时间，购买频次和交易金额作为标签呢？因为可以通过RFM对用户价值进行分层，进而进行精细化运营。

具体的标签体系搭建步骤我们会在第三部分中具体介绍，这里先不展开。

3、制定不同画像用户的运营策略

不同标签将用户划分为不同的用户群，但只有对不同的用户群制定针对性的运营策略，用户画像才能落地有价值。

举个栗子，在RFM模型中，有的同学不清楚用户交易金额M如何确定阈值，进而划分为高和低呢？是消费1000元算高还是10000元算高，有些同学因为这个纠结不已，为什么不反过来想呢？阈值设为1000或者2000我对应策略是什么？如果没有对应的策略，我划分了高低有何用处呢？这个时候不妨问问产品和运营的同学，你会发现运营上为了促进价格敏感的低客单价用户有满1000减200的满减活动，对于购买能力较强的金主爸爸，有满2000送独家定制的钻石会员卡，可以享受超级VIP待遇，以终为始，这个时候用户画像是不是更容易落地了？

05 用户画像的构建步骤

已经明确了业务需求以及不同画像用户的对应策略，下面就可以开始用户画像

的构建了，主要分为标签体系搭建和标签权重计算，简单来说，就是用哪些标标签表征用户，用户在各个标签上的偏好程度如何。

1、标签体系构建

理解用户画像，最直接的方式便是将画像信息标签化。信息标签化是用户画像系统用信息化手段刻画用户全貌的手段，也是用户画像系统中最核心的环节之一。我们通过构建丰富的标签，获取相关的标签数据，才能够刻画和洞察用户的兴趣和偏好。

1）标签体系的构建方法

构建标签体系的主要有两种方法：

方法一：结构体系化构建（常用）。通过划分标签类别和维度，从刻画用户的完整维度出发构建维度体系。这样的划分方式结构清晰、逻辑性强，能够比较全面的梳理出所有的信息维度，但受限于实际数据，落地较困难。

方法二：场景效果化构建。结合人群定向的实际需求，通过用户在不同行业领域或平台上的行为记录，对用户的心理需求和倾向性进行描述。这种方式目的性强，人群定向也较为精准，容易跟实际应用场景接轨，落地到具体的业务目标，跟实际数据结合较好，但标签会跟随消费趋势、娱乐热点等的变化波动。

2）标签维度的设计思路

标签维度设计上不仅需要清晰直观，还需要考虑多个场景化使用需求，同时兼顾多种产品运营需求及商业化投放需求。

标签设计上需要在了解业务方规划前提下，对标签的使用上有前瞻性的设计。

画像数据的来源一般有：用户调研、用户行为数据获取、客户端/服务端数据内容上报、第三方数据平台、基础数据及爬取第三方数据等。

ps：此处需要特别关注以下两个方面：

标签粒度：粒度过粗不利于运营使用推广，很容易脱离业务本身，对行为数据进行过度提炼造成信息丢失；而粒度过细则会导致标签覆盖率过低、耦合运营业务推广。

标签数据：标签数据的获取直接关系到实际使用价值，需要在可获取的数据范围内进行，扩宽数据源难度较大，通常需要优先进行数据可行性的统计。

3）标签体系的基础框架

不同业务的画像标签体系并不相同，需要我们针对性的提炼出来。有一种比较简易的方式是：我们可以先找出一些通用类画像标签，然后再根据实际场景和需求补充业务类画像标签。这样得到的标签体系会相对比较完整，也能够随业务变动及时调整优化。

通用类画像标签体系（参考）：

业务类画像标签体系（以某电商公司为例，参考）：

按照以上的框架将用户画像信息标签化，能更好的根据实际需求去获取相关的用户画像数据。但是，需要注意的，产品用户画像的分析并不是要用到所有的标签数据，并且越是完整的标签体系，落地是越是困难。而且，更大的难度在于如何精准描述用户特征。因为只有用户特征描述越精准，我们得到的用户画像才会越清晰，在实际应用过程中的帮助越大。所以如何精确计算出用户的标签的权重就成为重中之重。

2、标签权重计算

用户在不同标签上的偏好是通过权重来反映的，权重越高，说明用户在该标签上的偏好越强，反之亦然。而且，这个权重会随着时间变化而变化，标签权重的计算主要通过TF-IDF算法。

1）TF-IDF算法思想

用户标签权重，是由该标签对用户本身的重要性（TF-IDF权重）与该标签在业务上对用户的重要性（业务权重）两者共同决定的，

即：用户标签权重 = 业务权重* TF-IDF权重。

TF-IDF权重是通过TF-IDF计算得到的，业务权重是通过用户对标签的行为来决定的，

即：业务权重=行为类型权重 * 行为次数 * 时间衰减

2）简单理解

就是用户对一个标签的重要程度，会用不同行为来表达，不同的行为有不同的难度，比如：对于电商用户的行为难度来说，支付>收藏加购>分享>浏览>点击。不同行为就会有不同的权重，行为越难代表越喜欢，权重越高，同理行为次数越多也代表越喜欢。

标签对这个用户来说越稀有代表越喜欢，喜欢程度会随着时间的增加而逐渐降低，通过这个公式计算标签权重。

3）行为类型权重

用户浏览、点击、搜索、收藏、分享、下单、购买等不同行为对用户而且有不同重要性，一般根据业务经验或者使用层次分析法定义一个基本行为权重。

4）行为次数

这里的行为次数表示每一种行为的次数。

5）时间衰减

时间衰减是指用户的行为会随着时间的流逝，用户偏好会不断减弱。在建立与时间衰减相关的函数时，我们可套用牛顿冷却定律数学模型。

牛顿冷却定律：较热物体的温度F(t)是随着时间t的增长而呈现指数型衰减，其温度衰减公式为：

F(t)=T*exp(-α*t)。
T：初始温度
α：衰减常数即冷却系数，是自己定义的数值，一般通过回归可计算得出
t：时间间隔

冷却系数如何计算呢？

冷却系数是自己定义的数值，一般通过回归可计算得出。例如：初始偏好设置为1，1天后的偏好为0.85，即 0.85=1*exp(-α*1)，求得α=0.16，这个就是标签的冷却系数。

在这里我们用Python语言来模拟一下这个冷却曲线：

import numpy as np
import matplotlib.pyplot as plt
import math
t = np.arange(0,100)
plt.plot(t,1*np.ma.exp(-0.16*t))
plt.title('偏好度冷却趋势')
plt.ylabel('偏好度')
plt.xlabel('时间(天)')
plt.show()

6）举个栗子

用户“小美”，对于标签“口红”的权重计算：假设我们之前定义冷却系数α=0.16，基于业务经验或通过层次分析法假设行为类型权重：点击（0.1）、浏览（0.2）、分享（0.5）、收藏加购（0.6）、支付（0.9）。

小美的每日行为表：

2021-05-01：

2021-05-02：

2021-05-03：

用户“小美”对标签“口红”每天的权重：

2021-05-01：2*0.1+2*0.2+3*0.6+1*0.5+1*0.9=3.8

2021-05-02：3.8 *exp(-α*1)+1*0.1+1*0.2+2*0.6+1*0.5+0=5.06

2021-05-03：5.067718*exp(-α*1)= 4.32

这样算下来是不是就很清晰了。

06 用户画像效果评估&迭代

在初步形成了用户画像后，并不能直接交给运营、业务人员直接使用，还需要评估用户画像的准确性，以及交付使用后不断迭代用户画像，以获得更加精准的用户画像。

评估方式主要分为3种：逻辑验证、A/B test、用户回访。

逻辑验证：也叫做交叉验证，在完整的用户画像标签体系中，一些标签往往会存在一些相关性；比如用户的累计在线时长越长，订单量通常会越高；比如购买3C产品的用户群中，男性用户数通常大于女性用户数；另外，如果公司购买了第三方机构的数据，也可用于交叉验证。

A/B test：也叫做灰度测试，以上述的忠诚度为例，保证对照组、实验组的流量相同；对实验组的用户，进行提升忠诚度的运营策略（促销活动、积分奖励等）；如果实验组的用户，忠诚度相比对照组用户，有一定提升，则可以认为用户画像比较精确。

用户回访：最朴实的评估方法，比如用户画像系统，定义了10万用户为低忠诚度用户；此时从中随机抽取1000人，交给客服，进行回访。根据回访结果，判断用户画像结果是否准确；甚至可以对回访结果进行文本挖掘，形成词云，查看消极词的占比。

07 总结

本文很长，所以最后还是要做个总结，区别于其他文章单纯阐述如何构建用户画像，这篇文章系统而全面的分析了用户画像是什么？是否一定要搞？怎么搞？层层递进地说明了：什么是用户画像？→ 什么场景会用到用户画像？→ 我们是不是真的需要用户画像？→ 用户画像怎么搞才能落地？→ 能落地的用户画像的构建步骤 → 用户画像的效果评估&迭代。

希望我们在做用户画像的时候都能多问几个为什么？知道为什么要做远比知道怎么做更重要，只有这样，才能做出落地且有价值的用户画像。

以上就是数据分析思维—用户画像部分的内容，更多数据分析思维的文章持续更新中，敬请期待，如果觉得不错，也欢迎分享~

-END-

本文系作者：运营那些事儿授权发表，鸟哥笔记平台仅提供信息存储空间服务。

本文为作者独立观点，不代表鸟哥笔记立场，未经允许不得转载。

《鸟哥笔记版权及免责申明》如对文章、图片、字体等版权有疑问，请点击反馈举报

关键词

用户运营

用户画像