APP推广合作
联系“鸟哥笔记小乔”
收藏!一文助你入门数据分析(上)
2021-07-06 16:36:56

关注了一些互联网大佬的公众号,标题都是类似于《月薪5w的产品经理必备的能力》、《你正在被有这项能力的人淘汰》等,点进去读了一半才发现基本都是数据分析、Python学习的网课广告。


虽说是恰饭文,但也从侧面说明了处于存量市场的互联网下半场,企业和产品越来越需要通过数据建立精细化经营的模式。


那么,问题来了,产品经理是否有必要掌握数据分析能力呢?


答案是肯定的。


抛开那些升职加薪的短期钱财利益,数据分析能力更能带给你如下3个更为长远的价值:


帮助你思维纠偏、更加客观理性


除非你有像乔布斯那样极佳的直觉天赋,大部分人的直觉可能都充满了私心和偏见。大量的数据分析能够纠正你的个人偏见和一厢情愿,扶正你看待用户、产品和行业的视角


帮助你培养复盘反思的习惯


懒是人类的天性,对于没有背KPI或业务指标的产品经理而言,上线就意味着结束。但其实上线才仅仅走完了PDCA戴明环中的Plan和Do环节,只有不断循环PDCA,我们才能够更快的成长,而上线后的数据分析则是在完成后续的Check和Action环节


快速培养对产品/商业的灵敏嗅觉


通过持续关注产品和业务的关键指标及趋势,能帮助产品经理更贴近真实的用户和真正的商业运作方式,从而快速培养对产品和商业的灵敏嗅觉


这里提醒一点,不同行业、不同产品经理阶段(产品助理、产品经理、产品总监)所需要的数据分析能力掌握程度和掌握内容肯定是有所不同的,并不是每一个产品经理都要会Python和回归分析法,应当视具体所需而定。

那么,数据分析到底是什么?产品经理需要掌握哪些呢?

接下来,我们会将本次的产品经理数据分析之旅分为上下2篇,此为上篇。上篇为理论篇,以建立对数据分析的宏观知识框架为主,下篇为实战篇,以笔者亲身实操和复盘踩坑为主。

那开始咯。

一、数据是什么?数据分析是什么?

既然我们是在做数据分析,那我们就需要先弄清楚数据是什么,数据分析又是什么。

数据是什么?

关于数据,对于刚入门的数据分析小白而言,会走入如下2个误区:

误区一:数据就是数字

事实上,数据Data并不是数字Number。数据是事实或观察的结果,是对客观事物的逻辑归纳,是用于表示客观事物的未经加工的原始素材。它可以用于科学研究、设计、查证、数学等,以数字、声音、图像、符号或文字等形式进行呈现。

误区二:数据来源为客观采集,因此,我们可以绝对依赖数据做决策

由误区一可见,数据确实是对客观事物的逻辑归纳,但是数据本身只是素材,并不是信息。而我们做在决策时是需要将数据信息解读为一个结论,再依据结论来做决策。

那么,问题来了。在解读的过程中,我们很容易被自己或他人对数据的个人解读所蒙蔽,抱着以数据为准的借口来反向证明自己的观点。数据本身确实没有情绪和观点,但数据的解读难免就会带有主观的色彩。

因此,我们不可唯数据论,而应当将只将数据视为一种用于辅助决策的较为客观的信息来源。

数据分析是什么?

在知道了数据是什么之后,我们再回过头来看数据分析到底是在做什么。


数据分析是指根据分析目的,用适当的分析方法或工具,对数据进行处理与分析,提取有价值的信息,形成有效结论的过程。———《谁说菜鸟不会数据分析》


那么数据分析有什么作用呢?


主要包含如下三大作用:现状分析、原因分析、预测分析


简而言之,就是通过数据对过去、现在和未来进行分析:即通过数据衡量和描述现在与过去的状态,找出过去出现问题的原因、对未来的走向进行预测。

套用到互联网产品中,产品经理可以在以下场景中善用数据分析更好地解决问题:

验证idea或方案


当有了一个idea或方案时,通过对方案关键指标进行把控和衡量,能够帮助我们快速验证方案是否正确、哪个方案更好,从而辅助我们快速做出正确的决策


下钻找出问题


当产品或业务指标出现异常后,我们可以通过数据分析进行细致下钻,找出造成异常的环节并进行优化改善


预测产品走向


数据分析并不只局限于对过去问题的解决,还能通过趋势预测未来的数据走向。一旦预测到某关键指标未来可能会出现问题,便可以及时在当下做出调整,避免等到未来问题发生再处理,那就为时已晚了

二、数据分析的流程

讲完了数据分析的作用和适用场景,我们就来看看数据分析具体要做哪些事。

一次完整的数据分析共包含如下6件事:明确分析目的、数据收集、数据处理、数据分析、数据展现、报告撰写。


这里说明一下,关于数据分析的流程,笔者见过至少好几种个版本,4、5、6步的都有,但内容基本一致,只不过是为了帮助不同的受众(如数据分析师、产品经理)更好地理解罢了,大家不用太过纠结。

为了帮助大家更好地建立对数据分析的全流程理解,本文选择了其中一个较为详细的版本。

下面,我们就来到了本文内容的重中之重,即数据分析的核心6大流程都是在做什么事。

2.1 明确分析目的

无论是产品分析、竞品分析,亦或是本文主讲的数据分析,任何「分析」都要清晰确立好目的。

数据分析目的就像一次迭代中明确的需求清单list一样,让我们在迷茫和溢出时,时刻谨记方向和范围,避免偏航和做出无用功。

对于非数据产品经理而言,常见的分析目的包含但不限于:

验证新上线的功能实际使用情况是否符合预期?


用户更倾向于哪一种交互或方案?哪一种方案的转化更好?


核心路径各环节的转化效率如何?是否还有提升优化的空间?


用户到底在怎样使用我们的产品?功能使用频率如何?


核心用户画像是怎样的?从画像中能否找到一些机遇和突破点?

2.2 数据收集

从字面意思来看,这一步主要是在收集数据,为后期的数据分析提供素材和依据。数据收集的常见来源包含公司内的业务数据库、互联网上发布的数据、市场调研等等。

那么,对于一款互联网产品而言,常用的数据主要是用户交互数据和业务数据。

抛开业务属性,用户与产品的交互可以抽象为浏览和操作两大类事件。为了降低成本,很多中小公司都会趋向于借用第三方数据平台对用户的访问进行无埋点,而对于具有业务属性的操作再进行代码埋点,通过将这2种方式结合来以最低的成本完成数据的收集。

关于埋点和无埋点技术,大家可以前往GrowingIO、神策数据、易观方舟等第三方数据平台的产品帮助文档上进行更为细致的学习。

然而,确定如何收集只是「数据收集」这一步的开胃菜,真正的难点在于收集哪些数据

这里我们引入一个能够参考制定数据指标的模型:OSM模型

OSM模型(Object-Strategy-Measure)


O代表业务目标Object。需要我们思考业务、产品、功能存在的目的是什么、能够解决用户什么问题、满足用户的什么需求;


S代表业务策略Strategy。指在我们清楚业务目标之后,为了达成上述目标,我们应当采取的业务策略;


M代表业务度量Measure。用于衡量我们的策略是否有效,反映目标的达成情况。

通过OSM模型,我们就能确立出度量业务策略的数据指标,也就确立了本次收集的对象是哪些数据。

举一个简化的例子,用户最近经常抱怨当前系统的数据无法与其他财务系统打通。因此,你们准备先临时做一个导出功能,通过手动导出当前的表格进行财务数据的处理,从而初步满足客户的需求。

那么,在上线导出功能之后,为了验证该功能到底有多少人在用、导出功能的效率高不高等问题,我们就可以制定出如下几个数据指标(示例):

导出按钮的展示量


导出按钮的点击量


导出成功的平均时长、中位数


导出成功/导出失败的比率


通过以上这个案例,我们就确立出了为了衡量业务策略所需要收集的指标及数据。

但是,数据分析还需要对指标从不同的维度进行对比分析,才能得出真正有效的结论。因此,这一步我们还需要搭配「维度」来为这个功能进行更多角度的度量。

指标


是用户衡量事物发展程度的单位,也称为度量。


指标需要经过计数、加和、平均等汇总计算方式得到,并且需要在一定的前提条件下进行汇总计算,如事件、地点、范围,也就是我们常说的统计口径与范围。


例如订单量为2300、用户数量为1000,这些都是对访问、订单、用户的一种度量;


维度


是事物或现象的某种特征,用于分解、过滤以及对比指标的角度。

例如昨天的订单量为300、女性用户的数量为500,这些都是看待指标的一种角度,是指标的某一属性。


通过指标+维度的搭配,我们就能够在这一步明确需要收集哪些数据,且数据未来以什么样的维度进行细分等,为我们后续进行数据分析做好准备。

2.3 数据处理

数据处理指对收集到的数据进行加工整理,得到适合数据分析的样式,其基本目的是从大量、杂乱无章、难以理解的数据中,抽取并推导出对解决问题有价值、有意义的数据。

数据处理主要包括数据清洗、数据合并、数据抽取、数据计算、数据转换等。一般拿到手的数据都需要进行一定的处理才能用于后续的数据分析。对于专门从事数据分析的数据分析师而言,数据处理占据了整个工作中的大部分比例。

那么对于非数据产品经理而言,一般不需要掌握全部数据处理的方法,但是一定要明确数据的收集规则,要对第三方平台、工程师、数据分析师帮忙收集来的数据再经过一次验证和确认后才方可使用。

否则,一旦数据源有问题,后续全部的分析、结论和决策就可能南辕北辙,甚至可能会蒙蔽问题、造成完全相反的结论和后果。

2.4 数据分析

当我们所需要的数据已经「干干净净」的呈现在我们面前时,此时,我们就可以通过一通分析对它们“下毒手”了。

常见名词

在系统学习数据分析之前,想必大家都听过AARRR漏斗、留存分析、热力图、LTV、PV/UV等一系列高深莫测的名词。在笔者第一次接触到这么多生词时,完全不知道他们之间都是什么关系,脑子里真的是一团浆糊=。=

不知道大家有没有遇到类似的问题~所以,笔者整理了一个简单的金字塔图,帮助大家一次性明确好这些名词之间的关系。这些常见的名词可以归类为3种:分析思路、分析模型、数据指标,下图就很好的阐述了这3者之间的关系:


对比分析、分组分析、分布分析等这些都属于分析思路的一种,这些并不能直接应用于进行数据分析,而是我们进行实战的一些指导思想。

我们在第三方数据平台或者自建的数据平台上常常应用的AARRR漏斗、留存分析、Session分析等则为一种结合了多种思路的分析模型。

例如,通过用户分群对新老用户的留存进行分析,则是结合了对比分析和分组分析这2种分析思路而产生的模型。

分析模型有点类似于数学公式,是我们可以直接套用来找到答案的常见方法。

而PV/UV、IP、流失率、LTV等则是具体的数据指标,是分析模型中需要的基石指标。单个的PV指标并不能产生任何价值,只有我们将这些数据套入到常见的分析模型中,亦或是直接应用分析思路进行分析后,才能够指导我们的决策。

那么,接下来,我们就来列举一些常见的分析思路、分析模型和数据指标。

常见分析思路

下面我们挑出几种常用的分析思路进行粗略的介绍:

对比分析:对比分析能够非常直观地看出事物某方面的变化或差距,并且可以准确、量化地表示这种变化或差距是多少。常见的会进行同级类别对比(横向对比)、不同时期对比(纵向对比)、与预期目标对比等。


分组分析:根据分组字段,将分析对象划分为不同的部分,以对比分析各组之间的差异。


结构分析:在分组的基础上,计算各组成部分所占的比重,进而分析总体的内部构成特征。


因素分解法:把综合性指标分解为各个原始因素,主要用于分析有明确数量关联关系的各因素之间的变动对综合指标变动量的影响程度,从而确定影响指标变化的原因。

常见分析模型

AARRR海盗模型


指Acquisition、Activation、Retention、Revenue、Referral,分别对应用户生命周期中的5个重要环节,被广泛应用于产品和运营的日常工作中


(图源网络)

RFM模型


是衡量客户价值和客户创利能力的重要工具和手段。在众多的客户关系管理(CRM)的分析模式中,RFM模型是被广泛提到的。该模型通过一个客户的近期购买行为、购买的总体频率以及花了多少钱3项指标来描述该客户的价值状况。


留存分析


留存分析模型是一种衡量用户健康度/参与度的方法,超越下载量、DAU 等指标,深入了解用户的留存和流失状况,发现影响产品可持续增长的关键因素,指导市场决策、产品改进、提升用户价值等


(图源易观方舟)

智能路径


路径,是指用户在应用中使用的行为轨迹。通过智能路径,我们可以清晰的看出哪条路径是用户走的最多的路径,哪条转化路径最短,每个环节的流失率是多少等


(图源易观方舟)

暂时就介绍这4种较为常见的数据分析模型,还有很多诸如分布分析、热图分析、间隔分析等模型,大家可以前往GrowingIO、神策数据、易观方舟等这些第三方数据平台上直接进行了解和体验。

这几家平台的分析模型有一些微小的区别,但是大体上基本大同小异,可以任选一家进行体验。

常见数据指标

其他与营收相关指标

LTV:life time value生命周期总价值,意为客户终生价值,是公司从用户所有的互动中所得到的全部经济收益的总和。


GMV:Gross Merchandise Volume,网站总成交金额。


ARPU:Average Revenue Per User,该业务在一定时期内每个用户贡献的收入价值,计算公式是为总收入/总用户数。


ROI:Return On Investment,即投资回报率。


以上,就是数据分析阶段对分析思路、分析模型、数据指标的初步介绍。通过将数据指标套入分析模型或分析思路中,我们便能够对业务和产品进行数据分析,从而获得有价值的关键信息。

2.5 数据展现

当我们对大量的数据进行分析处理之后,如果把枯燥和抽象的数据直接展示出来,其实会让人很难直观地找到数据分析的重点。因此,我们可以借助图表来让数据的展示更为形象、重点更为突出。

上学时,大家都学过折线图、柱状图、饼图等,但是当需要将数据变为图表时,可能一时间难以快速找到最合适的展示方式。

因此,这里给出《谁说菜鸟不会数据分析》这本书中非常棒的一张图,帮助你快稳准地找出最适合的图表展示形式。

(图源《谁说菜鸟不会数据分析》)

当然,将数据变成图表这个过程可以借助很多工具,例如无所不能的excel、第三方数据平台等。如果不能希望有更真实的感触,建议直接去试用下第三方的数据平台。通过对同一类数据切换不同的图表展示方式,能够快速帮助你对不同图表类型的适用场景有更深的理解。

2.6 报告撰写

在完成完整的数据分析之后,往往都需要得出一定的结论和决策。因此,在部分场合下需要再撰写单独的数据分析报告,从而更好地向boss和同事进行汇报。

数据报告主要包含如下3大作用:


展示分析结果


验证分析质量


提供决策参考


当然,这部分是相对进阶的内容。数据分析报告本身就是「报告」的一种,朝着如何写好报告(清晰高效地告诉受众他所关心的内容)努力就可以。如果你有兴趣深入了解,可以看看《谁说菜鸟不会数据分析》上最后一章的内容。

截止到此,笔者就带着大家一起初步掌握了数据分析的全部6个过程:明确分析目的、数据收集、数据处理、数据分析、数据展现、报告撰写。闭上眼睛回想一下,你是不是心里已经对数据分析有了一个大致的框架呢~

-END-

冰冰酱
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
冰冰酱
冰冰酱
发表文章15
不会写文章的产品经理不是好产品经理。公众号:产品冰冰酱(setmefreeee_)
确认要消耗 0羽毛购买
收藏!一文助你入门数据分析(上)吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接