教你从0到1搭建数据分析知识体系
数据分析在运营工作中无处不在,无论是活动复盘、专题报告、项目优化,还是求职面试,数据分析都有一席之地。
对于数据分析,我发现很多运营都有这样一些困惑:
不知道从哪里获取数据;不知道用什么样的工具;不清楚分析的方法论和框架;大部分的数据分析流于形式;…… 其实,数据分析并没有大家想象的那么难!接触了很多数据从业者,总结了这篇文章,希望对有志于学习数据分析的运营同学有所帮助。
一、概念:数据和数据分析
其实大家一直都在接触数据和数据分析,但是对于两者具体的定义又很难说清楚。我曾经做过一个调查,问一些运营同学,下面5个选项哪些属于“数据”概念的范围。
大部分人都知道把“4.报表”选上,但是很难有人会认为上面5个选项都是。其实这反映了一个很普遍的现象:很多人都会先入为主,认为数据就是各种表格、各种数字,例如excel报表、各种数据库。其实这是一个错误或者说有偏差的认识,它会使得我们对数据的认识变得很狭隘。
(一)什么是数据
数据(data)是描述事物的符号记录,是构成信息或者知识的原始材料。这种哲学层次的定义,让数据的范围极大丰富,也符合目前“大数据”发展的需要。试想一下,现在很多搜索引擎做的 “图片识别”、“音频识别” 难道不是数据分析的一部分吗?
作为一名互联网企业的运营从业者,我们接触到的数据可能没有那么复杂,但是也有很多类别。
从数据的来源来看,可以分为企业外部数据和内部数据。外部数据主要包括社会人口、宏观经济、新闻舆情和市场调研数据;内部数据包括用户行为数据、服务端日志数据、CRM与交易数据。不同数据的获取途径、分析方法、分析目的都不经相同,不同行业、不同企业在实际分析中也都各有偏好。
那么我们常见的“信息”和“数据”有何不同?
数据是信息的载体和表现形式;信息是数据的内涵,信息加载于数据之上。以书本和知识为例,书本属于数据概念范畴,知识属于信息概念范畴;书本是知识的一种载体和表现形式,知识是书本的内涵和升华。
(二)什么是数据分析
数据分析是指从数据中提取有用的信息,并指导实践。
这里有两个点需要注意:首先,我们需要提取的是有用的信息,而不是自嗨;其次,这些信息需要用来指导实践,而不是流于形式。
二、思路:方法论和方法
很多新人入门数据分析的时候,要么胡子眉毛一把抓,要么无从下手。这都是缺少分析思路的表现,需要宏观的方法论和微观的方法来指导。
那么方法论和方法有什么区别?
方法论是从宏观角度出发,从管理和业务的角度提出的分析框架,指导我们接下来具体分析的方向。方法是微观的概念,是指我们在具体分析过程中使用的方法。
(一)方法论
数据分析的方法论很多,这里我给大家介绍一些常见的框架。
PEST分析法:从政治(Politics)、经济(Economy)、社会(Society)、技术(Technology)四个方面分析内外环境,适用于宏观分析。SWOT分析法:从优势(Strength)、劣势(Weakness)、机遇(Opportunity)、威胁(Threat)四个方面分析内外环境,适用于宏观分析。5W2H分析法:从Why、When、Where、What、Who、How、How much 7个常见的维度分析问题。4P理论:经典营销理论,认为产品(Product)、价格(Price)、渠道(Place)和促销(Promote)是影响市场的重要因素。AARRR:增长黑客的海盗法则,精益创业的重要框架,从获取(Acquisition)、激活(Activition)、留存(Retention)、变现(Revenue)和推荐(Referral)5个环节增长增长。数据分析的方法论很多,这里不能一一列举;没有最好的方法论,只有最合适的。下面我详细介绍一下 AARRR 方法论,对于精益化运营、业务增长的问题,这个方法论非常契合。
对于互联网产品而言,用户具有明显的生命周期特征,我以一个O2O行业的APP为例阐述一下。
首先通过各种线上、线下的渠道获取新用户,下载安装APP。安装完APP后,通过运营手段激活用户;比如说首单免费、代金券、红包等方式。通过一系列的运营使部分用户留存下来,并且给企业带营收。在这个过程中,如果用户觉得这个产品不错,可能推荐给身边的人;或者通过红包等激励手段鼓励分享到朋友圈等等。
需要注意的是,这5个环节并不是完全按照上面顺序来的;运营可以根据业务需要灵活应用。
AARRR的五个环节都可以通过数据指标来衡量与分析,从而实现精益化运营的目的;每个环节的提升都可以有效增长业务。我们下面的分析也是围绕这个方法论展开的。
(二)方法
根据运营工作的实际需要,在参考了 GrowingIO 陈明的文章《一名优秀的数据分析师是怎样炼成的》基础上,我整理了7种分析方法。借助常见的网站/APP数据分析产品,我们非常快速的完成这7种分析。
1.趋势分析
趋势分析是最简单、最基础,也是最常见的数据监测与数据分析方法。通常我们在数据分析产品中建立一张数据指标的线图或者柱状图,然后持续观察,重点关注异常值。
在这个过程中,我们要选定第一关键指标(OMTM,One Metric That Metter),而不要被虚荣指标(Vanity Metrics )所迷惑。
以社交类APP为例,如果我们将下载量作为第一关键指标,可能就会走偏;因为用户下载APP并不代表他使用了你的产品。在这种情况下,建议将DAU(Daily Active Users,日活跃用户)作为第一关键指标,而且是启动并且执行了某个操作的用户才能算上去;这样的指标才有实际意义,运营人员要核心关注这类指标。
2.多维分解
多维分解是指从业务需求出发,将指标从多个维度进行拆分;这里的维度包括但不限于浏览器、访问来源、操作系统、广告内容等等。
为什么需要进行多维拆解?有时候一个非常笼统或者最终的指标你是看不出什么问题来的,但是进行拆分之后,很多细节问题就会浮现出来。
举个例子,某网站的跳出率是0.47、平均访问深度是4.39、平均访问时长是0.55分钟。如果你要提升用户的参与度,显然这样的数据会让你无从下手;但是你对这些指标进行拆解之后就会发现很多思路。
下面展示的是一个产品在不同操作系统下的用户参与度指标数据。
仔细观察的话,你会发现移动端平台(Android、Windows Phone、IOS)的用户参与度极差,表现在跳出率极高、访问深度和平均访问时长很低。这样的话你就会发现问题,是不是我们的产品在移动端上没有做优化导致用户体验不好?在这样一个移动互联网时代,这是非常重要的一个问题。
3.用户分群
用户分群主要有两种分法:维度和行为组合。第一种根据用户的维度进行分群,比如从地区维度分,有北京、上海、广州、杭州等地的用户;从用户登录平台进行分群,有PC端、平板端和手机移动端用户。第二种根据用户行为组合进行分群,比如说每周在社区签到3次的用户与每周在社区签到少于3次的用户的区别,这个具体的我会在后面的留存分析中介绍。
4.用户细查
正如前面所说的,用户行为数据也是数据的一种,观察用户在你产品内的行为路径是一种非常直观的分析方法。在用户分群的基础上,一般抽取3-5个用户进行细查,即可覆盖分群用户大部分行为规律。
我们以一个产品的注册流程为例:
用户经历了如下的操作流程:【访问官网】-【点击注册】-【输入号码】-【获取验证码】。本来是非常流畅的一个环节,但是却发现一个用户连续点击了3次【获取验证码】然后放弃提交。这就奇怪了,用户为什么会多次点击验证码呢?
这个时候我建议您去亲自体验一下您的产品,走一遍注册流程。你会发现,点击【获取验证码】后,经常迟迟收不到验证码;然后你又会不断点击【获取验证码】,所以就出现了上面的情况。
绝大多数产品都或多或少存在一些反人类的设计或者BUG,通过用户细查可以很好地发现产品中存在的问题并且及时解决。
5.漏斗分析
漏斗是用于衡量转化效率的工具,因为从开始到结束的模型类似一个漏斗,因而得名。漏斗分析要注意的两个要点:第一,不但要看总体的转化率,还要关注转化过程每一步的转化率;第二,漏斗分析也需要进行多维度拆解,拆解之后可能会发现不同维度下的转化率也有很大差异。
某企业的注册流程采用邮箱方式,注册转化率一直很低,才27%;通过漏斗分析发现,主要流失在【提交验证码】的环节。
经过了解发现,邮箱验证非常容易出现注册邮箱收不到邮件的情况,原因包括邮件代理商被屏蔽、邮件含有敏感字被归入垃圾邮箱、邮件送达时间过长等等。既然这么多不可控因素影响注册转化率,那就换一种验证方式。换成短信验证后,总体转化率提升到了43%,这是非常大的一个增长。
6.留存分析
留存,顾名思义就是新用户留下来持续使用产品的含义。衡量留存的常见指标有:次日留存率、7日留存率、30日留存率等等。我们可以从两个方面去分析留存,一个是新用户的留存率,另一个是产品功能的留存。
第一个案例:以社区网站为例,“每周签到3次”的用户留存率明显高于“每周签到少于3次”的用户。签到这一功能在无形中提升了社区的用户的粘性和留存率,这也是很多社群或者社区主推这个功能的原因。
第二个案例:首次注册微博,微博会向你推荐关注10个大V;首次注册LinkedIn,LinkedIn会向你推荐5个同事;申请信用卡时,发卡方会说信用卡消费满4笔即可抽取【无人机】大奖;很多社交产品规定,每周签到5次,用户可以获得双重积分或者虚拟货币。
在这里面“关注10个大V”、“关注5个同事”、“消费4笔”、“签到5次”就是我想说的Magic Number,这些数字都是通过长期的数据分析或者机器学习的方式发现的。实践证明,符合这些特征的用户留存度是最高的;运营人员需要不断去push,激励用户达到这个标准,从而提升留存率。
7.A/B测试与A/A测试
A/B测试是为了达到一个目标,采取了两套方案,一组用户采用A方案,一组用户采用B方案。通过实验观察两组方案的数据效果,判断两组方案的好坏。在A/B测试方面,谷歌是不遗余力地尝试;对于搜索结果的显示,谷歌会制定多种不同的方案(包括文案标题,字体大小,颜色等等),不断来优化搜索结果中广告的点击率。
这里需要注意的一点,A/B测试之前最好有A/A测试或者类似准备。什么是A/A测试?A/A测试是评估两个实验组是否是处于相同的水平,这样A/B测试才有意义。其实这和学校里面的控制变量法、实验组与对照组、双盲试验本质一样的。
三、流程:宏观、中观和微观
(一)宏观
1.中国古代朴素的分析哲学
其实数据分析自古有之,中国古代很多名人从事的其实就是数据分析的工作;他们的名称可能不是数据分析师,更多的是“丞相”、“军师”、“谋士”,如张良、管仲、萧何、孙斌、鬼谷子、诸葛亮。
他们通过 “历史统计”-“经验总结”-“预测未来” 为自己的组织创造了极大的价值,这是中国古代朴素的分析哲学的重要内容。
2.精益创业的MVP理念
风靡硅谷的精益创业,它推崇MVP(最简化可行产品)的理念,通过小步快跑的方式来不断优化产品、增长用户。
在运营工作中,我们要大胆尝试,将想法转化成产品和运营方法。然后分析其中的数据,衡量产品或者运营的效果。如果好的话保持并大力推广,如果不好的话总结问题及时改进。在“构建-“衡量”-“学习”的不断循环中逐渐优化,这个流程是非常适合运营工作的。
(二)中观
《谁说菜鸟不会数据分析》书中介绍了更为具体的分析流程:1.明确分析目的和思路 →2.数据收集 →3.数据处理 →4.数据分析 →5.数据展现 →6.报告撰写。
这个流程只是从“数据”的角度阐述了前后的流程,并未结合业务实际;而且它将数据分析的落脚点定位于“报告撰写”是具有误导性的,因为数据分析的最终目的是为了指导实践,而不是写一份报告。
但是这个流程仍具有参考价值,尤其是 “明确分析目的和思路” 对于新手入门具有一定的指导意义。
(三)微观
下面介绍的是一个非常详细的分析流程,借助于一定的分析工具,我们可以按照这个思路对您的网站/APP进行细致入微的分析。
《提高用户留存,产品、市场和运营都有哪些方法》中介绍的流程,我认为适用于大部分的运营数据分析。
它的前提是用数据分析工具做好数据采集和监控工作,把精力集中在业务分析上。
这个流程的核心是“MVP”的理念,“发现问题”-“设计实验”-“分析结果”,通过数据来不断优化产品和运营。
四、应用:体系和分析
(一)案例1:搭建数据分析体系
小张今年刚毕业,在某公司从事新媒体工作,负责微信的日常运营。小张并不清楚微信运营的核心目的,尝试了很多方法,原创、翻译、改写了很多文章发布在微信上,但是阅读量时高时低,总体一般。
经理让小张想办法改进一下微信运营,提高微信的粉丝数和阅读数;但是张三毫无头绪,无从下手。
这是很多运营真实的写照,琐碎的工作容易让人忘记思考,这很可能就发生在你我的身边。
我们从数据分析的角度对这个案例进行了诊断,总结了小张存在的这些问题:
不清楚自己需要关注哪些核心指标;不清楚目标用户的特征(用户属性、用户画像等);对自己过往工作缺乏系统分析(数据采集、监测和分析)。从业务增长的角度出发,我给小张量身定做了一套数据分析体系,配合其内容工作的开展。
第一点,内容定位。
运营需要明确知道自己的目标或者KPI,然后选择一个核心关键指标(OMTM)进行监测。如果是创业公司,初期可能需要拉新,那么核心指标是注册用户数或者新访问用户数。如果是资讯媒体,注重影响力和覆盖面,那么核心指标应该是微信阅读数或者网页PV。
第二点,用户画像。
无论是哪一种运营岗位,都需要明确知道自己的(目标)用户是那些人?这些人都有哪些特征,他们的关注点和痛点是什么?如果你的用户是产品经理,那么可以尝试爬虫抓取产品经理网站上有关的问题,然后做文本分析:这是定量层面的分析。
同时,通过调查访问和问卷调研,获取更加深入的用户特征信息:这是从定性层面的分析。
第三点,持续监测。
借助数据分析工具,对核心关键指标(OMTM)进行持续监测。对于指标异常情况,我们需要及时分析和改进。
第四点,数据分析。
统计和分析过往内容的数据,找出哪些内容、哪些标题、哪些形式、哪些渠道的效果更好,然后朝这方面不断优化。
案例2:分析业务核心指标
电子邮件营销是现在很多企业仍在采用的营销和运营方式,某互联网金融企业通过EDM给新用户(有邮件地址但是未注册用户)发送激活邮件。一直以来注册转化率维持在20%-30%之间,8月18日注册转化率暴跌,之后一直维持在10%左右。
这是一个非常严重的衰退,需要立即排查原因。EDM渠道注册转化率涉及到太多的因素,需要一个一个排查,数据分析师帮运营罗列了可能的原因:
技术原因
ETL(数据抽取、转化、载入)出现问题,导致后端数据没有及时呈现在BI报表中;
宏观原因
季节性因素(节假日等),其余邮件冲击(其余部门也给用户发邮件稀释了用户的注意力);
微观原因
邮件的标题、文案、排版设计,CTA设计,注册流程设计。
一个简单的业务指标,会影响到它的因素可能是多种多样的,所以我们需要对可能涉及到的因素进行精细化衡量才能不断优化。最后发现,产品经理在注册环节添加了『绑定信用卡』,导致注册转化率大幅度下降。
五、学习:业务、工具和资源
(一)业务层面
数据分析并没有想象中的高不可及,掌握好相应的概念、思路、流程,运营都可以做好数据分析。这里要着重强调一点,数据分析的目的是指导业务实践;脱离实践的数据分析、为分析而分析的数据分析都是在耍流氓。
不同于职业的数据分析师和数据科学家,运营人员做好数据分析的前提是娴熟的业务理解。从业务的角度来说,数据不是数字,它是用户的心声。运营人员要从数据中发现问题,不断优化,提升用户体验、为用户创造更多的价值。
(二)工具层面
磨刀不误砍柴工,做好数据分析工具必不可少。我汇总了下面几种工具,运营可以结合自己的实际需要采用。
Excel 是最常见、最基础的数据分析工具,Excel 里面的图表、函数、透视表能满足大家基本的需求。Access 是微软 office 系列套装的一部分,是一种小型的关系数据库;当excel数据量很大、表格之间各种关联、查询、更新频繁的时候,Access就是一种非常不错的选择。
Python是一种高级的编程语言,近年来发展很快,它可以用来做数据分析、编程或爬虫;R语言是一种数据分析工具,在统计学中广泛使用。目前,Python被广泛用来编写爬虫程序,获取网上的信息,这是对运营人员非常有帮助的。
Google Analytics、百度统计、友盟是常见的网站流量分析工具,Mixpanel、Heap、GrowingIO属于用户行为数据分析工具,较前者功能更加丰富、分析更细致。
(三)资源层面
运营入门数据分析,并不需要学习多么复杂的数学知识理论,更多的是将业务操作和数据分析结合起来。我这里推荐两个网站和两本书,希望有帮助。
本文系作者:
赵同学
授权发表,鸟哥笔记平台仅提供信息存储空间服务。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》
如对文章、图片、字体等版权有疑问,请点击
反馈举报
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)