引言
大部分的数据分析教学都会教你excel,Python,sql,机器学习,还有一些分析方法比如对比分析、漏斗分析、留存分析等等技能。
但是,很多人掌握了这么多工具和技能,依然做不好数据分析。面对具体的业务问题,我们还是容易两眼一抹黑。就像我们大部分人学习英语,都会学习单词、语法、音标等等,但是一开口就跪了。
而英语母语的人就算不懂语法是什么,却能如同抬手睁眼一样自然地用英语表达。
这其中的区别,便是因为英语母语的人拥有“英语思维”。
想要做好数据分析也一样,单单会工具和技能是不够的,还必须拥有数据分析思维。
数据思维决定了你如何思考问题,如何搭配这些分析方法,如何得出结论,如何确定问题。
数据分析师第一个要训练的思维方式便是:只说事实,不说观点。
事实和观点这两个名词看起来区别很大。但实际上在生活中我们经常会将两者混淆。
比如说你的同事告诉你:最近的转化率大幅下降。
这句话到底是事实还是观点呢?
很显然这句话是观点。究竟下降多少算大幅下降?也许你认为的大幅下降在我看来变化并不大。
那么如果他说:转化率下降了。
这句话是事实还是观点呢?
这句话看起来已经非常像事实了,但是实际上它依然属于观点。
有这样一种情况,转化率在短期内它看起来是下降的,但是你站在宏观的层面上,以月为单位甚至以年为单位,它是它是上涨的,那么你究竟说他是上涨还是下跌呢?
那么什么是事实?
周一到周三的转化率持续下降,周三相比周一已经下跌了5%。
这句话就是事实,这句话不同的人都能理解,不会出现歧义。
因为观点的沟通会出现误差,而事实则不会。如果我们用观点进行沟通,自然会出现大量的误解。
如果连背景都没有理解清楚,后续的分析也就无从谈起。不过如果我们用主观判断数据的好坏,那么还是回到了原来的老路上去。
那么周三相比周一转化率下跌了5%,这个数据到底表现如何呢?
想要解读出观点,我们需要先找到一个标准。
1.可以是老板定的标准,看数据是否符合老板心中的标准。虽然这也是拍脑袋,不过老板毕竟是老板,他们心中有些战略构想是建立在某些条件满足的基础上的。所以没什么说的,如果老板不满意,那这数据肯定是有问题的。
2.可以看行业和竞品的平均标准,看数据下降是否是行业的普遍现象。
3.看企业过去的平均水平,可以在历史数据中找到类似场景下的数据情况,和自己的过去对比。然后我们通过数据和这些标准进行对比,得出一个观点。
比如我们可以分析每周的情况,看历史上是否存在这一的趋势,平均下跌是多少?如果历史上每周三都会下跌,平均下跌7%,那么我们就可以认为目前数据比较正常,没有问题。这样得出的结论全都是客观的,如果你不找标准,而用主观判断数据的好坏,那么不同部门的人会沟(shuai)通(guo)很久。人们总是习惯于通过自己的现存经验和知识去判断未知事物。这本身是进化带来的优势,它能让人在信息不完备的情况下迅速做出决断并付诸实施。这种预设立场的思维在原始人的时代很有价值,其优势在于:
第一,不浪费宝贵的能量,大脑是能量消耗大户;
第二,快速决断,避免因为低效决断而错失机会,这一点在避免伤害时尤为重要。在数据分析的场景下,我们需要尽可能地找出真实原因。此时这种预设立场的决断方式会造成许多错误,因为现有经验和知识在应对未知事物时是不足的,是有偏差的。如果出现了业务问题,关联的业务方往往预设一个立场:这事没有看起来那么糟,或者这事和我没关系。
比如转化率下降了,业务方的反应往往是这个数据下降肯定跟自己无关。
自己的运营活动明明做的很成功,转化率下降一定是行业因素、用户质量等等其他因素导致的。于是为了证明这个观点,他们顺着这个预设的前提,找到一些相关的证据来解释转化率下降的现实。实际上,想要证明一个观点,只要你肯去找,不管观点多么荒谬,总能找到支持你的理由。不仅辛普森悖论这种统计学的把戏可以得出完全相反的结论,即使最简单的“真话不全说”的方法,也能达到这种目的。比如,我说两个比较荒诞的列子。
1.把正例说成反例。
我想要证明一种物质是有害的,我列举出以下论点:
1.它是酸雨的主要成分;
2.对泥土流失有促进作用;
3.过多的摄取可能导致各种不适;
4.皮肤与其固体形式长时间的接触会导致严重的组织损伤;
5.吸入该物质容易引发窒息;
6.处在气体状态时,它能引起严重灼伤;
7.在不可救治的癌症病人肿瘤中已经发现该物质;
怎么样,你会不会觉得这是一种非常危险的物质,实际上上面描述的是“水”。
2.想要把反例说成正例也没问题。
比如中国男足,想要把男足描述成世界强队行不行?当然行。
1.哥斯达黎加是世界杯史上为数不多能够战胜中国队的国家
2.即使是巴西队这样的世界强队也仅战胜过中国队一次
3.自2002年韩日世界杯后,中国队在世界杯正赛上不败纪录已经延续12年
4.纵观漫长的世界杯史,中国队也仅输过三次
5.中国队从未在世界杯点球大战中失利过
6.中国队在领先的情况下从未丢过球
数据分析部门一般独立于业务部门之外,这样可以确保数据分析师没有业绩压力,分析具有独立性。因为数据分析的独立性,所以最终问题究竟是在产品上、运营上或者市场上,数据分析师不会有明显的偏向,只认客观数据。同样是转化率下降了,数据分析师的职责就是找出下降的真实原因。他们要梳理出和转化相关联的各个环节,获取数据,根据数据推演出合理的结论。有些资深的数据分析师有一定的业务敏感度,他们会提出一些可能性很大的假设。比如他们猜测可能是运营出现了问题,那么就需要找到一些数据来验证这个假设。预设立场,是要找到证据来证明猜想,一个数据不行,那就换另一个数据。直到能证明这个观点为止。
而验证假设,则是事先规划验证这个假设需要的数据。如果数据最终不符合假设,那么就抛弃这个假设。
好的数据分析师,能够根据客观数据,随时抛弃旧的假设,并建立新的假设。
抛弃固有的思维定式,这是非常反人性的,这也是为什么说数据分析需要专业训练的原因。
归纳法是从特殊到一般的推理,是从结果找原因的方法。
也就是说,通过观察很多个别事物的特殊性,然后概括出同类事物的特征。
但是我们一般不可能观察到这个事物的所有样本。所以归纳法得出的结论是不确定正确性的。你有没有听过这个故事:
在一个火鸡饲养场里,一只火鸡发现,不管是艳阳高照还是狂风暴雨,不管是天热还是天冷,不管是星期三和星期四,每一天上午的9点钟,主人都会准时出现,并给它喂食。
于是,它得出了一个惊天大定律:“主人总是在上午9点钟给我喂食。”
时间来到圣诞节的前一天,上午9点,主人又一次准时出现,但是这一次,主人带来的并不是食物,而是把它变成了食物….
这个是英国哲学家伯特兰·罗素提出的一个问题,被称为「罗素的火鸡」,用来讽刺那些归纳主义通过有限的观察,得出自以为正确的结论。
大部分人思考问题,会优先使用归纳法。因为这是人类认识世界的方法,这是人性决定的。比如一月到三月的成交金额连续上升,初级分析师往往会说:成交金额呈现上升的趋势。
这是典型的归纳法思维:因为过去是这样的,所以未来应该也会继续这样。这和那只火鸡的思维其实也没有什么本质的差别。
而且这和没分析一样,你把数据丢给业务方,他们也能看出目前呈现上涨的趋势。如果想要做好数据分析,就不能滥用归纳法,这点依然很反人性。
演绎法是从一般到特殊的推理,是从原因找结果的方法。
要想预测四月份的成交金额会如何,首先需要分析前三个月的成交金额为什么会上涨?当时的背景是什么?上涨需要哪些条件?
四月份的这些条件是否依然存在?如果维持成交金额上涨的条件不变,我们才能说四月份会继续延续这种上涨的势头。经过演绎法推理的结论才是合理的,而且我们通过深挖找出了内部的原因,这才是业务人员想要知道的。数据分析师是需要大量的逻辑思维训练,但我们自己做好还不够,我们的工作必需和业务方沟通,帮助他们解决实际的业务问题。
但是很多业务人员没有考虑清楚就跑来沟通,他们的需求可能充满了逻辑问题,这时我们就需要帮对方理清思路,找出对方表述背后的逻辑。数据分析师往往会听到业务方这样问:本周的转化率相比上周已经下降了5%,怎么办?这句话听起来感觉没什么问题,实际上逻辑并不是特别严密。
首先,这句话的前半部分很好地表达了事实,值得表扬。如果前半句是一个观点,我们还要先找到事实。
但是这句话的后半句有问题,后半句的“怎么办”,放在这个语境中,潜台词其实是这样的:本周转化率相比上周下降了5%
这是个不好的情况
需要解决这个问题
怎么办?
相比最开始的表述,我们分析出这句话中间出现了两个衍生的问题。问题1:转化率下降5%真的是不好的情况吗?
这就涉及到了标准了,之前提到了我们要找到一个客观标准,通过标准解决出数据的业务含义。问题2:如果数据表现真的不好,那么这是现在急需解决的问题吗?
这个问题的答案也是不一定。
商业世界要解决的问题太多,在同一时刻,永远存在着各种各样的问题。
而企业的资源是有限的,不可能同时解决所有的问题。问题的解决必然有轻重缓急之分。
那么凭什么要先解决转化率的问题,而不是解决引流的问题、留存的问题、活跃度的问题?
数据分析师必须了解企业当前的战略方向,把有限的资源投入到更重要的方向上。如果上面这两个隐藏的问题不想清楚,就开始分析怎么办,那么这类分析师的工作往往会费力不讨好,做很多低绩效的工作。说到这儿你有没有觉得,分析师的工作和法律工作者非常的像。
法官需要标准,标准就是法律文本。即使被告的行为看起来多么地不符合社会道德,只要法律没有规定不允许,那么法官就不能认为有罪。
法官不预设立场,法律的原则是无罪推断,任何人在未经证实和判决有罪之前,都视其无罪。法官要用演绎法推断。法官的判决讲究证据链完整。证据链中的链字,就有一环扣一环的含义在其中。很明显就是需要用演绎法来进行分析。
最后律师要理清当事人的逻辑,大部分人是说不清一件事的,当事人在律师的引导下把事情逐渐还原。法律史上有一个非常著名的故事,可以为我们带来一些启发。在1608年,英国国王詹姆斯召见了法官,提出一项要求:既然法官只是国王的代理人,国王自然有权直接裁决诉讼案。
这个故事中非常重要的观点就是“自然理性”不等同于“技艺理性”,而技艺理性是需要长时间的专业练习的。
他们认为“自然理性”加上“分析工具和方法”就能做好数据分析。分析工具、分析方法等技能确实可以速成,但是数据分析的能力不是自然理性能够驾驭的。
想要做一个好的数据分析师,必须拥有数据分析的思维,这是一种“技艺理性”,有一点反人性,必须花大量的时间训练才能掌握。如果你学会了很多数据分析的工具和技巧,依然做不好数据分析。
本文系作者:
三元方差
授权发表,鸟哥笔记平台仅提供信息存储空间服务。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》
如对文章、图片、字体等版权有疑问,请点击
反馈举报
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)