很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
有同学问:陈老师,每次被面试都被问“你使用过哪些数据分析的方法”。结果都感觉答不上来。到底数据分析有什么方法?为啥我在做数据分析,却感觉没什么方法?今天系统解答一下。
首先,并不是名字带“分析”俩字的,就是数据分析方法。有很多XX分析,是统计学、运筹学、数学的专业工具,并不直接指向业务问题的答案。当人们在问:“有什么分析方法”的时候,更多期望听到一个能给出结论的方法。
所以想回答好这个问题,要回到:数据分析到底解决哪些业务问题上去。
从业务用途上看,数据分析可以解决5大类问题
1、是多少(数据描述状况)
2、是什么(树立数据标准)
3、为什么(探索问题原因)
4、会怎样(预测业务走势)
5、又如何(综合判断状况)
围绕每个问题场景,有特定的方法组合(如下图)
用数据描述状况,需要建立完善的数据指标体系。建立数据指标体系,则需要梳理清楚数据指标之间的逻辑。数据指标间有两种基本的逻辑:串行逻辑和并行逻辑,因此衍生出两种基本的分析方法:漏斗分析法&指标拆解法。
拆解的业务多了,人们发现,某些数据指标可以固定的组合使用,比如:
用户运营场景:AARRR指标、RFM指标
零售门店场景:人、货、场指标
商品管理场景:进、销、存指标
这些也习惯性被称为:分析模型。但注意,这些都只是在展示数据。数据+判断标准,才有分析结论。有关判断标准的分析,就是:是什么类问题。
判断标准可以很简单,比如领导的指令、KPI要求、过往同期数据,都能作为标准。这些统称为:简单标准。但很多时候,指标走势是否正常,并无明确的KPI约束,甚至KPI达标,但是走势奇特,领导们还是会觉得有问题。这时候就需要找其他参照物。因此衍生出一系列分析方法。
比如:
与业务自身规律比较,判断好坏:生命周期法、自然周期法
与同类型,同期发展的业务比较:同期群分析法
与其他业务个体进行比较:分层分析法
这样对比,即使只有1个数据指标,也能得出好坏判断。如果业务发展违背过往规律,明显比其他个体更差,则可以判定为:不好。
当然,也可以使用2个指标,比如经典的矩阵分析法,通过两指标交叉+两指标平均值,分出四类业务,从而得出好坏判断。
如果用更多指标也行,比如常用的Kmean聚类,可以先利用多个指标对业务个体聚类,之后再看各类型之间表现优劣。
以上这些方法,都能将业务的好/坏区分出来,从而在一定程度上辅助判断。
“分析下这个问题是什么原因导致的……”是常见的要求,这就是“为什么”问题。解决为什么问题,有两大基本思路:
一:结果推断:问题发生后,用各种数据寻找差异,建立假设。
常见的,比如:
结构分析法:通过结构分析,找到问题发生点
标签分析法:通过打标签,做个体对比,找到问题原因
相关分析法:通过计算指标相关关系,找到相关指标,再形成假设
MECE法:讲多个业务假设,按MECE原则合并成分析逻辑,一一验证
结果推断,可以把业务口中“我觉得这是XX原因”,抽象成一个数据可验证的假设,因此适用范围非常广。但结果推断只是单方面从结果做归纳,有可能有偏颇,还需要实验验证。
二:实验推断:先有假设,然后通过实验/分组对比,验证假设。常见的方法,包括ABtest、DID、PSM、RDD、Uplift等方法。
这些方法更接近传统统计学的实验,大部分都要求:
1、开展数据实验,验证假设
2、设参照组/实验组,且参照组/实验组特征相似
3、区分控制变量、环境变量,重点测控制变量的影响
实验推断有统计学依据,计算过程复杂,看起来更量化一些。但是对实验条件要求太高,比如大促销类ALL in的业务,比如商品、店铺这些无法控制环境的业务场景,比如业务员行为、内容传播等难采集数据的领域,都很难用。
理想的状态,肯定是两者结合,事实-假设-验证,不断循环,接近真相。但现实中有很多条件制约。导致我们只能从一个角度切入,慢慢靠近真相。
预测类问题,是所有人都感兴趣的话题,也是统计学/算法最有可能发挥作用的地方。唯一限制方法使用的,是:到底有多少数据&业务人员要不要参与。
如果业务人员坚持参与预测过程,就只能用业务假设法或者滚动预测法,这些方法把影响结果的参数都列出来,方便业务人员拍脑袋,也能帮他们清晰:我要做多少。
如果业务人员不参与,则视数据量的多少。数据少,则使用时间序列预测,数据多,且有影响结果的原因数据,则可以用诸如回归模型一类算法预测。
综合评估与分配问题,统称“又如何”问题。这是决策的最后一步,决定是否对业务做动作,做多大动作。有些简单的评估是很容易的,比如销售签了生死状,达不成业绩目标就炒鱿鱼。
但大部分情况,评估很复杂,要考虑方方面面。这里最大的区别,在于要不要考虑领导的主观意见。如果要,果断使用主观评分法!满足领导的打分欲是第一位的。如果不要,再考虑使用有监督的机器学习算法,或者因子分析法,DEA法(求的是相对效率)等客观方法。
至于:做多少,谁来做。就是更复杂的问题了。想做好分配,得先把前边几步分析做完,对每个业务线基础能力有充分认识,才好下判断。这里,线性规划的方法,可以用来做支持。
综上可见,数据分析的方法是非常多的。但为什么很多同学感觉自己没用上方法呢?因为每种方法是和业务场景、领导风格、数据质量、息息相关的。
比如因果推断算法大多基于分组测试展开,而实际业务中,很多因果分析是事后再查原因,也不给二次实验的机会。
比如很多公司的分配方案,根本就是领导拍脑袋,一言堂,根本没机会让分析师用算法。
比如预测问题,很多公司根本没有足够数据积累,只有一条销售数据,那撑死了也只能用时间序列法。
这种理想与现实的差距,让很多同学很痛苦。一方面不清楚到底这些方法该如何用,另一方面不了解,自己该如何应对业务需求。面试和工作都很吃力。
为了帮助同学们,我会在知识星球中,分阶段地对这些方法介绍,第一阶段,先选了9种,不需要统计学、运筹学、算法知识的基础方法,整理成《九大数据分析方法》系列,供大家参考。
同时,数据分析方法也要结合业务场景,才好发挥作用。我会在知识星球中,更新《数据分析七大场景系列》第一期《经营分析》场景已经更新,供大家参考。
当然,一两个讲座,不可能穷尽所有的业务场景,如果对具体如何分析问题缺少思路,可以直接在知识星球内向我提问,之前提问的同学,都收获了很多具体详细的回答,配合分析方法一起看,进步更快哦
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)