APP推广合作
联系“鸟哥笔记小乔”
收藏 | 如何着手数据指标异常分析?
2023-11-30 10:07:07

来源|小飞象&木木自由

什么是异常分析?异常分析(Anomaly Analysis)是指对不正常的数值(指标)进行分析,尝试找出原因,并给出解决方案。

异常分析,一方面是数据分析师、数据运营、数据产品、数据开发工程师、数仓、数据科学家、数据总监等数据人的一项基本日常工作;另一方面异常分析涉及问题分析、结构分析、对比分析、假设分析等数据分析基本技能,这些都是数据分析能力的基本要求。比如指标的突然上升或者突然下降,也或者是指标的持续上升或者持续下降,只有找到背后真实的原因,才能更好的进行后续动作,或者策略迭代,否则就是盲打,原地打转。

收藏 | 如何着手数据指标异常分析?(附数据异常监控模板及相关资料下载)

异常分析的具体场景,比如:

搜索领域:假设百度的流量突然降低了,是什么原因?

短视频领域:假设抖音的人均活跃时长连续7天下降了,该如何分析?

电商领域:假设京东的9月GMV比8月GMV下降了30%,该怎么分析?

那么,今天将系统的梳理总结一下这类问题的分析框架以及需要考虑的问题,今后在遇到此类问题时,希望能有一个明确的着力点以及分析思维。

01

一般来讲,产品的某些数据指标都会具有固定的波动周期,而且每个周期内数据的变化应该趋于稳定,但在数据监控体系里的日报、周报、月报中某数据指标突然不再符合预期的稳定变化,这就是我们所说的数据出现异常波动。在这种情况下,我们就需要去深挖数据异常产生的原因。

判断异常的关键看和谁进行比较。所以异常分析的要素主要有两个:被比较的数值,比较的数值。这里被比较的数值,常常是实际数值,业内数值、环比指标、同比指标、期望数值、经验指标等等。有时候可能是两个正确(错误)的指标进行比较,寻找差异。 

而做数据异常分析核心就是结合以往经验及各种信息,找出最有可能的原因假设,通过将数据指标的进行拆分,再多维度分析来验证假设,定位问题所在。其过程中可能会在原假设基础上建立新的假设或者是调整原来假设,直到定位原因。

其实,通过我们每一次的异常分析来定位造成数据波动的问题及原因,建立起日常运营工作和数据异常波动之间的关联性,进而就可以从中找到促进数据增长的新的思路和方法,改变数据结果。

02

现在,我们先来明确一下数据指标出现异常:上升或下跌,通常有以下情况:

▶一次性波动:只在某个时间节点发生波动。一次性上升/下跌背后原因的一般都是短期/突发事件,比如系统更新导致数据统计错误,突发的渠道投放冻结等。

▶周期性波动:会周期性发生上升/下跌,比如双十一、周末、春节等季节性因素。一般业务开展都有周期性,比如考勤工具类APP,就是以周为单位循环。工作日和周末就是有明显差异波动。

▶持续性波动:从某时间开始,一直出现上升/下降趋势。而持续性上升/下跌背后原因往往都是深层次的,比如用户需求转移,渠道投放长期暂停,大环境等因素,导致出现持续性的。

以上,这三种情况意味着问题本身不同的严重程度。如果是数据指标下跌的话,周期性下跌一般都不需要做特殊处理;一次性下跌往往来的比较突然,要关注事件持续性;持续性下跌的,特别是不见好转,持续的时间越长问题越严重。需要注意是不能单纯的看日周月报表中趋势图的走势,要结合波动的幅度来看,幅度越大,说明出现的异常问题越值得注意。

03

那么接下来,捋清楚思路,我们以“某APP的日活有所下降”,该如何着手分析呢?

第一步:确认数据以及统计来源的准确性 。在这里强调一下, 数据真实性是根基。

实际上因为数据源出问题,导致的指标异常非常非常多,所以在开始着手分析前,必须首先确认数据的真实性。经常会遇到服务器异常、数据后台统计出现错误、在数据报表上出现异常值。所以,遇到问题第一顺位先确认数据没有错,找数据统计相关的产品和开发确认下数据的真实性。

第二步:了解清楚数据指标(app日活)具体业务情况和异常情况。明确以下问题:

①明确日活究竟下跌了多少?持续的时间是多久?

②相比昨天、上周都分别跌了多少?(同比、环比)

③确认指标波动幅度是不是在合理的范围?

④引起日活下跌的因素有哪些?这些因素分别对日活的影响程度有多大?

⑤与这些因素相关的运营以及产品部门对日活的影响程度有多大?

⑥这些部门是不是会因为产品迭代或者运营策略得到改变影响日活?

⑦确认日活下跌对整体产品业务线的KPI影响程度?

⑧了解日活下跌对产品业务线有哪些影响?

⑨以前日活下跌后,都采取过哪些措施?

清楚了数据指标(APP日活)的具体情况,有了轻重缓急的判断,下一步就可以进行指标的拆解,再缩小怀疑范围,建立分析假设。而建立假设,有助于去伪存真的进行验证,进一步逼近真实原因。

第三步:将数据指标进行拆解。如:日活=新增用户+老用户留存+流失用户回流,二级指标拆解如下

①可拆解新增用户来源渠道:如应用市场,百度搜索等

②可拆解老用户留存渠道:华为、vivo应用商店等

③可拆解新老用户登录平台:安卓、iOS等

④可拆解新老用户用户的地区:天津、北京等

⑤可拆解新老用户使用版本:新老版本

⑥可拆解新老用户活跃时间:节假日、周期性等

⑦可拆解流失用户:自然回流, 回访干预回流等

可分别计算每个维度下不同的活跃用户数。通过这种方法定位到导致哪个区域或者渠道的日活下降的用户群体是谁,以及定位原因有了大致范围。比如定位是新用户问题,我们需要再把新用户日活按渠道进行拆分:新用户=渠道1+渠道2+渠道3+其他渠道;通过渠道拆分,我们会发现是具体哪个渠道效果发生的问题。那么,继续下一步我们要根据实际业务进一步做假设,具体情况具体分析。

第四步:异常范围定位后,要根据业务进一步做假设,实际具体情况具体分析。具体分析可以采用“内部-外部”事件因素考虑。

内部-外部事件在一定时间内同时发生可能很多种,主要关注数据指标的起点、拐点、终点。

数据指标起点:数据指标刚下跌时,发生了什么事件;往往起点事件是问题发生的直接原因。

数据指标拐点:在指标持续下跌过程中,是否某个事件的出现,让问题变得更严重,或者开始转暖。拐点意味着,这是可以通过运营手段改善指标的。

数据指标终点:当某个事件结束后,指标恢复正常。或当开始某个事件后,指标下跌结束。终点事件的两种形态,代表着两种改善指标的方法:等问题自己过去,或者主动出击解决问题

▶内部事件因素分为获取用户(渠道转化率降低、渠道平台的问题等)、满足用户需求(新功能变更等引起某类用户不满)、促活运营手段(签到等提活手段没达成目标、产品自然使用周期低导致上次获得的大量用户短期内不需要再使用等)、内部功能和运营策略调整(产品、运营、技术在数据异常时间点附近做了什么策略调整)。

▶外部事件因素采用PEST分析(宏观经济环境分析),政治(政策影响)、经济(短期内主要是竞争环境,如对竞争对手的活动)、社会(舆论压力、用户生活方式变化、消费心理变化、价值观变化等偏好变化)、技术(创新解决方案的出现、分销渠道变化等)。

我们遵循短期变化找内因,长期异动找外因。在条件允许范围内,再结合自身业务经验确定几个最可能的原因假设,给这些假设排数据验证的优先级,逐一排查,深入分析,比如本次指标下跌是因为新功能不符合预期不给力、渠道投放力度不够、竞品太厉害、版本更新大bug、流失严重等。

还有其他常见因素,如下:

天气异常(可能会导致一次波动)

竞争对手有促销活动(可能会导致一次波动,持续波动)
黑天鹅事件(可能导致持续持续波动,一次波动)
特定人群节假日(可能导致周期波动)

···

第五步:预测未来是否还会下跌?应该采取什么方式避免下跌?与业务沟通反馈分析结论,探讨后续方案的执行。再针对原因解决问题,制定优化策略。最后,我们要预测影响到什么时间。并运营、产品沟通反馈分析结论,探讨后续方案的执行。

04

以上,就是梳理的“数据指标出现异常波动时,该如何着手数据异常分析?”的思路框架,现在总结一下。

第一步:确认数据以及统计来源的准确性

第二步:了解清楚数据指标具体业务情况和异常情况

第三步:将数据指标进行拆解。

第四步:异常范围定位后,要根据业务进一步做假设,实际具体情况具体分析。

第五步:预测未来是否还会下跌?应该采取什么方式避免下跌?与业务沟通反馈分析结论,探讨后续方案的执行。再针对原因解决问题,制定优化策略。

总之,异常分析的本质是因果分析。异常分析先是由结果(异常)找可能的原因,属于归纳法,最后验证可能的原因是由原因推结果,属于演绎法,所以异常分析是归纳法与演绎法的综合应用。异常分析涉及问题分析、结构分析、对比分析、假设分析等数据分析基本技能,这些都是数据分析能力的基本要求。 

在实际业务中,数据异常的影响原因可能是多方面的,有的时候也需要建立统计分析模型来做一些定量分析。可能要花几天的时间去不断排查问题。

就需要我们在平时工作中多留意数据变化,随着对业务的熟悉和数据敏感度的提升,针对数据异常分析我们也会越来越熟练,更快的找到问题所在。

关键词
小飞象木木自由
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
小飞象木木自由
小飞象木木自由
发表文章55
互联网从业6年,公众号木木自由:专注数据分析实战案例经验以及方法论的总结!
确认要消耗 羽毛购买
收藏 | 如何着手数据指标异常分析?吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接