APP推广合作
联系“鸟哥笔记小乔”
有多少公司做的是“伪数据分析”?
2021-03-15 10:51:31

大部分的互联网从业者,每天醒来,睁开眼睛,都几乎立即浸泡在压力之中。无论他们过去有多么成功,新的一天开始,新的挑战也随之开始。在这新的一天,我们不仅仅花费金钱,我们同样投入智力和精力,并且花费大量的时间,只是确保我们的互联网生意最终能够收获能让自己欣慰的结果。


数据,几乎是互联网一切产品和营销的出发点,又是二者的归宿。数据,帮助我们洞悉互联网产品和营销的奥秘,甚至助我们在山穷水尽之后又柳暗花明,在“绝地”之后又重获新生。数据,看似唾手可得却又如此变化莫测,看似新鲜可口却又常常味同嚼蜡。我们想要更好的互联网生意,就应该更好的掌握和利用数据。没有捷径,但有窍门。

我想提醒立志于在这个领域大干一场的朋友们,一定要注意在认知上的一些常见的“坑”——那些看起来很华美,但可能有“毒”的东西

一、警惕“伪数据源”

第一个坑,在于我们在意识中并没有真正形成数据从何而来的正确思想。我们可能会认为,数据是唾手可得的,或者只要愿意付出金钱,就能获得数据。而一些黑科技、灰科技、工具和数据平台们,也不断鼓吹:有了我们,数据唾手可得!

但事实并非如此!钱和技术,并不是获取真正有价值数据的充分条件。

许多年后,我也才意识到“无运营,不数据”的真正含义。这并不是说,运营都需要数据(虽然你也可以这么理解),而是反过来,真正有价值的数据,只有通过两手沾满泥、脚踏实地的运营才能真正获得。

想要打通不同消费者平台上的数据(微信、网站、app、小程序、CRM、电商)?没有技术可以帮你直接解决。你只能通过运营手段为实现技术性的打通创造条件——最起码的,你得让更多的消费者愿意注册登录,这不是光靠钱和技术就能解决的。

想要搞清楚细分流量的来源?无论web端还是app端还是小程序端都有成熟的技术解决方案,但问题是,还是需要通过运营人员手工做好标记,交给技术工具才能让技术工具按照你的标记进行数据抓取。这虽然跟技术有关,但是必须靠人动手去做。

想要获得用户细致入微的行为?依靠无埋点或者全埋点的方法?存在风险,手动在每一个真正监测价值的用户交互点上做好事件监测才能获得准确可靠的数据,这又是既需要研究业务需求,还需要耐心仔细才能做好的工作。关于事件监测和埋点,在2.6.4小节会有详细的介绍。

还有,人群画像,机器自动就帮我们画好了?不靠细致的数据埋点(事件监测),不靠费心费力建立起标签,不靠基于业务实际情况而建立的细致规则,是不可能获得一个真正的用户画像的。这样的画像数据其实无法真正对运营起到效果。

这不是在一个工具上用一个漂亮的图生成一个美妙的数据可视化这样性感的工作——虽然很多人认为这就是数据工作的样子。数据工作常常毫不起眼,仅仅只是收集数据获取,就需要大量的时间、专业的精神、以及很多的技巧与智慧。

二、要注意数据和数据是不同的

很多时候,那些看似被你拥有的数据,有可能害惨了你。

数据有真有假,而即使是真实的数据,也是千差万别,即使是你自己所拥有的数据,也是如此。数据之间最主要的差异,是质量的好坏、口径的不同,以及背后业务含义的区别。

要让这些形态性状各异的数据能够真正为你所用,必须经过数据清洗

数据清洗,一个几乎没有什么服务商会主动提及并且愿意收费提供的服务,因为这是一个极为耗费时间、人力,而又充满“风险”的工作。关键是,**背后的口径,以及这些数据背后的业务含义,也不是一个外部的服务商能够短时间内搞清楚的。

曾经经历过的数据清洗项目仍然记忆犹新,仅仅只是清理同一个事物的不同名的重复数据,就得忙上好几天,不是数据本身清洗有多难,而是沟通不同名字背后究竟是怎么一回事就得要了老命;再加上看似同样的指标,可能含义不同,于是又得几乎排查一遍。还有,各种数据记录的随意性和不一致性,各种系统之间同名字段定义的不一致性,你看到之后真的要跺脚骂娘!其工作的复杂、繁琐、无奈,以及“脱发指数”都在各类工作中名列前茅。

于是,我们看到太多太多的数据系统架构和数据整合,是在没有做有效数据清洗的情况下完成的!

这时的数据本身,泥沙俱下,藏污纳垢,可靠性令人发指!这样的系统,不过是表面上把外包装搭好了,而根本不管这包装里面装的是何种洪水猛兽!

这样的数据和系统,质量不佳用不上反而是最好的结果,要是真的拿着这些数据做决策,那比没有数据凭着经验还要糟糕。

在理解数据孤岛这个事情的时候,我意识到,数据孤岛的存在有它的理由。这并不意味着我认为数据孤岛是好的,但若不经过真正可靠的数据清洗,那些看似在各个系统中你拥有的数据,真的把它们弄出来揉在一起后,你就会发现,要么根本用不了,要么根本用不上,甚至还不如过去的数据孤岛好使!

这就是令人心痛的现实。这也是为什么,我总是建议,不要一口吃个大胖子,能够在局部数据和应用上做出改善,已经非常非常不容易了。

因为,少有中国的企业,存在“数据治理(data governance)”一说,只有“痛过之后”,才会幡然顿悟,代价则是又增加了一个耗资巨大的烂尾工程。

本文没有专门介绍数据治理,但我提醒所有的读者,数据治理非常重要,在互联网上有很多数据治理的资料值得阅读。

三、概念并不是最重要的,更要小心伪概念

“伪数据主义者”的另一个特征,是迷恋性感的概念,而忽视朴实无华的规律与实实在在的分析。他们制作了大量充斥着“性感”概念的鸡汤,摆在你面前,然后说,干了这碗汤,一切就都成了!

要真是这么简单就好了!

不像别的科技,数据本身和数据应用的方法,实在没有太多华丽的转身,也不该有太多花俏概念的装点。可因为数据本身透露着神秘,便更容易被添油加醋地包装。

一个很有趣的例子——把核心指标用一个更诗意魔幻的名词“北极星指标”表达,确实增添了很多遐想,似乎就跟着光芒万丈了起来,但仔细一想,它究竟和关键指标或者核心指标有多么巨大的差别呢?

例如,我们可以着迷于“北极星指标”这样的性感称谓,但它究竟应该是什么指标,以及如何发现它,并没有看到任何可以作为规律的方法论——包装一个概念不难,撕开包装切实落地的方法论则很难。显然,一个关键性的指标只能在业务中产生,甚至它并非一个数字世界中的指标。业务是变化的,流动的,因此关键性的指标也在随着业务的变化而改变,这是我们要适应的必然的商业演进逻辑。至少现在,工具都没有办法能够直接揭示更深层次的商业逻辑,尤其是运营角度的逻辑。不,我不是在否定“北极星指标”本身,而是要小心别以为它就是我们运营工作所追求的数据核心。

增长是否要追求如同“黑客”般犀利的效果,我很难评判,其中的思维方式强调不断尝试、流量和产品共同优化,以及更加合理的用户运营方式等,这些是非常可取的。但增长不太可能通过简单的一些灵光乍现的调整即可获得,也不可能像真正的电脑黑客那样纯靠技术完成。我是“老旧保守派”,始终坚持认为,唯有商业模型和产品本身靠谱,以及在实际的运营中两手沾满泥,才能创造实实在在的可维持的增长。而且,随着流量红利的枯竭,产品本身比过去任何时候都更加重要了——或者换句话说,今天留给迷恋性感概念和称谓的空间越来越小,“能打”才是唯一的评判指标。

我想,当“数据主义者”们创造了这么多抬高期望的高大上的东西之后,这些期望万一被拍在地下摔得粉碎,会不会让数据消费者们连同对数据的希望也一起粉碎了,那就真的是得不偿失。

然后,在数据源层面,数据也被用成了更加高大上的皇帝的新衣。

比如,言之凿凿地跟你说:“我们能拿到(或是拥有)BAT[ 从业者们都很熟悉BAT这种说法,代表着百度、阿里和腾讯,但今天,BAT的队伍可能要扩展,也应该加上字节跳动、京东、美团等。不过,具体包含谁不重要,关键是它指代了今天的极为强势的寡头]的数据。”

嗯,能拿到BAT数据不假,但几乎每一个做与BAT相关的投放的广告主都能拿到很多的BAT数据吧,比如自己的广告展现点击呀,阿里的数据银行里面的数据或者各DMP给你生成的营销效果报告之类。

此数据非彼数据,数据的概念和种类太多了,到底拿到的是BAT的具体什么数据?难不成真是淘宝用户device ID[ 这里谈到的device ID是指用户终端设备比如手机的硬件ID,用来标识每一个用户个体。在2.4.1中,会具体介绍它。]和他们的行为和交易数据?

什么,这些数据都能拿到?不过数据是以“包状物”呈现的?多大的包?几亿呀,这么多?!而且可以用于广告投放?还可以拿着阿里的数据到腾讯投放?

这些话语都属于模棱两可的话语,你既可以说它有道理,也可以说它不可能,但当你真的购买这些数据的时候,可能会发现根本就用不上它们。尤其是在今天媒体普遍围墙花园化和个人信息保护日趋严格的情况下。

今天的数据生态跟过去完全不同了,并且用户的数据太有保质期,拥有外部数据和拥有鲜活的数据是两个概念。今天的主旋律是企业一方面向内看,保持自有用户/客户的实时数据的捕获,另一方面则通过应用外部数据或与外部数据连接扩展自己的数据能力。

四、成本问题

无论是对数据,还是对运营,该花的钱要花,节约没有错,但是不能过度。

你不可能用一套SaaS的钱来搞一个私有部署,也不可能用一个标准套件的钱来做定制化开发。所有承诺给你愿意这么做的都是别有用心,毕竟,所有你希望占到的便宜,都在暗中标好了价格,甚至不是价格,而是代价,而且来的总是特别迅速。

并且,也不要妄想让供应商帮你做完所有工作,就算你出了高价钱,你也必须了解,有大量的工作就是需要自己做的。毕竟,数据是你自己的数据,数据背后的业务是你自己的业务,如同我前面所讲的,那些运营上的细节、需求的分析、数据的清洗,没有哪一条是供应商能帮你完成的。不是他们不帮你,是压根在你给定的成本下,他们无论无何都帮不起。更何况,最了解情况的永远都是你自己。

所有想要在前期偷懒省事的,都会在后面给你不断暴雷。

如果成本有限,就从小处开始吧,获得一点进步,实现一些落地,一个混凝土的小楼房绝对比用纸壳建的宫殿靠谱。

五、坚持正确的数据理念

尽管大部分企业都认可数据是最有价值的资产之一,但也请你注意,数据本身并无意义,除非我们能够善用它。何为善用?机械地套用数据和模型,不是善用;鼓吹概念,却故意忽略或矮化那些“不够性感”却真实可靠的工具和方法,不是善用;强调技术和工具才能解决问题,尤其是强调机器智能的强大却忽视人在其中作用的,不是善用;唯数据是瞻,不与业务和场景相结合的解读数据,不是善用。

请大家注意到“数据自身也是有原罪的”,因为数据既不是答案,也不是结果,并且很多时候,也不代表真相。它可以**纵、被捏造、被误读、被曲解、被粉饰,我们怀着美好的意愿跟它打交道,却很有可能得到与我们意愿相反的结果。所以,我们不可以无条件信任它,如同核能的开发,你首先要相信它是“魔鬼”,才能让它转化为“天使”。

数据是我们的工具(而且完全不是唯一的工具)、我们的手段、我们要经历的过程,但绝对不是结果,也绝对不是答案本身。数据不会让事情变得更简单,除非我们能真正懂得如何与之相处,否则甚至比没有数据造成的情况更糟。我们也要警惕数据成为不断堆积的垃圾、纸上谈兵的口号、隐瞒现实的遮羞布。

要警惕一个倾向,即在缺乏真正业务理解和业务场景情形下让数据穿凿附会,还为此建立一系列的指标、工具和模型。举一个例子,任何一个企业在某一个时段所应该采用何种KPI指导自己的业务方向,绝无一个定式,它绝对不是由某一个工具利用某种具备“慧眼”的算法所能做出的,也不是仅仅由数据本身的增长或减少就能判定的,而一定是从业务需求出发,通过对业务和效能之间的对应关系做出不断的拆解才能达成。这个过程,数据不是主角,数据本身也不产生洞察,最终形成的KPI,不是数据推演的结果,而是业务推演的结果。

数据总是倾向于让我们变得更加机械,并压缩我们的眼界,也正因此,我们必须非常小心,而且必须要付出更多的努力,在真正的商业环境和场景中去挖掘数据真正的价值,以契合不断变化的业务。

六、企业数据化成熟度模型

任何企业的数据化营销与运营的背后,都是数据能力在支撑,而数据运营能力,实际上又是由三个层次共同作用、共同驱动的结果。

这三个层分别是:组织层(企业组织与文化角度上的数据能力的构建)、治理层(企业从资源管理和资产管理的角度的数据能力的构建)、应用层(企业从数据实际落地应用的角度对于数据能力的构建)。

这三个层次,组织层最为基础,治理层最为关键,应用层最具价值。



企业数据化能力三层结构

下表是每一个维度及它对应的7个层级的数据能力特征的表现。现在你阅读这个表可能不能完全看懂,里面有不少的专有名词,并且其中的表述可能对你也是陌生的。但没关系,读完这本书之后,你在回过头来看这张表,一定能够理解其中的含义。



企业数据化营销与运营成熟度等级

企业的数据化运营能力的构建是从内部数据的简单整合开始起步的,例如,广告投放的效果衡量需求,必然要求广告端和效果端的数据打通。

在初步整合之后,随之而来的是企业内部数据能力很快遭遇瓶颈。例如,为运营提供关键支持的更深层次的数据需求变得迫切,这些数据需求包括消费者行为的分析、用户画像、转化优化等方面的数据。大多数企业难以单靠自己的力量获取这些数据,而必须嵌入外部的技术解决方案和工具。因此,嵌入外部能力作为层级4,标志着企业开始进入更高层级的数据成熟状态。

在嵌入外部能力获得更多可供驱使的数据的同时,新的需求也将产生:企业需要以消费者(个体或者群体)为维度打通企业的内外数据资源,从而为更细致深入的运营提供支持。企业因此需要进入更高的数据成熟度阶段,即全面的内部整合,以及与外部的数据能力实现协同(层级5、6)。

最终,当企业拥有足够多高质量的结构化数据,以及具备了非结构化数据的处理和应用能力,企业会到达目前最具象征性的智能化阶段(层级7)。

当然,企业的互联网营销数据成熟度模型并不意味着所有企业都要沿着这个“科技树”向上攀登。取决于不同的业态和企业的目标,任何企业都可能停留在自己足以保证业务高效开展的层级上。例如,仅依赖于单一数字渠道或数字触点的市场部门是存在的,他们可能处于这个模型中的层级3或略高于层级3的状态便已经足够“舒适”。同样,受众范围极为广泛的快消品(例如普通饮料)行业,他们中的一些企业如果没有“进取心”而愿意保持在层级2也肯定不会在短期内“拖累”生意。事实上,尽管我们认为DMP和CDP是攀登到这个“科技树”更高位置的标志,但绝对不是所有的企业都有必要采用它。关于DMP和CDP,后面的章节就要为朋友们介绍。

纷析智库所做的调研显示了一个有趣的事实:今天中国的大多数品牌企业(或被称为品牌广告主)正处于层级3和层级4向层级5过渡的阶段。考虑到当前的互联网营销大环境的变化,这样的变迁耐人寻味,它体现了企业们在数字世界中强烈的危机感和求生欲。帮助这些企业更好地像更高的成熟度前进,也是这本书期望实现的一个目标。

本文节选自宋星老师的新书《数据赋能》,有部分删改。

BAT名企都在学的新常态下的企业数字化营销实战指南,讲透数字化营销与运营的本质,真正讲述用数据赋能企业增长。更多干货,还在《数据赋能》全书中展现。

-END-

运营那些事儿
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
运营那些事儿
运营那些事儿
发表文章43455
确认要消耗 0羽毛购买
有多少公司做的是“伪数据分析”?吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接