嘉宾:前51.com副总裁,王武佳
如何做好数据分析,从而提高运营效率,加快产品迭代呢?一个好运营应该需要具备什么样的数据分析能力呢?拥有十年社交经验的武佳老师会告诉你数据分析背后的奥妙。
正文:
该股票研究中心向市场非特定对象群发了1000封邮件,一组告诉他股票会涨,一组告诉他股票会跌,每次发送的时候总有一部分预测到时准的,一部分预测是错的,接下来循环发送几次,总有几个人预测都是正确的,Peter就是其中一个用户。这个案例告诉我们一个道理,在数据分析中,你有时候看到一些数据很稳定的朝一个方向变化,不一定表示代表真相一定就是这样的,而是要看你是否选择性注意到某些东西,而事实真相往往在你选择性注意之外的。
在数据分析中选择样本是很重要的,如果只看到幸存者的样本,那么导出来的数据和结论是有偏差的。
肿瘤和头晕是没有关系的。
问题讨论:
1、Q:数据分析前对数据的准确性有什么好的方法评定嘛?@LH
武佳:确定数据的准确性有两方面:
(1)确定统计指标是怎么定义的,他的采集方式是什么,不同的方式会对数据有不一样的影响(参见视频中邮件案例)
(2)交叉验证:如果有疑虑不要用单一的数据作分析,比如:分析一个产品的数据,pv涨的很高,我们看到这个指标就会下结论,如果我们分析其他的指标,比如uv,如果uv的涨幅和pv不成正比甚至人均pv下降了,那这个数据可能就有问题。
2.Q:老师,我想问下,比如我们是一家同城货运APP的互联网公司,因为现在大部分都是在靠钱补贴的,所以想请问老师有没有什么好的维度去监控刷单行为呢?还有一个难点就是关于留存和活跃的问题 @puple
武佳:有位做O2O的同城货运的朋友,问怎么防止刷单。这其实是很大的一个问题,我们主要从数据分析角度来讲。我觉得要回到你产品和业务的主要场景上来讲,比如这位朋友讲到说可以分析货车司机行走的轨迹。我觉得这是一个很好的视角,是从个体的角度进行分析。我觉得要防刷单,主要从两个方面看:整体宏观指标和微观指标都要进行分形,这样可能更容易做到防止刷单。
宏观指标是指某个区域或城市,如广州、佛山。这个区域,或某一类型的用户,比如司机整体在马路上跑的时间是多少,每单的接单时间、响应市场是多少等。像这样做O2O的,在线下积累一段时间后,会对这些用户的行为模型有整体的把握。再用这个模型去套用不同的用户,这样就很容易在套用过程中,发现刷单的用户了。而具体微观的行为分析,就是像刚这位朋友提到的,分析司机的行驶路径等。总体上,就是要把宏观和微观的分析都结合起来。
这是一个非常好的问题。1个月2个月还是3个月没来的用户算流失,业界没有一个标准答案。我们举一个和工作不相关的案例,如果你不在公司现场上班,如何用数据分析,员工是否流失?一般员工都会打卡上班,如果一个员工连续几天没来上班,最多请假一周。如果一个员工1-3周没来,基本可以判断员工就算流失了。主要看你的使用产品了。
不同产品使用频率是不同的。在企业中,商务人士来说,邮箱使用频率很高;普通用户来说,邮箱用来收发验证码和简历,可能基本3个月-半年登录一次。所以对于低频用户3个月没来,我们就可以定义为流失。所以总结为:
高频使用产品用户短时间没来基本就流失了,低频产品的根据产品来做判断,这是定型分析。
定量分析,取一些样本用户,1个月3个月或不同的时间周期,100个用户回来的可能性有多少。当天100个用户中60%流失,基本可以把3-4天的定义用户的流失周期。
3.Q:数据分析的表格应该是什么样子的?是每天都要录入数据还是一个星期录入一次@米兔
武佳:个人习惯是两种频率:
1.日常周期性的分析,每天第一件事就是看数据报表,对于这类日常分析,我建议每天手动填到表格中,在填表的过程中就是思考的过程,就考虑分析数据的关联性和逻辑,可以产出日报和周报
2.专题分析,目前在分析的项目,就没有固定的频率了。
4.Q:做旅游产品的品类运营,请问怎么判断一个区域的下降是因为市场原因还是产品原因,或者是推广的问题?@大叔控☞控大叔
武佳:数据分析最重要的两种办法是细分和横向的联系,我觉得这两种办法都可以在这个问题中用到。比如横向的联系,可以有两种联系的方法,一种是时间轴的联系,比如业务量的上升或者下降 ,你把这种时间轴拉长,看看有没有什么规律,比如去年同期,月末效应这种东西。还有一个就是横向的跨地域的。
我不清楚你做的旅游产品是什么,可能是景点比如像江南水乡这些,或者是乌镇或者周庄。假如周庄最近的游客人数大幅上升或者门票收入大幅上升,这样其是就可以联系周边同样性质的旅游产品,做一个横向的比较。还有一个细分就是一个数据的分析,在我们刚才的分享中已经找到各种各样的方法,在这里我们就不再重复,那总体来说就这两个方法。
5.Q:做数据分析需要具备有哪些方面的知识@木子李54680
武佳:建议大家看下ptt里推荐的书《统计陷阱》和《决策与判断》,推荐先把《统计陷阱》这本书比较简单,大概一下午可以看完,看完后可以对数据分析有一些思想上的认识你,但是仍然需要对业务的理解和洞察,没有专门的业务知识,离开业务的数据分析都是空谈,这些都蕴含在对业务的洞察之中。
6.Q:如何通过数据分析进行分析用户潜在需求?
武佳:数据分析是可以分析用户需求,但这不是数据的强项。如果要确定用户的潜在需求,我建议还是得做1对1深度访谈。可能焦点小组这种都不一定是最好的办法。还是得去和用户交朋友,去了解他的生活环境,真实的生活场景、使用场景是怎样的。
当你有一天做产品,做运营,闭上眼睛就能想到这个用户现在正在干什么。就像你回想起你的高中同桌,无论你(什么时候)打电话过去,都能猜到他现在正在干什么。能达到这样的境界,我觉得去了解用户的潜在需求就很容易了。
7.Q:数据分析这个本领,更倾向于先天获得还是后天培养?
武佳:我认为肯定是后天的培养,没有谁一开始就有这种本领。本质上和你平常思维方式有很大关系。联系和细分的思考方式不仅在业务中要用,在生活中大量练习也会有收获。
8.Q:当指标完成很好时,如何借住数据判断是指标当初定的太低,还是团队执行过程超乎预期
武佳:用联系的方法来做,要分析竞争对手做的怎样,网站app其他业务怎样是变高还是变低,和历史同期水平相比怎样。
细分的方法对你有帮助,活动的设计是对目标群体的数据有增长还是对所有群体的增长都有影响。
做活动首先数据怎么分析取决于目标的设定,目标要调动那部分用户的需求和行为,完全取决于你的目标。
9.Q:老师你好。我想问下关于你说的对于用户行为,以及用户的对象的使用高频和低频进行分析,这一块怎么去破???怎么去断定这一批用户已经流失还是休眠,还是僵尸呢??
武佳:你应该想问用户到底是流失还是短暂休眠,对于具体个案很难判断,每个人的行为模式差异很大,我们只能分析他回来的概率。这是一个业务经验性的分析,比如一个月左右他会回来,定量分析数据的时候可以假设几个生命周期带进去进行计算。
比如一个用户两个星期没来就流失了、三个星期没来就流失了、四个星期没来就流失了,取一百个样本放进去带入计算,如果你把用户的生命周期定位2周的时候,发现2周后90%用户的用户仍在平台上,4-5个星期90%的用户不来了,我们可以判断一个用户4个星期后再来的可能性就很小了,我们就判断用户的生命周期是4周左右。
10.Q:老师,非常感谢您的课程!请问,在对产品销量做预测时,由于受到比较多的因素影响,比如天气,促销活动等,有没有比较科学的方法,在考虑这些因素的情况下,给每个因素不同的权重,目标期望建立比较实用的模型,来预测近期的销量?希望老师指点
武佳:做活动,首先数据分析取决于,你的目标如何设定。你的目标想调动那个人群的需要?你希望调动订单量、购买率还是转化率,关键取决于你的目标。
不倾向于建立这种复杂的、带各种权重的数据分析模型。可能跟我本身不是做数据分析的,而是做产品出身的(背景有关),我认为在互联网产品中,尤其是迭代频繁的产品中,要建立一个这样复杂的模型去预测是比较难的,因为整个商业产品和环境变化比较大。建议拆开来做分析比较好,不要建立过于庞大的数据模型。
本文系作者:
运营那些事儿
授权发表,鸟哥笔记平台仅提供信息存储空间服务。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》
如对文章、图片、字体等版权有疑问,请点击
反馈举报
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)