数据分析与数据化运营的关键知识点,全在这里了
导读:本文是《Python数据分析与数据化运营》(第2版)的读书笔记,作者除介绍这本书适合有哪些需求的人阅读之外,还整理了这本书最精华部分的知识点,值得收藏。
本文为华章科技内容合伙人之「鉴书小分队」成员老杨同志在阅读《Python数据分析与数据化运营》(第2版)后原创的读书笔记。
本文结构:
01 总览
02 数据分析
1. 核⼼内容
2. 阅读建议
03 数据化运营
1. 会员数据化运营
1.1 关键指标
1.2 应用场景
1.3 分析模型
2. 商品数据化运营
2.1 关键指标
2.2 应用场景
2.3 分析模型
3. 流量数据化运营
3.1 关键指标
3.2 应用场景
3.3 分析模型
4. 内容数据化运营
4.1 关键指标
4.2 应用场景
4.3 分析模型
⾸先,《Python数据分析与数据化运营》不是⼀本讲解Python语⾔的书。Python只是用于数据分析进而支撑数据化运营的开发⼯具。因此,如果希望学习Python语⾔,这本书不太适合。
其次,这不是⼀本讲解机器学习算法的书。虽然整本书⾥数据分析和数据化运营⼤量的使用到了这些算法,但更多侧重应用层⾯举例,⽽不是算法模型的数学证明。因此,如果希望深⼊研究机器学习算法模型的原理,这本书也不太适合。
再次,这本书完整的讲解了数据分析的整个过程,每个步骤都进⾏了较为细致深⼊的解析,包括常用算法模型的介绍。如果希望较为快速的上⼿数据分析,抛开各种繁琐理论和算法,加快学习效率,这本书⽐较适合。
最后,我认为这本书最精华的部分,是⾮常完整的总结了数据化运营中各个主题下的业务模型,基础知识点、关键指标、应用场景、业务模型等等,⾮常完整。即使抛开Python语⾔,单纯把这部分内容拉出来, 都⾮常适合运营⼈员学习。因此,如果希望学习数据化运营的思维,这本书⾮常适合。
1. 核⼼内容
本书前半部分(1~4章),主要讲数据分析。其中:
第 1 章作为入门章节,主要介绍了Python语⾔和数据化运营的基本知识。较⼤篇幅讲解数据分析常用的三⽅库,最后给了⼀个简单的案例。第 2 章主要讲解数据采集,即通过各种数据源采集数据并进⾏最原始的解析,包含了⼀些特征提取的内容。第 3 章主要讲数据预处理。数据预处理是数据分析中⾮常关键的⼀个步骤,对算法模型拟合的效果影响很⼤。当然,其内容也⾮常丰富,书中分 10 个小节分别讲解了数据清洗、标志转换、数据降维、样本不均衡、数据源冲突、抽样、共线性、相关性分析、数据标准化、数据离散化、⾮结构化数据预处理等内容。第 4 章主要讲算法模型,核⼼内容包括 聚类、回归、分类、时间序列分析等模型。2. 阅读建议
第1章简单看看,有⼀个⼤体的概念。三⽅库不用去记忆,用到时再去翻看附录。第2章快速浏览⼀遍就可以了,内容太细节,没必要看的太仔细。第3章和第4章对于理解数据分析的步骤和思路⽐较重要,需要反复阅读。第3章中的数据清洗、数据降维、数据标准化,是⼏乎所有建模前的必备步骤。第4章集中在聚类、回归、分类、时间序列分析模型的学习,基本可以解决常⻅的绝⼤部分问题。另外,书中的内容相对⽐较简略,还需要再寻找资料深⼊学习(如周志华的⻄⽠书)。基于个⼈理解,梳理的数据分析步骤及内容如下:
本书后半部分(5~8章),主要讲数据化运营业务层⾯的内容,重点在 关键指标、应用场景、分析模型。
从实际⼯作的⻆度来说,数据分析的算法模型相对是较固定的,反⽽是这些业务层⾯的内容,可能更具有实际意义,也更需要经验。尤其是 “会员数据化运营”和“商品数据化运营”两个章节,⼏乎适用所有的商业场景。
所以个⼈认为这部分内容是本书的精华所在,值得反复细读并深⼊理解。因此下⾯把关键指标、应用场景、分析模型完整的记录了下来。
1. 会员数据化运营
1.1 关键指标
会员整体指标:注册会员数、激活会员数、购买会员数。会员营销指标:可营销会员数、营销费用、用券会员/⾦额/订单⽐例、营销收⼊、营销费率、每注 册/订单/会员收⼊、每注册/订单/会员成本。会员活跃度指标:整体会员活跃度、⽇/周/⽉活跃⽤户数。会员价值度指标:会员价值分群、复购率、消费频次、最近⼀次购买时间、最近⼀次购买⾦额。会员终⽣价值指标:会员⽣命周期价值/订单量/平均订单价值、会员⽣命周期转化率、会员⽣命周 期剩余价值。会员异动指标:会员流失率、会员异动⽐。1.2 应用场景
会员营销会员关怀1.3 分析模型
会员细分模型:重点推荐ABC分类法,更利于分清主次、抓住关键。会员活跃度模型:借鉴RFM模型,构建了RFE模型,以评估会员活跃度。会员价值度模型:常用的RFM模型。会员流失预测模型:基于业务⾏为对用户流失的概率估计和分类。会员特征分析模型营销响应预测模型2. 商品数据化运营
2.1 关键指标
销售指标:订单量/商品销售量、订单⾦额/商品销售额、每订单⾦额/客单价/件单价、订单转化率、⽀付转化率、有效订单量/有效订单⾦额/有效商品销售量/有效商品销售额、订单有效率/废单 率、⽑利/⽑利率。促销活动指标:每订单成本/每有效订单成本、每优惠券收益/每积分兑换收益、活动直接收⼊/活动 间接收⼊、活动收⼊贡献、活动拉升⽐例。供应链指标:库存可用天数、库存量、库龄、滞销⾦额、缺货率、残次数量/残次⾦额/残次占⽐、 库存周转天数。2.2 应用场景
销售预测库存分析市场分析促销分析2.3 分析模型
商品价格敏感度模型:辅助销售定价、促销活动折扣⽐例等。新产品市场定位模型:基于相似度算法,实现竞品分析。销售预测模型:通过 时序分析、回归、分类(客户是否购买⾏为的分类) ⽅法预测销售情况。商品关联销售模型:基于关联算法,分析关联商品。异常订单检测商品规划的最优组合:基于线性规划等算法寻找最优解。3. 流量数据化运营
3.1 关键指标
站外营销推⼴指标:曝光量、点击量、点击率、CPM、CPD、CPC、CPA、每UV成本、每访问成本、ROI、每点击/UV/访问/⽬标转化收益。⽹站流量数量指标:到达率、UV、Visit、PV、新访问占⽐、实例数。⽹站流量质量指标:访问深度、停留时间、跳出/跳出率、退出/退出率、产品⻚转化率、加⼊购物⻋转化率、结算转化率、下载转化率、注册转化率、购物⻋内转化率。3.2 应用场景
流量采购:流量预测、效果评估、效果分析、作弊检测。流量分发:内部⼴告、活动引导、⾃然引导、个性化推荐。3.3 分析模型
流量波动检测渠道特征聚类⼴告整合传播模型:⼴告来源路径、⽬标转化归因、⼴告渠道的关联访问。流量预测模型:基于现有流量及⼴告费用等因素预测⼀定条件下可以产⽣多少流量。4. 内容数据化运营
4.1 关键指标
内容质量指标:原创度。SEO类指标:收录数量/⽐例、关键字排名、点击量和点击率。内容互动指标:收藏量、点赞量、评论量、传播量/传播率、⼆次传播率。⽬标转化指标4.2 应用场景
内容采集内容创作内容分发内容管理4.3 分析模型
情感分析模型:基于朴素⻉叶斯、SVM 等分类算法分析内容的情感倾向(正向、中性、负向)。搜索优化模型⽂章关键字模型:通过 词频统计、TF-IDF 模型识别⽂章的关键字。主题模型:提炼出⽂字中隐含主题。垃圾信息监测模型:基于分类算法实现垃圾信息识别。关于作者:老杨同志,资深程序员,重度算法控。
延伸阅读《Python数据分析与数据化运营》(第2版)
推荐语:这是一本将数据分析技术与数据使用场景深度结合的著作,从实战角度讲解了如何利用Python进行数据分析和数据化运营。本书与同类书大的不同在于,并不只有纯粹的关于数据分析技术和工具的讲解,而且还与数据使用场景深度结合,在业务上真正可指导落地。此外,本书作者提供微信、邮箱等,可通过实时和离线两种方式及时为读者在线传道、受业、解惑。
本文系作者:
赵同学
授权发表,鸟哥笔记平台仅提供信息存储空间服务。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》
如对文章、图片、字体等版权有疑问,请点击
反馈举报
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)