APP推广合作
联系“鸟哥笔记小乔”
数据运营模型(从数据中台到数据生产力,网易数帆构建新模型加速企业数字化转型)
2022-11-08 22:17:38

从数据中台到数据生产力,网易数帆构建新模型加速企业数字化转型

数据运营模型(从数据中台到数据生产力,网易数帆构建新模型加速企业数字化转型)
  随着我国数字经济的发展,近年来,数字化转型业已成为各企业战略发展的关键词。今年1月,国务院印发《“十四五”数字经济发展规划》,明确了“十四五”时期推动数字经济健康发展的指导思想、基本原则、发展目标、重点任务和保障措施。至今,已有中钢集团、国家电网、中国航发、中国医药集团等62家头部央企提出了适合自身企业发展的数字化转型战略方案或路线图,我国的数字化转型将从“初步探索”阶段逐步进入到“应用践行”阶段。

  近日在杭州举行的“网易数字+大会”上,网易副总裁、网易杭州研究院执行院长、网易数帆总经理汪源结合企业数字化转型的发展阶段提出,“早期的数字化转型大多是由点状的应用场景驱动,当转型发展到中期,企业更加关注如何长期地建立数据资产及相应的运营管理机制。”

  在为十余个行业300多家行业头部客户深度服务的基础上,今年网易数帆首次提出以“数据资产”为核心的“数字化转型方法论”。该方法论分别由软件资产生产、软件资产运营、业务应用组装、业务运行支撑组成的软件生产力模型,以数据技术、数据资产、数据应用、数据运营为核心的数据生产力模型和结合AI算法技术、智慧资产、智能应用的智慧生产力模型,三模型围绕企业数字资产的沉淀与运营,打造抓手可循、落地可依的最优路径。

  网易数帆大数据产品线总经理余利华在《人人用数据,时时用数据,释放数据生产力》的主题演讲以及随后的记者问答环节中,针对网易数帆这一最新战略从数据生产力角度划出了重点。

  从数据中台到闭环模型,加速释放数据生产力潜能

  去年数据猿曾对网易数帆余利华进行了深入的访谈,彼时正逢网易数帆发布了有数全链路数据生产力平台2.0,随即推出有数DataOps、逻辑数据湖等重点产品,余利华曾表示,“在数据生产力平台2.0阶段,我们需提高自身技术服务能力,从大数据底座、到数据中台、再到数据应用,每个链路都需要更好的打磨才能服务好客户。”不过他也提到,“我们在与客户交流后发现,企业想要构建一个物理上集中的数据中台非常困难。”

  2021年余利华在网易数帆数字生产力平台发布会上的演讲,来源:网易数帆

  时隔将近一年,我们发现,网易数帆经过与客户进一步的实践探索,在今年已经把“大数据底座、数据中台、数据应用”的三层架构化为了两个相互连接的闭环。该闭环模型由三部分组成,外侧是一个大闭环,包括数据技术、数据资产、数据应用和数据运营,并对智能决策、数据中台、湖仓一体、数据标准、运营平台等数据产品与服务进行了细致的分类;内侧则是一个更具有方法论性质的数据生产力内核,包括DataOps、DataFusion和DataProduct三大方法论。

  网易数帆数据生产力模型,来源:网易数帆

  与其他大厂一样,2016-2018年网易内部也在组建自己的数据中台,渐渐会发现数据中台离业务还有一定距离。而如何让数据体现价值,才是网易数帆认为最需要回答的一个问题。他们从业务中观察到一些现象,比如网易严选的补货供应链,当有补货决策时,把决策发到采购系统,自动生成了采购单,然后点一下“确定”就可以下单,大部分采购由系统直接生成订单,无需修改或定制,直接下单即可;又如网易云音乐的会员运营、爆曲洞察,还有像是多门店的零售行业客户,常常需要运营人员看到数据变化及时做出调整,那么就可以在数据中台上去搭配对应的数据产品。数据产品将直接从中台拿到高质量的数据,把决策发给业务系统,后者产生进一步的运营数据返回数据中台,然后数据中台提取数据形成再进一步的高质量数据,这样就可以推动形成高价值的数据生产力闭环。

  网易数帆发现,在企业实际经营过程之中,数据生产力更接近于一种循环,借数据技术改善研发效率,提炼成为数据资产,并在此基础上生成先进的数据应用产品,自动或手动产生一些决策,通过决策影响到业务系统,进而推动高质量的数据运营,运营后又根据客户反馈继续提升数据技术,这种闭环可能要比层级结构产生更高的效率。

  “数据中台本身有它的好处,相当于对原来数据仓库的升级,数据中台能为整个企业建立数据公共层指标,让数据以服务的形式提供给客户,这是好的思想,”余利华说道,“不过我们也发现,不能为了中台而中台,不去看应用,强行把数据收集起来,并未发挥价值,业务方、客户都有意见,此时的‘中台’没有成果就会失败。”

  而从数据中台过渡到数据生产力的闭环模型,其重要目的就是从各环节加强对数据的使用,充分发挥数据的价值。余利华表示,“未来数据不只是给大老板用的,而是应通过打造面向场景化的数据产品,让人人都可以用起来,每个岗位、每个角色都可以在日常工作中基于数据做出决策,每次有效的决策就会改进企业的竞争力。企业竞争力往往在于此,没有一招鲜,而是在平时业务当中一次次去尝试、去改进、去迭代,我们有这样的循环,也希望用这样的方式去传递给更多企业。”

  因此,今年网易数帆着力推出的数据生产力模型,其核心就是通过数据技术的创新,与客户一起建设数据资产,并且围绕数据资产打造场景化的数据产品,用人才培养,数据运营的手段,实现“人人用数据,时时用数据”,最终以提升企业数据生产力为目标。

  源自中台并超越中台,数据治理将成为数据推向业务的基石

  在网易数帆新的生产力模型中,我们看到,核心部分包含了三个关联耦合的方法论,DataOps、DataFusion、DataProduct,它们含义如下所示:

  数据研发(DataOps):数据全生命周期研发体系数据治理(DataFusion):数据治理2.0数据产品(DataProduct):面向场景化的数据产品来源:网易数帆、DataFun

  其中数据治理(DataFusion)环节起到承上启下的重要作用,当数据开发加工出来,形成数字资产,数据治理则让数据资产变得高质量、安全可控且容易被消费,如此才能在下游的数据应用环节,创造数据的价值。

  DataFusion本身含义恰是“数据融合”,它源自数据中台,又超越数据中台。其采用数据中台的方法论来构建企业指标体系,让企业形成数据公共层,去除烟囱式开发;其超越中台之处则在于通过研发一体化的治理方式,取得数据的长效治理,从而把数据资产沉淀下来,能够在未来更好地被消费。

  来源:网易数帆

  “未来,数据中台这个概念有可能慢慢淡化一些,但在指标设计、建模等方面仍有很强的指导意义,也反映了一些数据领域的需求,能与传统数据治理结合在一起,所以我们把它吸纳到方法论中。”余利华如是说。

  我们知道,传统的数据治理是旁路的系统,上不能深入到开发环节,下不能深入到数据消费环节。数据治理为什么那么难做呢?余利华总结了四大痛点,

  先污染后治理,问题存在于数据开发环节,出厂质量不高,总依赖于事后治理;运动式治理,很多时候治理效果无法衡量和持续反馈,无法形成闭环;治理范围只能治理大数据平台内的数据,不能覆盖平台外更广泛的数据;在数据消费环节,出现了数据资产“找不到,看不懂,信不过”的问题。余利华认为,在闭环方法论下,才能更全面地进行数据治理,总结起来就是“开发治理一体化”,其核心是将治理融入到开发的各个环节中,在开发的过程中就完成数据的治理。

  在网易数帆新的数据治理框架中,将开发环节分为设计、编码、测试、上线等四个阶段,每个阶段都蕴含着数据治理与数据开发,如下图所示,黄色代表治理,蓝色代表开发,连线则代表治理和开发环节的关联,连线越密集,说明开发与治理做得越好。

  来源:网易数帆

  余利华介绍说,上述的每个阶段都有数帆大数据的产品支撑。以数据标准产品为例,数据标准定义了数据取值范围、数据安全方面的特性以及数据的类型,如果数据标准与数据质量相结合,则在早期为表、字段自动生成集合规则,从而在数据测试阶段,就能看到数据质量的报告,在持续运行的阶段,还能收到数据质量的告警;当数据标准与安全中心相结合,我们则可以得到数据的安全等级,能得到加密、脱敏的规则,而且可以影响发布审批的流程,通过产品之间紧密的联系,实现开发治理一体化。

  开发治理一体化重在解决事前的问题,在事后已有的数据,网易数帆也考虑了相关的解决策略。“我们通过大数据健康度评估体系,从五个维度对已有数据的健康度进行打分,并给出为什么扣分的原因,帮助该数据的相关团队进行优化。我们也在运营方面形成自我改进的反馈机制,如通过数据治理大赛交流学习,优秀成果在公司层面进行推广等一些方法。” 余利华如是说道。

  来源:网易数帆、DataFun

  流式湖仓实现底层存储的统一,

  为数据生产力提供坚实的底座

  当用户同时具有数据仓库与数据湖时,流式湖仓服务则是另一种解决方案。为什么要强调流式湖仓?余利华表示,大多数湖仓一体不强调流批一体的概念,只是说数据仓库和数据湖可以结合在一起,提供查询的能力,但并没有流批一体的能力,这就导致了一个问题,由于底层的存储无法统一,同样一份数据,数据团队往往要向数据消费者提供两张表,一张表是T+1离线数据,另一张表是实时数据。

  “网易数帆的流式湖仓希望能把底层存储统一起来,用一张表既能支持实时查询,又能支持高效查询,这样的表不仅能批量获取所有的离线内容,还能实时获得更新的数据,因此我们认为流式湖仓是更为理想的状态,我们更强调引入流批一体,最终实现存储的统一。”

  我们知道,如今在湖仓一体领域,Delta Lake、Iceberg、Hudi解决方案三足鼎立,业内尚未形成统一的标准。余利华表示,“无论是Delta Lake表格式、Iceberg表格式,还是别的表格式,我们希望全部建立在一个数据中台上,用户能够根据自身需要选择不同的表格式,他们可以这张表用Delta Lake,那张表用Iceberg,做到完全的自主选择。”

  今年8月,网易数帆与华泰证券共同发布了开源的Arctic项目,即建立在开源的表格式之上,向 Flink、Spark、Trino 等主流计算引擎提供流批统一、开箱即用的元数据服务,并融入实时的能力,流计算延迟可达毫秒级,使网易数帆大数据体系在存储层面实现完全统一,企业数据生产力的发挥将不再被孤岛所困扰。

  来源:网易数帆

  余利华在演讲的最后表示,最近他们正撰写《从数据中台到数据生产力》一书,主要是记录下团队在大数据产品与技术成长过程中的思考,而其书名恰能反映出他们近一年来在探索实践后的独立思考总结。可以说,余利华的团队是网易近六年来打造企业数字化转型服务团队的缩影,从产品技术支持走向服务深化,旨在助力企业数据生产力的重塑。

  正如汪源在今年网易“数字+大会”总结发言时强调,“我们希望通过聚合网易数帆在基础软件领域的全线能力,充分激活企业软件生产力、数据生产力与智慧生产力,沉淀出更加易管理、易使用、高价值、高质量的数字资产,与有形资产共同形成相互促进的增长闭环,为企业构筑坚实的技术护城河。”

  文:陆易斯 / 数据猿
小张
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
小张
小张
发表文章1102
确认要消耗 羽毛购买
数据运营模型(从数据中台到数据生产力,网易数帆构建新模型加速企业数字化转型)吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接