很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
掘金热时,挖金人无数,卖水的赚了钱。在AI热潮中,戴文渊想让第四范式做那个卖水人。
撰稿:贾 宁
01
想做AI界的甲骨文
第四范式,戴文渊所有的野心就嵌在这个名字里。
范式是科学用语,人类科学研究的发展经历了四个范式,第四种范式是数据科学,即让计算机总结规律的数据密集型科学。第四范式的名称就来源于此。
范式也是计算机专业术语,数据库通过三大范式来优化数据存储方式。在数据库企业解决方案领域,市值1900多亿美元的甲骨文,是一座难以攀越的高山。
第四范式创始人兼CEO戴文渊希望做人工智能时代的甲骨文,为企业及合作伙伴服务产业的公司提供既好用又有壁垒的技术服务。
「大部分人想做服务器,因为壁垒不高,好用归好用,我可以再做一个和你竞争。但是,好用的甲骨文数据库没有人想着再做一个。」戴文渊对新经济100人说。
▲第四范式创始人兼CEO 戴文渊
他意识到,企业服务不仅要产品好用、有价值,还得有技术壁垒。「甲骨文作为传统的企业服务公司,仍然有这样的收入、这样的估值。我认为AI的天花板不会比这个低。」按照他的设想,像甲骨文有个数据库体系一样,第四范式未来将有个AI体系。
这个体系不是「烟囱式」的创新,按垂直行业划分,从头做到尾,提供端到端的解决方案。而是不同要素像积木一样叠加,成为通用的平台。
02
「先知」的进化
第四范式所有产品线围绕一个名为「第四范式先知」(以下简称「先知」)的平台。
「先知」的设计,来源于学习圈理论。学习圈是大卫·库伯总结了前人经验之后提出的经验学习模型,包括具体经验、反思性观察、抽象概念化、主动实践四个环节,体现了学习的完整流程。
▲学习圈理论
以「先知」平台上的反欺诈为例,如何训练机器自动识别一笔交易是正常交易,而不是盗刷信用卡呢?
首先输入很多历史交易数据,这些交易行为会有反馈,盗刷会有电话投诉,没有被投诉的交易可以判断是正常的。这些反馈交给机器学习做反思,反思不是剖开机器大脑做神经元连接,而是运用AutoML技术,把行为数据和反馈数据导入机器,反思出一个模型,自动产生理论总结,知道什么情况是正常交易,什么情况是欺诈。最后,把这个模型做成线上系统。新的交易数据过来,机器就会判断它是否是欺诈。
这就是完整的学习圈过程,其中,反欺诈可以替换成医疗、金融、政府、能源等各行业的应用。
类似纺织业从手工缝制变成了工厂流水线生产,AI的落地演进也会走上社会化分工再提炼的必由之路。
第四范式联合创始人兼产品负责人胡时伟打了个比方,现在一些公司给客户提供AI解决方案,相当于裁缝上门给客户量衣服。在某个行业落地相当于预先做好一些版型,批量生产。
而第四范式想做的,是打造制衣厂生产线,多个版型的衣服都能在这条生产线上生产。
要实现这个目标,第四范式花费了三年时间来摸索路径,让「先知」升级换代。
机器学习的核心是模型具备判断能力,建模技术门槛比较高,一般都由AI专家来做,「先知」1.0就是取代AI专家的建模工具。
在企业落地的时候,第四范式发现只是建模还不够,数据的来源、生成的模型如何上线都需要解决。于是,「先知」2.0向前向后各增加一环节,前接数据进来,后可生成服务。
从「先知」1.0到2.0,从建模工具到全流程开发平台,由于没有对功能抽象提炼,导致后来出现问题:作为一个工具,每个部分都要单独做,项目太多了。
AI在一家企业里的应用,应该是一片森林,而不只是一棵树。那么如何批量植树造林?
到了「先知」3.0,第四范式提出核心系统的概念,把数据和应用之间的关系都连接在这个核心系统上,从获客到营销,从风控到留存,从安全到员工体验,到上下游的供应链等各个环节,全部都用一套系统。
「1.0相当于我们造了一个发动机,结果发现发动机开不了,自己还得手动组装车,2.0相当于我们弄了一个生产车的手工作坊,一辆一辆地造车,3.0相当于弄了一套生产线,可以生产各种不同型号的车,是一个再扩展的过程。」胡时伟对新经济100人说。
「先知」3.0另一个重要改变是,把开发和运行区隔开了。AI企业做企业服务业务,通常派人去客户现场做,大家对于AI外包的业务形态有过不少激烈的争执。
「软件知识产权的开发和运行没有分开,缺少一套方法论和语言去定义,什么叫AI应用。比如手机上的App,下载就可以使用。但是AI现在还做不到下载一个营销应用就可以直接使用。先知3.0就是要定义一种可下载使用的AI应用,实现行业内的复制。」胡时伟说。
同时,第四范式提供开发工具,让合作伙伴在各自行业内开发应用。应用开发出来后,通过相关载体,企业拿去安装即可,不需要派人到每家企业部署实施。
这种方式成为第四范式商业化的重点。
没有甲骨文之前,企业想用数据库,就需要自己开发。甲骨文首先推出了商用SQL(结构化查询语言),后来,大家都做SQL语句,语句最后形成了应用。第四范式认为AI应用的发展,也将类似。
那么,一个AI应用应该是怎样的?
「我们利用学习圈理论,通过数据的采集、标注、机器学习和模型上线四个部分,定义一个AI应用。最早企业做信息化都是外包,没有SAP,没有eHR,这些软件后来才出现。各行各业定义出AI应用后,推而广之,就可以解决现在做AI就是外包的问题。」胡时伟说。
做toB业务,难免会遇到客户提出各种需求。在AI应用早期,客户的理解经常会有偏差,有时候客户提出来的需求需要转化。
第四范式团队经常遇到这种情况:客户说要A,第四范式说你要的是B。客户马上说,对对对,我要的是B。
举例来说,客户对第四范式提过一个需求,能不能把公司数仓数据导入进来,用数仓数据来建模。实际上,数仓数据是为BI设计的,用BI里的数据做AI,基本都惨不忍睹。因为BI是报表数据,是给人看的,AI的数据是给机器看的。
于是,第四范式给客户分析投入产出比,用数仓数据不如直接从生产系统上重新采集数据。从生产线拿过来的原始数据,不需要预处理,最适合机器学习。BI的数据经过复杂的聚合,信息量丢失了,机器反而训练不好。
对企业来说,解决方案的方法论和交互越简单越好。第四范式的工程和算法团队很大一部分精力,是为了减少客户的操作步骤,为了让模型更普适,让应用更广泛。
当前,第四范式产品按照学习圈理论,构建数据、算法和生产三大核心,给企业客户提供包括行为数据、反馈数据、模型训练和模型应用在内的全流程应用。客户点击进去进行简单操作,就可以得到想要的应用服务。
▲第四范式先知界面图
AI能够发挥作用的关键是数据。企业接入「先知」平台之前,如果没有数据积累,往往有一个收集数据的过程。
「我们认为一千万条以上的数据很大概率能达到比人好的效果,一千万条数据意味着机器可以写一千万条规则。人最多可能写几十到几百条,如果机器写的规则数比人写的规则数多几个量级时,就能达到一个比较好的效果。」第四范式首席研究科学家陈雨强说。
按照戴文渊的设想,「先知」平台的发展,将从数据输入变为业务输入。只需要把企业的业务目标告诉机器,机器就可以从企业数据仓库中创造出业务价值。
其产品设计的逻辑在于,内部越做越复杂,对外越来越简单。
03
从竞争走向合作
2015年初,第四范式公司刚成立,戴文渊就想着做银行。周围的人觉得他异想天开,银行不可能和一家刚成立的小公司合作。
戴文渊直接与招商银行营销部的一位负责人沟通,介绍互联网公司的营销方式,他在百度时是如何做营销的。当时,百度采用了机器学习的方式,带来效益8倍的提升。
戴文渊问对方,招行模型如何制定,得到的回答是有专家在写营销规则,两百多条。
戴文渊说,你知道百度有多少条吗?一千亿条。通过机器,我现在能给你做到一千万条。
银行需要在持卡群体里找到有分期需求的客户,通过打电话、发短信或者微信推送的方式进行营销。银行的营销渠道资源容量有限,只能从数千万持卡人中挑出一小部分意愿比较强、有较大分期需求的客户,做出投入产出比更高的选择。
机器学习可以从几千万人里精准找到这类客户,优先拨打他们的电话。同样打十万个电话,有多少客户响应了电话营销,这个响应率或者营销成功率是最终判断机器学习模型是否有效的核心业务指标之一。
后来,第四范式为招行信用卡中心做了五千万条营销规则,上线以后收入提升60%。
有了招商银行作为标杆案例,第四范式陆续拿下了国内几家大型信用卡中心,为它们提供精准营销服务。
之后,第四范式不断扩张业务,从精准营销扩散到反欺诈、定价等银行业务的各个环节,再从银行扩展到能源、政府、医疗、零售等各个行业,如今客户近2000家。
企业服务依赖公司交付团队的规模,第四范式试图通过合作伙伴模式打破限制。
「交付团队的规模决定我们业务成长的速度,我们需要一个生态圈帮助我们更快速、更大范围地落地。靠自身能力扩张市场,边界总是有的,合作伙伴帮我们弥补了自身能力覆盖不到的边界外部分。」 第四范式咨询合伙人柴亦飞说。
选择合作伙伴这种模式,也是为了在各行业快速落地的变通。
对创业公司来说,风卷残云般「洗劫」某个行业,并不现实。原有供应商在行业内盘根错节,拥有自己的一方地盘,对于横插一杠子的新竞争者,他们会制造各种各样的障碍。
所以,第四范式从竞争转向合作。「做商业共赢,让所有公司都觉得跟你合作有饭吃。要帮到别人,不要说比别人强。就算我真的没办法帮到你,那我跟你也是两个不同的东西,咱俩没竞争关系。」戴文渊如此划分阵营。
现在第四范式的不少合作伙伴都曾经与其有过竞争。例如,现在有一合作伙伴,曾跟他们竞争过广发银行的标。广发银行的需求是反欺诈加平台,合作伙伴做的是反欺诈,第四范式是平台,最终第四范式中了标。
后来第四范式拉上对方,形成联**,在第四范式平台上开发反欺诈应用,共同完成之后的大单。
这好比掘金热时候,挖金子的人无数,卖水的商人大赚了一笔。戴文渊想让第四范式做掘金人背后的卖水人。
但是在卖水之前,第四范式也掘金,以此来告诉其他人,掘金是赚钱的。在通过合作伙伴渗透行业之前,第四范式自己也会做行业标杆案例,推动平台在行业落地。
对手依然存在,戴文渊也有自己的竞争思路,那就是拿下行业所有标杆。
「我们在拿下第一个标杆招行以后,第一件事情不是去扩大收入,而是看行业内还有什么其他的标杆,比如工商银行、建设银行、中国银行、民生银行、中信银行等。」戴文渊说。
戴文渊带着黑色框镜,穿着黑色衬衫,透着一股理工科生的气质。他曾是百度最年轻的高级科学家。和新经济100人交流当天,因为嗓子不舒适连喝了三四瓶水。他努力说话,声音不大,有些沙哑。
2005年,还在上海交通大学读书的戴文渊,和两位搭档一起夺取了ACM大学生程序设计竞赛世界冠军。这项赛事由美国计算机协会(ACM)主办,经过四十多年发展,已经成为全球最具影响力的大学生程序设计竞赛。
捧回冠军的戴文渊来不及高兴,他发现,热门的计算机图像学已经被同学选完,人工智能是剩下的为数不多方向之一。他因此结缘香港科技大学计算机系主任杨强——华人界首位AAAI Fellow、唯一执委,IJCAI理事会主席。2015年,戴文渊创业,杨强担任第四范式首席科学家。
在大三参加ACM比赛之前,戴文渊成绩一直不太稳定,每每到了关键比赛就发挥不出应有水平。
后来他调整自己的心态,控制自己的情绪,不去想那些对结果没有帮助的事情,让自己达到最佳状态。
「你经历过最残酷的竞争,你越是想得到,你越得不到。最高水平的竞争,大家差距是非常微小的,胜负只在一念之间。」
他发现,比赛最重要的事情不是把自己发挥到极致,而是把团队发挥到极致。以前他们团队三个人比赛,每个人都把自己那部分做到最好,戴文渊尝试自己做得弱一点为代价,让队友做得更好。结果,团队强大了很多,也如愿收获了世界冠军。
由此,戴文渊学会了变通。如果方向清晰,那就一直往那个方向走,用什么方法都行,不是非要用某个方法才行。
一如第四范式的商业逻辑,无论是自己做,还是经由合作伙伴,只要能够进入到企业客户,哪一条路都行。
世界级竞赛残酷,创业更是。
头图来源:东方IC
延伸阅读
AI天才少年的生意经:拿下70%互金客户,分食万亿新零售。一样的赚钱,不一样的酷
融资近3亿,PK谷歌微软,他利用国内海量数据,用AI杀入传统行业,前方无人,搜图时代已来!
2次抵押房产, 苦熬10年,获巨头超3亿投资, 这群剑桥青年要打造BAT之外的新物种,能成吗?
欢迎扫描下方二维码加入新经济100人
CEO交流群或其他细分交流群!
点击阅读原文订阅创投圈深度好文,最前沿创业干货(每两周一期)
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)