对话360数科费浩峻:用「AI+大数据」讲好增长的故事
引语:360数科的进击之路——从探索者、从业者再到科技赋能者。
“从再造到赋能”这是360数科2022年技术开放日的主题,站在金融科技新的发展阶段下,这一次,360数科更加强调自己是科技赋能者这一角色。
过去很长一段时间,金融科技经历了金融电子化、金融信息化、互联网金融再到金融科技阶段。尤其互联网金融经历了野蛮生长后进入市场调整期,不合规平台淘汰出局,行业重新洗牌。
金融科技飞速发展的这几年,让我们真实地看到了什么是“科技驱动商业”。在金融科技发展的支持下,技术、场景、金融的融合发展也创造了金融服务新的获客模式、风控模式和盈利模式。因此在这一阶段下,金融科技公司必须进一步增强科技服务金融的能力。
彼时,科技+金融的结合方式成为了多数互联网平台的转型新选择。而360数科也经历了从市场的连接者到流程再造者的技术演化历程,从以往的探索者、从业者到如今的科技赋能者,注定是一条艰辛的道路。
那么360数科身份转换背后的意义是什么?站在新的时代背景下,360数科又交出了怎样的答卷呢?
在360数科第二届技术开放日会后,雷峰网与360数科首席算法科学家费浩峻展开了对话。
360数科首席算法科学家费浩峻
360数科结“科技”硬寨,打硬仗
回望金融科技过去十几年的激荡发展历程,从早期“数据大集中”的开展、网上银行的设立到互联网金融浪潮的来袭与消退,再到如今金融与人工智能、区块链、云计算、大数据等为代表的现代信息技术深度融合、迈向智能化。
技术的发展,让传统金融业面临新的机遇。而金融与科技的深度融合,也为金融行业的发展找到更多的发展可能性。
早在席卷整个互联网金融行业的严厉政策监管到来之前,诸多互联网金融巨头已经感受到了仅仅只是收割流量,而不去做深度改变金融行业的操作是一个死胡同。于是,他们早早地便开始了转型,并且试图寻找一种科技与金融行业结合的最佳方式。
以BAT为代表的互联网巨头开始强调自己的科技属性,以更加明确自身的定位——即互联网金融不再仅仅只是一个获取用户的手段,而是能够给传统金融行业带来真实改变的东西。
打赢这场硬仗不容易,360数科苦炼内功,强化营销、运营、风控三大核心技术能力。面对来自互联网大厂的压力,360数科也只有结硬寨,才能打硬仗。
费浩峻告诉雷峰网:“只有拥有基础的科技能力,才能让科技与金融更好的融合,创造产出更多新产品,比如智能风控、智能获客、智能客服以及网络安全等。”
对于从业者到赋能者身份转换的意义,360数科CTO王继平也在会上表示:“如果我们只作为从业者,在这个行业里我们就只是1,而如果我们成为行业的赋能者,我们就能从1到100,让技术释放出更大的能量。唯有以技术重构价值链,把自身技术能力逐步开放,赋能给全行业,方能打破增长瓶颈,迎来发展第二曲线。”
以“AI+大数据”搭桥
“科技怎么更好的赋能金融行业,这是社会给我们的问题,也是360数科的使命。”费浩峻如是说。
伴随新一轮科技革命和产业变革的不断深入,对于传统金融行业而言,数字化转型是企业实现长期、可持续发展的必经之路。但谋求线上化转型的同时,犹如硬币的两面,一面是商业线上化发展的必然趋势,另一面则是数字化转型过程面临的种种困难。如何找到“流量密码”并真正服务于金融业务发展,成为了一道必答题。
例如,获客方面,由于线下渠道受限,有效场景缺失,传统线下获客困难,金融企业亟需寻找更加智能、便捷的营销增长入口。
雷峰网了解到,截至目前360数科注册用户已超过1.9亿、撮合交易量突破万亿大关,获客方面已经取得了行业第一的投放规模。
360数科取得如此亮眼成绩的背后,到底是什么在支撑?
在费浩峻看来,大数据和AI是这个时代下促动整个行业进步的源动力。确实,科技可以更好的为金融等行业服务已经是所有人的共识。
360数科这些喜人数据的背后,是其基于大数据和AI打造出的第二代增长引擎Glaucus超级大脑。
目前,Glaucus引擎已经接入了中国95%的全网流量,不管是主流媒体平台还是手机厂商都已经进行了深度合作。
费浩峻表示:“Glaucus引擎可以说是业内第一的增长引擎,不仅在金融行业,在整个科技行业,从接入的流量、并发量、以及处理数据的复杂度、转换效果都能拔得头筹。”这不仅得益于公司的整体支持,同时在团队方面,其成员也都是来自一线大厂的人才。
Glaucus超级大脑,每天能进行270亿次的运算,能在2ms内快速判断流量价值、流量的竞争力以及流量最适配的创意,并将出价系数和创意ID返回媒体, 峰值可达到每秒钟处理41w次请求。
具象一点理解,每天处理270亿次请求,是什么概念?全球60多亿人,每人每天可能有四次服务的机会;而2ms是引擎每处理一次请求的时间,类比一下,人的神经元大概的反应时间是100ms,而Glaucus引擎反应的时间大概是它的50倍。每秒钟最大处理41w次请求,如果换成分钟,那就是2400万次,相当于一分钟的时间可以把全北京的人服务一遍。
再用两个数字来看,“一小时”“一天”能做什么呢?Glaucus实时模型每小时自迭代一次,用户是否参与竞争流量?是否有竞得流量?转换如何?所有的用户行为形成一套模型实时反馈到业务层;同时,离线模型的迭代周期也控制在一天,因为用户长期的行为反馈是离线的,这都是因为Glaucus有超强的自学习迭代能力。另外,Glaucus引擎还有自动化投放管理能力,可以根据市场和账户的变化,对账户出价进行自动化微调,对账户计划进行自动扶持和关停。
在流量竞争日益激烈的环境下,360数科逆流而上。自5月以来,Glaucus已帮助360数科在整个信息流的核心用户获取能力上提升了40%,优质客群也较年初提升了20%,获客效率优化了30%。
费浩峻告诉雷峰网:“获客的本质还是服务,360数科就是把真实而正确的产品价值传递给不一样的用户。”
在客户与金融机构之间,360数科扮演着搭“桥”的角色,用数字化的方式让银行实现增长的同时,帮助个人及小微企业更好的贷款,助推实体产业的增长。而银行也愿意把互联网营销获客的事情交给更专业的第三方,从而帮它触及到更多他原本触及不到的潜在客户。
只有让钱流动起来,才能盘活更多的市场,带动金融行业的增长。
“虽然学界有很多很难很厉害的算法,但是我很早给自己的定位,就是架起学界和工业界的桥梁,把好的算法应用到工业界。”费浩峻作为一个在算法和增长领域研究多年的工程师、架构师,他希望作为科技行业从业者的一份子,能够切切实实帮助和影响到人。而这与360数科的使命不谋而合——大时代下的小使命——用科技赋能金融行业。
以“运营和服务”为马
据费浩峻介绍,他是2021年5月正式加入360数科,目前主要负责三个团队:数据生态团队、数据挖掘团队以及业务模型团队,主要职责是横向支撑公司内部的业务场景,其中对业务支撑最重的工作主要是增长还有客户经营。
在增长方面,上文提到Glaucus在增长行业打出了一个特别漂亮的仗,整个过程仅仅用了一年的时间。
一年的时间,360数科不仅于营销增长上取得较大突破,在精细化运营方面和AI基础能力建设上,也做了很多建设性的内容。
第一,大模型计算能力。大模型被认为是AI未来的核心发展方向,也是各个行业及企业必争之地。目前,数科的计算有17亿的顶点,200亿条边,另外自主研发的CAST的算法较业内最流行的算法在各个共有的数据集的评估上都要高3%的绝对点。这套算法也支撑了Glaucus底层的运算和处理。
第二,视觉上OCR系统。360数科在ICDAR 2019 SROIE国际大赛OCR单项任务中,拔得头筹。ICDAR(国际文档分析与识别大会)有着“OCR奥斯卡”之称,360数科在竞赛中提出了一种基于RARE改进的新文本识别算法,并与优化后的CRNN模型进行了模型融合,还利用大规模公开数据集用于预训练模型,同时应用已训练完成的自然语言模型,纠正文本识别中的错误。目前360数科已经覆盖了500多个金融场景,在一些业务场景中字段精度均高达95%以上。
第三,知识图谱。知识图谱是大多数企业做决策的神经中枢,数科自主研发的金融知识图谱,融合了其重点服务的五个行业,1900多万家企业,进行精细化的风险管控和经营。
费浩峻表示:“经营就是让用户留下来,因此只有服务好用户才会让用户留下来。360数科的第一个优势就是比别人服务好,第二是因人而异做定制化服务,做到千人千面模型。”
目前通过精细化运营的实践和能力建设,360数科的用户标签达到30个大类1000+的数量,支持秒级的实时策略,海量并发支持千万级别的用户互动。精细化运营实现了显著的降本增效,30分钟之内可以完成从策略创建到用户互动的全流程,过去一年里,公司运营人效提升6倍,放款额提升20%。
在智能营销以及精细化经营方面,360数科确实花了很大的力气。费浩峻坦言,这一过程不容易,但是太容易的东西反而没有太多技术门槛,作为数科领域的头部公司,担当还是要有的,不能因为难就不去做,去不断探索行业的新模式,不断突破,才能真正帮助人,赋能不仅仅是一句口号。
中小企业融资难、融资贵,到现在为止还是一个比较突出的问题。对于小微企业,360数科也做了相应助力,在金融知识图谱中,这些中小微企业的信息,包括了上下游、行业规模、盈利性所在的城市,通过这些信息360数科对每个小微企业做定制化的风控产品和经营模式,例如提供招投标信息、供应链信息、亦或是一笔资金,小微企业更需要能长久陪伴其成长的服务。360数科真正做到了精细化的运营服务。
目前,360数科在金融和增长行业,逐渐成为了“领头羊”。但是其还在不断探索新的技术以及服务模式,为行业更好的赋能。
费浩峻的“攻守之道”
费浩峻认为,不断探索科技的上限,用科技服务行业是“攻之道”,那么作为一个科技从业者,更应该懂“守之道”,科技是应该要守住一些底线的。
从进入这个行业开始,费浩峻就梦想能够用科技改变行业,真正走到这个位置上,发现一举一动都能影响很多人,同时也发现这个行业也充斥着很多不好的东西,所以作为科技人,更多应该想想怎么样守住底线?
费浩峻认为三个守是:守住产品底线、数据底线还有科技伦理底线。
第一,产品底线。产品的底线就应该是服务和赋能。而360数科的所有AI系统都会服务于和用户交互的每一个阶段,在每一个阶段都会有视频和语音的质检,保证其传递服务的真实性。
第二,数据底线。大数据时代的到来,让越来越多用户的数据被盗卖,用户的利益受到了极大的损失。360数科的数据底线,就是保护用户的每一个数据,这是红线。在360数科内部,从数据进入公司之后,会进行数据的加密、脱敏,再进行存储,数据流动的整个过程都是可被追踪和审计的,内部员工也根本看不见数据;同时,利用隐私安全计算引擎,数据也可以被提取到外部使用,目前该平台已经实现了百万级的样本高效联合建模。
第三,科技伦理底线。科技是把双刃剑,只有坚守伦理的底线才能不让科技这把剑砍偏。一些黑灰产通过图像篡改技术,让不合规的创意通过媒体审核,而有底线的科技公司使用OCR技术是做差异化定制化的服务。因此,360数科内部已经形成了一个层层审核的机制,保障用户利益。
那么360数科是如何保证每项技术都可以用在正确的地方呢?
据介绍,首先,所有的技术都会通过一套严格的评审机制,让技术委员会评审;其次,ESG评审机制会穿插在技术启动以及业务开展的每一个环节;再次,公司进行正确的价值引导,让正确的伦理价值观深入到每个数科人骨子里。
正如费浩峻所说,“AI没有原罪,有罪的是使用的人。”
作为脱胎于大安全的360数科,深知只有在安全的基础上用好数据,才能真正发挥数据的价值,从而推动金融行业的发展。
本文系作者:
小庄
授权发表,鸟哥笔记平台仅提供信息存储空间服务。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》
如对文章、图片、字体等版权有疑问,请点击
反馈举报
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)