APP推广合作
联系“鸟哥笔记小乔”
中国AI公司可以不走寻常路
2024-07-29 16:57:43

@港股研究社原创

作者丨在辉

大模型落地呼声越来越大,但是以什么方式落地依然有争议。国内如此,国外亦然。不同的思想对应着不同的方法论。

一部分AI企业忙着更新通用大模型打榜,做一些视频生成工具之类的热门产物,巨头多数属于此类。

另一部分则在专注行业大模型或是平台,例如国外的Glean和国内的第四范式,后者最近还发布了AI数字人视频合成平台,着眼于让企业更方便地用上大模型能力。

此外,还有以服务大模型发展为己任的“卖铲子”型公司,比如从数据标注工作发展到AI全流程数据服务和模型搭建的Scale AI——如果转型顺利,它也会成为第二类公司。

这不是单纯的商业模式辩论,“所有行业都值得用AI再做一遍”的共识早已形成,但直到现在,还有很多问题在等待着回答。尤其是背靠中国产业背景的AI公司们,也许可以送上不同的答案。

01、AI大模型的方向划分

很多公司现在都可以说自己是AI行业的,但形成模式≠有长期价值。

目前大多数企业利用AI展业的方式,一定是通用的语言大模型,使用本行业的数据语料训练一下,就已经称得上差异化应用。但这很可能是一种取巧的方法,Zapier(一家基于无代码模式开展业务流程自动化探索的公司,与生成式AI自主工作的智能化特点有较强契合性)联合创始人Mike Knoop认为,扩大语言大模型本质上只能推动“记忆”这种智力形式的发展,和智能是有区别的。它不能理解企业的场景和需求,所以也做不到把AI的价值彻底发挥。

中国AI公司可以不走寻常路

(图源:Zapier官网)

另外,如果我们能将GPU算力投入增加与语言大模型能力提升的曲线进行对比,那么它的收益增量虽然确实存在,但很有可能是存在边际收益递减的。当互联网上已经存在的公开简易数据都被用光了之后,再想依靠做通用语言大模型在AI领域弯道超车,就会变成一种幻想。

这对企业来说更是不利的。企业总是会在追求新技术的过程中如“猴子掰玉米”,譬如一开始想要用新技术解决一个确切的问题,结果变成了一场概念追逐战:大数据出来了就用大数据,计算机视觉火了开始研究CV,到了大模型和生成式AI的时代,AIGC、AGI变成了他们战略报告的关键词。但越往后,最根本的问题反而被忘记了。

解决这个问题,或者说解决企业AI大模型需求问题的方法,其实就握在AI企业手中。

明星风投公司Benchmark的合伙人Sarah Tavel认为,第一波AI用例只是给出了一种API的使用方式,但把人工智能技术限定在帮助单一工具层面并不是合理的结果,最好的发展方向是基于给客户提供完整的产品和服务——面向行业客户具体需求开展大模型创业。

而号称华裔天才少年的Alex Wang,同时也是Scale AI(Scale AI最初以数据标注服务起家,后来在此基础上转变为以AI为主导的全流程数据解决方案服务商,包括帮助客户建立可用大模型,以及托管服务)的联创,他认为,数据才是AI模型性能的瓶颈,而非算法或计算。数据最终来自很多个垂直行业,这意味着AI企业应当深入到行业领域,做符合企业需求的行业大模型。

这个过程有两个需要注意的关键点:

一方面是数据问题,正如Alex Wang的观点,AI公司要有“读懂”用户和行业的能力。因为从根本上来说,经历过数字化时代的公司大多有很多数据语料躺在仓库里,但缺乏辅助情况下,它们无法发挥作用。

另一方面是管理和迭代问题,由于行业、场景千变万化,目前的行业资源不太可能支持一家公司横跨所有领域一个一个建造大模型。如何解决这个问题呢?

第四范式和Zapier联合创始人Mike Knoop都将关键指向了自动化。技术方面,AutoML、程序合成和神经架构搜索都涉及自动化和优化过程,以期减少人工干预,提高效率和效果。Mike Knoop认为AGI的探索需要基于程序合成和神经架构搜索,而第四范式创始人兼CEO戴文渊则在接受“智能涌现”采访时提到,构建无数个行业大模型的底座技术是AutoML——自动机器学习。

中国AI公司可以不走寻常路

(图源:Microsoft Learn)

戴文渊说,AutoML是“一个失败的艺术”,它能发挥更大的价值,是因为第四范式做过太多的场景,懂得怎么让数据和模型的发展,向特定场景的需求贴近。成功的化为成果,失败的变成养料,基于自动化加速扩大迭代。就像Alex Wang说的:“机器学习是一种垃圾输入、垃圾输出的框架。”但如果我们有高质量的行业数据,以及不断纠错的能力,最终就会让行业大模型成为现实,并实现可靠的落地。

这个行业的顶尖思想者们,一定程度上对行业塑造的逻辑保持了对齐。而像第四范式这种根植于中国复杂产业场景的AI公司,所做的延伸还可以更多。

02、做不同的AI模型,想法、途径和前景

以OpenAI为代表的、一部分专注通用大模型的企业,发展趋于横向,大模型就是一切。在商业模式上,它们售卖的就单纯是大模型的能力。相比之下,第四范式、Glean,甚至Palantir这样的利用AI技术帮企业在某些方面做决策以提升整体工作效果的公司,走的是另一条路。它们的商业模式也不一样。

比如Glean,它提供基于AI技术打造的AI企业搜索和知识管理平台,并集成了非常多的第三方应用功能,直达其他的SaaS产品。也就是说,把自己变成了工作流的一部分。同时,Glean也可以帮企业用企业数据训练专属AI模型,而训练的基础是Glean自主打造的“可信知识模型”。这家公司的出发点是,员工往往很难在复杂的工作体系中找到有用的信息,而Glean在传统企业搜索的基础上,利用AI模型和工作流全流程跨应用服务能力,建立了新的优势。

对照Glean来看,第四范式对提升企业核心业务的关注,以及实现AI大模型介入业务的手段,在思想内核上是一致的。这是因为它们的理念就是从行业和企业需求出发的,脱离了单纯的唯技术论、唯参数论、唯语言论。不过,第四范式更深入到行业核心业务问题的预测管理上。

第四范式在今年上半年发布了行业大模型平台先知AIOS 5.0,它继承了此前第四范式对数据治理与智能发展等方面的思考,但更注重帮助企业挖掘行业大模型的潜力。AIOS 5.0核心特点是基于各行各业场景的X模态数据,构建行业基座大模型。

中国AI公司可以不走寻常路

(图源:第四范式官网)

在能力层面,它侧重于Predict the Next “X”,X代表各大行业包罗万象的逻辑和结果。在使用层面,在支持接入企业各类模态数据的基础上,先知AIOS 5提供大模型训练、精调等低门槛建模工具、科学家创新服务体系、北极星策略管理平台、大模型纳管平台、主流算力适配优化等能力,实现端到端的行业大模型的构建、部署、管理服务。在应用层面,考虑到中国的产业和场景复杂度水平极高,实际为行业大模型垂直发展提供了环境。

这其实是中国AI公司基于产业背景发展的一个极佳案例。戴文渊曾说:“我们国内有大量场景和数据优势,当我们覆盖场景足够多,把这些模型拼起来,最后你可能也实现了AGI。”相比之下,现在流行的很多行业大模型,依然还是行业大语言模型,大而不精。划分到更精准的场景后,虽然表面上看起来需要建立很多个大模型,但每个精准场景的数据量负载有限,同时有自动化技术的帮助,反而另辟蹊径实现了AGI在应用层面的发展。

如同Mike Knoop的观点,AGI之所以在狂飙突进后迅速遇到了上行阻碍,是因为我们过度依赖语言大模型,把AGI定义为能完成大多数工作的系统,但AGI实际上应该更侧重高效获取的新的能力,解决各种场景下的开放性问题。

事实上,这也许才是正确的思路。英伟达CEO黄仁勋就在美国加州理工学院第130届毕业典礼讲话中提到,随着大模型发展,计算机从指令驱动转向意图驱动,“将来的应用程序所做的和执行的都会与我们做事的方式相似,组建专家团队,使用工具、推理、计划和执行我们的任务”。这样的逻辑本身就意味着通用性。所以我们也看到,大模型正在进入物理世界,因为物理世界的决策同样有迹可循。

类似的例子,就像过去一年多时间因AI技术估值暴涨两倍多的Palantir。Palantir原本是一家To G的大数据公司,基于数据分析和建模仿真辅助决策,但生成式AI技术令其处理数据的方式发生转变,在自动化与数据决策方面进步甚多,加速了AI To B业务的开拓。第四范式,就是在每个具有确定性的场景中建立行业大模型,助力企业掌握自己的应用,做出有效的决策。

中国AI公司可以不走寻常路

(图源:雪球)

最后,回到关于未来前景的思考上。OpenAI过于注重把通用能力做到极致,因而暂时失去了占据特定领域产品优势的机会。相比之下,那些侧重于发展更自由、更开放的模型的企业,都得到了发展机会。而在商业模式上,以订阅为主导的OpenAI会继续“出售”大模型的能力,更像是工具;而第四范式、Glean、Scale AI、Palantir等公司则是销售技术及其附加组件和服务,更像一个系统。

Scale AI上半年以138亿美元估值融资了10亿美元。成立五年的Glean在 D 轮融资中筹集了2亿美元巨款,估值已高达22亿美元,换算成人民币在160亿元左右。第四范式在港股的估值稳定在224亿港元左右,其成长性应该主要挂钩先知平台的发展和收入。今年一季度,第四范式8.28亿元的总营收中,先知平台占5亿元,比例为60.6%。随着应用场景的增加和收入的增长,它的价值也会得到释放。

最终,AI公司在通往AGI的道路上一定免不了和行业巨头对比。但只要它们能生产出越来越多的能在实际场景中为企业创造价值的产品时,市场自然会为它们赋予不一样的价值。AGI是个巨大的概念,一切探索对未来而言都是有益的。

港股研究社
公众号二维码
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
港股研究社
港股研究社
发表文章172
港股研究社
一个挖掘港股投资机会的专业平台
确认要消耗 羽毛购买
中国AI公司可以不走寻常路吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接