主笔 / 脱落酸

文章架构师 / 毛自聪

出品 / 巨头财经

音乐人包小柏用AI技术让去世女儿复活，为母亲献上生日歌；B站up主吴伍六通过AI跟过世奶奶唠嗑；商汤科技年会上，被AI如影复活的汤老师，像往年一样讲了脱口秀。

疾速进化的生成式AI，催生了AI 复活这条过亿赛道；乘着 AI 这股东风，以商汤为首的AI四小龙纷纷赶考多模态大模型。

4月，Meta上线SAM没几天，商汤便推出了“日日新”大模型；5月，云从科技“从容”大模型高调亮相；依图紧随其后，发布了针对特定行业的多模态大模型“天问”，最后的旷视科技则推出了InferLLM，一个用于部署和运行大型语言模型的工具。

看似，这些曾经的资本宠儿凭借数据和行业经验，在多模态大模型领域拥有先发优势。但实际上，面对这一波冲击，他们并没有练就足够脱颖而出的打法。

另外，在ChatGPT掀起变革之前，大多数AI企业已经陷入增长瓶颈期。尤其OpenAI投下Sora这枚重磅炸弹之后，AI圈再次掀起巨浪。

中国承受不起AI的落后，AI四小龙无疑将更加内卷，所有AI企业都需要重新思考自身价值，探索新的商业模式。

01AI一路高歌，昔日的AI四小龙却各有不顺？

曾经的AI四小龙赶上了AI的风口，在计算机视觉CV领域各领风骚。

进入AI2.0时代，当大家逐渐意识到这个赛道不仅烧钱，回报周期还长时，故事就不好讲了。

资本退潮退去，这四家公司无一例外，都在经历从AI技术到应用、再到商业化的困境。

因人脸识别AI技术声名鹊起的商汤科技，七年内融资12轮，市值一度高达3200亿港元。

是高企的研发费用，商业化落地难题，导致了连年亏损的局面，据相关统计，经调整2018年-2023年中，商汤五年亏损净额分别为1.5亿元、11.6亿元、7.1亿元、14.2亿元、47亿元、23.9亿元。

早期在AI领域不像消费互联网容易发生连锁反应，很多中国AI公司转向给企业（B2B）定制服务，而且每个客户的需求都不同，成本往往很高。

商汤上市后蒸发了超900亿港元；同为四小龙的云从科技高开低走，2023年虽同比减亏但形势依然严峻。

财报显示，2020年-2022年，云从科技三年累计亏损高达23.14亿元。到2023年，云从营业收入6.29亿元，同比增长19.43%；亏损6.3亿元，同比减亏约三成。

据公告，是以大模型为代表的人工智能技术，刺激了B 端客户的数智化升级需求，带动了业绩增长。

尽管云从科技强调，不拘泥于短期财务指标的压力，但商业化和盈利压力始终成为掣肘；与之境地相同的，还有旷视科技与依图科技。

前者三年前递表科创板未果，现希望成为AIoT领域的基础设施提供商，降低AI技术的门槛。后者置之死地而后生，如今选择聚焦安防主业，追求更高质量的生存。

依图科技借助大模型开启数智安防新时代；旷视科技坚持算法定义硬件，进军AIoT智能物联网；

云从科技主打人机协同操作系统，讲述智慧物联网平台的故事。商汤科技则围绕“大装置+大模型”频频发力；

这些CV公司，带着“AI-native原生企业”光环，正努力度过转型期的迷茫，而生成式AI和大模型成为了他们新的希望所在。

02转战大模型，会是AI企业的解药吗？

AI四小龙们都渴望重新站上AI新时代的浪尖。

以依图为例，目前已经推出了针对特定行业的多模态大模型“天问”，它不仅支持海量视频语义搜索，还能实现零样本学习和快速启动。

在城市公共安全领域，比如你想创建一个识别骑车不戴头盔的算法，只需要输入需求，就能立刻生成算法。

再比如，用简单的语言交互，就能快速找到“堵塞消防通道的车”或者“积水的路面”的视频等。

官方介绍，依图早在2019年开始，就专注投入以Transformer为基础的大模型技术。与依图一样，旷视也研究大模型超过四年。

旷视专门成立了一个名叫Foundation Model的小组，这个团队专注于核心模型设计，而不是做工程化内容。

ChatGPT爆火后，旷视科技曾快速回应称，将继续深入大模型研发，并在应用方向上保持专注。

公司不会盲目追求热点，而是会在“AI in Physical”战略指引下走好AIoT软硬一体化之路。

到去年7月，旷视科技都没有推出大模型。不过他们发布了InferLLM工具，用于部署和运行大型语言模型。

相较旷视和依图的长周期布局，商汤和云从推出大模型的时间更早，且声量更猛。

去年4月发布“日日新”大模型体系后，商汤在不到一年时间里就更新升级了好几波。喂，AI四小龙，醒醒！

开头提到的“如影”（SenseAvatar），早在去年7月，就进化到了2.0版本。现在只需5分钟真人视频，就能创建出动作流畅、口型精准、支持多语种的数字人形象。

还有近期被提及最多的面向创作创意场景的文生图秒画大模型SenseMirage，也已经更新到了第四版本。

除此之外，时下全新升级的“日日新”大模型体系之下，还有推理和编程方面的表现甚至超过了GPT-4的SenseChat V4，以及用于办公场景，帮助分析数据的SenseChat-DataAnalysis V4等工具都算是商汤手握的王牌。

值得一提的是，以上大模型都是基于商汤大装置（SenseCore）这个AI基础设施进行训练和优化。所谓的商汤大装置是可理解为，一个AI开发平台，它就像是AI的“电力站”，为各种AI应用提供所需的“电力”。

面对大模型之路如何走这个问题时，商汤给出的答案是，抓最前沿的技术趋势，但为开发者设置最低的使用门槛，打通通向AGI的桥梁。

反观云从研发的大模型更加注重B端行业垂直市场的应用，为特定行业提供定制化的解决方案。

去年5月云从推出“从容”大模型，今年2月1日，云从科技推出AI原生数据分析产品DataGPT。

理想状态下，DataGPT基于云从自主研发的从容多模态大模型，能让数据解析变得如同日常对话一样简单自然。

依托资本市场的原始积累，云从科技正加快大模型研发步伐。不过，高昂的开发和训练成本，尤其是对高性能GPU显卡的大量需求，还是让公司面临巨大的资金压力。

尽管云从科技抛出了定向增资计划，为“行业精灵”大模型研发项目，募集资金不超过36.35亿元。

但上市未满一年便进行如此大规模募资，不但引发了监管机构疑虑，还在一定程度上打击了资本信心。

03我们离下一代主流技术AGI有多远？

大模型的出现绝对是新助力，但要说解救不了AI企业的困境恐怕不容易。

首先，大模型及AIGC技术本身就存在商业落地挑战；其次面对企业的多样化需求，AI企业提供的服务大同小异。

最后，与百度、阿里、华为等科技大厂相比，四小龙在自然语言模型技术和稳定的盈利模式方面仍有巨大上升空间。

AI赛道需要强大的资本支撑，这考验着企业的耐心和决心，我们无法预测C端产品大规模上市和应用的时间，但可以肯定的是，AGI（通用人工智能）将是未来的主流技术。

所谓AGI是指，能够跨领域、跨模态学习，与人类和其他AI高效协作，感知和表达复杂情感，具备媲美甚至超越人类能力的智能体。

近期Sora的横空出世，被视为AGI里程碑式的一个节点。

前几月前，我们还在讨论GPT-5都是一个初级的通用人工智能，凯文·凯利还说，现在是黑莓时刻，AI颠覆世界还很早。

如今按周鸿祎的预判，AGI实现将从10年缩短到1年，为什么？

简单理解他的解释，Sora证明了AI在理解和模拟真实世界方面的惊人进步。

附上他的原话：“OpenAI训练这个模型应该会阅读大量视频，大模型加上Diffusion技术需要对这个世界进行进一步了解，学习样本就会以视频和摄像头捕捉到的画面为主。

一旦人工智能接上摄像头，把所有的电影都看一遍，把YouTube上和TikTok的视频都看一遍，对世界的理解将远远超过文字学习。

一幅图胜过千言万语，而视频传递的信息量又远远超过一幅图，这就离AGI真的就不远了，不是10年20年的问题，可能一两年很快就可以实现”。

04找到差异化优势才能解开亏损魔咒

ChatGPT证明了 AI 是未来方向，而SAM的突破则断崖式缩短了AI企业推出大模型的时间。

面对互联网巨头和传统软硬件厂商在人才、研发、资金和客户方面的全面竞争，AI四小龙的优势可能只剩下他们在实际应用和经验上的积累。

尤其在AI企业间业务高度重叠、竞争同质化的背景下，不仅是四小龙，所有AI公司都需要迅速寻找新的突破口。

还是那句话，无论身处AI1.0时代，还是竞逐AI2.0风口，随着资本热潮的消退，未来只有那些能够找到并深耕差异化优势的公司，才能构建起竞争壁垒，逆转亏损的困境。

本文系作者：巨头财经授权发表，鸟哥笔记平台仅提供信息存储空间服务。

本文为作者独立观点，不代表鸟哥笔记立场，未经允许不得转载。

《鸟哥笔记版权及免责申明》如对文章、图片、字体等版权有疑问，请点击反馈举报

关键词

大模型

互联网