很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
主笔 / 脱落酸
文章架构师 / 毛自聪
出品 / 巨头财经
音乐人包小柏用AI技术让去世女儿复活,为母亲献上生日歌;B站up主吴伍六通过AI跟过世奶奶唠嗑;商汤科技年会上,被AI如影复活的汤老师,像往年一样讲了脱口秀。
疾速进化的生成式AI,催生了AI 复活这条过亿赛道;乘着 AI 这股东风,以商汤为首的AI四小龙纷纷赶考多模态大模型。
4月,Meta上线SAM没几天,商汤便推出了“日日新”大模型;5月,云从科技“从容”大模型高调亮相;依图紧随其后,发布了针对特定行业的多模态大模型“天问”,最后的旷视科技则推出了InferLLM,一个用于部署和运行大型语言模型的工具。
看似,这些曾经的资本宠儿凭借数据和行业经验,在多模态大模型领域拥有先发优势。但实际上,面对这一波冲击,他们并没有练就足够脱颖而出的打法。
另外,在ChatGPT掀起变革之前,大多数AI企业已经陷入增长瓶颈期。尤其OpenAI投下Sora这枚重磅炸弹之后,AI圈再次掀起巨浪。
中国承受不起AI的落后,AI四小龙无疑将更加内卷,所有AI企业都需要重新思考自身价值,探索新的商业模式。
曾经的AI四小龙赶上了AI的风口,在计算机视觉CV领域各领风骚。
进入AI2.0时代,当大家逐渐意识到这个赛道不仅烧钱,回报周期还长时,故事就不好讲了。
资本退潮退去,这四家公司无一例外,都在经历从AI技术到应用、再到商业化的困境。
因人脸识别AI技术声名鹊起的商汤科技,七年内融资12轮,市值一度高达3200亿港元。
是高企的研发费用,商业化落地难题,导致了连年亏损的局面,据相关统计,经调整2018年-2023年中,商汤五年亏损净额分别为1.5亿元、11.6亿元、7.1亿元、14.2亿元、47亿元、23.9亿元。
早期在AI领域不像消费互联网容易发生连锁反应,很多中国AI公司转向给企业(B2B)定制服务,而且每个客户的需求都不同,成本往往很高。
商汤上市后蒸发了超900亿港元;同为四小龙的云从科技高开低走,2023年虽同比减亏但形势依然严峻。
财报显示,2020年-2022年,云从科技三年累计亏损高达23.14亿元。到2023年,云从营业收入6.29亿元,同比增长19.43%;亏损6.3亿元,同比减亏约三成。
据公告,是以大模型为代表的人工智能技术,刺激了B 端客户的数智化升级需求,带动了业绩增长。
尽管云从科技强调,不拘泥于短期财务指标的压力,但商业化和盈利压力始终成为掣肘;与之境地相同的,还有旷视科技与依图科技。
前者三年前递表科创板未果,现希望成为AIoT领域的基础设施提供商,降低AI技术的门槛。后者置之死地而后生,如今选择聚焦安防主业,追求更高质量的生存。
依图科技借助大模型开启数智安防新时代;旷视科技坚持算法定义硬件,进军AIoT智能物联网;
云从科技主打人机协同操作系统,讲述智慧物联网平台的故事。商汤科技则围绕“大装置+大模型”频频发力;
这些CV公司,带着“AI-native原生企业”光环,正努力度过转型期的迷茫,而生成式AI和大模型成为了他们新的希望所在。
AI四小龙们都渴望重新站上AI新时代的浪尖。
以依图为例,目前已经推出了针对特定行业的多模态大模型“天问”,它不仅支持海量视频语义搜索,还能实现零样本学习和快速启动。
在城市公共安全领域,比如你想创建一个识别骑车不戴头盔的算法,只需要输入需求,就能立刻生成算法。
再比如,用简单的语言交互,就能快速找到“堵塞消防通道的车”或者“积水的路面”的视频等。
官方介绍,依图早在2019年开始,就专注投入以Transformer为基础的大模型技术。与依图一样,旷视也研究大模型超过四年。
旷视专门成立了一个名叫Foundation Model的小组,这个团队专注于核心模型设计,而不是做工程化内容。
ChatGPT爆火后,旷视科技曾快速回应称,将继续深入大模型研发,并在应用方向上保持专注。
公司不会盲目追求热点,而是会在“AI in Physical”战略指引下走好AIoT软硬一体化之路。
到去年7月,旷视科技都没有推出大模型。不过他们发布了InferLLM工具,用于部署和运行大型语言模型。
相较旷视和依图的长周期布局,商汤和云从推出大模型的时间更早,且声量更猛。
去年4月发布“日日新”大模型体系后,商汤在不到一年时间里就更新升级了好几波。
开头提到的“如影”(SenseAvatar),早在去年7月,就进化到了2.0版本。现在只需5分钟真人视频,就能创建出动作流畅、口型精准、支持多语种的数字人形象。
还有近期被提及最多的面向创作创意场景的文生图秒画大模型SenseMirage,也已经更新到了第四版本。
除此之外,时下全新升级的“日日新”大模型体系之下,还有推理和编程方面的表现甚至超过了GPT-4的SenseChat V4,以及用于办公场景,帮助分析数据的SenseChat-DataAnalysis V4等工具都算是商汤手握的王牌。
值得一提的是,以上大模型都是基于商汤大装置(SenseCore)这个AI基础设施进行训练和优化。所谓的商汤大装置是可理解为,一个AI开发平台,它就像是AI的“电力站”,为各种AI应用提供所需的“电力”。
面对大模型之路如何走这个问题时,商汤给出的答案是,抓最前沿的技术趋势,但为开发者设置最低的使用门槛,打通通向AGI的桥梁。
反观云从研发的大模型更加注重B端行业垂直市场的应用,为特定行业提供定制化的解决方案。
去年5月云从推出“从容”大模型,今年2月1日,云从科技推出AI原生数据分析产品DataGPT。
理想状态下,DataGPT基于云从自主研发的从容多模态大模型,能让数据解析变得如同日常对话一样简单自然。
依托资本市场的原始积累,云从科技正加快大模型研发步伐。不过,高昂的开发和训练成本,尤其是对高性能GPU显卡的大量需求,还是让公司面临巨大的资金压力。
尽管云从科技抛出了定向增资计划,为“行业精灵”大模型研发项目,募集资金不超过36.35亿元。
但上市未满一年便进行如此大规模募资,不但引发了监管机构疑虑,还在一定程度上打击了资本信心。
大模型的出现绝对是新助力,但要说解救不了AI企业的困境恐怕不容易。
首先,大模型及AIGC技术本身就存在商业落地挑战;其次面对企业的多样化需求,AI企业提供的服务大同小异。
最后,与百度、阿里、华为等科技大厂相比,四小龙在自然语言模型技术和稳定的盈利模式方面仍有巨大上升空间。
AI赛道需要强大的资本支撑,这考验着企业的耐心和决心,我们无法预测C端产品大规模上市和应用的时间,但可以肯定的是,AGI(通用人工智能)将是未来的主流技术。
所谓AGI是指,能够跨领域、跨模态学习,与人类和其他AI高效协作,感知和表达复杂情感,具备媲美甚至超越人类能力的智能体。
近期Sora的横空出世,被视为AGI里程碑式的一个节点。
前几月前,我们还在讨论GPT-5都是一个初级的通用人工智能,凯文·凯利还说,现在是黑莓时刻,AI颠覆世界还很早。
如今按周鸿祎的预判,AGI实现将从10年缩短到1年,为什么?
简单理解他的解释,Sora证明了AI在理解和模拟真实世界方面的惊人进步。
附上他的原话:“OpenAI训练这个模型应该会阅读大量视频,大模型加上Diffusion技术需要对这个世界进行进一步了解,学习样本就会以视频和摄像头捕捉到的画面为主。
一旦人工智能接上摄像头,把所有的电影都看一遍,把YouTube上和TikTok的视频都看一遍,对世界的理解将远远超过文字学习。
一幅图胜过千言万语,而视频传递的信息量又远远超过一幅图,这就离AGI真的就不远了,不是10年20年的问题,可能一两年很快就可以实现”。
ChatGPT证明了 AI 是未来方向,而SAM的突破则断崖式缩短了AI企业推出大模型的时间。
面对互联网巨头和传统软硬件厂商在人才、研发、资金和客户方面的全面竞争,AI四小龙的优势可能只剩下他们在实际应用和经验上的积累。
尤其在AI企业间业务高度重叠、竞争同质化的背景下,不仅是四小龙,所有AI公司都需要迅速寻找新的突破口。
还是那句话,无论身处AI1.0时代,还是竞逐AI2.0风口,随着资本热潮的消退,未来只有那些能够找到并深耕差异化优势的公司,才能构建起竞争壁垒,逆转亏损的困境。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)