很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
文/Leon
编辑/cc孙聪颖
作为全球AI领域的黑马,DeepSeek成功搅乱了中国AI大模型市场的格局。科技大厂们选择合作,接入其模型疯抢用户;而AI独角兽们则陷入两难境地,上演了“Do Or Die”的抉择。
其中,有着“大模型六小虎”之称的六家AI独角兽公司(智谱AI、百川智能、月之暗面、MiniMax、阶跃星辰及零一万物),纷纷开始转型:
2025年伊始,李开复的零一万物宣布转型,不再追逐超大模型,而是聚焦AI商业化应用;紧接着,消息称百川智能放弃B端金融市场,聚焦AI医疗;月之暗面开始削减Kimi的投流预算,重新规划大模型发展方向;MiniMax的B端业务频繁调整,逐步将重心移向C端。
在此情况下,智谱AI(以下简称智谱)成为今年首个拿到新一轮风投的AI独角兽公司,因此备受关注。2025年3月,智谱开启D轮融资,投资方包括杭州城投、上城资本等,金额超10亿元。
但市场瞬息万变,唯一不变的就是变化。就在智谱刚刚获得新一轮投资时,中国AI市场又出现了新的血液:一个名为Monica的杭州团队,做出了号称“全球首个通用Agent”的 Manus。暂不讨论其是创新还是营销,Manus迅速引爆舆论登上热搜,成功出圈。与此同时,腾讯元宝取代DeepSeek登顶AppStore中国区免费下载榜榜首,则充分说明大厂资源之雄厚,投流不计成本。
在越来越严苛的市场环境下,智谱能否找到新的风口,讲好中国AI故事?
AI企业讲究“基因”,而智谱显然是其中最优秀的尖子生。智谱脱胎于清华大学知识工程研究室,创始人团队成员均是清华学霸,天使轮投资者之一也是清华大学资管。
智谱首席科学家、创始人唐杰,曾任清华大学计算机系教授、系副主任等职务,深耕数据挖掘和机器学习领域,发表了200余篇论文,带领团队成功打造出中国首个且世界规模之最的1.75万亿参数大规模预训练模型WuDao 2.0。
作为初始核心团队的一员,张鹏更为人熟知,目前担任智谱CEO职务。基本上,产品发布会、参与活动及访谈,都能看到张鹏的身影。张鹏同样是清华大学计算机博士,参与了智谱的主要产品包括GLM系列大模型、AMiner、XLORE等项目的研发工作。
2019年6月,智谱正式成立,主公司是北京智谱华章科技有限公司。张鹏、刘德兵和王绍兰作为合伙人创立宁波慧惠企业管理合伙企业(有限合伙),以10.8995%股份比例作为大股东控股智谱;唐杰则是智谱的最大自然人股东,企查查显示其持股比例7.5077%。
值得一提的是,智谱的股东阵容十分豪华,除了中关村科学城、大兴投资、深圳达晨地方性国企,还包括蚂蚁集团、顺为资本、腾讯投资等互联网资本,以及老牌VC/PE机构红杉中国、高瓴创投等。
据公开资料统计,截至2025年3月3日,智谱已经进行了至少7轮融资,募集资金超150亿元,在C+轮时估值达到了200亿元。最新D轮投资者中,杭州城投、上城资本两大杭州政府投资平台的加入备受关注,毕竟杭州是DeepSeek(深度求索)的大本营。
清华学霸团队、国企背书,智谱无疑是AI独角兽中最具光环的一个。但现实是,它并未像DeepSeek一样出圈。复盘其中的原因,除了营销因素之外,技术路线的不同也是关键。
回顾一下智谱大模型的发展历程,会发现在走传统路线(卷参数)的同时,还伴有部分局部创新,如多模态、多工具调用、算力优化等。张鹏曾在多个公开场合表示,智谱更倾向于大模型,而不是垂直领域的小模型。
2021年9月,智谱团队设计了GLM算法,并推出100亿参数的开源大模型GLM-10B。GLM算法的优势是改进了空白填充预训练,在自然语言理解任务上超越了谷歌制定的BERT 和 T5算法。
随后,智谱对大模型产品进行逐步升级和细分化,包括千亿参数的GLM-130B、ChatGLM对话模型以及多模态模型产品矩阵。2023年8月,智谱清言AI助手上线,代表着智谱正式进入C端市场。
2023年3月,智谱发布千亿参数对话模型ChatGLM即开源版本ChatGLM-6B,该模型的提升除了参数部分,还加入了跨平台硬件支持,除了英伟达显卡,还包括华为昇腾、海光、神威等国产卡,缓解算力紧张的情况。
进入2024年,智谱最强大模型GLM-4发布,张鹏亲自站台,详解了该模型的技术突破。性能方面,GLM-4在基准性能测试中比肩GPT-4,并将重点放在多模态“All Tools”概念,即模型自动选择工具,可实现文图生产、代码解释器、网页浏览等。同年6月,智谱又发布了GLM-4系列的开源模型,包括多种版本。
GLM-4的问世,进一步提升了智谱在资本市场的价值,高瓴、红杉、腾讯、顺为均是此时入场。从这个角度来说,GLM-4是极为成功的。
技术方面,走闭源+开源双路线,从单纯卷参数到提升多模态能力、工具化来降低使用门槛,智谱在大模型领域也是走出了一条属于自己的路。
那么,GLM-4为什么没有DeepSeek火呢?近日,由中科院、北大等多家机构发布的一篇论文,可能说明了一些问题。该论文从两个关键要素去评估和量化蒸馏模型的影响,发现包括智谱在内的许多大模型存在过度蒸馏的情况。
论文中选取了Claude 3.5-Sonnet、豆包Pro-32K、Gemini-Flash-2.0、GLM-4-Plus、Qwen-Max-0919、Deepseek-V3等模型进行测试,其中仅有Claude和豆包的宽松分数和严格分数最低,代表着其受蒸馏影响最小;而GLM-4-Plus、QwenMax和Deepseek-V3是疑似响应数量最多的三个大语言模型,说明它们的蒸馏程度较高。
所谓“蒸馏”,是指一种将知识从通用大型语言模型(LLMs)转移到较小模型的技术,目的是创建效率更高且性能卓越的模型。蒸馏技术在大模型训练领域被广泛应用,通常选择开源模型,所以并不能简单理解成“剽窃”。然而该论文指出,过度蒸馏可能会导致模型同质化,并削弱其处理复杂或新任务的稳定性。该论文发表在Github上,感兴趣的读者可以自行阅读。
当然,蒸馏度并不能完全代表一个大模型是否好用,只是其中的一个参考因素。但对于智谱这样深耕大模型数年的企业来说,如何在DeepSeek R1的压力下拿下更多市场,是迫在眉睫的挑战。
对于所有AI公司来说,商业化都是悬在头上的达摩克利斯之剑。相对来说,智谱在早期便敲定了C端、B端的商业化方向,并获得了一定的市场份额和收入,同时保持增长。但面对严苛的市场环境,前景仍不算明朗。
智谱COO张帆曾对媒体表示,智谱清言预计2024年收入超过千万元,智谱MaaS开放平台bigmodel.cn API年收入同比增长超过30倍。“一个企服企业如果要做到几个亿的ARR(年度经常性收入),通常需要将近10年的时间,去年我们花几个月的时间就走完了。”张帆表示。
结合C端、B端市场的数据来拆解一下智谱的收入构成,其2024年整体收入保守估计超过1.4亿元。
据AI监测平台“AI产品榜”数据显示,2025年2月AI应用MAU(月活数)全球TOP3分别为ChatGPT、豆包和Nova,DeepSeek紧随其后,月活数约为6181万。智谱清言排名第41位,约为792万,其收入主要来自高级会员订阅。
今年2月,智谱官宣与三星合作,Galaxy S25国行版集成Agentic GLM大模型,智谱清言及清言智能体平台也同步登陆。不过,三星手机在国内市场份额较小,预计年内对月活用户数量的贡献不大。
B端市场的竞争则更加激烈。在这个领域,不仅有“六小虎”等初创公司,百度、阿里、腾讯、字节等巨头同样在争夺该市场。
据IDC调研报告称,中国AI大模型B端目前可以分为解决方案和模型及服务(Maas)两大市场,区别在于前者提供模型框架、大模型、模型训练和调优等服务,支持企业构建和训练自己的大模型;后者是提供以云服务模式交付的全流程AI大模型生命周期工具链以及AI大模型服务,通过API访问、模型中枢或会话接口来提供服务,不包含单独销售的云基础资源层(IaaS)和算力的收入。智谱方面,两大领域均有涉足。
数据显示,2024年上半年,在两大市场中百度均占主导位置,这与其提前十年布局AI市场有关。AI大模型解决方案市场,智谱以约8.8%市场份额拿下第四名;MaaS市场则是大厂的天下,仅有商汤科技挤进前五(“AI四小龙”之首,已于2021年末登陆港股),其他AI独角兽市场份额相对较小。
另据《中国大模型中标项目监测报告(2024)》(来源:智能超参数)显示,2024年中国通用大模型厂商中标前六名分别为:科大讯飞、百度、智谱、火山引擎(字节)、阿里云和腾讯云。其中,智谱中标的数量为32个,披露金额约为1.29175亿元。
据报道称,智谱在B端市场的拓展是非常积极的,也是AI初创企业中最早有收入的公司之一,陈雪松是关键人物之一。这位智谱重金挖来的阿里云原副总裁,曾担任AI公司旷世的高级副总裁、城市业务事业部总经理,主要负责AI安防业务。由于其职业生涯包括国企,现在负责数字政府方面的相关业务,可谓如鱼得水。
另外,智谱在2023年便推出了与华为合作的“智谱-昇腾 AI一体机”系列产品,对于更注重数据安全的国企来说,昇腾芯片显然是比英伟达更好的选择。不过,智谱方面未透露相关产品的具体销售额。
综合以上,智谱在2025年面对的挑战是来自多方面的。一是大厂,譬如阿里,近期不仅拿下了与苹果合作的大单,还计划在未来三年内投资至少3800亿元用于建设云计算和AI基础设施,无疑也是瞄准了增长迅猛的MaaS市场。
其次,是DeepSeek为代表的AI新贵。目前,DeepSeek已经涉足政企云端接入、本地部署等业务,第三方硬件企业还在大力推广一体机产品,均与智谱业务重叠。据悉,在相关招标文档中明确提出:“支持市面上主流的信创操作系统和中间件,能和DeepSeek对接,提升智能化水平。”
在众多的采访中,张鹏提到了两个重点,分别从技术和市场角度明确了智谱的未来发展方向。当然,这是在DeepSeek出现之前。
技术方面,张鹏表示“不做中国的ChatGPT”,这个观点无疑是具有前瞻性的。张鹏认为,GPT的预训练模式是一项革命性技术,但也并非万能,不一定是AGI的终结方案。“从最早开始我们就定了做通用大模型,我们认为只有一定规模的大模型,才能够实现类人的认知能力的涌现;其次我们希望拥有解决多场景、多任务甚至跨模态的技术。”张鹏说道。
不过,这种认知似乎随着时间推移而发生了变化。在去年8月的采访中,张鹏曾表示:“我对小模型的思考在于,它可能是在应对一些特定问题、特定场景时更有性价比的模型。现在的问题不是模型天花板足够高,而是成本高到大家受不了。”
同时,在被问到对于智谱在C端和B端市场成果是否满意时,张鹏坦言:“取得了一些成绩,但要说完全满意还谈不上。”他对智谱在市场方面的期许,是“找到用户的所谓共性需求,挖掘痛点,用技术去解决,再找到最好的性价比”。
据接近智谱的人士透露,智谱内部从技术层面上颇为认可DeepSeek R1的技术方向,即深度思考,内部已经开始训练下一代模型。
从最新融资来看,智谱作为“国家队”的含金量并未降低;DeepSeek对AI算力模式的颠覆,已经开始影响投资人对“六小龙”的未来评估。有行业人士表示,如果没有DeepSeek,智谱目前IPO的估值也许有望达到四五百亿甚至更高。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)