清华学霸创办的智谱，估值200亿，却被DeepSeek抢-鸟哥笔记

文/Leon

编辑/cc孙聪颖

作为全球AI领域的黑马，DeepSeek成功搅乱了中国AI大模型市场的格局。科技大厂们选择合作，接入其模型疯抢用户；而AI独角兽们则陷入两难境地，上演了“Do Or Die”的抉择。

其中，有着“大模型六小虎”之称的六家AI独角兽公司（智谱AI、百川智能、月之暗面、MiniMax、阶跃星辰及零一万物），纷纷开始转型：

2025年伊始，李开复的零一万物宣布转型，不再追逐超大模型，而是聚焦AI商业化应用；紧接着，消息称百川智能放弃B端金融市场，聚焦AI医疗；月之暗面开始削减Kimi的投流预算，重新规划大模型发展方向；MiniMax的B端业务频繁调整，逐步将重心移向C端。

在此情况下，智谱AI（以下简称智谱）成为今年首个拿到新一轮风投的AI独角兽公司，因此备受关注。2025年3月，智谱开启D轮融资，投资方包括杭州城投、上城资本等，金额超10亿元。

但市场瞬息万变，唯一不变的就是变化。就在智谱刚刚获得新一轮投资时，中国AI市场又出现了新的血液：一个名为Monica的杭州团队，做出了号称“全球首个通用Agent”的 Manus。暂不讨论其是创新还是营销，Manus迅速引爆舆论登上热搜，成功出圈。与此同时，腾讯元宝取代DeepSeek登顶AppStore中国区免费下载榜榜首，则充分说明大厂资源之雄厚，投流不计成本。

在越来越严苛的市场环境下，智谱能否找到新的风口，讲好中国AI故事？

清华团队做大模型，估值200亿

AI企业讲究“基因”，而智谱显然是其中最优秀的尖子生。智谱脱胎于清华大学知识工程研究室，创始人团队成员均是清华学霸，天使轮投资者之一也是清华大学资管。

智谱首席科学家、创始人唐杰，曾任清华大学计算机系教授、系副主任等职务，深耕数据挖掘和机器学习领域，发表了200余篇论文，带领团队成功打造出中国首个且世界规模之最的1.75万亿参数大规模预训练模型WuDao 2.0。

图：智谱首席科学家、创始人唐杰

作为初始核心团队的一员，张鹏更为人熟知，目前担任智谱CEO职务。基本上，产品发布会、参与活动及访谈，都能看到张鹏的身影。张鹏同样是清华大学计算机博士，参与了智谱的主要产品包括GLM系列大模型、AMiner、XLORE等项目的研发工作。

2019年6月，智谱正式成立，主公司是北京智谱华章科技有限公司。张鹏、刘德兵和王绍兰作为合伙人创立宁波慧惠企业管理合伙企业（有限合伙），以10.8995%股份比例作为大股东控股智谱；唐杰则是智谱的最大自然人股东，企查查显示其持股比例7.5077%。

值得一提的是，智谱的股东阵容十分豪华，除了中关村科学城、大兴投资、深圳达晨地方性国企，还包括蚂蚁集团、顺为资本、腾讯投资等互联网资本，以及老牌VC/PE机构红杉中国、高瓴创投等。

据公开资料统计，截至2025年3月3日，智谱已经进行了至少7轮融资，募集资金超150亿元，在C+轮时估值达到了200亿元。最新D轮投资者中，杭州城投、上城资本两大杭州政府投资平台的加入备受关注，毕竟杭州是DeepSeek（深度求索）的大本营。

清华学霸团队、国企背书，智谱无疑是AI独角兽中最具光环的一个。但现实是，它并未像DeepSeek一样出圈。复盘其中的原因，除了营销因素之外，技术路线的不同也是关键。

卷参数、卷工具，却打不过DeepSeek

回顾一下智谱大模型的发展历程，会发现在走传统路线（卷参数）的同时，还伴有部分局部创新，如多模态、多工具调用、算力优化等。张鹏曾在多个公开场合表示，智谱更倾向于大模型，而不是垂直领域的小模型。

2021年9月，智谱团队设计了GLM算法，并推出100亿参数的开源大模型GLM-10B。GLM算法的优势是改进了空白填充预训练，在自然语言理解任务上超越了谷歌制定的BERT 和 T5算法。

随后，智谱对大模型产品进行逐步升级和细分化，包括千亿参数的GLM-130B、ChatGLM对话模型以及多模态模型产品矩阵。2023年8月，智谱清言AI助手上线，代表着智谱正式进入C端市场。

2023年3月，智谱发布千亿参数对话模型ChatGLM即开源版本ChatGLM-6B，该模型的提升除了参数部分，还加入了跨平台硬件支持，除了英伟达显卡，还包括华为昇腾、海光、神威等国产卡，缓解算力紧张的情况。

进入2024年，智谱最强大模型GLM-4发布，张鹏亲自站台，详解了该模型的技术突破。性能方面，GLM-4在基准性能测试中比肩GPT-4，并将重点放在多模态“All Tools”概念，即模型自动选择工具，可实现文图生产、代码解释器、网页浏览等。同年6月，智谱又发布了GLM-4系列的开源模型，包括多种版本。

GLM-4的问世，进一步提升了智谱在资本市场的价值，高瓴、红杉、腾讯、顺为均是此时入场。从这个角度来说，GLM-4是极为成功的。

技术方面，走闭源+开源双路线，从单纯卷参数到提升多模态能力、工具化来降低使用门槛，智谱在大模型领域也是走出了一条属于自己的路。

那么，GLM-4为什么没有DeepSeek火呢？近日，由中科院、北大等多家机构发布的一篇论文，可能说明了一些问题。该论文从两个关键要素去评估和量化蒸馏模型的影响，发现包括智谱在内的许多大模型存在过度蒸馏的情况。

论文中选取了Claude 3.5-Sonnet、豆包Pro-32K、Gemini-Flash-2.0、GLM-4-Plus、Qwen-Max-0919、Deepseek-V3等模型进行测试，其中仅有Claude和豆包的宽松分数和严格分数最低，代表着其受蒸馏影响最小；而GLM-4-Plus、QwenMax和Deepseek-V3是疑似响应数量最多的三个大语言模型，说明它们的蒸馏程度较高。

所谓“蒸馏”，是指一种将知识从通用大型语言模型（LLMs）转移到较小模型的技术，目的是创建效率更高且性能卓越的模型。蒸馏技术在大模型训练领域被广泛应用，通常选择开源模型，所以并不能简单理解成“剽窃”。然而该论文指出，过度蒸馏可能会导致模型同质化，并削弱其处理复杂或新任务的稳定性。该论文发表在Github上，感兴趣的读者可以自行阅读。

当然，蒸馏度并不能完全代表一个大模型是否好用，只是其中的一个参考因素。但对于智谱这样深耕大模型数年的企业来说，如何在DeepSeek R1的压力下拿下更多市场，是迫在眉睫的挑战。

商业化保持高增长，但背腹受敌

对于所有AI公司来说，商业化都是悬在头上的达摩克利斯之剑。相对来说，智谱在早期便敲定了C端、B端的商业化方向，并获得了一定的市场份额和收入，同时保持增长。但面对严苛的市场环境，前景仍不算明朗。

智谱COO张帆曾对媒体表示，智谱清言预计2024年收入超过千万元，智谱MaaS开放平台bigmodel.cn API年收入同比增长超过30倍。“一个企服企业如果要做到几个亿的ARR（年度经常性收入），通常需要将近10年的时间，去年我们花几个月的时间就走完了。”张帆表示。

结合C端、B端市场的数据来拆解一下智谱的收入构成，其2024年整体收入保守估计超过1.4亿元。

据AI监测平台“AI产品榜”数据显示，2025年2月AI应用MAU（月活数）全球TOP3分别为ChatGPT、豆包和Nova，DeepSeek紧随其后，月活数约为6181万。智谱清言排名第41位，约为792万，其收入主要来自高级会员订阅。

今年2月，智谱官宣与三星合作，Galaxy S25国行版集成Agentic GLM大模型，智谱清言及清言智能体平台也同步登陆。不过，三星手机在国内市场份额较小，预计年内对月活用户数量的贡献不大。

B端市场的竞争则更加激烈。在这个领域，不仅有“六小虎”等初创公司，百度、阿里、腾讯、字节等巨头同样在争夺该市场。

据IDC调研报告称，中国AI大模型B端目前可以分为解决方案和模型及服务（Maas）两大市场，区别在于前者提供模型框架、大模型、模型训练和调优等服务，支持企业构建和训练自己的大模型；后者是提供以云服务模式交付的全流程AI大模型生命周期工具链以及AI大模型服务，通过API访问、模型中枢或会话接口来提供服务，不包含单独销售的云基础资源层（IaaS）和算力的收入。智谱方面，两大领域均有涉足。

数据显示，2024年上半年，在两大市场中百度均占主导位置，这与其提前十年布局AI市场有关。AI大模型解决方案市场，智谱以约8.8%市场份额拿下第四名；MaaS市场则是大厂的天下，仅有商汤科技挤进前五（“AI四小龙”之首，已于2021年末登陆港股），其他AI独角兽市场份额相对较小。

另据《中国大模型中标项目监测报告(2024)》（来源：智能超参数）显示，2024年中国通用大模型厂商中标前六名分别为：科大讯飞、百度、智谱、火山引擎（字节）、阿里云和腾讯云。其中，智谱中标的数量为32个，披露金额约为1.29175亿元。

据报道称，智谱在B端市场的拓展是非常积极的，也是AI初创企业中最早有收入的公司之一，陈雪松是关键人物之一。这位智谱重金挖来的阿里云原副总裁，曾担任AI公司旷世的高级副总裁、城市业务事业部总经理，主要负责AI安防业务。由于其职业生涯包括国企，现在负责数字政府方面的相关业务，可谓如鱼得水。

图：智谱副总裁陈雪松

另外，智谱在2023年便推出了与华为合作的“智谱-昇腾 AI一体机”系列产品，对于更注重数据安全的国企来说，昇腾芯片显然是比英伟达更好的选择。不过，智谱方面未透露相关产品的具体销售额。

综合以上，智谱在2025年面对的挑战是来自多方面的。一是大厂，譬如阿里，近期不仅拿下了与苹果合作的大单，还计划在未来三年内投资至少3800亿元用于建设云计算和AI基础设施，无疑也是瞄准了增长迅猛的MaaS市场。

其次，是DeepSeek为代表的AI新贵。目前，DeepSeek已经涉足政企云端接入、本地部署等业务，第三方硬件企业还在大力推广一体机产品，均与智谱业务重叠。据悉，在相关招标文档中明确提出：“支持市面上主流的信创操作系统和中间件，能和DeepSeek对接，提升智能化水平。”

张鹏想要寻找 “共性需求”

在众多的采访中，张鹏提到了两个重点，分别从技术和市场角度明确了智谱的未来发展方向。当然，这是在DeepSeek出现之前。

技术方面，张鹏表示“不做中国的ChatGPT”，这个观点无疑是具有前瞻性的。张鹏认为，GPT的预训练模式是一项革命性技术，但也并非万能，不一定是AGI的终结方案。“从最早开始我们就定了做通用大模型，我们认为只有一定规模的大模型，才能够实现类人的认知能力的涌现；其次我们希望拥有解决多场景、多任务甚至跨模态的技术。”张鹏说道。

不过，这种认知似乎随着时间推移而发生了变化。在去年8月的采访中，张鹏曾表示：“我对小模型的思考在于，它可能是在应对一些特定问题、特定场景时更有性价比的模型。现在的问题不是模型天花板足够高，而是成本高到大家受不了。”

同时，在被问到对于智谱在C端和B端市场成果是否满意时，张鹏坦言：“取得了一些成绩，但要说完全满意还谈不上。”他对智谱在市场方面的期许，是“找到用户的所谓共性需求，挖掘痛点，用技术去解决，再找到最好的性价比”。

据接近智谱的人士透露，智谱内部从技术层面上颇为认可DeepSeek R1的技术方向，即深度思考，内部已经开始训练下一代模型。

从最新融资来看，智谱作为“国家队”的含金量并未降低；DeepSeek对AI算力模式的颠覆，已经开始影响投资人对“六小龙”的未来评估。有行业人士表示，如果没有DeepSeek，智谱目前IPO的估值也许有望达到四五百亿甚至更高。

本文系作者：华尔街科技眼授权发表，鸟哥笔记平台仅提供信息存储空间服务。

本文为作者独立观点，不代表鸟哥笔记立场，未经允许不得转载。

《鸟哥笔记版权及免责申明》如对文章、图片、字体等版权有疑问，请点击反馈举报

关键词

科技与文化