很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
文/Leon
编辑/cc孙聪颖
DeepSeek的持续火爆,被广泛认为是中国AI大模型的“弯道超车”,其最大的意义是打破了物理算力至上的逻辑,用更低的成本训练出高性能AI大模型,对行业领头羊OpenAI产生巨大冲击。
自2025年1月末上线以来,基于DeepSeek V3模型的DeepSeek官方App下载量飙升,目前已经登顶全球140多个国家应用商店,日活突破2000万,在多个国家及地区取代ChatGPT成为最受欢迎的AI应用。
人红是非多。很快,DeepSeek的高效、低成本遭遇质疑,包括马斯克等科技大佬纷纷下场表态,认为DeepSeek不可能突破算力瓶颈。
训练大模型需要算力,算力则是通过英伟达AI显卡实现。以马斯克xAI的全球最大超级计算中心“Supercluster”为例,该集群由10万个液冷英伟达H100 GPU组成,价值超40亿美元。同样,OpenAI、Meta、亚马逊等企业的AI投入,也都以数亿美元起计算。
没有算力,开发不出高性能的大模型;算力需要英伟达高性能AI显卡,不仅奇货可居,还针对中国市场进行限制,只向中国市场销售低性能的阉割版本,比如特供版H800,性能明显低于通用版H100。因此,按照上述逻辑来说,DeepSeek这样同时具有高性能、低算力成本的大模型,是不应该出现的。
据了解,DeepSeek-V3模型仅使用了2048块H800的芯片、历经两个月,便实现了6710亿参数的训练成果。相比之下,Meta的Llama 3训练参数为4050亿,则需要16384块性能更强的H100芯片、耗时54天才能完成训练, DeepSeek的训练效率提升了11倍。
目前,对于DeepSeek算力争议众说纷纭,《华尔街科技眼》汇总了各方观点。
第一种观点,是DeepSeek隐瞒了其训练模型的真实算力,马斯克便是其中之一。据美媒报道,美国白宫和FBI正展开调查 DeepSeek是否透过新加坡作为中转站获得H100显卡。所谓的疑点来自英伟达财报,其2023 财年第三财季新加坡营收占比仅为9%;而在美国升级对华AI芯片出口管制之后,新加坡在英伟达2025 财年第三财季的营收占比提升至22%。
对此,英伟达方面简称公司遵循所有法律要求,表示新加坡是主要的交易中转站,英伟达是在此统计销售额,并不代表产品的实际最终使用地点。
第二种观点,是OpenAI主张的“数据蒸馏”观点。DeepSeek的大模型均为开源,在使用指南中也提及到数据蒸馏,但数据蒸馏在训练大模型中是常见的手段,关键争议在于DeepSeek是否使用了OpenAI的闭源数据。ChatGPT分为多个版本,只有GPT 2时期短暂开源,后续的 3.5/4.0等均不再开源。至截稿前,OpenAI方面未发布相关的调查结果。
DeepSeek与OpenAI大模型基准性能测试对比
第三种观点,即DeepSeek的创新实际上是思路上的改变,通过算法上的优化降低物理算力成本。此观点也获得了一些AI权威的认同。人工智能和机器学习领域的权威学者、曾任百度首席科学家的吴恩达认为,DeepSeek通过算法创新而非纯粹的算力,为AI领域带来了新的思路转变,包括专注效率而非规模的理念、降低AI应用的构建门槛等等,将对AI企业的商业决策产生深远影响。
吴恩达的观点很快得到了印证。最新消息称,“AI教母”李飞飞团队和华盛顿大学研究人员近日以不到50美元的云计算费用训练出一个名为S1的人工智能推理模型,其数学和编码能力在测试中的表现达到了OpenAI o1和DeepSeek R1的水平。
需要指出的是,S1模型是使用了16个英伟达H100显卡、通过数据蒸馏谷歌Gemini 2.0 Flash Thinking Experimenta多模态模型,耗时26分钟完成训练。“不到50美元”的成本仅计算了云服务费用,不包括显卡、服务器等其他硬件费用。
李飞飞团队成功训练出成本不足 50 美元的人工智能模型,有力地打破了 DeepSeek R1 身上那层被过度神化的光环,让业界对其有了更为客观、理性的认知。
神秘面纱已经褪去,算力争议仍存在,随之而来的,便是以数据安全为由的各种调查以及针对性措施。据《路透社》2月6日报道称,韩国产业通商资源部一位官员表示,出于安全因素,该部门已暂时禁止员工访问DeepSeek。此前,韩国政府在4日发布通知,呼吁各个政府部门员工在工作中谨慎使用AI应用,包括ChatGPT及DeepSeek。目前,尚不明确上述部门是否同样禁用ChatGPT。
韩国并非首个在政府部门禁用DeepSeek的国家。据新加坡《联合早报》报道,2月5日,澳大利亚以“国家安全”为由,禁止在政府设备上使用DeepSeek。
据悉,澳大利亚内政部长托尼·伯克在一份声明中指出,根据澳大利亚情报机构的威胁评估,DeepSeek相关技术奖构成不可接受的风险,主要集中在用户使用DeepSeek时上传的信息可能“无法被妥善保护”、并可能会“让用户面临恶意软件的风险”。基于国家安全考量,将从政府系统中移除所有DeepSeek产品和相关服务。
不过,伯克也表示澳洲政府做出上述决定,是“基于风险评估,而非针对某个国家,旨在保护澳大利亚政府及其资产免受风险。”
美国方面,部分政府部门也在近日通过行政命令来禁止在官方设备上使用DeepSeek,包括美国国防部、国会、海军、NASA以及得克萨斯州政府。
与此同时,美国方面也在加紧制定相关政策,限制使用DeepSeek。据美媒报道,2月3日,美国国会提出新法案,寻求全面禁止包括DeepSeek在内的中国的先进AI模型,下载者将被判处20年监禁。当然,这只是一份提案,而且过于极端,即便是美媒都表示该法案不可能通过。
与上述国家不同,目前意大利实施全面封禁DeepSeek的政策。1月28日,意大利隐私监管机构 Garante要求DeepSeek提供关于个人数据使用问题的解释,包括“收集了哪些个人数据、收集来源、收集目的、基于什么法律依据,是否存储在中国等。”随后在1月30日,意大利区苹果AppStore和谷歌Play商店中的DeepSeek应用均被下架,无法下载。
作为欧盟成员国,意大利先于欧盟封禁DeepSeek是令人有些意外的。欧盟对中国跨国应用的态度一直相对温和,虽然Temu、TikTok等应用此前也被相关机构调查过,但并未采用一刀切的封禁措施。与之相对的,ChatGPT在意大利并未受到该监管组织的质疑。
在2月6日的中国外交部例行记者会上,有媒体就此事提问,外交部发言人郭嘉昆表示:“我想强调的是,中国政府高度重视并依法保护数据隐私和安全,从来没有也不会要求企业或个人以违法的形式采集或存储数据。中方一贯反对泛化国家安全概念、将经贸科技问题政治化的做法,同时中方也将坚定维护中国企业的合法权益。”
事实上,部分封禁并没有阻止DeepDeek在全球市场流行。To C市场方面,据Appfigures数据显示,DeepSeek App于1月26日首次登顶苹果App Store,并迅速攀升至140个国家及地区榜首,在发布的18天内实现1600万次下载,其中印度下载量位居榜首,达到15.6%。
To B市场,包括英伟达、亚马逊、微软等科技巨头纷纷接入DeepSeek平台,与西方国家政府的谨慎态度形成了鲜明对比。
与上述三国政府不同的是,跨国科技巨头对DeepSeek的态度更加开放,其中也包括受影响最大的英伟达。
DeepSeek爆火后,一度导致英伟达单日市值蒸发约5468亿美元(约合3.9万亿人民币),公司总市值降至2.95万亿美元。不过,截至美东时间2025年2月5日,英伟达股价再次上涨超5%,市值一夜之间增加了1513亿美元(约合1.1万亿人民币),总市值再次突破3万亿美元的大关。
事实上,英伟达在1月31日便宣布接入DeepSeek-R1大模型,同时加入的还有亚马逊和微软。
据英伟达官方表示,DeepSeek-R1采用大规模专家混合(MoE)架构,参数规模高达 6710 亿,是许多流行的开源大模型的10倍,推理能力极强。在接入该模型后,英伟达的To B用户可通过NVIDIA NIM服务更加高效地构建AI智能体。
与英伟达类似,曾经表示要调查DeepSeek数据来源的微软,也在第一时间宣布接入R1大模型。微软CEO萨提亚·纳德拉在1月29日接受访问时说道:“我认为DeepSeek有一些真正的创新。这种优化意味着AI将更加无处不在,对于像我们这样的超大规模服务提供商和PC平台提供商来说,这都是好消息。”
苹果CEO蒂姆·库克同样盛赞DeepSeek,称其高效创新令人瞩目,这也不免让人猜测难产的苹果智能中文版,未来是否有接入DeepSeek的可能性。
另外,腾讯、华为、海光信息、潞晨科技等科技企业,也在近日宣布旗下产品接入DeepSeekV3和R1模型,拉动了一批概念股上涨。
在此情况下,DeepSeek的最大竞争者OpenAI,似乎陷入了窘境。据悉,OpenAI正在调查其数据是否被与DeepSeek “以未经授权的方式”获取,同时还在商业行为上做出,包括推出免费大模型o3-mini、免费向所有用户开放ChatGPT搜索等。
客观地说,OpenAI在近年来AI技术发展中占据绝对的主导地位。这家初创公司开创了基于大模型的生成式人工智能创新,这种模式高度依赖GPU算力,才有了英伟达从游戏显卡厂商到AI硬件算力供应商的华丽转身。
OpenAI的定义下,中国科技巨头如腾讯、阿里、字节、百度等,也都纷纷开始堆积算力跑大模型,但不论是通义、豆包或是文心,都没有让OpenAI产生危机感,直至DeepSeek的出现。
用最容易理解的话来说,即DeepSeek颠覆了算力为王的传统概念,这也是其充满巨大争议的主要原因。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)