APP推广合作
联系“鸟哥笔记小乔”
理想智驾“零接管”背后,李想的AI哲学
2025-01-22 14:24:13

文|刘俊宏

编|王一粟

2025刚开年,智能汽车今年竞争的主旋律便已经定调。随着武汉、北京等城市即将允许L3自动驾驶上路,卷了一年高阶智驾落地的玩家们终于到了“决战时刻”。

面对这场竞争,理想汽车(下简称“理想”)选择率先出手。

1月16日,理想汽车全量推送了OTA7.0版本车机系统,并将高阶智驾升级到 AD Max V13.0版本。与特斯拉的“期货”不同,理想已经给车主们准备好了拥有800万clips训练数据、无限接近零接管、全场景端到端、车位到车位“丝滑无断点”的智驾体验。

值得注意的是,此次明确的智驾版本号,背后是理想要让用户更好感知智能驾驶变化的决心。事实上,自理想OTA 5.0切换BEV架构,上线城市NOA以来,理想内部就启用了AD Max的独立版本号进行管理。如今的V13.0版本,意味着过去一年理想共完成了12次AD Max重大更新。并且后续AD Max版本号也将按照产品的更新及优化进行版本号迭代和维护。

政策的松口、无限接近“零接管”智驾的落地,意味着一个新的高阶智能驾驶的时代已经到来。

在智驾落地的压力下,车企和智驾供应商们开始“着急”起来。其中,奥迪和广汽全面抱上了华为的“大腿”;比亚迪宣称要在智能化方面投入1000亿;地平线新推出了智驾掉头和园区漫游功能。

就在智能汽车玩家们狂卷智驾能力的节点上。理想汽车CEO李想却在2024年12月25日-27日连续的三天理想AI Talk中,再次强调理想汽车将成为一家全球领先的人工智能企业。

为何理想要在汽车智能化竞争最激烈的时刻认为AI比汽车更重要?背后或许是李想洞察到公司落地AI所取得的成果。

聚焦产品层面,理想在2024年实现了汽车智能化从追赶、持平到领先的追越。在智驾上,理想仅用了3个月便完成了无图NOA到端到端+VLM智能驾驶的迭代。在技术的迭代下,消费者也形成了理想=智驾的认知。

统计数据显示,截至2024年12月31日,理想NOA导航智能驾驶里程已占智驾里程的70%。同时,在理想产品最主要的30万及以上的价格段内,AD Max(智驾顶配版)的交付量超过75%。

“增强我的能力、成为我的助手、成为我的硅基家人”。

随着用户对智驾逐渐依赖,李想也看到了一条AI连接物理世界和数字世界的道路。AI以汽车作为载体,为用户提供越来越丰富的服务和价值。或许在李想看来,未来Robotaxi提供的服务还是过于“冰冷”,有人情味的“车和家”才是更接近智能汽车产品的第一性。

为了实现AI能更懂人类的梦想,据理想汽车数据显示,每年投入上百亿元研发,有近50%用于投入AI。在大模型这边,李想也提出了公司要在未来几年内把大语言模型的基座模型做到行业前三的要求。如此,在视频(VLM)大模型的结合下,懂视觉和语言的AI,最终将彻底理解这个世界。

在2024年完成智驾赶超的理想,能实现李想宏大的AI理想吗?

L3智驾,理想准备好了

“下半年如果我还看不到变化,理想智驾拿不到头部位置的话,那你这个负责人就可以不用干了。”回忆起2024年初李想对智驾落地的督促,理想汽车自动驾驶研发副总裁郎咸朋至今都倍感压力。

在李想看来,理想汽车是否能顺利落地高阶智驾,已经到了影响“生死存亡”的地步。

而在此之前的2023年,郎咸朋带领的团队和国内大多数的智驾公司一样,一直在尝试用规则的方式解决Corner case(边界情况),就是出一个问题,写一个代码去解决。这导致理想汽车在2023年落地高阶智驾的节奏整体偏慢。

2024年上半年,高阶智驾已经成为消费者选车考虑的重要因素。根据工业和信息化部披露的数据显示,中国乘用车L2级辅助驾驶及以上新车渗透率达55.7%,其中具备领航辅助驾驶(NOA)功能的新车渗透率达到11%。

换句话说,是理想产品主打的30万及以上的价格段内(在整体车市的销量占比大概为15%左右),消费者已经形成了标配高阶智驾的共识。

事实上,理想智驾起步的目标非常高。早在2023年4月的上海车展,理想汽车就喊出了城市NOA落地100城的目标。但半年过后,这个目标就缩水为“在100城开通通勤NOA”。2024年初,李想带队前往美国体验特斯拉FSD,随后理想的智驾才开始转向无图NOA。

此时,各路智驾供应商们,开始向车企兜售无图NOA解决方案。同时,由于AI大模型的催化,智驾技术领先的玩家们也都开始了初步“端到端”的探索。

“还是回归产品和用户体验上,而不是追求指标的领先。”诚如郎咸朋所说,在与李想达成智驾研发要用“端到端”技术和注重体验的共识之后,2024年4月开始,理想的智驾能力“直线起飞”。

以OTA大版本为节点,在2024年5月,理想智驾主要还是聚焦在场景细节调优。从7月的6.0版本更新无图NOA开始,理想智驾开始更注重功能和体验。

理想智驾“零接管”背后,李想的AI哲学

作为佐证,理想在2024年8月更新的车位随心画功能,智驾能够理解用户的停车意图,想停哪里就停哪里。离车泊入功能也升级到了关门泊入,在用户对理想智驾的信任下,用户自动泊车再也不需要掏手机控制了。

10月,理想智驾更新至“端到端+VLM智能驾驶”后,理想的智驾能力再一次飞跃式提升。光锥智能在实际体验之后,发现这个版本的智驾不仅能顺利通过环岛。而且在无保护右转时,不会向其他厂商的智驾一样,还需要“踩一脚刹车”。

理想智驾“零接管”背后,李想的AI哲学

理想智驾“零接管”背后,李想的AI哲学

参考理想用户社区@仟仟爸爸的分享,理想智驾能够轻松面对环岛+突然加塞+变道绕行的复杂操作。用户全程只是吐槽了一下加塞车辆,然后用“也行”,点评了一下变道操作。

理想智驾“零接管”背后,李想的AI哲学

如今,随着已经推送的AD Max V13.0更新,可以预见,理想智驾在复杂的中国道路可以实现“零接管”。这也是符合自动驾驶L3标准的表现。

消费者也开始逐渐信任智驾,并愿意为此买单:“买理想就买智驾版”,成了消费者的共识。

李想曾经在采访中对光锥智能透露,2024年上半年,理想曾经有几个月被问界的销量压制的很难受,但在智驾能力上升后,理想的销售们都能挺起腰杆让消费者“随便对比”,而后,理想的销量也随之打了一个漂亮的翻身仗。

根据理想统计的数据显示,截至2024年12月31日,NOA导航智能驾驶里程已占智驾里程的70%。这意味着,NOA已经替代了原先大量辅助驾驶的使用,类似LCC(车道居中保持)等功能,正在“撤离”用户心智。另一边,在端到端全量推送一周内,理想注意到有3600位之前从未在城市使用NOA的车主开始每天使用该功能。并且,这些用户每天的导航里程提升了两倍,这意味着用户已经相当依赖智驾了。

在销售端,理想智驾也已经成了潜在客户最重要的购车原因之一。据统计,截至12月31日,理想NOA试驾占比超72%。30万以上车型AD Max交付量占比超75%,40万以上车型AD Max交付量占比超84%。这样的销量构成,意味着消费者几乎是因为理想智驾而选购理想汽车。

可以看到,在智驾经历不到一年的迭代中,理想不仅实现了智驾跨越式升级,还更新了品牌的消费者认知。如今的理想,已经从此前“冰箱、彩电、沙发”的标签,切换到了智驾(AI)实力派。

为何理想的AI进展能如此之快?

或许正如李想与郎咸朋在讨论智驾方向时所言,“要么做端到端,要么别做自动驾驶了”。在AI时代,选对路径比一味的努力更重要。

对标“人”理想智驾的第一性原理

在人类研究AI的60余年里,科学家们得到次数最多的教训便是方向比努力更重要。

以AI大模型的基础架构Transformer为例,虽然谷歌的科学家在8年前提出了Transformer,但谷歌在研究方向的犹豫,让OpenAI率先完成了ChatGPT,颠覆了谷歌此前在NLP领域不少心血。

同样的感慨,也发生在理想转向“端到端”之后。

“比之前所有车的状态都要好,刹车非常拟人舒适,这些问题在规则阶段用很多代码都没办法解决。”在采用端到端仅仅15天之后,看到新技术架构对过去的颠覆,郎咸朋不禁惊叹道。而实现这种差异的过程,理想智驾算法研发部门负责人贾鹏总结说:“一行规则都没写,全是系统按照给的数据训练出来的。”

回顾理想的三次智驾技术变迁,从NPN(先验信息)到无图NOA,再到如今的端到端+VLM双系统架构,每一代都在根本上颠覆了上一代的设计架构。

理想智驾“零接管”背后,李想的AI哲学

其中,无图NOA为了替代NPN必须的先验信息(一般是指高精地图),智驾系统强化了感知和规划模块,将智驾从原本的“开卷答题”转向到“闭卷作答”。端到端对无图NOA的提升,主要在于端到端用AI学习取代了无图NOA的人力编写规则模块,相当于原本智驾“背公式”转向到“随机应变”。

由此看到,设计更好的AI架构,智驾也更接近实现全自动驾驶。

理想参考了人类逻辑思维中的下意识反应和深思熟虑,将整个智驾系统拆解成了“快慢”双系统(对应系统一和系统二)。

理想智驾“零接管”背后,李想的AI哲学

其中,系统一是完全的端到端架构。智驾模仿人类面对正常路况的操作,这时候控制车辆“加减速”不需要思考太多。系统二则是在端到端的基础上,理想“外接”了一个多模态大模型(VLM)。利用多模态大模型对图片、文字等信息的理解能力,系统二能为系统一提供真实世界的认知。

为何理想的架构与市面上玩家都不同,既不是特斯拉用单个端到端模型“暴力破解”人类操作,也不是小鹏、华为、蔚来等分段式端到端的路线?

因为,这么设计能带来更快的智驾迭代速度。

具体而言,是端到端部分负责快速学习投喂的clips(视频片段)。通过对人类操作的模仿,智驾系统能快速学到与“老司机”近似的操作水平。

“我们起初投喂80万clips的时候,还过不了环岛。后来当数据量达到100万clips时,他自己就能过环岛了。我觉得是100万clips里头刚好有一些环岛数据的原因。模型确实很神奇,你喂了什么数据,他就能学会相应能力。”贾鹏解释说。

另一边,借助能理解真实世界信息的VLM,整个智驾系统还能方便投入到世界模型中参与“考试”,从而实现针对能力训练和模拟智驾在Corner case中的表现。“我们还会根据所有的数据生成“模拟题”,针对模型容易出问题的部分,再生成一些内容训练。”郎咸朋说。

理想富有创意的架构设计,一经发布便斩获行业内多个奖项。2024年,理想智能驾驶的DiVE(世界模型)及StreetGaussians(世界模型)发表在了ECCV 2024上,DriveVLM(双系统)发表在了CoRL 2024上,获得行业的一致认可。

总之,面向2025年即将推广的L3自动驾驶,坐拥110.9万用户、智驾总里程累计达29.3亿公里、800万clips投喂、8.1EFLOPS训练算力,并且每年训练算力的投入超过10亿人民币(以上数据截至2024年12月31日)的理想,已经做好了十足的准备。

随着理想对智驾的深入研究,其AI基础能力也在快速升级。

其中,为了在芯片层继续优化智驾能力,理想即将流片自己专用的智驾SoC。原本用于座舱助手的理想同学,现在也登陆手机,对标ChatGPT、豆包等通用智能体。在汽车AI能理解人类之后,李想也开始考虑起人工智能的下一个形态——机器人。

汽车之外,理想要用AI做更多产品了。

李想的理想,打通硅基世界

理想汽车至今的成功,背后离不开李想顶级的产品能力。

细细复盘李想的每次创业,都能看到他以“超级产品经理”的姿态,对每个行业的高举高打。每次切入一个新赛道,李想都能看到行业最根本的发展主线。

理想智驾“零接管”背后,李想的AI哲学

例如,2005创立汽车之家时,李想看到了中国消费者巨大的汽车消费潜力,但缺乏了解渠道的困境。为了满足消费者对汽车产品的好奇,汽车之家主打汽车评测,一举打败了主做车友会的爱卡汽车网。

2015年创立理想汽车时,李想看到的是中国汽车在电动化和智能化存在机遇,同时传统汽车供应链早已成熟的情况。为了在最低限度打造一款智能汽车,李想尽可能采用成熟的技术和设计。避免了里程焦虑、空间不够、不舒适等新能源汽车常见问题的理想ONE,开卖即爆款。

在AI大模型时代刚刚开始的2023年初,看到ChatGPT的横空出世,李想在1月发布的全员信中提到,公司将在2030年成为全球领先的人工智能企业。随后在李想的号召下,理想快速跟上了行业每一个AI落地的风口,AI从隐藏战略变成了“阳谋”。

“AI意味着未来的全部。”诚如李想在2024年12月的理想AI Talk上对AI的看法。随着理想对AI的落地,李想也慢慢看到了AI应用更广袤的视野。

在智舱领域,是理想为了追赶大语言模型的热度,2023年一季度理想开始了Mind GPT项目,并在2023年6月的理想家庭科技日发布会上发布。2023年年底,Mind GPT随着OTA 5.0上车,跟上了行业用大语言模型提升车机智能化的趋势。如今,结合VLM对视觉世界的理解,理想“摸到”了AI融合的边界。

“基座模型到一定时刻,一定会变成VLA(视觉语言行动模型,可以理解成真正能理解世界的智能)。因为语言模型,也要通过语言和认知去理解三维的世界。”正如李想所说,随着AI对世界愈发理解,语言、图片、生成、硬件的边界即将被打破。

“一个真正的大模型产品,一定是能够去自主使用所有的设备,会拥有所有的服务,这才是真正的人工智能。”正如李想所言,AI产品的核心逻辑其实与智驾一模一样。

都是从小范围、标准化的场景出发,到逐渐适应更多场景,为客户提供更多样的服务。最终打破硬件的壁垒,同一个AI能同时落地到全场景的智能硬件。换句话说,能听懂指令并能自觉执行任务的机器人,何尝又不是一种带着乘客“逛街”的自动驾驶呢?

“普通老百姓都能用了,它能独立地、持续地、连续地完成任务,而不需要靠密集的提示词。”李想说。

或许,在AI即将大范围落地端侧的2025年里,李想看到了AI终将打通硅基世界的未来。

关键词
光锥智能
分享到朋友圈
收藏
收藏
评分

综合评分:

我的评分
Xinstall 15天会员特权
Xinstall是专业的数据分析服务商,帮企业追踪渠道安装来源、裂变拉新统计、广告流量指导等,广泛应用于广告效果统计、APP地推与CPS/CPA归属统计等方面。
20羽毛
立即兑换
一书一课30天会员体验卡
领30天VIP会员,110+门职场大课,250+本精读好书免费学!助你提升职场力!
20羽毛
立即兑换
顺丰同城急送全国通用20元优惠券
顺丰同城急送是顺丰推出的平均1小时送全城的即时快送服务,专业安全,准时送达!
30羽毛
立即兑换
光锥智能
光锥智能
发表文章57
前沿科技,数字经济。公众号:光锥智能(guangzhui-tech)
确认要消耗 羽毛购买
理想智驾“零接管”背后,李想的AI哲学吗?
考虑一下
很遗憾,羽毛不足
我知道了

我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。


一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
    1)反对宪法所确定的基本原则;
    2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
    3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
    4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
    5)煽动民族仇恨、民族歧视,破坏民族团结;
    6)破坏国家宗教政策,宣扬邪教和封建迷信;
    7)散布谣言,扰乱社会秩序,破坏社会稳定;
    8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
    9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
    10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
    11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
    12)危害未成年人身心健康的;
    13)含有法律、行政法规禁止的其他内容;


2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
    1)轻蔑:贬低、轻视他人及其劳动成果;
    2)诽谤:捏造、散布虚假事实,损害他人名誉;
    3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
    4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
    5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
    6)谩骂:以不文明的语言对他人进行负面评价;
    7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
    8)威胁:许诺以不良的后果来迫使他人服从自己的意志;


3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
    1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
    2)单个帐号多次发布包含垃圾广告的内容;
    3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
    4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
    5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
    6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
    7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
    8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。


4. 色情低俗信息,主要表现为:
    1)包含自己或他人性经验的细节描述或露骨的感受描述;
    2)涉及色情段子、两性笑话的低俗内容;
    3)配图、头图中包含庸俗或挑逗性图片的内容;
    4)带有性暗示、性挑逗等易使人产生性联想;
    5)展现血腥、惊悚、残忍等致人身心不适;
    6)炒作绯闻、丑闻、劣迹等;
    7)宣扬低俗、庸俗、媚俗内容。


5. 不实信息,主要表现为:
    1)可能存在事实性错误或者造谣等内容;
    2)存在事实夸大、伪造虚假经历等误导他人的内容;
    3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。


6. 传播封建迷信,主要表现为:
    1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
    2)求推荐算命看相大师;
    3)针对具体风水等问题进行求助或咨询;
    4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;


7. 文章标题党,主要表现为:
    1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
    2)内容与标题之间存在严重不实或者原意扭曲;
    3)使用夸张标题,内容与标题严重不符的。


8.「饭圈」乱象行为,主要表现为:
    1)诱导未成年人应援集资、高额消费、投票打榜
    2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
    3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
    4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
    5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序


9. 其他危害行为或内容,主要表现为:
    1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
    2)不当评述自然灾害、重大事故等灾难的;
    3)美化、粉饰侵略战争行为的;
    4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。


二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。


三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)

我知道了
恭喜你~答对了
+5羽毛
下一次认真读哦
成功推荐给其他人
+ 10羽毛
评论成功且进入审核!审核通过后,您将获得10羽毛的奖励。分享本文章给好友阅读最高再得15羽毛~
(羽毛可至 "羽毛精选" 兑换礼品)
好友微信扫一扫
复制链接