很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
闷热的场馆里,兴奋的议论声,所有人生怕错过这场AI让机器人进化的盛宴。
人山人海的会展现场 光锥智能拍摄
8月21日,2024世界机器人大会(WRC)在北京开幕。在这场由169家企业携600余款产品的展会中,具身智能以几乎单独“承包”一个场馆的阵仗,27家公司的人形机器人和机器狗吸纳了最多的观众。
在众多机器人的演示中,光锥智能发现各家企业执行复杂任务的能力明显变强,实用性也得到了很大的提升。
相比去年机器人更多演示跳舞、对话、走两步的简单任务能力,今年有伟景智能机器人摘水果、优必选机器人检修汽车、星辰智能机器人写毛笔字、加速进化的人形机器人足球比赛。宇数科技在表演了连续侧身翻跳跃的机器狗外,还带来了定价9.9万元的人形机器人——G1。在众多厂商机器人的能力演示和价格的发布中,人形机器人距离走向现实的时刻越来越近。
宇树科技G1机器人动作演示
“大模型的发展,极大地促进了人形机器人的进步。”
科大讯飞副总裁、研究院院长刘聪对光锥智能称,不管是“大脑”感知和理解的能力,还是“小脑”的运动控制能力都大幅提升。
进一步,逐际动力联合创始人兼COO张力认为,AI的进化让机器人实现了跨越式的提升,“通用人工智能让软件、算法能够帮助机器人去实现很多以前根本完成不了的事”,
随着AI大模型的突破,今天的人形机器人开始向着自动驾驶的方向发展。在借鉴了端到端大模型让汽车一边理解世界,一边快速迭代的进化中,机器人也展现出了能够理解复杂指令和学习更流畅的动作。同时,在大模型训练需求下,人形机器人也来到了数据驱动智能迭代的阶段。而各家机器人厂商也在试图从家用、工业、仓储物流、零售等一系列场景中占得一席之地。希望以单一场景为中心取得数据和迭代的闭环后,打通不同领域,最终走向通用。
尽管在过去AI发展的十年中,机器人曾经历多次希望和幻灭。但通过本次机器人的明确进化方向,星尘智能创始人来杰兴奋地称,“下一个十年,最值得做的就是人形机器人”。
机器人正在掀起一场资本、技术和产业的共同狂欢。
“这两年看到最多的投资,除了大模型就是机器人”,刘聪对光锥智能称。
虽然人形机器人行业尚处能力演示的阶段,但投资者和创业者们都知道,不能错过这场风口。
在回顾近一年来的投资趋势后,我们发现人形机器人作为热度最高的机器人终极形态,技术和难度都最高的同时,也在资本市场中占领了高地。
创业者层面,IT桔子数据显示,2023年1月至今国内共成立了29家人形机器人公司,其中有22家已经获得至少1轮融资。其中,由前华为天才少年“稚晖君”创立的智元机器人,在成立17个月就完成了七轮融资,投前估值已达70亿元。
站在资本的角度,根据《中国电子报》的不完全统计,2024年上半年全球人形机器人领域融资事件超过22起,融资金额超过70亿元。对于人形机器人的投资热情,不少投资机构的布局堪称“扫货”。
蓝驰创投合伙人曹巍表示,在机器人领域已经投资了超过10家早期项目。经纬创投更是手握宇树科技、智元机器人、银河通用、星尘智能,四家人形机器人公司的“明星天团”。
“行业和资本都对机器人的未来很乐观,毕竟这是个万亿的市场”。在大会现场,优必选全球营销总监李卓对光锥智能称。
于是,人形机器人在软件、硬件、资本推动、前沿应用效果的共同作用下,成了AI时代最热门的赛道。
以宇树科技在2023年初才开始探索人形机器人的经验为例。之前不做人形机器人的理由,王兴兴认为,“全球人形机器人的控制技术,大家都做的不是特别理想。性能上不去,达不到实用或者干活的阶段,所以过去很多年都没做人形机器人”。
如今,随着机器人软硬件技术升级,人形机器人正逐渐从实验室走到实际的运用场景中。今年7月,马斯克称特斯拉工厂已有两台Optimus机器人在进行电池搬运工作。在本次机器人大会现场,我们也看到了优必选的人形机器能执行简单的汽车质检任务。
优必选机器人演示质检场景
诚然,以人类熟练工的角度来衡量,机器人“员工”的效率还是太低。但若是与规模叠加,人形机器人24小时连轴工作的特性,还是吸引了汽车、物流、科研院所、AI科技等不同行业的尝试意愿,共同催促着人形机器人的交付进程。
“在2022年底,我们还没做人形机器人,但已经有一些客户找我们想买人形机器人了”,王兴兴认为宇树科技的人形机器人进展都是顺势而为的结果。
不过,猎豹移动董事长兼CEO、猎户星空董事长傅盛认为机器人行业还有很多方面需要打磨,尤其是“两条腿走路”的人形机器人要面临物理学的限制,“双足机器人的技术过于复杂,它必须依赖于机械结构。机械结构的迭代不会像自动驾驶那么快,每年能进步的幅度不多。”
但总之,行业内的玩家们在人形机器人的预计成熟时间上,达成了基本的一致意见。李卓对光锥智能表示称,“预计行业还有3-5年才能彻底成熟”。
在头部创业者们看来,此时此刻的人形机器人恰如2019年,特斯拉刚推出FSD芯片、百度Apollo刚拿到多张测试牌照的自动驾驶,一切都充满了希望。
一切,都是因为人形机器人在本轮AI大模型的影响下,实现了根本性的改变。
“一个是大语言模型,另一个是端到端算法。”
光轮智能创始人兼CEO谢晨如此总结着本轮机器人进化的最大原因。
在大会现场,无论是人形机器人、机器狗,甚至差异化设计的餐饮机器人都表现出了“更合理”的动作表现。以一年周期为对比,今年大会上的机器人操作明显流畅了许多。
较为明显的例子,可以从机器人做冰淇淋这一简单任务中看出。在去年的世界机器人大会上,机械臂的运动基本上是单调地执行“转圈”。而今年遨博智能的冰激淋机器人动作明显更加流畅,机械臂仅转了一圈,就将冰淇淋接了出来。
2023年(上)和2024年(下)冰淇淋机器人的动作表现对比
不同的动作流畅度,意味着机器人任务执行的底层逻辑发生了改变。
“原先机器人操作设计是模块化的,底层是学习加规则混合的方案。”星海图联合创始人、清华大学交叉信息学院助理教授、MARS Lab主任赵行解释称,“这种模式有点像之前自动驾驶的物体检测-决策-规划-控制的过程。例如做一个抓取策略,之前我们要对物体进行检测、状态和姿态估计。但现实情况的物体大多没什么姿态可言,就像一张纸铺在桌子上,很难定义姿态和关键点。”
这与自动驾驶的发展过程如出一辙。此前的机器人动作规划与自动驾驶发展到“端到端”前,遇到得是同样的问题——在特定场景的开发模式下,只能靠规则写有限的动作,无法适应真实世界的无限场景。
机器人只能操作有限形状和种类的物体,就像是自动驾驶只能在封闭路段使用一样“鸡肋”。而有了“端到端”的机器学习之后,如同汽车能够自己学习如何掉头一样,机器人也能学习如何抓取不同形状、颜色、柔软程度不同的物体。
优必选机器人听指令抓东西
参考自动驾驶结合大模型的趋势,机器人在结合了多模态大模型后,也开始能理解现实世界。在现场,银河通用机器人展示的便是药店值班的场景。机器人在拿取货架上的药品之余,看到有东西掉到地上还能自己捡起来。
银河通用机器人演示药店值班场景
AI大模型对于机器人能力提升的重要性,刘聪认为主要体现在三个方面:
首先,大模型显著提升了机器人解决复杂任务的能力,根据理解,把复杂任务拆解成一系列可执行的任务。
接下来,在多模态大模型的能力下,机器人可以依托视觉、触觉等在更复杂地场景里做事。
最后,体现在运动能力上,机器人可以根据AI合成的数据做模拟训练。如果没有大模型,机器人实现的功能会相对受限。
由此也看出,数据是除了大模型技术外,制约机器人下一步进化最关键的要素。
为了获取足够用于机器人训练的数据,不少厂商通过真实数据和仿真数据结合的方式解决。在真实数据的获取中,厂商一般通过真人动作和机器人遥操作的方式,将任务过程中的数据“喂”给大模型。而仿真数据则是通过搭建一个尽量真实的场景,设定尽可能多的建模和现实参数,让虚拟化的机器人进行训练。
不过,上述的两种方式还是存在着各自的短板,当前机器人行业还远未达到数据飞轮的启动时刻。一方面真实数据的成本极高,机器人当前还达不到自动驾驶般的普及度。在真实数据足够多之前,厂商需要花长时间和配备数据标准团队来一点点积累。而对于仿真数据而言,最大的问题还是现实仿真不够真实。机器人在模拟世界能成功,但导入到现实世界就会有一定的失败率。
“现阶段,对机器人行业最大的一个限制,还是AI不太够。AI模型、AI的训练数据集、AI的场景的落地部署,都完全远远不够。”王兴兴称。
而随着AI的发展,赵行预判,“随着更高效的算法和算法的泛化能力提升,未来机器人学习一个技能的数据量将会从现在的几千、几万,下降到一千甚至几百几十的数量级。”
参考自动驾驶行业由量产带来的数据飞轮,为了进一步解决数据问题,不少机器人厂商正在探索从量产中“拿”数据了。
价格,是人形机器人走向量产的一大制约因素。
据光锥智能在世界机器人大会上向各家了解,智元机器人合伙人兼营销服副总裁姜青松称,一台1.7m高的人形机器人行业内售价大概为60-70万。
相比前几年数百万起的波士顿动力,这些价格已经是少数行业能接受的“尝鲜价”,但离大规模普及还非常遥远。
王兴兴称,“现在还没有真正到商业闭环。一台机器人达不到比人还低的成本,商业价值依旧不是正向的。”
这是因为,从研发成本角度,由于人形机器人的不成熟,公司的研发过程会在技术布局、硬件选用、场景设计等环节中设置充分的冗余空间。这导致产品在前期研发成本的分摊下,“背”上了大量除必要硬件之外的“隐性成本”。
而在销售环节结束之后,机器人公司还要继续为应用效果负责。“厂商要为工业应用试点客户,配置专门的驻场团队来进行后续研发和维护”,在大会现场,一位参展商这样告诉光锥智能。
虽然当前的客户需求和产品都非常不标准化,但是光锥智能在大会现场发现,不少厂商已经尝试在不同的需求下,制定了相应的产品策略,试图让机器人的销售更加顺畅。
基本上,光锥智能了解到多家厂商的通用人形机器人售价集中在50-60万元的区间,并搭配廉价的量产版本作为产品线补充。例如,四足机器人销量最高的宇树科技,其通用人形机器人H1售价就定在了50-60万,最新的G1人形智能体也发布了量产版本,售价仅9.9万人民币起。
另一边,众擎机器人的人形机器人销售更加极致,为了降低成本,在拿掉了机器人的“头和双臂”后,众擎DG01干脆把“大双足机器人”的价格干到了3.85万。
这或许意味着,人形机器人的第一轮价格战快要来了。
众擎机器人定价3.85万 光锥智能拍摄
但更大规模的降价,还得依靠量产。
日前,智元机器人预计今年的出货量为200台,已经是行业头部水平。而上一个阶段中,商用清洁机器人的单家出货量也仅在一年千台左右。
什么时候能突破一年万台,甚至十几万台的销量,才是机器人真正的“iPhone时刻”。
为了达到量产目标,头部人形机器人厂商已经把第一个场景瞄向了工厂。
在全球范围,除了特斯拉正在使用的自家机器人Optimus外,OpenAI 投资的Figure已经与宝马合作,计划在美国南卡罗来纳州落地Figure 01机器人。而美国机器人制造商Apptronik则与奔驰合作,Apollo机器人已经在奔驰的流水线上搬箱子了。
在国内,当前落地最快的还是人形机器人唯一一家上市公司优必选。今年以来,优必选的人形机器人已经进入蔚来汽车、东风柳汽、吉利汽车、一汽等多家车企“打工”。随着优必选在经典制造业场景的落地,人形机器人在质检、搬货、分拣、拧螺丝、装配等环节,初步验证了行业应用的可行性。
“目前机器人行业尚在早期,但随着大模型的加持,技术和产品的从0到1,有望在三年内一起突破。”谢晨总结道。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)