很可惜 T 。T 您现在还不是作者身份,不能自主发稿哦~
如有投稿需求,请把文章发送到邮箱tougao@appcpx.com,一经录用会有专人和您联系
咨询如何成为春羽作者请联系:鸟哥笔记小羽毛(ngbjxym)
作者 | 刘亮
想象一下这个画面:一个凌晨的车间,几排整齐的人形机器人沙沙作响地做着流水线任务。这个场景放在几年前只出现在科幻电影里,不过在今天已经实现了。
前不久,人形机器人企业Figure推出第二代人形机器人Figure02,在软硬件上比起一代都有突破进展,更是搭载了“金主爸爸”OpenAI定制的语音推理模型,实现自然语言的交互。现在的它,已经进入宝马车厂开始“打工”了,可以无休止地狂干20个小时。
“炸裂”新品的发布又把人形机器人推到了舆论中心,从去年底优必选(9880.HK)上市到今年WAIC上特斯拉Optimus新一代的亮相,再到近期Figure02的推出,人形机器人的发展在这两年可谓进展神速。
但是,脱下“创新技术”这层外壳,人形机器人的量产难度到底在哪里?从研发到商业化应用又需要面对什么挑战呢?
人形机器人,最近又火了。
被微软、英伟达和OpenAI投资的人形机器人企业Figure在前几天发布了号称“地表最强”新款人形机器人Figure02。据“趣解商业”了解,和上一代相比,Figure02进行了外观的重构,机器人的外皮承担了压力,采用了外骨骼结构,这样子机器人的电源和算力布线就集成在机体内部,由此提高了机器人的性能;迭代后的Figure02手部具有16个自由度,能够承受与人类相当的力量。
软件方面,新一代机器人也搭载了投资人OpenAI定制的语音到语音推理模型,这样子人类就可以直接用语音和机器人交互。
其实机器人发展到现在,在我们日常生活中的渗透率已经非常高了,比如在商场里常见的大型清扫机器人、物流流水线上的物流机器人等;专项机器人如此完善的今天,我们为什么还要做人形机器人?
而且,为什么一定要是“人形”?
答案其实很简单,因为只有“人形机器人”才最有可能接近“全能机器人”。
我们生活的世界中,所有的场景、设备、工具都是服务于人类的形态设计的,所以各种单项的机器人可以拆解某一种具体的场景去使用,比如物流机器人可以做扛、放重物,工业机器人可以拧螺丝、扫地机器人可以打扫,但是出了这个特定的领域,这个机器人就成了一块“高科技板砖”。
而只有人形机器人能够不受场景的限制,融入人类生活的各个方面。人形机器人最大的特点是自由度高,具备较强的自主性和多功能性;例如,在工业制造中,人形机器人可以替代人类从事重复、繁杂和危险的工作减少事故发生。我们可以将现在各种机器人理解成发展人形机器人的一个初级形态,而人形机器人才是终极形态。
为了实现这个终极形态,人形机器人需要做三件事:感知、运动、思考。
就拿跨越障碍物这件事情来说,得先“感知”到障碍物,然后“思考”是走过去、跳过去还是跨过去,最后“运动”或者说行动来实现跨越。这对普通人来说只是下意识的行为,对人形机器人就是一个复杂的训练过程。
现在大部分的人形机器人的问题都出在“思考”这个环节上,毕竟感知和运动可以通过传感器布局、机器人关节设计的完善来在硬件上下功夫,不过“思考”这件事情实在是太复杂了。
以往大家的训练方式都是“打标签”,比如教人工智能学习什么叫做“西瓜”就把各式各样的西瓜打上标签,人工智能在看到符合这个标签的物体的时候就可以给出相应的认知。不过这样的训练方式放在有局限性的领域中还好,放在更大的领域中就很难做到穷尽。
现在有了大模型,就打开了一种新的训练思路。大模型加上传感器数据,可以训练机器人更好地了解世界的规律。
比如同样都是去冰箱里拿饮料,拿瓶装可乐和袋装牛奶的方式就不一样,大模型学习可以让机器人“理解”可乐可以直接捏起来而袋装牛奶就要轻轻拎起来的区别。
更重要的是,大模型可以训练机器人对自然语言的理解,比如你说“我饿了”,现在的机器人未必懂它需要做什么,但大模型训练之后,机器人就可以为你跳转到外卖平台的界面,更甚者可以给你去炒盘菜。对自然语言的深入理解,帮助机器人更好地理解人类,也能更大地减轻人类与机器人的交互难度。
可以说,大模型的应用又给人形机器人的发展推向了next level。
在大模型的加持下,2023年被称为“人形机器人元年”。
从融资表现来看,据“IT桔子”数据,2023年人形机器人领域融资事件有23起,总金额达到54.71亿元,是过去十年以来的巅峰。而截至当前,2024年人形机器人领域已经有14起融资事件,总金额接近24亿元。
从产品来看,2023年开始至今,不论是新锐的产品还是企业都在涌现。比如2023年成立的星动纪元,由清华大学交叉信息研究院孵化,致力于具身智能以及人形通用机器人技术和产品的研发;同年成立的开普勒,自研算法实现人形机器人预设动作与端到端全自主规划相结合模式及精准控制...
还有赶在今年元旦之前上市的机器人赛道老牌选手优必选,更是以“人形机器人第一股”的姿态给整个产业的资本化再次推上快车道。
以优必选为例,这些三方供应商是整个领域的主力军。这些企业基本都会以某种使用场景为切入来进行人形机器人的研发,比如优必选更专注于工业制造、达闼更多面向家庭服务。作为整个产业链的中游,三方供应商最重要的自然是争取下游的订单,趁早“进厂”;所以,市场化、商业化就对他们非常重要。比如,今年2月,优必选的Walker S已经在合肥蔚来汽车工厂进行“实调”;据“趣解商业”了解,优必选已经和数十家国内头部新能源汽车企业接触,推进人形机器人需求对接。
而这些“被进厂”的下游企业当中,也有部分开始自己搞人形机器人的选手。
特斯拉,就是一个代表。机器人作为马斯克的“宏图计划”当中非常浓墨重彩的一笔,其机器人的代表作Optimus也一直都有进展,如今已经可以双臂与腿配合完成基础瑜伽动作,与此同时保持躯干的稳定性;还可以通过纯视觉输入,以正常的速度拿起积木,并能按照蓝、绿两类颜色正确分类,在对面发生人为移动积木的动作时,Optimus依旧能以自身原本的节奏顺利完成任务,且在积木摆放出错时,自主调整正面朝上,完成纠错。
小米也早在2022年就发布了“Cyber one”,近期又联手机器人泰斗王田苗,投资了一家名为"小雨智造"的具身智能科技公司,这也是小米首次对外投资具身智能领域公司;而本田入局机器人领域都已经三十多年的时间,推出的ASIMO甚至在2002年就跑去和纽交所董事长握手去了。
和中游供应商有差别的是,下游企业的研发出了实用性还有品牌效应,尤其是这几位都是现在典型的造车企业,在汽车智能化势不可挡的趋势下,对于智能机器人的研究能让车企更敏锐地捕捉前沿技术,也展现自己的技术实力。
在去年的 1024 小鹏汽车科技日上,小鹏汽车董事长兼CEO何小鹏推出了小鹏汽车自研的人形态双足机器人 PX5;据“趣解商业”了解,小鹏团队耗时 5 个月,实现了自研双足机器人的稳定行走。
8月12日,何小鹏在微博上发布一则视频,展示了一只机器手订购MONA M03的过程。何小鹏还表示:“AI及大型硬件的新进展今年内我们将跟大家同步,敬请期待。”虽然微博透露的信息不多,但也能看出小鹏在积极布局机器人赛道。
在实用性上,中游厂商更重视“开源”,因为要“开张卖钱”,而下游厂家就更重视“节流”。马斯克就表示Optimus量产之后也会率先进入到特斯拉的生产流水线。用人形机器人代替工人拧螺丝,可以收获一个24小时待机、不会疲劳、不会闹情绪的“完美打工人”,成本降低、效率提升,最终实现的就是生产成本的控制。
当然,下游厂商研发的人形机器人足够稳定后也可以进行商业化,从而成为整个企业收入的一个增长部分;不过从底层逻辑来说,虽然都是争先“进厂”,但中游和下游的侧重点还是略微不同。
不论是中游还是下游选手,虽然都热热闹闹的,但也各有各的麻烦。
特斯拉的人形机器人已经开始拖延量产时间了。去年就表示Optimus要在2024年底前实现量产的马斯克在不久前发推称特斯拉明年会小批量的生产人形机器人,然后预期在2026年实现量产以及对其他企业客户的交付;也就是说整个机器人的进展推后了几乎一年。
小米的“Cyber One”在2022年亮相之后最后一次展示是在2023世界机器人大会上,而且展示的也是2022年的老版本,之后也没传来什么突破性的消息。
“预计优必选人形机器人进入汽车工厂将在2024年底实现小规模交付。”优必选董事会主席、执行董事兼行政总裁周剑表示。不过在交付之前,已经上市的优必选还要面对市值滑坡的困境。
截至8月14日,优必选的报收86.25港元/股,相比今年3月7日最高峰的股价328港元/股,不到半年时间跌幅已经超过了70%;市值也由高峰的超1300亿港元跌到了361.87亿港元,蒸发近千亿港元。
那么,人形机器人的困境到底在哪里?
首先是技术难关。有媒体曾经报道,国内一线研发专家在人形机器人系列电话会上提出了人形机器人量产的四个技术痛点:
1.手部和腿部硬件集成难度大,需要更高的损失峰值功率和驱动能力;
2.腿部行走算法稳定性难以保证,学术界尚未出现真正意义上的类人走行算法;
3.手部精细化感知难度大,涉及到手的21-26个自由度;
4.双臂协同、混合智能操控和避让等算法难度大,需要高维度的规划。
其次是在成本层面。机器人的量产还得考虑软硬件的成本控制,如何随规模效应逐渐均摊成本。
但这边成本控制都还不成熟,那边市场定价就已经卷起来了。今年5月,宇树科技发布的G1人形机器人售价只要9.9万元,用得着和用不着机器人的都沉默了,因为人形机器人的定价当时还动辄在百万元的区间。结果大家还没为9.9万元这个定价吃惊多久,3.65万元售价的众擎机器人发布的专业级双足机器人SA01整机或散件套装上市,主要面向科研教育市场发售。
这种两极分化的情况就让很多机器人厂商十分为难了,而这背后反应的实际是人形机器人下游市场需求不明确的情况。这也是大部分高新技术产品市场化的问题,由于高新技术产品对技术创新有极高要求,结果满足要求的产品又太贵,所以中游厂家只能推出一个又一个便宜的版本。
还有就是,人形机器人在非结构化场景中的应用受限;由于机器人通用性不足,无法灵活应对突发事件。人形机器人的商业化落地,最需要的是一个迫切又确切的场景;以现在的局面来看,高端制造需求下的工业化场景,以及人口老龄化趋势下的生活化场景是商业化价值最高的场景。但是市场上仍缺少一个产品的典范,让大家能更直观地看到人形机器人的商业价值。
人形机器人能否真正取代人类的部分重复劳作,还有很长一段路要走;但人形机器人必然是未来的趋势,谁能把这个“故事”具象化,谁才是赢家。
本文为作者独立观点,不代表鸟哥笔记立场,未经允许不得转载。
《鸟哥笔记版权及免责申明》 如对文章、图片、字体等版权有疑问,请点击 反馈举报
Powered by QINGMOB PTE. LTD. © 2010-2022 上海青墨信息科技有限公司 沪ICP备2021034055号-6
我们致力于提供一个高质量内容的交流平台。为落实国家互联网信息办公室“依法管网、依法办网、依法上网”的要求,为完善跟帖评论自律管理,为了保护用户创造的内容、维护开放、真实、专业的平台氛围,我们团队将依据本公约中的条款对注册用户和发布在本平台的内容进行管理。平台鼓励用户创作、发布优质内容,同时也将采取必要措施管理违法、侵权或有其他不良影响的网络信息。
一、根据《网络信息内容生态治理规定》《中华人民共和国未成年人保护法》等法律法规,对以下违法、不良信息或存在危害的行为进行处理。
1. 违反法律法规的信息,主要表现为:
1)反对宪法所确定的基本原则;
2)危害国家安全,泄露国家秘密,颠覆国家政权,破坏国家统一,损害国家荣誉和利益;
3)侮辱、滥用英烈形象,歪曲、丑化、亵渎、否定英雄烈士事迹和精神,以侮辱、诽谤或者其他方式侵害英雄烈士的姓名、肖像、名誉、荣誉;
4)宣扬恐怖主义、极端主义或者煽动实施恐怖活动、极端主义活动;
5)煽动民族仇恨、民族歧视,破坏民族团结;
6)破坏国家宗教政策,宣扬邪教和封建迷信;
7)散布谣言,扰乱社会秩序,破坏社会稳定;
8)宣扬淫秽、色情、赌博、暴力、凶杀、恐怖或者教唆犯罪;
9)煽动非法集会、结社、游行、示威、聚众扰乱社会秩序;
10)侮辱或者诽谤他人,侵害他人名誉、隐私和其他合法权益;
11)通过网络以文字、图片、音视频等形式,对未成年人实施侮辱、诽谤、威胁或者恶意损害未成年人形象进行网络欺凌的;
12)危害未成年人身心健康的;
13)含有法律、行政法规禁止的其他内容;
2. 不友善:不尊重用户及其所贡献内容的信息或行为。主要表现为:
1)轻蔑:贬低、轻视他人及其劳动成果;
2)诽谤:捏造、散布虚假事实,损害他人名誉;
3)嘲讽:以比喻、夸张、侮辱性的手法对他人或其行为进行揭露或描述,以此来激怒他人;
4)挑衅:以不友好的方式激怒他人,意图使对方对自己的言论作出回应,蓄意制造事端;
5)羞辱:贬低他人的能力、行为、生理或身份特征,让对方难堪;
6)谩骂:以不文明的语言对他人进行负面评价;
7)歧视:煽动人群歧视、地域歧视等,针对他人的民族、种族、宗教、性取向、性别、年龄、地域、生理特征等身份或者归类的攻击;
8)威胁:许诺以不良的后果来迫使他人服从自己的意志;
3. 发布垃圾广告信息:以推广曝光为目的,发布影响用户体验、扰乱本网站秩序的内容,或进行相关行为。主要表现为:
1)多次发布包含售卖产品、提供服务、宣传推广内容的垃圾广告。包括但不限于以下几种形式:
2)单个帐号多次发布包含垃圾广告的内容;
3)多个广告帐号互相配合发布、传播包含垃圾广告的内容;
4)多次发布包含欺骗性外链的内容,如未注明的淘宝客链接、跳转网站等,诱骗用户点击链接
5)发布大量包含推广链接、产品、品牌等内容获取搜索引擎中的不正当曝光;
6)购买或出售帐号之间虚假地互动,发布干扰网站秩序的推广内容及相关交易。
7)发布包含欺骗性的恶意营销内容,如通过伪造经历、冒充他人等方式进行恶意营销;
8)使用特殊符号、图片等方式规避垃圾广告内容审核的广告内容。
4. 色情低俗信息,主要表现为:
1)包含自己或他人性经验的细节描述或露骨的感受描述;
2)涉及色情段子、两性笑话的低俗内容;
3)配图、头图中包含庸俗或挑逗性图片的内容;
4)带有性暗示、性挑逗等易使人产生性联想;
5)展现血腥、惊悚、残忍等致人身心不适;
6)炒作绯闻、丑闻、劣迹等;
7)宣扬低俗、庸俗、媚俗内容。
5. 不实信息,主要表现为:
1)可能存在事实性错误或者造谣等内容;
2)存在事实夸大、伪造虚假经历等误导他人的内容;
3)伪造身份、冒充他人,通过头像、用户名等个人信息暗示自己具有特定身份,或与特定机构或个人存在关联。
6. 传播封建迷信,主要表现为:
1)找人算命、测字、占卜、解梦、化解厄运、使用迷信方式治病;
2)求推荐算命看相大师;
3)针对具体风水等问题进行求助或咨询;
4)问自己或他人的八字、六爻、星盘、手相、面相、五行缺失,包括通过占卜方法问婚姻、前程、运势,东西宠物丢了能不能找回、取名改名等;
7. 文章标题党,主要表现为:
1)以各种夸张、猎奇、不合常理的表现手法等行为来诱导用户;
2)内容与标题之间存在严重不实或者原意扭曲;
3)使用夸张标题,内容与标题严重不符的。
8.「饭圈」乱象行为,主要表现为:
1)诱导未成年人应援集资、高额消费、投票打榜
2)粉丝互撕谩骂、拉踩引战、造谣攻击、人肉搜索、侵犯隐私
3)鼓动「饭圈」粉丝攀比炫富、奢靡享乐等行为
4)以号召粉丝、雇用网络水军、「养号」形式刷量控评等行为
5)通过「蹭热点」、制造话题等形式干扰舆论,影响传播秩序
9. 其他危害行为或内容,主要表现为:
1)可能引发未成年人模仿不安全行为和违反社会公德行为、诱导未成年人不良嗜好影响未成年人身心健康的;
2)不当评述自然灾害、重大事故等灾难的;
3)美化、粉饰侵略战争行为的;
4)法律、行政法规禁止,或可能对网络生态造成不良影响的其他内容。
二、违规处罚
本网站通过主动发现和接受用户举报两种方式收集违规行为信息。所有有意的降低内容质量、伤害平台氛围及欺凌未成年人或危害未成年人身心健康的行为都是不能容忍的。
当一个用户发布违规内容时,本网站将依据相关用户违规情节严重程度,对帐号进行禁言 1 天、7 天、15 天直至永久禁言或封停账号的处罚。当涉及欺凌未成年人、危害未成年人身心健康、通过作弊手段注册、使用帐号,或者滥用多个帐号发布违规内容时,本网站将加重处罚。
三、申诉
随着平台管理经验的不断丰富,本网站出于维护本网站氛围和秩序的目的,将不断完善本公约。
如果本网站用户对本网站基于本公约规定做出的处理有异议,可以通过「建议反馈」功能向本网站进行反馈。
(规则的最终解释权归属本网站所有)