5至10年后将有重大突破,商业落地蓄势待发

作者:沈逸斌,IT时报

责任编辑:孙艳

“桌子有点乱,你能帮忙收拾一下吗?”

“好的,我正在清理你的桌子。”

听到指令后,“青龙”一边回答,一边慢慢抬起双臂,用双手慢慢地、轻轻地抓起桌上混合着的面包和水果澳门精准三肖三码三期内必出,放进左右的篮子里。即使是松软的面包也不会变形。此次人形机器人与具身智能发展论坛上展示的“青龙”人形智能机器人,不仅具备识别认知能力,身高185厘米,体重80公斤,堪称机器人界的“帅哥”。

从众多国内外机器人企业展出的“十八大金刚”,到畅想机器人发展前景的各类论坛,人形机器人、具身智能已经成为2024年世界人工智能大会(WAIC 2024)当之无愧的“顶流”。据主办方数据显示,本次大会展出的人形机器人超过25款。大热的人形机器人赛道正迎来商业化转化的关键时刻。

但冷静思考,人形机器人发展仍面临诸多挑战。上海人形机器人制造业创新中心首席科学家姜雷表示,目前人形机器人面临的问题可以概括为“一高五难”:硬件门槛高、软件算法难、软硬件解耦难、知识积累难、人才聚集难、安全应用难。

人形机器人和具身智能的现状如何?何时实现商业化?人形机器人又该如何遵循“机器人三定律”?带着这些问题,我们将在WAIC 2024走进人形机器人的“世界”。

人形机器人应按重量出售

人形机器人由控制器、传感器、精密减速器、交流伺服电机等核心部件组成,每个部件的成本都很大。

根据2023年发布的报告,目前人形机器人的硬件总成本约为5万美元。其中,端到端AI软件大脑、传感器和芯片、伺服电机和电机驱动器各花费1万美元实践经验(2024年新奥开什么今晚)按重量出售的人形机器人,惯性测量单元和扭矩传感器花费5000美元,精密减速器花费8000美元,电池和电池控制系统花费2000美元,其他部件花费约5000美元。

以色列智能机器人中心主席尤西·拉哈德在人形机器人前沿论坛上表示,人形机器人要想得到广泛应用,其成本需要降低到 2 万美元以下,不到目前成本的一半,甚至可能需要对机器人的外观做出一些改变,比如重新考虑模仿人类腿部的底座设计。特斯拉计划明年量产这款机器人,预计成本在 1 万美元左右,预计售价为 2 万美元。

相比之下,国产人形机器人价格已降至10万元以内。今年5月,宇树科技发布的最新人形机器人产品G1,市场售价仅为9.9万元。“我们一直认为,未来人形机器人应该像猪肉一样,按磅卖。”宇树科技联合创始人陈力在“国际人形机器人技术与应用发展论坛”上表示,除去研发成本,人形机器人其实就是铁、钢、铜等材料的堆砌,随着零部件的量产,成本自然会下降。

《2024年中国仿生机器人行业研究报告》指出,仿生机器人成本降低按照量产规模大致可分为三个阶段:数千台的小批量生产,成本降低20%~30%,约10万美元;1万台,成本降低50%,约5万美元;数十万台至数百万台的大规模量产,成本降低70%~80%,约2~3万美元。一时间,人们觉得仿生机器人商业化指日可待。

但需要注意的是,G1与G2的区别在于它没有大型车型,如果以智能化的标准来衡量,特斯拉仍然可以作为行业标杆之一。

成本不仅仅来自硬件

硬件是人形机器人最直观的成本,但降低成本不能单纯依靠硬件的量产。

“我觉得降低硬件成本已经不再是主要问题,而是时间问题,设计、研发的成本才是人形机器人当前需要攻克的成本问题。”国讯新威董事长方婷婷在论坛上表示,我国在人形机器人领域很多核心技术依赖国外进口,比如人形机器人仿真工具平台等。

从人形机器人软件角度来看,大量跨学科内容需要与软件融合,需要更多相关行业企业共同努力。人形机器人厂商在设计之初也必须考虑软件和硬件的成本。

鑫精诚传感器董事长吴浩认为,集成化也是降低人形机器人成本的一种方式。例如灵巧手方面,人的手指可以感知温度、力度等,人形机器人的传感器也可以借鉴这一点,将多模态感知集成在同一个部件上,这样不仅可以降低成本,还可以缩小体积。

人形机器人会在哪些应用场景爆发呢?在B端场景,开普勒CEO胡德波认为,第一类是工业场景,特别是重工业,工人安全得不到保障,用工成本高,适合人形机器人替代;第二类是仓储物流场景,这可能是最快落地的场景之一;第三类是制造业,比如3C制造、汽车制造等。业内人士对C端场景应用已经达成共识,人形机器人将走进千家万户,赋能养老、育儿等场景。

根据高盛最新预测,到2035年,人形机器人将迎来爆发式增长,出货量将达到140万台,全球总市场规模(TAM)将达到380亿美元。从事物流和制造业的人形机器人数量将在2030年左右达到100万台,人形机器人有望在十年内进入服务、家庭护理、健康和教育行业。

5至10年后实现重大突破

如今的人工智能就像是被封在瓶子里的“大脑”,虽然可以计算、思考,却无法采取行动。具身智能是智能系统或机器通过感官交互与环境进行实时交互的能力。通俗的理解是为人工智能打造一个可控的躯体,包括四足机器狗、工业机器人、动物仿生机器人、自动驾驶汽车等形态。但人形机器人的人形形态更能满足人们的交互需求,无疑是具身智能的最佳载体。

中国工程院外籍院士张建伟在仿生机器人与具身智能发展论坛上表示,实现具身智能需要在三个维度上实现突破:空间维度,在开放、复杂、动态的空间环境下实现二维、三维的动态语义建模;时间维度,除了简单的移动,还要具备操作、使用工具的能力;交互能力,让机器人能够基于知识做出与人、与环境正确的交互行为。这依赖的是AI大模型。

仅依靠大型模型进行感知和规划并不能使化身真正拥有智能。添加“小脑”将使其能够执行动作。

以“青龙”为例,具身大脑“朱雀”以大的多模态模型为核心,以文本信息、图像信息作为输入,输出语音交互、任务决策信息;“玄武”小脑模型为具体的任务执行模型;轨迹规划模块以端到端的模仿学习为驱动,以人的操作为模仿对象,进行机载视觉输入,输出预期的动作轨迹;运动控制器基于强化学习的智能运动控制方法和全身动力学的模型预测控制方法两条技术路径,通过环境信息和机器人自身状态完成任务执行。

尽管大型AI模型已经开始“移植”到具身智能,但效果并不理想。“青龙”机器人平台技术总监梁振杰坦言,该模型还处于早期研发阶段,功能尚不完善,能力还有待提升。

宇树科技CEO王星星在论坛上表示,当前的大语言模型、多模态模型对整个世界的理解非常差,包括时间、空间、物理规律等等,世界模型+具身智能才是通向AGI的最佳路径。

上海人工智能实验室主任、首席科学家周博文也认为,具身智能不只是大模型加机器人的应用,而是大模型需要根据物理世界的反馈,及时进行演化。

不过,业界对人形机器人和具身智能未来的发展,还是持积极开放的态度。“未来5年肯定会有大的技术突破,肯定不会超过10年”,王星星预测。国地共建人形机器人创新中心总经理徐斌也表示,相关人形机器人包括大脑、小脑、四肢等全栈技术都会开源,5到10年后,会在人类家政服务、沟通护理等领域有更多应用。

大规模数据是最大痛点

数据是人工智能和具身智能的灵魂,目前人形机器人的主要数据来源是国外的开源数据以及研发机构通过动作捕捉、视觉捕捉等方式采集的数据。

但自行回收往往需要大量的人力成本和不断的模拟演示。北京大学助理教授、银河具身智能联合实验室主任王鹤在人形机器人与具身智能发展论坛上举了一个例子,称把电池放进箱子里对人来说是很简单的动作,但特斯拉却靠40人的回收团队,远程操控,把倾斜、跌落、错位等所有故障案例都收集起来。

“人形机器人的大规模数据是目前整个行业最大的痛点。”国家地方共建人形机器人创新中心研发体系总监幸博阳也同样表示。

面对这一行业痛点,王鹤认为,真正能够规模化量产的数据是合成数据。所谓合成数据,就是通过算法生成的数据,虽然和真实数据类似,但并非直接来自于现实世界。

从0到1的突破,是用合成数据体现智能。在训练银河万能机器人的过程中,发现二维传感器存在泛化问题,不会处理训练数据以外的任何东西;三维传感器无法识别玻璃等透明物体。最终,通过千万级场景、数十亿次抓取的合成数据进行大规模训练,银河万能机器人能够随心所欲地抓取任何物体。

国地共建仿生机器人创新中心代表刑博阳主张通过开源数据,实现海量数据共享,为此成立开源社区,通过社区和训练场的创新机制,加速仿生机器人相关工作,具体包括智能训练、数据集建设等。

缺乏发展是最大的不安全

人形机器人不再是科幻小说中的幻想,而是已经融入我们日常生活的现实。试想未来,人形机器人会穿梭在繁华城市的大街小巷,在工厂、医院里按照系统指令一步步工作,这将改变人们的生活方式和社会结构。伴随这一技术进步而来的,是人形机器人治理的思考与挑战。

“高铁刚来到中国的时候,很多人担心电磁辐射;飞机、电话等早期发明也曾被人们担忧。可以说,人类进步史就是一部担忧科技发展史。我们应该制定一部法律来促进人工智能的发展,而不是制定一部法律来规范人工智能的行为。”在人形机器人法治与伦理论坛上,中国政法大学副校长史建中表示,面对担忧,我们不应过度焦虑,而应采取包容、谨慎的态度对待人工智能,这体现在训练数据的便捷获取、算力与算法的合作鼓励、生成内容的宽容和对错误的及时修正等方面。

联合国人工智能高级别咨询机构委员、中国政法大学数据法治研究院教授张凌涵也表示,不发展就是最大的不安全感,要竭尽全力推动人工智能发展。

“它就像一个一岁半的孩子,需要我们正确的引导。”华东师范大学人工智能与金融学院院长、教授邵逸磊表示,目前,人形机器人在人工智能的支撑下,已经具备感知智能、认知智能,而最后要攻克的“堡垒”则是行为智能。当人形机器人行为出现在人类社会中,是对人类身份和规律的挑战,不仅需要对人形机器人的身份进行界定,还需要人类对其行为进行引导和约束。

如何协调机器人与人类的互动?阿西莫夫的“机器人三定律”曾被视为基本规范。但随着具身智能时代的到来,这样的“三定律”已无法解决人机共生的复杂问题,需要新的法律治理框架。

中国海洋大学法学院教授李胜在《东方法学》人形机器人法治专刊中表示,治理架构需要立足于人形机器人与人类的差距,考虑现阶段发展的应用问题,而不是着眼于未来人形机器人取代人类后出现的问题。

策划/季嘉英

图片/IT Times WAIC

来源:IT时报官方账号

结尾