为期五天的“2024世界机器人大会”(WRC)刚刚落下帷幕。《中国经营报》记者从大会主办方获悉,近170家企业的600多款产品在大会上展示,首发新品超过60款,其中有27款人形机器人集中亮相,成为风头最盛的“主角”。大会参观人数近25万人次。与此同时,来自全球10余个国家的1.3万名选手参加了同期举办的“2024世界机器人大赛”。
与这些数据可以相互印证的是,记者连日在世界机器人大会现场采访了多位来自高校、科研机构、产业界的人士,同时在博览会上随机采访了多名观众,大多数受访者被问及感受时使用了“热”一词:产业“火热”,参与企业的产品数量创历年纪录;产品“热闹”,不仅形态各式各样,而且技能从做咖啡、冰淇淋、煎饼果子,到叠衣服和收纳物品,再到爬楼梯、做俯卧撑、打乒乓球等,以及参与汽车制造;观众“热情”,表明机器人“出圈”获得社会大众的高度关注。
热闹与喧嚣过后,摆在机器人尤其是人形机器人面前的依然是技术创新难题与商业化考验:人形机器人现在究竟发展到何种程度了?它距离真正的爆发还有多远?
现阶段只是“具身技能”
在世界机器人大会现场,记者观察了二十几款公开展示的人形机器人产品。根据它们的现场演示及介绍,其“技能”大致都可以划归为两类:一类是娱乐互动,比如EX机器人打造的“诺贝尔”“苏轼”、星尘智能展示书法、智元机器人打招呼、帕西尼感知科技“比心”等;另一类是运动控制,比如科大讯飞(34.390, 0.80, 2.38%)机器人拿取可乐、优必选Walker搬运物品箱、逐际动力爬坡行走、银河通用收纳物品等。
尽管具身智能已成为业内耳熟能详的热门词,中关村(3.960, 0.04, 1.02%)智友研究院院长、北京航空航天大学机器人研究所所长王田苗教授指出,此次大会上展示的大部分机器人是垂直领域的“具身技能”。现阶段,对于具身智能机器人或人形机器人,业界基本停留在通用领域的探索上。
在王田苗看来,人形机器人还处在攻关阶段,目前有两个问题值得特别关注:一是机器人的软件,新一波具身智能的浪潮是由AI大模型、生成式AI来驱动的,大模型如何赋能机器人,实现人机交互,将复杂任务拆解为子任务;二是各种子任务和现实中的物理空间的结合,需要视觉模型、触觉模型,没有视觉就没有空间的认知与推理,没有触觉,则很难完成精细的操作。
以灵巧手为例,王田苗告诉本报记者,具身智能的下肢是轮式还是双足式,目前还有争论。但从上肢来看,无论是在家庭场景中叠衣服、装电池、陪护老人,还是在工业制造中搬运货物、组装汽车等,灵巧手都起着重要作用。灵巧手上有各种各样的传感器,由此生成各种各样的数据,这些数据又要与控制结合形成闭环,因此在结构、感知以及成本方面都有诸多有待解决的挑战。
蓝驰创投合伙人曹巍指出,现在的机器人本体,无论是外观形态、感知能力、运动能力等,都是五花八门,并没有一个行业性的指引规范或统一标准。“这可以类比移动互联网早期涌现的各种应用,其竞争点在于适配能力——适配上百款手机。当下机器人赛道类似,还没有一个真正的爆款产品去引领行业标准,未来三五年或将出现爆款产品,届时会引领或推动行业性的标准建立,将硬件的水平拉动起来,在硬件层面达成共识。”
全国政协常委、致公党中央副主席、全国妇联副主席、中国电子学会理事长徐晓兰表示,人形机器人是AI+机器人的产物,是多学科交叉融合的集大成者。其“根技术”领域涵盖通用人形机器人、大模型、动力学模型以及控制、多模态感知与环境建模智能的人机交互、多智能体的协作等,同时还涉及类脑感知与认知的基础理论,以及新材料、新工艺、新结构、电子皮肤等领域。
北京具身智能机器人创新中心总经理熊友军认为,具身智能其实刚刚开始,它面临四个方面的挑战:首先,缺少高性能的具身智能本体,无论是各种具身智能的传感器、执行器还是整个身体,都有很多需要完善的地方;其次,具身智能的运动能力是不足的,尤其体现在对环境的适应性、操作能力方面,还有很大改进的空间;再次,具身智能大模型和多模态大模型算法的能力是不足的;最后,缺乏具有智能领域统一的通用数据集。就像传统人工智能一样,现在传统人工智能大量的语音智能或者是视觉智能这方面,得益于互联网上大量语音的数据和文字的数据。同样在具身智能领域也需要大量操作的数据,需要大量行为的数据来丰富具身智能的算法,甚至是具身智能数据集的标准,实际上都是缺少的。
何时真正“爆发”
不难看出,作为多学科技术交叉与集成的人形机器人,从头到脚、由里到外,各项技术都还在迭代升级中,关键技术的突破并非一蹴而就。那么,人形机器人真正走出实验室,实现规模化应用,迎来产业大爆发,究竟还需要多久?
“今年大家都把机器人拿出来展示,在商业和技术上进行大面积的尝试,到明后年应该会出现很多尝试过的结果,有的东西会留下,有的东西会迭代发展,这样会产生很多新的应用。人形机器人作为创新产品,不仅仅是替代现有的人,而且能够在很多新的领域创造新的就业机会,产生新的应用。”清华大学自动化系研究员、机器人控制实验室主任赵明国在接受记者采访时如是指出。
从2023年年初涉足人形机器人赛道的宇树科技创始人兼CEO王兴兴透露,该公司的第二款人形机器人G1近期已经快完成量产化的设计改造,到今年年底可以大规模量产。今年5月,宇树科技旗下G1在国内及海外的电商平台上线,凭借9.9万元的零售价格引发了国内外的高度关注。在王兴兴看来,距离业界讨论较多的人形机器人“iPhone时刻”,人形机器人还有一段时间,但不会超过五年。
由清华大学交叉信息研究院孵化的通用人形机器人企业星动纪元创始人陈建宇则认为,在接下来的五年里,深度学习、大模型等人工智能技术会取得非常大的进展,同时会非常深入地与人形机器人、具身智能融合起来,“可能会在五年内迎来机器人的‘ChatGPT时刻’”。
不同于宇树科技、星动纪元等人形机器人赛道的“新秀”,较早布局人形机器人赛道的优必选被业内视为已经“熬”过了上一个周期。优必选在本次世界机器人大会上展示了“人形机器人工业场景解决方案”,现场执行了质检、搬运、分拣等任务。优必选方面透露,该公司已经与汽车企业东风柳汽、吉利汽车等,3C企业富士康、物流企业顺丰达成合作,构建人形机器人应用生态。目前,其工业版人形机器人Walker S系列已经进入国内多家新能源汽车整车组装产线实训。需要指出的是,优必选人形机器人在工业场景的商业化成果方面还有待时间的检验。
备受关注的特斯拉旗下人形机器人Optimus虽然亮相了本届世界机器人大会,但现场并没有展示真实“技能”。按照特斯拉CEO埃隆·马斯克此前的说法,特斯拉计划从2025年开始小批量生产人形机器人,其长远目标是每年生产1亿台机器人,占据市场份额的10%以上,预计未来人形机器人与人类的比例可能是2∶1。
在浙江人形机器人创新中心首席科学家熊蓉看来,未来十年甚至更长时间里,如果把机器人的总量看作100%,那么随着相关技术问题的解决,是能够使人形机器人的占比超过50%的。当人形机器人成为一个通用泛化的本体时,不同企业的差别可能表现在人形机器人的设计方面,会构建起繁荣的生态。这类似于现在智能手机会有不同的品牌厂商,但手机里还有更多的App应用。
本报记者 曲忠芳 北京报道