4月29日,第八届数字中国建设峰会数字经济分论坛举行。杭州宇树科技有限公司董事王其鑫发表演讲,他表示2024年国内具身/人形项目融资突破100亿元,人形机器人有望走进千家万户。王其鑫认为,实现具身智能需分三步:建立具身认知系统、实现自主决策规划、目标驱动与物理世界精确交互。
每经记者 赵李南 每经编辑 魏官红
4月29日,第八届数字中国建设峰会开幕。
由国家数据局主办,国家数据发展研究院、国家发展改革委城市和小城镇改革发展中心、中国信息通信研究院等承办的数字中国建设峰会数字经济分论坛在同日举行。
杭州宇树科技有限公司(以下简称宇树科技)董事王其鑫发表了主题演讲。王其鑫表示,2024年国内的具身/人形项目融资突破100亿元,在可展望的未来,人形机器人会走进千家万户。
王其鑫认为,以人形机器人实现具身智能在技术路线上的发展可分为三步。第一,建立第一视角下灵活的具身认知系统;第二,实现高度自主的决策规划能力;第三,实现目标驱动与物理世界的精确运动交互。
王其鑫介绍称,目前宇树科技的产品分为消费级和行业级的机器人。
“消费级的机器人就是普通消费者可以买回去(使用),比如帮你取外卖、取快递,跑步帮你背个水,买菜帮你背包,做一些简单的事情,售价也会比较便宜,在天猫、京东就可以直接下单购买。”王其鑫表示。
王其鑫称,宇树科技主要的销售来源其实是工业端。“我们工业级的四足机器人,它可以在电力巡检、消防救援、园区安防等领域提供服务。一般应用场景都是一些有毒气、辐射或者是特别恶劣的环境里,为人类减轻负担。”王其鑫称。
对于目前AI(人工智能)的发展,王其鑫认为会分成三个阶段。“首先是弱AI阶段,指的是只能做一些单一领域工作的人工智能系统,比如谷歌的阿尔法狗(即AlphaGo)围棋系统。”
“下一个阶段是强AI,但是目前还没有达到强AI阶段,强AI除了在特定领域有一些应用,可以做到很智能的程度,同时具备一定的学习能力,具备比较广泛的智能能力。虽然说现在没有达到强AI阶段,但是我们看到这两年AI大模型发展得比较火热,AI大模型的非提前预设‘涌现能力’,是我们迈向强AI的一个重要的发展阶段。”王其鑫称。
王其鑫继续说道:“最后一个阶段就是AGI——通用人工智能,是指AI能够完全模仿人类的智能行为,比如说它可以实现自我学习、自我改进、自我调整等,目前来看只能在一些科幻作品里面看到这样的概念,但是AGI的实现是非常有可能的,实现它的途径之一必然是具身智能。”
王其鑫解释,具身智能是融合了身体感知、环境交互和运动能力的综合性概念。具身智能非常强调身体在智能行为当中的重要性,即必须要有一个智能体通过身体来感知周围的环境,比如具有视觉、嗅觉、听觉等,获取到了环境信息之后,再做出一些决策和改变,进一步跟环境进行交互,从而进行学习。
“具身智能在生活里面有很多应用案例,只不过(目前)都比较初级。”王其鑫举例称,比如医疗机器人,它可以缝合一个生鸡蛋,它是在感知到包裹蛋液的非常脆弱的外皮之后,还可以完美地把它缝合起来。
“比如说服务机器人,我们宇树的机器人去年在泰山清运垃圾。比如说工业机器人,我们看到汽车工厂里有很多机械臂,可以帮助(人类)减轻工作负担,这都属于具身智能的范畴。自动驾驶汽车同样属于这个领域,比如说它现在已经有非常强的感知能力,能够适应道路的变换、识别人行马路等,这些其实都是具身智能的应用案例,只不过目前还不是特别高级的具身智能。”王其鑫表示。
“(业内)大家有一个共识,就是我们(国家)在具身智能领域其实是并不弱于发达国家,因为我们有非常完善的产业链,所以说我们在这一方面其实并不差。尤其是美国硅谷精英,他们并不太愿意去做硬件产品,他们更喜欢做软件,这就是我们的机会。”王其鑫表示。
“其实国内在具身智能领域已经有很多新公司涌现出来了,比如,仅2024年就有百亿元的融资,要知道这里面大部分的公司其实都是初创企业。”王其鑫表示。
图片来源:每经记者 赵李南 摄
王其鑫认为,人形机器人应该是具身智能最好的形态之一。如果想要用人形机器人实现具身智能,要分三步走。
“第一步先要产生认知。举一个例子,国外一个研究团队基于宇树的人形机器人做的一个全身(实时控制)的遥控操作系统,这个技术方案我们也已经开源了一部分,它可以帮助机器人迅速认识我们周围的环境。”王其鑫表示。
“第二步是让机器人具有决策能力。卡内基梅隆大学基于宇树提出WoCoCo框架,解决了人形机器人顺序接触任务执行难题。这个框架可以有效帮助机器人迅速完成决策,比如,机器人可以在跳箱子的过程中自动决策自己的路线。”王其鑫表示。
王其鑫继续说道:“第三步就是交互。斯坦福大学基于我们人形机器人发表的一篇论文是(关于)跟踪和模仿人类,可以看到我们的机器人可以认知到很多细节问题。比如在开柜门的时候,它可以拉到柜门的门把手;在叠衣服的时候,它可以准确地交互到衣角、衣袖,完成叠衣服的过程。”
王其鑫也介绍了宇树科技的技术路线。“我们首先会基于人类的行为视频,或者是动作捕捉数据等,来构建我们人形机器人(所需要的)海量行为数据库,通过并行仿真和训练平台可以很好地实现基于强化学习的端到端的运动控制技术,这都是要基于我们数据平台来实现的。”王其鑫表示。
展望未来,王其鑫认为,具身智能的实现需要两到三个阶段。
“第一个阶段是可能会先应用在工业领域,比如一些特种行业、制造行业等,让机器人去做一些复杂、沉重的事情。在迈向民用阶段之前可能还会有一个商业阶段,比如零售业、康养业可能会让机器人先做一些工作,最终我们一定是希望人形机器人进入千家万户,来为我们每一个人提供帮助。”王其鑫表示。
封面图片来源:视觉中国-VCG31N2203664811
1本文为《每日经济新闻》原创作品。
2 未经《每日经济新闻》授权,不得以任何方式加以使用,包括但不限于转载、摘编、复制或建立镜像等,违者必究。