本刊记者 张燕 郑雪 宋杰 郭志强 牛朝阁
迎宾的、闲谈的、端茶倒水的、写诗作画的……在近来举行的2025中关村论坛年会上,“忙里忙外”的机器人成为现场最大的亮点,组团上演了一场科技秀。
曩昔几个月,人形机器人频频露脸于各个舞台,大展绝技:在春晚舞台上扭秧歌,在交际平台上跳舞、翻跟头,在工厂里“拧螺丝”,在群众视界中弹琴、端茶倒水……似乎一夜之间,一轮技能剧变的浪潮汹涌袭来,将咱们迅猛卷进从前只存在于科幻小说中的未来国际。
实践上,机器人技能的展开进程正不断提速。从1973年日本早稻田大学研制的WABOT-1诞生至今,人形机器人的研讨范式不断改变。现在,人形机器人被视为完结具身智能的最佳载体之一。
所谓具身智能,望文生义即“具有身体(物理载体)的智能(能感知交互和会学习考虑)”,而人形机器人无疑是最重要、最受等待的完结方法之一。
2023年10月,工信部印发的《人形机器人立异展开辅导定见》就已将人形机器人精准定位为“集成人工智能、高端制作、新资料等先进技能,有望成为继核算机、智能手机、新能源轿车后的又一颠覆性产品,它将深入革新人类动身生活方法,重塑全球工业展开格式”。
本年全国两会上,“具身智能”初次被写入政府作业陈述。一起,据记者核算,“具身智能”也呈现在了全国6个省份的2025年政府作业陈述中。
工业链协同打破前沿技能
感知、计划、举动,这一进程恰似人类与国际的互动形式。人形机器人亦是如此,凭仗摄像头、雷达等设备感知外界,借由大模型与算法进行剖析并作出决议计划,终究依托由履行器构成的肢体付诸举动。
从工业视点来看,人形机器人首要依托三大中心组件:“大脑”、“小脑”与本体。“大脑”司职高层决议计划以及智能信息处理;“小脑”专心于运动控制;本体则作为机器人的物理载体,实在承当详细的运动使命。
细腻的皮肤、活络的手,机器人正“进化”得越来越像实在人类。
人形机器人运用活络手抓握樱桃模型
数据搜集人员穿戴动作捕捉设备,“教”机器人做各种家务。
顾客下单后,机器人能够为顾客自主取送指定产品。本刊首席摄影记者 肖翊I摄
让机器人递水比跳舞更难
与其他形状的机器人比较,人形机器人的优势就在于未来与人类社会交互并履行使命。这也使得运动控制成为首要需处理的问题。
物理国际的杂乱性要求“小脑”系统在练习进程中,必须将各式各样不同的环境变量归入考量规划。尤其是双足行走,每一次迈出的脚步,都会产生不确认性:地上或许湿滑、物体或许具有弹性、摩擦系数也处于动态改变之中,这些要素均会对机器人的平衡感和判别才干构成搅扰。
在一次揭露采访中,宇树科技创始人王兴兴泄漏自己从前并不看好人形机器人。彼时的算法水平还缺乏以支撑人形机器人应对杂乱多变的环境。但是,人工智能的迅猛展开,为人形机器人前进带来了质的腾跃。现在,机器人研制者不再需求编写程序来操作机器人,而是能够经过大模型,让机器人不断学习传感器同步的实时数据,进一步完善运动控制,使人形机器人的平衡控制、动态功用更高。
“人形机器人之所以称为机器人范畴最难霸占的类型,就在于其运动控制的门槛极高。若无法做好运动控制,底子不具有进入该范畴竞赛的资历。”乐聚机器人副总裁柯真东对记者表明,人形机器人的构型极为杂乱,身上关节数量少则十几个,多则40多个。要用一套算法一起精准控制40多个关节,还要保证机器人在运动进程中不会倾倒,且动作滑润、和婉,这使得机器人的建模进程充溢应战。柯真东直言:当下,各家机器人在运动控制方面的差异,已成为摆开互相间隔的要害要素。
关于人形机器人,学会行走仅仅运动控制的第一步。从工业化视角看,双臂与手的协同操作才干才是重中之重。优必选首席品牌官谭旻指出,未来两三年,机器人职业竞赛焦点将会集在上半身,而非下半身。
在运动控制范畴,“活络手”被业界公以为最难打破的部分。解剖学研讨闪现,算上手腕,人类双手具有27个自由度(编者注:自由度是机器人常见术语,指它的各个关节能够在三维空间中独立移动的方向和视点的数量,自由度越高,机器人越活络),能组合出超300种根底动作形式,这种多维度协同让人类得以完结系鞋带、弹钢琴等精细杂乱使命。
宇树科技供给给记者的一段视频中闪现,该公司最新发布的Unitree Dex5活络手,具有单手20自由度(16自动+4被迫)以及单手94个活络触点,能够完结打扑克、玩仿照、翻书等动作。在论坛现场,记者还亲眼看到了灵心巧手Linkerbot人形机器人用双手演奏钢琴与电笛的精彩体现。
“活络手作为机器人的结尾履行器,想要完美复刻人手结构与功用是十分难的,它需求具有强壮的才干,履行捏、拿、握等种种精细操作,这联系到杂乱的结构规划和精细的控制问题。”灵心巧手(北京)科技有限公司联合创始人张延柏对记者表明,当时常见的人形机器人一般设有16~18个首要关节,而他们公司研制的单只活络手,就具有21个自动关节。
张延柏以为,现在活络手研制面对许多实践应战,如部件强度与自重平衡、传感技能精度、数据搜集功率与准确性、学习算法优化等。这些要素不只影响优质活络手的功用与实践可用性,还联系开发本钱、运用本钱,乃至决议其能否大规划量产与广泛运用。
关节自由度之外,触觉传感器的相关技能也相同决议着活络手的胜败。人类历经绵长的进化进程,才展开出对物体的力觉感知和形状感知才干。而机器人只能依托机器硬件以及算法来作出判别,其间的技能难度显而易见。
在上海清宝引擎机器人测验中心,一台约1.6米高的双足人形机器人正流畅地摇摆双臂,随同音乐跳起一段机械舞,关节活动时的纤细动静与精准动作引得在场人员惊叹。
“它的往复精度到达±0.05毫米,全球能做到这种水平的屈指可数。”公司董事长王磊说话间,机器人转向观众,眼部高清摄像头捕捉到记者表情后,闪现屏马上闪现浅笑。在这台机器人旁,另一台装备皮肤、五官的机器人,也在同步回应记者动作。王磊称,它的眼皮、眉毛、嘴唇均可活络运动,能依据对话方针心情切换16种表情。
即使动作精准度如此之高,王磊仍坦言:“让机器人像人相同递一杯水,需交融视觉辨认、运动控制和智能决议计划,难度比跳舞高出10倍。”
让机器人“大脑”更“灵光”
在中关村论坛现场,仿生交互机器人妮娅凭仗传神的形象与细腻的表情,招引了很多参会者的围观与互动。
北京清飞科技创始人、CEO魏宇飞向记者介绍,妮娅是清飞科技研制的仿生交互型机器人,在中关村论坛年会中承当接待作业。除了语音互动,妮娅还能经过调查人类表情感知心情反应,让交互进程愈加天然、人道化。“这也是仿生人形机器人最大的亮点,它十分通人道,不只智商高,还很有眼力见儿。”魏宇飞说道。
在这些语音交互、表情交互的背面,发挥要害作用的正是人形机器人的“大脑”。
在人工智能诞生前,人形机器人的“大脑”是一系列精细设定的方程式,尽管经过精细核算,但因为难以包含一切变量,机器人间隔实在含义上的“考虑”仍有很大间隔。现在,大部分人形机器人选用VLA模型(Vision-Language-Action Model,即视觉—言语—动作模型),能够从视觉感知动身,经过学习知晓怎样举动,完结业界所说的“端对端”作用。
视觉感知是VLA模型的重要组成部分。视比特机器人副总裁刘婷婷介绍,深度相机是当时人形机器人的干流视觉计划,包含结构光、ToF、多目视觉三类。现在国内在视觉感知方面,不管是价格仍是技能都十分老练。
但是,就现在人形机器人的展开状况而言,视觉感知到举动履行之间仍存在必定间隔。穹彻智能联合创始人卢策吾指出,当时常见的VLA模型存在两大杰出问题:一是缺少对国际的了解才干;二是在结尾履行环节,空间不确认性较大。
刘婷婷也向记者坦言:“将人工智能技能运用于人形机器人范畴,现在面对的最大问题是泛化才干缺乏。人工智能系统在特定场景中经过充沛练习后体现杰出,但一旦置于不同场景,运转就会堕入紊乱,无法有用习惯新环境并完结使命。VLA大模型虽为机器人“大脑”的干流构建方法,但以此控制机器人,其泛化性和活络性仍有很大提高空间。”
“泛化”是业界谈及人形机器人“大脑”时频频呈现的词汇。泛化意味着机器人有才干完结未学习过的使命,或许是触类旁通,也或许是依据了解履行更杂乱的使命。例如履行使命时,若光影布景、物体品种、空间方位等产生改变,乃至使命进程遭到人为搅扰,机器人也应具有应对才干,这正是泛化需求霸占的难题。
让机器人包办家务,是人们对人形机器人的开端想象。但是,即使机器人能够完结高难度武打动作、创作出美丽诗词,厨房里的一个脏碗却或许让它束手无策。人类凭仗直觉就能判别碗的原料、分量、油污程度,并依据水流状况天然地做出清洗动作。而机器人则需经过视觉或触觉逐渐辨认这些信息,再核算出适宜动作,这种感知与运动的杂乱性超出了当时技能才干规划。
爱观视觉投融资担任人刘昊对记者表明,未来人形机器人将由三大板块构成:本体系统(包含运动控制与活络手)、感知系统(视觉、听觉及传感器)及后端处理系统(大模型或“大脑”)。他着重,当时职业仍处于各板块独立展开阶段,没有构成高效整合。“实在完结人形机器人的全面代替,需求这三部分协同演进。”
伽南科技(北京)有限公司品牌总监梁骐钧直言:“人形机器人的展开仍需很多时刻,还有很长的路要走。”她进一步表明,当下人形机器人企业多聚集于本体的开发和身体控制研制,尽管现在人形机器人在智能(“大脑”)方面存在短缺,但有一天人形机器人能接入“大脑”时,此前练习出的杰出身体机能便能与之更好地协同合作。
“无论是我国仍是全球规划,在软件层面,即机器人的大脑老练度方面,都尚处于前期阶段,未来的探究之路还很绵长。” 刘婷婷说道。
机器人也需求不断练习
在坐落首钢园的人形机器人数据练习中心,超百台机器人具有各自不同的“工位”,它们每天都在这儿重复进行百余次练习。
记者在练习中心看到,人形机器人现已展开了在不同场景下的模仿运用,比方采摘果实、叠衣服、擦家具等场景,而机器人周围,则站着它们的“教师”——人形机器人练习员。他们控制机器人,以极端纤细的动作渐渐“教”会机器人从一个个分化动作开端,了解完结一整套连接动作。
“相当于咱们的作业员在教这个机器人怎样操作,怎样完结使命。在完结这个使命的时分,机器人能够记载各种数据,比方相机的、手机的、底盘的或者是结尾履行器的。”人形机器人数据练习中心担任人张钦锋介绍,为了让机器人具有在不同场景“触类旁通”的泛化才干,搜集员要不断地调试环境。
在上海,智元机器人相同具有一个相似的数据收会集心。4000平方米的厂房中,树立出家居、餐厅、工业、商超、作业五大类场景,包含超越200个细分场景的使命。在这些场景中,数百名数据搜集员头戴VR眼镜、手持操作手柄指挥着机器人进行各种动作。
“智元机器人的模型练习道路与言语大模型比较相似。最开端是预练习,该阶段运用尽量多的数据进行练习,构成对环境的根本感知等,之后从中搜集数百条高质量数据。练习的一起也会做一些泛化,比方倒水的动作,咱们会对水壶、桌面、光照等进行替换,对拿放方位及倒水姿势进行调整等,大约数百条数据能让机器人完结比较好的倒水作用。”智元机器人合伙人、具身业务部总裁姚卯青说道。
数据练习或许能处理泛化的难题。但与此一起,人形机器人在技能上还面对一些其他瓶颈:电池续航、自我负载、机械结构的活络性及稳定性等。
以电池续航为例。依据我国信通院发布的《人形机器人工业展开研讨陈述(2024年)》,人形机器人需求高功用电源来供给耐久的动力。我国现在大部分人形机器人的运转时刻一般为2至4小时。
一方面,人形机器人的体积有限,对其能够带着的电池容量和分量都提出了要求;另一方面,越是对人形机器人提出高要求的动作需求,其所需求的电量耗能更多。跟着“大脑”技能逐渐老练,人形机器人将装备更高档的传感器、更杂乱的控制系统、数量更多的芯片,能耗问题将进一步凸显。
“咱们估量,未来两到三年,硬件方面的问题将逐渐得到处理,相关标准会趋于一致。到时,人形机器人企业的中心竞赛力将更多体现在场景数据的堆集、智能算法(相似大脑、小脑功用)等方面,而机器人本体硬件部分在竞赛中的中心位置将有所弱化。”柯真东说道。
人形机器人一步步从概念走向实践 本刊首席摄影记者 肖翊I摄
从实验室迈向实践的要害跨过
从开始仅能带来别致体会的 “玩具”,迈向有望实在助力各职业展开的 “东西”,这一改变含义特殊。怎样从实验室迈向实践社会,是当时人形机器人工业面对的中心课题。
要害零部件打破与供应链规划化
扎稳马步、沉肩坠肘、松腰落胯、随腰出手……在我国具身智能大会现场,人形机器人Adam向观众表演了一段“功力深沉”的太极。
“Adam之所以能做出如此活络的动作,很大程度上得益于其全身装备的PSA高功用履行器,这相当于机器人的‘关节’。而且,它身上一切的履行器均由咱们团队自主规划、研制并出产。”梁骐钧一边用手指向Adam的关节部位,一边向记者介绍。
一台成人尺度的人形机器人,需求数十个精细电子履行器。这些履行器一般安装在机器人关节处,担任将能量转化为机械运动,使人形机器人得以完结行走、转移物品等动作。除履行器外,人形机器人的要害零部件还包含减速器、丝杠、传感器等硬件组件,以及相关软件系统。一台人形机器人的本钱,根本上由这些中心零部件构成。
人形机器人要完结商业化落地,在处理技能瓶颈的一起,本钱亦是要害要素。现在揭露出售的人形机器人中,宇树科技G1人形机器人价格为 9.9 万元,H1人形机器人价格为65万元。众擎上一年12月发布面向科研教育场景的敞开型人形机器人PM01,单台价格8.8万元起。优必选发布的“天工行者”价格29.9万元,已敞开预定。越疆机器人推出Dobot Atom,价格19.9万元起。
这个价格比2024年头下降了不少。彼时人形机器人的价格大约在60万~80万元。
灵宝CASBOT联合创始人兼COO张淼对记者表明,外行更重视机器人能做什么,但在职业界,咱们比拼的是“怎样以更低本钱、更高可靠性完结规划化落地”。
无论是减速器、传感器仍是精细结构件,本乡供应链的高效协同正在构成工业上下游的共建效应,助力人形机器人要害零部件打破本钱瓶颈。
本年年头,摩根士丹利发布《人形机器人100:制作人形机器人价值链图谱》 陈述。该陈述从“大脑” (半导体/软件)、“身体”(工业组件)、“集成商”(整机制作)三个维度,梳理出全球人形机器人上市公司百强名单。陈述闪现,在已确认参加人形机器人工业的公司中,近七成来自我国和美国,其间我国企业占36家。此外,在全球人形机器人工业链中,我国所占比例高达63%;在“身体”环节,我国集成企业占比达45%。
“我国具有巨大且完好的零部件供应链,这是其他国家或区域难以企及的。”姚卯青向记者表明,国内供应链优势体现在两个方面:一是本钱优势;二是机电一体高新技能、机器人关节模组的研制与出产制作才干,处于国际一流水平。
打造出可直膝行走的人形机器人的Cyan青心意创相同获益于国内供应链。该公司创始人牛腾昦表明,公司现在正全力展开电机减速器、驱动板及关节模组的自主研制作业,中心零部件首要依托国内供应链。他进一步指出,当时国内谐波/RV减速器技能已日渐老练,电机制作范畴则能够复用工业母机、轿车轮毂电机等现有的老练技能。从全体来看,完结国产化代替并不存在实质性阻止,而且一旦相关技能获得打破,产品本钱将明显下降。
减速器是人形机器人传动结构的要害零部件。以往,这一零部件首要由日系厂商出产。跟着国内供货商纷繁入局,商场比例已产生明显改变。东方证券研报数据闪现,2021年,哈默纳科、新宝两家日系厂商在国内的谐波减速器商场比例为42.9%,到2024年上半年,这一数字降至41.6%,下降了1.3个百分点;在运用更广的工业机器人用RV减速器商场,纳博特斯克、住友两家日系厂商的商场比例,从2022年的55%降至2023年的44%。
行星滚柱丝杠是人形机器人的中心“关节”部件,它将旋转运动转化为直线运动,决议着机器人关节移动的精度和活络性。单台人形机器人一般需搭载10至14个行星滚珠丝杠,其价值量占关节模组的20%,占整机的5%~8%。因为制作工艺触及高精度旋风铣床及特种合金钢资料,该商场比例长时刻被瑞士GSA、Rollvis与德国Rexroth等企业主导,规划制作一向依托进口,成为限制国内人形机器人工业展开的要害瓶颈。但跟着国产代替的推进,单件行星滚柱丝杠的报价现在已从1.5万美元降至千元左右。
摩根士丹利陈述中的一项数据相同印证了国内工业链在中心技能研制上的打破。依据陈述,曩昔5年,我国触及“人形机器人”的专利申请数领跑全球,达5688项,而比较之下,美国仅1483项。
美银近来发布的研报亦指出,假如更多机器人原始设备制作商(OEM)能够充沛利用我国供应链,全球人形机器人的遍及速度或将大大加快。
“需求留意的是,当时人形机器人的构型以及关节部分,没有完结标准化。” 柯真东表明,现在,很多出产伺服电机、减速器的企业,大多还未大规划投入到针对人形机器人关节的规划与制作傍边。各家企业在关节选用上差异较大,没有构成规划效应,这也是人形机器人本钱居高不下的原因之一。
张淼亦表明,现在供应链老练度仍远远缺乏,比方主控芯片缺失、中心零部件方针参数标准化存在许多问题等。不过,在巨大商场需求的推进下,工业链将继续完善。
“放眼全球,我深信我国的工业链必定具有优势。”张淼着重。
人形机器人稳步经过斜坡、碎石、沙袋等杂乱地势 本刊首席摄影记者 肖翊I摄
量产曙光已现
工信部发布的《人形机器人立异展开辅导定见》明确提出了量产的详细方针:到2025年,开端树立人形机器人立异系统,“大脑、小脑、肢体”等一批要害技能完结打破,产品能够批量出产;到2027年,人形机器人工业加快迈向规划化展开阶段,运用场景愈加丰厚多元,相关产品深度融入实体经济,成为重要的经济添加新引擎。
开源机械首席剖析师孟鹏飞介绍,2025年是人形机器人量产元年,现在国内订单超越3000台的机器人公司已有多家。
在商业化方面,本年以来,现已稀有十家机器人出产公司宣告量产。2025年1月,智元机器人迎来通用具身机器人(包含731台双足人形机器人和269台轮式通用机器人)量产1000台的重要时刻,现在累计产出已挨近2000台。
“当企业具有产线,具有专业的出产工艺管理系统,便有了完结量产的根底。”柯真东对记者表明,“以乐聚为例,2025年1月,咱们已正式对外出售并交给了 100台产品。依照现在的规划与预估,本年的产值有望到达千台等级。”
产能方面,据谭旻介绍,优必选2025年规划人形机器人产能1000台,估量交给几百台。
“在各个场景都顺畅落地的状况下,优必选达观估量2026年人形机器人交给将达数千台;2027年有望完结万台等级的交给。”谭旻对记者泄漏。
在谭旻看来,数据练习是人形机器人完结量产前的要害环节。若未经过商业场景的运用测验以及小规划批量交给,便无法为量产做好充沛准备。
“优必选的机器人刚完结了从单机实训迈向多机协同作业的集体智能打破,为本年的小规划量产交给奠定了技能根底。只要逐渐添加实训环境中的人形机器人数量,让人形机器人在不同场景、不同岗位履行各类使命,才干搜集更多实在且有用的数据。经过实在环境与仿真环境的数据堆集,机器人才干进一步提高练习的功率。如此一来,在完结量产交给时,才干支撑更多机器人进入工厂作业。”谭旻说。
下班回家就能吃上机器人做好的晚餐,房间还收拾得一干二净,这样的家庭机器人是不是你想要的?本刊首席摄影记者 肖翊I摄
从工厂到家庭的再进阶
不能疏忽的是,人形机器人现已站在了技能与商业化的十字路口。
在中联重科出产车间,一台人形机器人正在产线上尝试着分拣磨具,每个动作有条有理。据相关担任人介绍,这款机器人现已能在出产安装线上完结一些根底使命,未来还有望进入仓储物流、商业服务乃至居家养老等范畴。
为了让机器人更才智、更聪明,中联重科研制团队霸占了5项要害技能,比方怎样让机器人感知环境并了解行为目的,怎样经过视觉、力觉和触觉的结合完结精准抓取,以及怎样规划双臂协同操作的动作途径。这些听起来杂乱的技能,其实是为了让机器人变得更聪明、更活络,能够习惯各种杂乱的场景。
在工厂里,人形机器人已获得不少实训效果。在极氪5G才智工厂,数十台优必选Walker S1人形机器人现已完结了全球首例多台、多场景、多使命人形机器人协同实训。据谭旻介绍,工业人形机器人Walker S系列已进入春风柳汽、吉祥轿车、一汽—群众青岛分公司、奥迪一汽、比亚迪、北汽新能源、富士康、顺丰等多家职业头部企业实训,成为全球进入最多工厂实训的人形机器人。
相较于四足机器人的广泛运用,人形机器人现在落地的首要场景大多会集在相似“进厂打螺丝”这类工业出产环节。业界人士普遍以为,一条较为可行的落地推行途径是,先让人形机器人在工业或商业场景中进行小规划运用试点,待技能老练、规划效应闪现后,再逐渐向家庭、医院、养老等对安全性、活络性要求更高的场景进行拓宽。
马斯克曾斗胆预言:“未来,人形机器人将具有照料孩子、遛狗、修剪草坪、端咖啡等多种生活服务才干。全球80亿人口,每个人都极有或许具有一台归于自己的人形机器人。”
马斯克口中的未来还需求多远?谭旻直言,要实在完结人形机器人在家庭服务的愿景,需求让机器智能迈向通用人工智能,这或许还要10至20年的时刻。
“家用机器人的门槛首要在于不确认性。之所以说家用场景比工业场景难度大,是因为具身智能的实质难题便是不确认性。工业环境相对固定、可猜测,而家庭环境每天都在改变,人们会触摸各种不同的物体,充溢了不确认性。这是智能范畴天然存在的应战。”上海交通大学特聘教授马利庄对记者表明。
相较于工厂环境的单一,家庭环境相对杂乱且软弱。不只摆放着各种原料、形状、尺度的物品,还有老人和孩子。当时人形机器人主体结构多以钢铁原料为主,分量高达100多斤,存在较高的倾倒风险,操作不妥还会构成安全问题。
在上海卓益得机器人创始人李清都看来,人形机器人在人类场景中运转,安满是首要问题。他提出物理安全与信息安全偏重:“物理安全需轻量化规划,防止大功率导致风险;信息安全则需维护用户隐私,相似手机安全机制。”
“家用机器人落地要按部就班。”马利庄表明,家庭中的行为有着不同的难度层级,不能混为一谈。能够把家用机器人的运用按难度划分红多个层级,至于何时能全面进入家庭,完结各种功用,这需求逐渐推进。