进厂“试用期”一年,人形机器人“转正”还要跨过几道坎?

内容摘要刚刚离开实验室的机器人,想要在实际的场景中创造效益,需要多久?近日,具身智能初创企业灵初智能发布了Psi-R1大模型,并称搭载了这个“真正的VLA模型(Vision-Language-Action,视觉语言动作模型)”的机器人,能够在开放场

刚刚离开实验室的机器人,想要在实际的场景中创造效益,需要多久?

近日,具身智能初创企业灵初智能发布了Psi-R1大模型,并称搭载了这个“真正的VLA模型(Vision-Language-Action,视觉语言动作模型)”的机器人,能够在开放场景下解决长程复杂任务。作为当前具身智能领域的技术突破看点,处在发展早期的VLA模型已然成为了各家机器人厂商秀技术的标的。第一财经记者梳理发现,2025年以来,至少有七家企业都发布了VLA相关的模型,其中包括Physical Intelligence、英伟达、银河通用等。

另一边,具身大模型的发展,也让机器人在落地上找到了更多机会。截至目前,Figure 、开普勒、优必选、乐聚等多家机器人厂商也都已经宣布旗下机器人“进厂打工”。不过,第一财经记者了解到,从实验室到“进厂”,人形机器人想要在泛工业、零售场景“上工”,还需要走过漫长的概念验证阶段,如今的人形机器人大部分还处在“试用期”。

相比拍出一段酷炫的打工视频,概念验证阶段需要证明产品——也就是人形机器人的技术成功率、可靠性、效率、成本和收益,这些数据横亘在人形机器人技术突破与商业化落地之间,是每一家想要实现落地的人形机器人企业都必须啃的“硬骨头”。

动作信号输入成VLA模型难点

“碰!”“吃!”“杠上开花!”

第一财经记者看到,在灵初智能发布的视频中,搭载了Psi-R1模型的机器人PsiBot V1,能够在开放环境中和人类同伴打麻将。从洗牌、拿牌、翻牌到打牌,PsiBot V1看到“麻友”打牌的动作、打出的花色,听到“麻友”的指令之后,打出自己的下一张牌。

尽管人类能够在熟知打麻将的规则之后,在一次次判断中准确地打出一张牌,但对于机器人来说,拆解打麻将的每一个动作,并稳定地进行输出,都是一个复杂的工程。

作为一家重点攻克具身大模型和灵巧手操作的企业,打麻将是灵初智能有意挑选的展示场景。在这个场景中,机器人首先需要通过自身的视觉、听觉、触觉等传感器获取牌面图像信息,并实时接收包括音频、动作等输入信息,以推断出一个出牌策略,并进行决策操作。

相比于大部分VLA模型只能听从语音、图片等指令,将动作进行输出,R1将人类“麻友”打牌的动作也作为了输入端的信号。

在小红书上,记者看到了一位博主晒出的一段视频,博主将头部品牌的机器人带入家中,并通过语音的方式向机器人下达了“做家务”的指令。然而,这个机器人却在握住扫把后,机械地清理同一块地面。机器人仅仅做到了语音跟随,无法进行实际的工作。

“本质上来说,对于搭载了这类模型的机器人而言,机器人大脑在进行规划的时候,模型所依据的只有眼睛看到的视觉信息、听到的语言信息,以及机器人的一些关节状态信息。”灵初智能创始人王启斌向记者解释,当动作不作为大脑规划的输入,就有可能出现上述状况。“动作没有作为大脑规划的输入,意味着机器人大脑并不知道动作执行的具体情况,它仍然按照原来基于视觉和语言信息规划的路径和动作序列继续执行,因此会产生偏差。”

动作信号的缺失,导致了部分VLA模型缺乏泛化性,也影响了机器人长线推理能力的准确性。在家庭场景,也许这种缺失只是造成打碎一个杯子、地面不整洁的后果,但如果是商超,工业场景呢?

“因此我们认为只有将动作作为输入,参与规划层推理,才能在非结构化的场景真正实现工程化的落地。”王启斌说。

今年以来,中国和海外的多家机器人企业都开始发力VLA模型。今年年初,银河通用发布了完全基于仿真合成大数据训练出来的大模型GraspVLA;2月,Figure发布了自研的VLA模型“Helix”;英伟达也在在2025 GTC大会上发布了VLA模型Isaac GR00T N1;Physical Intelligence也在4月下旬发布了新的VLA模型π0.5。

在视频里,这些搭载了VLA模型的机器人们或能够进行简单操作,或能够展示双机器人协作的能力。“很多视频里展现的机器人操作,其实用简单的模仿学习加原子技能调用就可以完成,体现不出VLA模型的自主推理能力。”一位国内具身大模型企业高层向第一财经记者解释,VLA是当前具身智能技术突破的重要标志,也是机器人公司想要融资、曝光度、体现自身的先进性的手段,“有一个好的名字,好的展示视频很重要”。

乱花渐欲迷人眼,蒙太奇手法让真实的技术隐在了VLA的壳子里。

“真正的VLA需要具备几个特点,搭载VLA模型的机器人需要有长时序的动作执行能力,能跟随带有描述性的语言指令,并且这些都由同一个模型直出完成所有任务,而非靠多个模型。”星海图联合创始人、清华大学交叉信息研究院助理教授许华哲向第一财经记者解释道。

“转正”还需要多久?

机器人想要进厂打工,一步到位难于登天。

已经宣布在宝马“上工”的美国机器人初创公司Figure,近期就陷入了“造假”争议。在此前公布的视频中,Figure向外界展示了多台机器人在宝马工厂中作业的场景。但宝马方面的发言人Steve Wilson却指出,实际状况是“任何时候都只有一台 Figure 机器人”执行任务。他还表示,截至今年三月,Figure的人形机器人只在非生产时段进行简单的零件搬运训练,主要承担的工作是零件拿放工作。

在大部分机器人厂商秀出的打工视频里,人形机器人看上去是那么智能、流畅、高效。但企业的镜头之后,如何将机器人的算法与硬件耦合,如何确保精准和安全性,这些都是需要经过概念验证的细节,考验的是团队的工程化能力。

根据王启斌透露的信息,机器人想要接到工厂的实际订单,要经过起码三个阶段,时间可能需要一年。

“第一个阶段是在实验室进行为期三个月的内测,我们会一比一搭建、复刻实际的工厂环境。”王启斌说,在此期间,团队需要根据场景进行新的数据采集、模型调优,并且确保硬件整机的稳定性。

完成了这一步之后,需要前往客户的场景中进行为期三个月的验证阶段。当打磨后的大模型实际落地,技术理想和现实场景的分歧才刚刚显现。

正如王启斌所说:“很多问题都是走进工厂才会发现。”在实际的工厂中,光线条件复杂,可能干扰机器人视觉系统对物体的识别和定位;现场存在大量机器设备,产生的电磁干扰会影响机器人的信号传输,导致指令延迟或错误;不同工厂的生产流程和布局差异极大,机器人需快速适应新的空间环境和操作路径规划。

同时,客户也会针对这个环节提出成功率、作业效率的要求。“这三个月,客户对成功性有一定的要求,效率需要达到实际人工作业的60%左右。”王启斌透露。

六个月后,机器人才可以在有人陪产的状况下,进行实际部署。“这个阶段产品要真正在生产环境中运行,承受生产环境的压力。” 灵初智能联合创始人、强化学习负责人陈源培告诉第一财经记者,工厂中存在很多不可控因素,比如突然地人为打断、避让,需要机器人在这些场景中有效反馈。

这意味着机器人的上层大脑需要具备有效的推理能力。“当有人发出‘让一让’或是‘帮忙捡一下’的指令时,机器人的上层大脑需要听得懂,也就是对这些信号进行分析和推理,迅速作出合理反应,调整当前任务流程。”陈源培表示,在实际的训练中,团队会通过强化学习,在模拟环境中利用一些被打断的数据进行训练,优化决策策略,增强上层大脑应对打断的推理和决策能力。

跟工业机器人抢岗位?精细化才是目标

在产品验证阶段,除了工程化能力之外,最难的恰恰是“选择场景”,也就是王启斌口中所说的“第一刀扎在哪里”。

第一财经梳理发现,在一些泛工业场景,已经进厂的人形机器人们,大多数从事的是一些放置、搬运、检测的工种。在浙江宁波前湾新区的吉利汽车极氪5G智慧工厂,优必选S1工业人形机器人开始进行搬运物料的工作,并对车标及车灯实施毫米级无损伤检测;乐聚旗下的人形机器人“夸父”也在汽车工厂中进行搬运物料箱的操作;在今年3月公布的新视频中,波士顿动力的机器人Atlas也进入了汽车厂进行零件排序的工作;本月宣布在上汽通用工厂落地的开普勒K2则能够在工厂中完成车身缝隙检测等任务。

不过,对于一些自动化足够高的“黑灯工厂”,布满工业机器人的自动化流水线已经足够能够解决人力不足的问题,人形机器人如果仅仅是替代机械臂、带移动底盘的搬运叉车,意义在哪里?

“我们希望在未来,人形机器人进厂,所做的工作都是目前只能通过人力,自动化设备无法做的那些。”王启斌指出,在场景落地的选择上,自己会优先选择更需要人工完成、具有迁移性和通用性的场景,例如3C制造的质检车间。

在他的逻辑里,在3C制造的质检车间中,细致化、灵活化的操作仍然需要由通用性更强的人形机器人完成:抓取以零点几毫米为单位的微小原料,完成不同零部件的数量清点和外观检测……在多个SKU、工位动态变化的情况下,自动化设备的固定化特征无法解决这些工作。“每个场景中,单个操作所拆分出来的原子动作有多少、每个动作中的节拍是多少、动作串联的成功率是否能够稳定下来,这些都需要专业的工程化团队去解决,并用结果说服客户。”

或许,颗粒度足够小、泛化性足够高的岗位,才是人形机器人最后在工厂中实际想要“应征上岗”的目标。

陈源培也察觉到,相比技术的完美性,客户更关注落地的可行性。“具身智能的VLA模型仍然在发展早期,长程任务的推理能力仍然可能增加机器人操作实时性降低的风险,后期我们也需要进一步通过模型、推理优化的方式来确保工业场景中的实时控制要求。”

 
举报 收藏 打赏 评论 0
24小时热闻
今日推荐
友情链接:  生意多  |  立体车库网  |  机电网  |  电商信息网  |  环球信息网  |  电工网  |  优秀信息网  |  B2B  |  商路通  |  商途网  |  花卉网 天天商务网  |  易修网  |  直通车信息网  |  B2B  |  商务网  |  信息网  |  114  |  B2B  |  商路通  |  商途网  |  防雷网 每天发布网  |  我的航运网  |  转让系统  |  力之信息网
浙ICP备19001410号-1