《科创板日报》6月17日讯(编辑 郑远方)说起AI技术,自动驾驶与大模型是两大重要议题。而在“AI热潮”催化之下,作为AI关键载体之一的机器人将这两条主线汇聚至一处,指向了AI下一个浪潮“具身智能”,即能理解、推理、并与物理世界互动的智能系统。
【资料图】
特斯拉不久前披露Optimus人形机器人最新进展,机器人展现出不带辅助的行走能力,且能精准做到电机转矩控制,产品力的进步也被看作产业化渐近的信号。值得注意的是,Optimus内置FSD芯片、与汽车共用AI系统,毕竟正如马斯克所说,“我们的汽车差不多算是有轮子的半感知机器人。”
与此同时,相继面世的大模型则进一步赋予了机器人更智慧的“大脑”与“感官”。
例如Meta的SAM(Segment Anything Model)模型可分割图像中的一切对象,向多模态更进一步的同时,一举突破了机器视觉底层技术;还有谷歌联合柏林工业大学团队发布的“史上最大‘通才’AI模型”PaLM-E,只需要一句简单指令,便可实现更为自主的机器人控制,使得机器人的行动不再需要仰赖人类的手写指令与代码。
可以看到,这场由ChatGPT引起的“AI狂欢”中,技术大跨步迈进的,并不只有能在线上与用户自由交流的聊天机器人,更有线下能与现实世界切实交互的实体机器人们——此番热潮赋予了后者更聪明的大脑、更敏锐的眼睛以及更具行动能力的躯体。
▌特斯拉“擎天柱”:站在机器人、AI、自动驾驶的交汇点
在人形机器人行业中,特斯拉的Optimus(擎天柱)可以说得上是行业“领头羊”。
特斯拉研发人形机器人的初衷,便是最大程度上利用特斯拉在造车和自动驾驶方面的优势,特别是自动驾驶研发过程中积累的算法经验、数据驱动能力、AI芯片能力、模型训练能力等。开源证券指出,智能是特斯拉投入机器人领域最核心的竞争力。
人形机器人与特斯拉自动驾驶汽车都遵循“感知-认知-决策-执行”运行逻辑。而正如上文提到的,特斯拉机器人与汽车共用FSD系统。该系统由数据、算法、硬件构成整体架构,其迭代路径则是通过不断升级算力的硬件来支撑不断升级的算法,从而处理不断增加的海量数据。
其中,分析师指出,数据方面,特斯拉FSD系统已有海量数据储备,开发人形机器人可节省大量前期费用。
感知方面,特斯拉FSD系统拥有非常强大的纯视觉感知方案,特斯拉已引入Occupancy Network,与激光雷达相比,其视觉的语义感知能力更强。对于成本控制更加严格的人形机器人而言,类似Occupancy Network的方式优于激光雷达解决方案。
规划和控制方面,特斯拉“交互搜索”规划模型进一步增强了FSD系统的规控能力,且FSD系统还能通过Occupancy Network对可视区域进行建模,以处理未知不可见场景。
图|特斯拉Optimus复用Occupancy Network感知网络
▌人工智能与机器人相辅相成
大模型可通过将图像、文字、具身数据联合训练,引入多模态输入,进而提升大模型和环境的交互能力和学习能力,推动机器人向更智能、灵活和自主的方向发展。
人工智能是机器人实现智能化的关键,而与此同时,对于人工智能技术而言,机器人则是重要落地场景。如广发证券指出的,人形机器人作为具象的实体,是AI绝佳载体。
一方面,机器人、特别是人形机器人能丰富AI的表现方式。除了传统的语音交互、图片交互,人形机器人也为AI带来了更多的交互方式,包括表情、手势等,极大延展了AI的表达领域。
另一方面,机器人也承担起了AI输出窗口的作用。
以英国机器人公司Engineered Arts研发的一款类人型机器人Ameca为例,除了与人类相像的外表,其最重要的功能便是为各种AI技术提供了一个真实的平台。用户可以根据需要,从库中快速加载预先保存的姿势、声音、动画和子序列,只需使用计算机鼠标或触摸板,单击并拖动机器人的功能,就能实现丰富的面部表情。
▌机器人降本“三步走” 哪些环节扮演关键角色?
迈过实验室技术积累阶段,机器人行业正逐渐迈向具身智能时代。产业链各环节的技术进步推动者机器人产业不断向前,而整体行业的扩张也为产业链打开了更广阔的的空间。
机器人关键技术可分为AI技术与传动技术,其中广发证券指出,运动模块硬件等非核心传动部件并非是机器人公司专长,外购概率较高。
图|机器人关键技术分类(来源:广发证券)
机器人龙头之一的波士顿公司因缺乏合适供应商而“被迫”自研伺服阀,公司曾公开表示,作为机器人公司并不想自研伺服阀,公开寻求供应商。
因此分析师也猜测称,摄像头和算法等核心部件,特斯拉将进行汽车供应商平移或自制供应;而对于减速器、伺服等技术要求较低的驱动部件,或寻求外部供应。
而开源证券补充称,特斯拉机器人关节执行器采用的零部件种类和现有工业机器人基本一致,只需根据人形机器人特点对零部件进行调整修改,就可进行标准化量产,且轴承、齿轮箱、滚珠丝杠、电机等部件可复用特斯拉汽车供应链。
再次以特斯拉Optimus为例,这一机器人具体有哪些零部件?券商列出了具体零部件名单与相关标的。
(1)旋转关节:无框力矩电机、谐波减速器和力矩传感器是价值量占比最高的零部件,降价空间最大的为无框电机(降价75%)、谐波减速器(降价75%)、角接触轴承(降价64%)。
(2)线性关节:是特斯拉机器人在硬件端优化升级的核心。行星滚柱丝杠、倒置滚柱丝杆价值量占比,行星滚柱丝杠在特斯拉机器人硬件总成本中占比也最高。两者相比早期阶段,降价空间分别达到93%、95%。
(3)灵巧手:内部构成是一个微型线性执行器(伺服电缸)。国产厂商在除了减速箱以外的其他零部件领域均处于量产的布局期,能够率先实现微型线性执行器量产的企业将通过规模效应大幅降本。
(4)加工设备:磨床和齿轮加工机床是减速器、轴承、滚珠丝杠、电机在精加工阶段的重要设备。国内秦川机床、宁江机床、北平机床已具备批量生产高精度齿轮加工设备的能力。
(5)其他零部件:特斯拉人形机器人电池实现小体积大容量,推测复用汽车动力电池技术。视觉传感器硬件为左右单目相机+鱼眼相机,硬件成本较低,依赖算法。集成汽车视觉传感技术,工厂等部分场景有应用GPS传感器。
数据显示,目前Optimus硬件成本占BOM表比例超过50%,要达到2万美元售价还有84%的降价空间。对比当前时点和终局状态下BOM表拆解,开源证券指出,线性关节和灵巧手的降本空间最大。
总体而言,目前人形机器人成本约为 10-15 万美元左右。优必选预测,根据量产规模不同,人形机器人降本进程大致分为3个阶段:
几千台小批量生产,降本20%-30%至约10万美元;
1万-几万台量产,降本50%至5万美元;
几十万至上百万台大规模量产,降本70%-80%至2-3万美元。
▌结语
总体而言,AI大模型与人形机器人的相辅相成,迈出了通向通用人工智能的一大步。
国泰君安指出,服务机器人商业化落地的前提是产品能提供真实价值,而真实价值的判断在于机器人能否通用。将机器人做成人形,便是为了使机器人的执行能力更加通用。
伴随着自动驾驶技术的高速发展,人形机器人在视觉、SLAM与基础AI上有了更多方案选择。分析师预计,大模型的出现,会从语音、视觉、决策、控制等多方面实现同人形机器人的结合,形成感知、决策、控制闭环,机器人产业有望进入渗透率快速提升的新阶段。