北京时间10月11日上午11点,特斯拉举办了WeRobot发布会,我们本来都已经搬好小板凳抱着笔记本打算瞻仰这场技术盛会,结果多少有些令人失望——现场只是展示了它们的Robotaxi即Cybercab、无人驾驶货车Robovan以及人形机器人Optimus,并给到了一些时间线和基本面的描述,紧接着便是全场party。话说回来,内行看门道,炫酷的科技产品背后大多有些技术迭代的支撑,所以今天想跟大家聊的是,Cybercab也好、Robovan也好,还是调皮的Optimus也好,表象之下到底蕴藏着怎样的技术迭代?以及在如此花哨、层出不穷的发布活动中,我们还可以期待些什么?
陈龙 Wayve Staff Scientist主任科学家
*Wayve 是原生端到端自动驾驶公司的代表,2024年获得10.5亿美金C轮融资,是最近2年自动驾驶行业之最,也是比尔·盖茨和孙正义最为看好的自动驾驶公司wayve.ai)
孟醒 五源资本合伙人、滴滴原自动驾驶COO
7:50 We, Robot在美国版的横店举办,场景类似封闭测试场
11:18 为什么买Cybercab而不是Model3呢?家用车一车二用也许没那么合理
24:42 对外造型的吐槽:外观像Cybertruck,车顶和线条像Model3
26:48 Robovan大概是概念产品:巴士不是一种太好的商业模式
35:28 Tesla是在车辆上的成本是Waymo的十分之一/七分之一。
40:11 Wayve2017年开始做纯视觉端到端,在当时被认为十分激进
50:50 Wayve代表性产品Lingo视觉语言驾驶大模型
1:05:44因为数据量大,纯视觉会是未来自动驾驶和具身智能的主导性方案
1:11:36自动驾驶的端到端技术很难立即复用到机器人上
1:14:28Optimus机器人在发布会上的行动是遥操作的吗?
1:22:56为什么语言上的泛化被ChatGPT解决得很好了,机器人行动上的泛化却很难被解决?
1:32:27人的需求和机器人的发展会逐渐靠拢
Lyft | Wayve, Lingo, Gaia | 世界模型 | 理想双系统 | VLA模型(视觉-语言-动作模型)| VLM(视觉语言模型)| Mobile ALOHA | Real-time Game Engine
大奎