欢迎收听本期晚点聊今天的主播是曼琪 10 月 10 日备受期待的特斯拉 RoboTaxi 也就是无人出租车终于亮相不过这场发布会短期带来的更多是失望特斯拉的股价在发布会之后下跌了约 9%Uber 等网约车公司则大涨 10%首先要明确一点行业里说的全无人驾驶就是车上不需要人类司机并不等于特斯拉现在已经上车的 FSD
虽然后者也叫 full self-driving 对应中文的完全无人驾驶但它其实是一种需要人类司机随时接管的高级辅助驾驶特斯拉做全无人驾驶是一场连续数年的连续剧早在 2016 年 10 月马斯克就第一次承诺到 2017 年底特斯拉的车就能不依靠人独自从洛杉矶开到纽约事实证明这又是一次过渡承诺不过人们还是对特斯拉抱有期待
毕竟马斯克式的爽文叙事一贯就是先提出一个不切实际的想法再给出一个激进时间表然后苦苦挣扎多次延迟陷入绝望最后决定反击今年初开始特斯拉的一系列进展让市场对它的自动驾驶和无人驾驶有了更多期待
先是 FSD V12 表现惊艳 4 月也有消息称特斯拉将暂缓开发售价约 205 万美元的下一款平价车转而集中精力做 RoboTaxi 消息爆出的当天马斯克在推特上预告 8 月 8 日发布 RoboTaxi
这场发布会后来又推迟到了 10 月 10 日但在两个月的等待后马斯克只做了 20 分钟的演讲他展示了两款无人驾驶车辆但几乎没有讲技术信息也没有讲实际的落地计划这场发布会后的第一时间我们邀请了 L4 级别的无人驾驶资深从业者侯晓迪来与我们分享他看这场发布会的感受以及他对 L4 行业当前的观察
侯小迪本科毕业于上海交通大学后来在加州理工获得博士学位他从事自动驾驶第一股图森蔚来的联合创始人历任 CTO CEO 和董事长侯小迪的核心想法是 L4 自动驾驶现在更多是一个工程问题到了以 CPMCost Per Mile 也就是每英里综合运营成本为指引的阶段
各公司的竞争核心就是怎么在保证安全的情况下降低 CPM 从而能比现有运力网络更有优势其实马斯克在发布会中也提到了这个指标只不过侯小迪非常不同意马斯克所说的具体数字我们也聊了他对自动驾驶行业近年的一些热点技术如断道端和世界模型的理解和看法以及他在离开图森之后再次创业做 L4 自动驾驶的心认知和选择下面我们就正式进入节目吧
欢迎收听本期的晚点聊今天我们要聊的话题是刚刚结束的特斯拉的 V-Robot 发布会我们非常高兴地邀请到了自动驾驶而且是做了全无人驾驶也就是 L4 级别的自动驾驶非常多年的一位资深从业者侯小弟来和我们一起分享一下我们怎么来看现在
特斯拉的这场发布会以及目前这个阶段 Robotexy 的一些进展尤其我们想讲一讲这个行业里的实际的情况和一些烟雾因为自动驾驶行业一直是一个争议和交锋都非常多的行业小丁可以和我们的听友打一个招呼也简单的自我介绍一下
Hello 曼琪你好感谢今天邀请大家好我叫侯小迪我做自动驾驶大概已经做了八九年了吧我上一家公司还挺有名的叫 Too Simple 我是联合创始人 CTO 后来又成为了 CEO
但是由于一些原因呢这个公司也没有继续缩下去所以我现在又出来重新搞了一家公司新的公司叫做 Bot Auto 总部在美国的休斯顿小迪是非常坚持这个行业现在还是在做 L4 的无人驾驶那我们接下来可以先从发布会开始聊其实你是一个比较有名的在自动驾驶这个方向上应该算是马斯克一个反对者吧我想先问一问就是你昨天也被我看几场发布会包括你看的时候是一些什么感觉吧就直观的感受
那个我其实没有现场蹲他的发布会因为确实时间有点晚了但是我还是一个是看后边的一些剪辑啊以及复盘吧都看过对他发布会里边的一些细节还是比较了解的其实也不能说我是马斯克的反对者比如说我还是非常喜欢 SpaceX 的这个我只是比较讨厌这个他在推广过程中一些特别强的这些叫做 hype 就是一些吹泡泡的这些东西我是很反对
那我们今天正好可以聊一聊就是你觉得哪些是 hype 的缺泡泡的部分就总体来说这个发布会的话你觉得哪些地方是在你的预期之内哪些地方可能是超出你的预期的其实发布会本身就有一个预期我觉得发布会本身没有讲什么东西这件事情是在我预期之内的就是发布会之前一天我说爆米花已经准备好了
这个其实我就写在我的朋友圈里很多朋友还说你难道对这个发布会还有什么过高的不切实际的预期吗我说不不不我主要是看观众反应我是在局外之外去看观众们对这场发布会的反应我觉得这事比较热闹但其实呢这件事也很有意思就是我惊讶的发现人们对这个发布会的反应也超过了我的预期什么部分
这句话我展开说一下就是说实际上对于这个发布会而言甭管 8 月 8 号还是 10 月 10 号他不可能拿出一个具备 L4 功能的 RoboTaxi 这样的运营的产品这事显然是我早就知道了因为我们做 L4 做了很多年虽然我没有做 RoboTaxi 但这件事是很清晰的就是他们的技术水平 FSD 今天能到的状态是
是 L2 不是 L4 但是呢我觉得自从 FSD12 推出以来我觉得很多的公众对于 FSD 到底能达到什么样的程度以及在一些虚无缥缈的概念词比如什么 scaling law
比如 end to end learning 在这些词的加持之下很多人对于 FSD 对于 Elon Musk 对于 Tesla 有一些这种宗教式的狂热这些狂热让我觉得是比较不对的那么我很担心这些狂热会进一步加深人们对无人驾驶这明明是一个工程问题的误解所以这次发布会超出预期的地方就在于大家都好像分别
都表示对这个发布会觉得比较失望全部都没讲然后说马斯克是大忽悠的人的数量远超我的预期对他确实没讲什么但是也是有一些东西的一个就是他这一次是拿出了两款无人驾驶车辆的形态最受关注的肯定是 CyberCab 就是他轿车的这个版本两个座位然后是叠翼门没有方向盘也没有刹车踏板这个其实和目前谷歌的 vimo 还有百度的萝卜快跑
这些主流的 RoboTaxi 的形态都是非常不一样的至少在一般人看来特斯拉拿出的这个车可能它是更酷更未来更终极的然后作为从业者也想问问就是你怎么看这个新版本的 RoboTaxi 的轿车我其实觉得这事得退一步讲就到底有哪些东西是虚的哪些东西是实的我们是要分开
我们谈任何一个事情它分两个部分一个是事物发展的客观规律另外一个是公众意志这两个东西就像是阴阳的两个方面客观发展的规律是阳公众意志是阴有的时候两者一致有的时候两者不一致在我来看无人驾驶技术的发展这件事是很客观的你能看得出来这个是一个很实在的要靠证据说话的
但是大家对它的热情这就是一个公众意志这是一个因的部分那我觉得特斯拉特别擅长做的呢就是把这些因的部分基本上拉满比如说你看又是一个没有方向盘没有踏板就是没有方向盘没有踏板这件事它的逻辑是因为没有方向盘没有踏板显示出了特斯拉的自信这种自信反过来能给公众对于无人驾驶对于特斯拉对于无人驾驶十拿九稳又有更多的自信但是
但是没有方向盘和没有踏板这些事情完全不能帮助到它无人驾驶技术的前进但是它在这些跟客观发展规律不相关的一些地方就特别喜欢发很大的力就是在阴的这个方面强调非常多但我觉得如果说你阴阳调和你能强调的好也可以但是我觉得它在阳的方面又非常的落后所以这个事情实际上是一个我觉得不是很好的事情然后
然后他还发了一个形态就是一个无人驾驶的巴士这个可能跟你现在做的事关系会更大一些因为马斯克在发布会上也说这个无人驾驶的巴士他们叫 RoboOne 可以拉 20 个人然后他除了可以拉人之外他未来可能也可以送货你怎么看这种就好像我又能干这个又能干那个的通用的设计和设想
那我是毫不担心的因为就是这事真的也是跟我们没啥关系而且它这种 VAN 出来又是继续在操控公众意志上越走越远首先就是从产品设计上来说如果你有一个东西又能干这个又能干那个基本上就结果而言就是你啥都干不好对吧
对吧就是像什么我有一个特别厉害的杀人兵器叫要你命 3000 把一大堆东西都绑到一起说你看我这个是不是很厉害但实际上真正的战争中没有人使用要你命 3000 这种兵器但我觉得还是那句话就是他这个发布会过多的强调了公众意志实际上也是对特斯拉品牌形象是一种反噬当然了我觉得反过来说呢 Elon Musk 有他自己的打法对吧我们可能我们这种工程师或者科学家出身的人有另外一种打法我觉得
我觉得就我自己而言的话我觉得我可能过去太多关注门头发展了但是现在确实也是一个时机正如我今天接受咱们这边的采访一样是我希望公众意志不要成为事物客观发展规律的一种阻碍
所以从业者还是有义务要告诉大家实实在在来说这个无人驾驶技术接下来发展规律大概长什么样子就是你不要有一些不切实际的预期反过来说比较好的领域呢就是航空航天啊生物制药啊这些领域基本上没有点精良的人是不会敢多评论这些领域的所以这些领域上 hype 就少了很多但我觉得无人驾驶领域嘛我会开车我当然能点评一下你无人驾驶系统了
这个领域其实我觉得被代谢作戴的比较多我们刚才讨论有一些哲学我们可以说些更具体的昨天这个发布会上马斯克就也少数的说的一个比较具体的信息有数据的就是他说的每英里的运营成本他自己说 Cybercap 就是他们这个轿车的版本每英里的综合运营成本会低于 0.2 美元而现在 Uber 的每英里的成本是超过 1 美元的
当然马斯克也并没有非常具体地说这个 0.2 美元它到底是怎么算的以及说这是哪一年会实现然后你也是行业里第一个提出就是我们做自动驾驶要看 CPM 也就是每英里的综合运营成本那我们可以好好把这个讲一讲因为这也确实是商业化的一个关键这个 0.2 美元你怎么看就是怎么算怎么有
这个就是显然是又是带节奏的一个具体体现了我觉得这一点上就有实锤的证据而且非常简单十秒钟之内告诉你为什么两毛钱是不对的因为电池的成本每英里一毛五电力的成本每英里五分钱然后轮胎的成本每英里五分钱这三个加起来两毛五
好证明完毕所以马斯克在胡说就是完全不考虑自动驾驶我就只算本身车在路上跑的这些消耗你觉得就超过这个价格对对这些数字我还是因为是发布会发完了嘛我还特意去简单查了一下当我查完第三个数字我就发现哎得了瞎胡扯嘛就是
然后我觉得这件事也很有意思就是其他的行业里边的同行也都在问我求证也有些私下讨论说这个肯定不可能这么便宜这违反物理定律嘛对吧所以我觉得我是希望借这个机会呢展开说一说可能会比较长一些就是到底呃
应该怎么算每英里运营成本就这个叫做 CPMcost per mile 我们一般行业里边就简写是 CPM 我觉得首先第一我们要对 CPM 有一个共识要不然的话你经常会出现我们家这个产品这个 A 的方面比较厉害你们家的产品 B 的方面比较厉害那文人相亲就开始互喷了这样的话是不利于这个行业的发展的
那 CPM 需要一个统一的认识这就像说会计行业你需要一个什么叫做净利润的一个统一认识你不能说因为我换了会计师事务所我就能给一个公司算出来一个不同的净利润对吧就这件事情是需要有统一标准的
但是你看就像我刚才算了这三个数就超了两毛钱了就是两毛五了那对于 Elon Musk 来讲我相信他一定是通过其他的一些计算形式说这也不算那也不算我就算了一点点东西这些一点点的东西加起来你看不到两毛钱所以我很厉害但是人家 Uber 可是有正经的这个会计手册算出来的那人家能算出来一块钱这就是区别你不能用自己一个跟别人连标准都不一样的东西去互相对比这样好像永远比不出什么结果来
但是对于 CPM 的计算今天确实没有太多的标准我觉得这一点也是确实无人驾驶行业需要去进化的那我觉得这个计算一定要
放弃以前对于其他行业比如说我要是从保险行业过来我算可能能算出一个数字来我要从这个车辆制造行业我也能算出一个数字来但是无人驾驶它是一个新的产业有很多人说汽车产业怎么怎么样我要一直提醒大家无人驾驶产业不是汽车产业它是一个新的产业那么它的 CPMCost Per Mile 的计算要遵循第一性原则
第一个原则就是你只要车上路就得消耗能源对不对那这个能源成本怎么算甭管是电呀是燃油啊要算上那它有折旧那比如 Elon Musk 其实还提了说我这个车你可以自己拥有你还可以在你不用的时候去让别人去做但是你比如说你让别人去坐你的车当 taxi 去开它也是对电池的损耗也是对车体的折旧这些车辆的本身的资产的折旧也是应该算进来的
对吧那再接下来呢维修是不是也要算保险也要算不管是谁是谁负担这份保险哪怕说特斯拉自己负担了这个保险那保险也是应该要算到里面
除了保险之外的话还有很多奇奇怪怪的其他的东西比如说如果这个车今天发现哪坏了那维修以及由于维修产生的不能工作带来的损失是不是都是成本所以这里边一大堆的成本都要计算我们需要有一个新的结构尤其对于无人驾驶而言的话我想提两个非常重要的点一个是硬件成本就比如说很多人谈无人驾驶有很多的传感器那这传感器到底有多贵呢
如果我们举个例子我们有一个比较稳定可靠的激光雷达比如说我们公司现在用的是核赛的激光雷达我们就觉得非常好稳定性齐甲那 100 万英里
寿命如果 100 万英里的寿命咱们就说这个激光雷达量产了以后的价格比较便宜可能几千块钱咱们就往多里说 1 万美元 100 万英里的寿命那这时候每英里的运营成本摊下来呢就是一分钱我介不介意增加一分钱的每英里运营成本让我的系统安全一些当然我不介意所以从 CPM 的角度来讲那硬件成本就需要去重新的计算和认识
我想插一句就是你刚刚说你们激光雷达 1 万美元实际上和塞现在在国内给车企供应的主激光雷达大概也就在 3000 人民币以内所以你们用的是不同的版本是吗我说的不是我的意思就是说我们虽然是几
我们现在用量少嘛我们是几千未来如果车企大量买的话肯定是更便宜而且你还不止用一个你把所有的激光雷达的整个生命周期加起来一百万你就往多里算翻几番也是在一万美元以下的那换句话说它的每英里运营成本上带来的成本提升是小于一分钱的
我只是说想非常保守的去估算这样一个数字这个数字小于一分钱你说现在很多人说激光雷达之争为什么不用激光雷达这么贵的成本我们怎么能接受但是在运营成本面前这个成本一点都不贵
所以运营成本其实很好的能够帮助我们看到到底什么是主要矛盾什么是次要矛盾这是硬件成本那第二呢我想说的是 CPM 要遵循的第一性原则是因为很多时候你的运营无人驾驶的运营跟你自己家里边开一辆车是完全不一样的无人驾驶咱们先不说辅助驾驶啊辅助驾驶因为永远有司机在这个能够接管然后司机是为这个车辆驾驶负全责的
如果是无人驾驶的情况下那么我们需要关注的就是任何时候任何的硬件出了问题我们的系统都能够把控住局面确保车辆和人员的安全那么在这种情况下你就要有一重冗余甚至有的时候要有二重冗余那么如果你的车辆在正常行驶过程当中你的冗余系统出了问题怎么办呢
怎么办那是不是你就赶紧需要去维修了但是随着如果你的这个车辆系统变成了一个全冗余的系统那么你有可能出错的部件就会比一个普通的汽车要多得多对吧因为你的车辆能运行的基础条件是你原系统要确保能够正常工作同时冗余系统也要确保能正常工作这两个东西叠加在一起那你的失效点就比一般的车辆多很多而这种
由于组合产生的这种这种可能都不是线性的是超线性的这种失效点的个数就会让你会发现无人驾驶的运营就是在一方面确保绝对的冗余冗余都能够正常工作另外一方面就是你的冗余系统经常坏经常坏于是你就经常需要停下来确保冗余系统或者那些不那么重要但是它对于安全
有必不可少的系统一直都在工作在这种情况下运营的复杂度是成绩和技术往上走的而运营成本也和一般的车辆的运营成本完全不一样当然了这些事情都是后话也就是说 Elon Musk 在他前几天的发布会里完全没有提到我们甚至也不需要去算这些东西就知道他两毛钱一定是说了大话
你可以举一个例子吗就是一般人可能认为是一个很简单的跟自动驾驶这种高精尖技术不相关但实际上它在运营中又是很重要的冗余系统你处理不好就会导致你很麻烦举个例子每辆车都有胎压检测然后我们正常人驾驶的时候都不会发现胎压检测会有任何的误报
但是如果我们每一秒钟都勤勤恳恳的去监测胎压检测我们经常会发现胎压检测有一个一个一个跳动就这些跳动就会导致突然胎压检测不稳了那么到底是胎压检测器坏了呢还是胎压真的有问题了我们到底感冒多大的风险说轮胎胎压有问题了但是我们胆敢继续开车呢这就是问题但是很多时候对于人类开车的时候大家没有那么介意胎压检测这样的事情所以这就是一个
一个我们无人驾驶需要解决的工程问题这些工程问题没有一个很难但是如果我们真的用最严格的标准去监控这个系统的话你会发现这个指标总有一些不正常的地方就你说到这个我也想到一个比较有意思的点就是在这场发布会之前美国自动驾驶公司 Cruise 的创始人沃格特他列了一个清单就是说如果我们去看一个新的 Robotaxi 公司我们应该去看什么要点
我之后会把这个放到 show notes 里大家也可以去看他大概讲了十几个点其实里面跟一般人想的不一样他基本上没有提什么特别硬核技术的东西他提的全部都是一些运营细节的东西比如说如果你这个车出了一些问题你卡在路中间了你没有什么机制把它弄走你不要去影响其他的车流比如说碰撞之后我能不能远程的打开门
以及说因为现在其实你就算车上不坐人你肯定远程有一个操作员要去控制这些车的他可能一个人盯三台或者一个人盯十台这也是大家设想的未来降低成本的方法嘛但万一说这个远程控制这个通信中断了你有什么办法去保持安全等等他讲的全部都是这些当然马斯克的发布会上是这些都没讲啊
对就是马斯克的 CPM 就是他的 Cost Per Mile 完完全全就都不涉及这些东西而这些东西就像我刚才说的才是无人驾驶技术发展到后面接下来几年大家都需要努力去解决的核心问题所以我觉得那个 Kyle Vogt 他给的这些点都是实实在在的点可以看得出来他是属于比较上手干活的那个啊
我觉得那 CPM 框架之所以好就是万琪你刚才提到的这些指标很多很多都可以放到 CPM 的框架下举个例子比如说一个车停在马路中间了那么停在马路中间这件事情就牵扯到两个问题就是我多快的能去做救援我越快的救援就意味着我我
我要让一些人员 stand by 的这个成本就非常高对吧那如果我说我第二天再救那没关系那这个成本成本救援成本就会很低但是它对社会造成的压力以及这个社会压力反过来给公司造成的损失就会很大所以其实无人家很多时候是工程问题就是你你
快点救有快点救的麻烦慢点救有慢点救的麻烦但是我们要在 CPM 上找一个均衡就是到底多好的救援是一个能最终省钱的救援因为它会有总会有这个直接或者间接的影响反应在 CPM 上
但是这些问题我觉得你刚才提到的几乎都可以放到 CPM 的框架下而这些问题其实恰好也就是无人驾驶冲刺到比人类司机更便宜所缺的就是运营成本那比如说还有我在那个 Elon Musk 的发布会上还看到也很有意思他说我们这个车因为是要
作为一个公共的系统给很多人做那比如说其他的乘客把车弄脏了怎么办呢没关系我们有机器人能去洗车洗车档内部那我就问你多长时间洗一次洗车的成本有没有放到这个 CPM 里边显然是没有但是我觉得如果从 CPM 从行业规范来讲的话正如说每一个这个
就是净利润这件事情是一个很好的 accounting 的一个数字就是很好的一个会计的数字那么我们也希望是 CPM 是一个包含了全部直接或者间接影响的数字这些数字都应该算进去你的洗车当然要算在你的驾驶里面因为洗车也是你运营的一部分而且是不可分割的一部分
你刚才讲说你觉得行业应该要形成一个 CPM 的共识我听下来我理解是两层意思一个就是大家都认可说这个框架很重要另一个就是大家要去有一个共识说这个里面具体它的成本都包含哪些成本第二点我觉得比较好理解第一点其实现在可能这个阶段会有一个比较大的疑问就是我们现在就来讨论 CPM 那前提是其实你这个东西的技术上已经比较 ready 了是吗
但是现在这个技术还在快速的发展为什么现在这个阶段就要以成本去作为一个指引的指标就是技术的发展跟 CPM 的下降不矛盾甚至它们是相辅相成的如果你有一个早期技术那我们还是回到这个航空航天的例子上来说早期的技术比如说是这个航天飞机航天飞机诞生之初它发明的这个准则是说我做一个可重复使用的飞行器这个可重复使用的飞行器
就能够自然而然的降低成本那这显然是办公室决策啊它是没有真正深入一线的当第一架第二架航天飞机造出来以后人们发现哎呀每次要航天飞机落地再起飞要做的维修工作甚至比我直接造一个一次性火箭还贵所以很长一段时间这个航天飞机的运营成本反倒是比
这个就是美国航天飞机的运营成本反倒是比苏联造火箭然后一次一次的单次使用的成本要高那后来呢还是 Elon Musk 对吧他说我们要把一次性的火箭转化成多次发射多次使用的火箭那基于这样的第一性原则呢 SpaceX 才会去说我不管是什么形态航天飞机也好火箭也好我不管我只要便宜
这个第一性原则最终导致了这个可重复发射的火箭当然它可重发射火箭里边也不是任何什么什么东西都重复也是说以尽可能节约成本为第一性原则去往下做加法或者做减法在这种情况下看的话呢其实我觉得
CPM 的前进你不应该去把它定义在某一个具体技术之上技术可以天天换没关系但是技术发展的大方针应该是在保证安全的情况下尽可能的去降低 CPM 所以恰好就应该是在技术发展的过程当中我们应该用 CPM 作为指导行业发展进步的一个指挥棒和一个标尺像我刚才说到的激光雷达嘛
还是那个意思就是你现在不要跟我提要不要激光雷达这不是一个主义之争这是个黑猫白猫抓着耗子就是好猫之争激光雷达如果是低于一分钱的成本因为刚才我稍微一算低于一分钱的成本那如果能上激光雷达感觉安全性能好很多那自然要上了现在没有必要去讲究什么我不上激光雷达所以我的技术比别人更先进不是这样的
那选不选某一种传感器会不会导致你的技术发展路径不一样然后导致你性能是不一样因为当时马斯克就是要求不用激光雷达他其实让他的这个视觉能力倒逼他们去发展的比较强包括为什么后来做断道端也是因为你视觉再往上做已经到顶了从信息论意义上讲的话呢激光雷达带来的信息永远是一个增量信息
就是这事我们不应该去跟相同老爷的叫板说啊我们没有这东西反倒必有这东西好不是这样的就我觉得所有的技术好坏不应该由工程师的这个所谓的 taste 来决定这个东西因为优美所以好我们现在面临的是一个工程问题这个东西安全或者不安全它是一个客观标准的这个标准跟技术无关啊
能达到这个标准这个技术就够好了不能达到这个标准的你回去改进技术你可以通过倒逼算法改进这个技术你也可以通过加装传感器改进这个技术作为一个产品的角度来讲我不 care 我用了什么技术最后就是跟 RoboTessy 本身不那么直接相关但也是在大的这个机器人范畴就是他这次发布会上其实让很多 optimist 亮相最后变成了一个大的 party 嘛
他自己就讲了 20 分钟后面可能有一个小时吧就是有很多机器人来服务人有跳舞的有给你端水倒酒的给你猜拳什么帮你唱生日歌的有些观点会认为说这次虽然无人出租车好像没啥亮点和惊喜但是特斯拉的这个机器人的表现他的这种动作的丝滑程度他和人互动的程度还是让人有些惊艳的
那关于这个我可能因为首先我不是机器人行业的专家所以我不太好评价它的这个水平相对于其他公司的相对发展更快或者更慢或者怎么样我听到的更多是从业人员给我的一些反馈就是分三层第一层的从业人员说哇好厉害啊这个不光无人驾驶还有机器人很厉害
第二层说你别看那些机器人那些机器人都是远程遥控所以这个不行肯定是有问题的但是第三层呢这个真正机器人行业的从业者说虽然是远程操纵但是他们的远程操纵也比别的 ABC 家公司做的厉害做的好
所以我觉得这三重不同的认知恰好表现出了这个就是所谓公众意志和事务发展客观规律之间的一个矛盾具体的从业人员看都是技术细节很有可能呢都是职员身在此山中所以他们想的就是就算是有了远程遥控这个优化做的也是为别人好的所以要肯定
但是呢如果你退出这个具体的工程实现你会在一个更大的尺度上你去看这个产品形态和产品价值和商业模式你会发现你都远程遥控了你这玩意有什么商业价值啊对吧所以就是位于第二层的人不会去管第三层的微小技术进步但是会看产品价值那于是第二层的人会 diss 这个发布会议会觉得不好
然后但是在第一层更广泛的人民群众会说啥也看不懂反正我就是来看戏的我觉得挺酷的所以我觉得这个恰好表现的是不同的精细度对这件事情的看法这些不同的层次的观点都应该综合起来构成一个所谓的公众意志其实人行集权这个行业现在应该是你所说的这种阴阳博弈就是大家认为它能做到什么程度和它实际上能做到什么程度
分歧更大的一个领域就相比自动驾驶可能要大得多正如 2016 年的自动驾驶我想说我觉得它可能比 2016 年的自动驾驶还早期因为现在这些机器人没有办法针对自己在工作和活动对吧就像你说的它其实背后要有一个人去操控它的那 2016 年自动驾驶起码可以开得吧在路上虽然可能只能非常小的范围
那现在在厂房里边机器人也是能拧螺丝的对这涉及到另一个我觉得也算是一个误解吧就其实从 2012 年之后机器人加 AI 这个事情已经在发生了并不是说在大模型之后才开始发生的现在的工厂里本身也有很多有一定的自主性可以干活的机器人这是另一个话题了
最后想聊一下这次发布会的可能影响其实这次发布会也是马斯克对内对外官宣进入 L4 行业这和特斯拉之前做的高级辅助驾驶可以说是两个范畴相当于是 L4 领域迎来了一个来势汹汹的新玩家你之前说过马斯克声称要发 Robotexy 这件事情就会导致你们行业我是指的 L4 行业里的很多人就输了因为不管他做得成还是做得不成可能都会有很多人跑来质问你们
后来实际这个发布会结束之后是什么情况可能那个时候我也是有点过于悲观了现在看起来我说这个发布会让我比较惊喜的地方就是看明白这件事的人呢比我想的还是多得多的我听到的更多的是共识第一呢就是说这个发布会果然就是个话柄的发布会
第二呢就是 CPM 就像我刚才说的已经渐渐成为这个行业的共识就是说你别我也不管你用什么技术对吧到最后呢保证安全的前提下你越便宜这个东西越逼近它的这个量产越逼近商业化所以就是 CPM 现在已经渐渐成为一个大家都认为需要发力都认为应该用 CPM 去来定义一个公司的发展前进路径的这样一个事情所以我觉得这个是好的
其实马斯克自己也提了这事如果他觉得这指标不重要他肯定发布会也不会说我倒觉得发布会本身不重要但是因为它的热度和它的新闻性通过这个发布会看大家的反应反倒是能够让我们更好的去说这个因的那一部位就是公众意志的这一部分到底是朝着哪个方向在前进的我觉得现在来看的话它的建设性是大于它带节奏的误导性的
接下来我们可以从这个发布会进一步的延展就是聊聊目前自动驾驶行业里的一些实际情况和弥漫的烟雾因为从去年到今年这个领域其实进展也非常快尤其是它出现了很多新的流行词和 buzzword
一个最闪亮的明星肯定是你最开头的时候有提到的这个端到端特斯拉他今年的 Robotaxi 的发布会为什么在之前的一段时间里我觉得大家还是很期待的就是因为从去年底到今年初 FSD V12 确实有一个很大的表现的提升这个提升按照马斯克的表述也是因为他们使用了端到端的技术因为你自己在美国生活你也开特斯拉就实际上你体验 FSD V12 是一个什么感受
哦开的没那么频繁啊就是我老婆的车是特斯拉所以是不是借着开一开大概可能一个星期做一次测试员吧反正至少在休斯敦十分钟一次接管算是运气好的运气不好的时候可能刚出门就接管呃
关于这个端到端我觉得这个事情实在是比较不好它是带节奏的我总结了一下就端到端这件事它叫技术的意识形态化我觉得现在国内的很多宣传基本上你是端到端你厉害你先进你不是端到端你就是基于规则的什么无人驾驶那你就是上一代的技术你就要被淘汰了根本不听你讲细节你是不是端到端你是端到端那你是革命的你不是端到端那你不行你就是上一代的腐朽的意识形态
就开始打击所以我觉得这件事情是特别不健康的然后当然你说我懂不懂端到端当然了我比挑战我端到端那些人肯定都懂端到端但是我不能上端到端我是有原因的所以我觉得无人驾驶技术其实大家不要去想用一个简单的名词就把一大堆的概念涵盖在一起
因为任何时候你用一个几个字的词汇去描述一个特别复杂的概念一定是有很多失真的又恰恰的是这些小的技术选择最后决定了第一你安不安全第二你的运营成本怎么样这种反应在 CPM 上那简单来说一下的话端到端是一种什么思路然后你说的被舆论认为是上一个时代的落伍的基于规则的技术它又是一种什么技术好
我觉得就是说首先人工智能这个技术或者说深度神经网络发展到了一定程度以后呢你就变成了你有一坨数据然后你把这坨数据扔给一个你也无法解释的网络最后你得到一个输出然后呢人们又进一步的发现当然这个跟原始 paper 说的也不一样啊但是呢我就我现在就说的是意识形态化以后的一些概念啊人们又进一步的发现你数据越多算力越强你最后的结果就越好
这件事情就构成了某些人的非常简化的一个思维就是我不管你的技术水平怎么样第一你是不是完全用一个神经网络的算法来去做优化而不要人工插手这个优化你只要任何地方有人工的插手你就不圣洁了你就不先进了你这就是基于规则的这事就是不好的这是端到端的意思但事实上就是首先有些事情是要通过学习来解决的但另外一些东西不是通过学习来解决
我举两个例子一个是车辆行驶的物理规律就牛顿力学就这事你不要用机器学习的方法来学学这个事情就是舍近求远了第二就是人类的驾驶规则规则这个事你也不要去学当然你说理论上你用无限量的数据而这个数据质量又无限的高你是不是能够让神经网络学出来
一套符合规矩的或者是符合交通规则的行为的策略的集合呢当然也能但是问题这里边有第一无限的数据第二无限高的质量的数据这两件事情都不能被满足所以安特恩在我来看他第一不是解决一切问题的根本我们要意识到任何的技术它都是这个历史长河中一朵小小的浪花它的技术是要往前发展的就要先承认这个技术不是完美的
然后再往前发展然后再有一个就是人们经常会去说我有这个 scaling law 这个我指的是意识形态化以后的曲解过的 scaling law 原来那 paper 大家都可以去读一读人家不如这意思在这个意识形态化下就说我多一些数据我就厉害我数据越多就越厉害
这个事情明显是一个非常懒惰的思维就是数据越多越厉害这件事是一个无用的真理就是可能几十年前任何的 machine learning 算法都会存在一个数据越多效果就越好这样的现象但是之所以 machine learning 这个行业就机器学习这个行业不断的在发展不是人们抓住一个数据够多的救命稻草
就是 20 年前 40 年前的很多 nonparametric learning 的算法或者说任何 nonparametric learning 的算法都具备这样的属性就是数据越多效果越好但是人工智能或者说 machine learning 这个领域过去四五十五六十年的人们的努力一直是让算法在进化不断地搞出更聪明的算法
而不是说现在我别的不管了我就陆续秀的开始加大算力加大算力永远是一种蠢人的做法如果没有被简化的这个 scaling law 的版本就是你说的原始的论文里它会是怎么描述的它指的是特定网络结构下在特定任务上当然 scaling law 这个事本身如果你上 wikipedia 你可能有更广的更远
的解释但是我说在 machine learning 或者说在当下很多人援引他援引的出处收库 AI 的那篇论文对他当时讲的应该是 transformer 这种架构之下的就是在特定网络结构也就是说在不改变算法不让算法变得更聪明的前提下在具体的任务指标上他发现了这样一个东西那蠢货的问题都在于他们在无线外推找到了一个片面的认知就把这个认知推广到宇宙的各个角落这是不对的
我们可以回到端到端就是端到端是不是它有一个改进是说我把自动驾驶本身它三个模块感知决策然后控制它把感知和决策给它贯通了然后它会带来一些性能上的提升
或者说感知到决策这两个模块因为就算是端到端就算是一个神经网络你也可以把这个网络作为一个图你可以切一刀切一刀以后你可以认为这边是感知那边是怎么样的这个都好说那么其实端到端要做的事情他想强调的点是一个神经元的集合和另外一个神经元集合之间的通信的带宽增大了
但是这个带宽增大你是端到端还不是端到端都可以达到但是我承认就是这个带宽的增大是一个非常有价值的事情假设我们做一个过度的简化这个自动驾驶算法里面你会发现说有一辆车在往前开
你不光要告诉这辆车在往前开你还要告诉说这辆车的大小是什么这辆车的行驶轨迹是怎么样以及这辆车的遮挡情况是如何如果你能把这些边边角角的一些其他的属性都告诉你的运动规划的算法很有可能这个规划算法就能够规划出一个和之前不一样的路径了
也就是说上下文的重要性你如果让路径规划算法能考虑更广的上下文而且每一个物体的上下文能够之间有一个互通那么这样的话路径规划一定是能做出更好的结果的所以这是一个通常的对于呃
机器学习而言非常有价值的一个东西就是你的信息量越大你当然就能做出更好的决策端到端实际上是他提出了一种网络架构而这种网络架构恰好满足好几个刚才我说到的这样的优点但是呢同时端到端这种架构也没有必要的增加了一些其他的一些限制因素
也就是说中间你不能碰它中间你不能干扰它那这些限制因素这些限制因素在我来看是完全没有必要的所以我没有必要去效忠端到端但是呢我觉得这个网络结构的迭代和升级朝着这个方向去前进朝着一个模块和模块之间共享更多信息的大方向这个是绝对正确的
对你可以把这些限制因素展开说一下因为你刚才也说其实你是了解断道端的所以你们才没有在现阶段来用这个东西那它目前的缺陷或者说问题是什么就是你不知道这个系统是怎么做对的你也不知道这个系统是怎么做错的这件事呢就是说这个 AI 的结果是不可解释的
不可解释带来一系列问题第一你不知道它是不是合规的你也不能保证它一定会做出合规的行为然后第二就是说如果当系统不合规的时候你怎么能让它修修完了以后它能变得合规又是一个炼丹一样的玄学所以它在有人在车上的这种 L2 或者说 L2 到 L2.99 吧这个阶段它在应用上是可行的如果在 L4 上它就不可行你是这么认为的
对就是你可以认为有这么几类啊就是我们谈一个产品呢产品都有这个叫做 Best Case PerformanceAverage Case Performance 和 Worst Case Performance 就是在最佳情况下就是你去秀 demo 的时候能表现出的行为来或者说正常情况下的行为但是对于无人驾驶游戏 L4 它一定要看的是在最糟糕情况下它是不是还是能够化险为一保证安全因为这个最糟糕的情况只要不能够解决
那它带来的后果都是任何公司都无法承受的所以我觉得就是 end-to-end 的这个系统呢它在 average case 或者 best case 的情况下它都做的不错那就是说你看咱们也见到很多这个大语言模型去平时写个小作文什么的还挺方便的但你让大语言模型去给你搞一个
什么法律诉讼出个法律文书吧那他不是之前就有一个律师被发现法律文书里边 hallucinate 出来了一些奇怪怪的东西就是在这个最差情况下他是对于他的结果的质量没有一个最低保证所以任何英文叫 mission critical 就是在一个你不能容许他失败的任务上
直接无脑的上这种 end-to-end learning 那基本上就找死作为一个 L4 从业者我们需要的是一个 explainable AI 就是这个 AI 必须可解释如果是 end-to-end 你可以认为就是你有一根管
进气口呢你就吹一大堆数据进去然后出口就是出一大堆你也不知道是什么的东西出来但是我们要在中间去检查它的气流那么就要把密闭的这根管道呢中间扎几个洞让这个早期中期晚期的这些这个小洞里边都能有些东西出来就我们把这个管改造成一个长笛那我们
就能够从这个小洞里面去窥见它里面的执行机制是怎么样的确保这个东西在执行过程当中永远是有一些足够强的限制或者说它也本身是可解释的说到这个其实发布会上马斯克还说到一个点就是说在他们这个 Cyber Cap 也就是现在没有放上盘的这个版本量产之前你自己买的 Model 3 然后 Model Y 这些车就可以去路上拉客人那实际上也会面临合规的问题对吧
就我们基本上可以认为这句话是不太可能实现的短期内对不可能实现那撞了人算谁的这个问题谁解决撞了人如果是算车主的那哪个车主敢把自己的车放出去搞这事那么哪个车主就死定了如果特斯拉要来做一个 RoboTaxi 的运营它是不是还是得像 Vimo 那样我先从一个小范围开始做运营测试
我觉得应该是吧想不出来别的路径当然他要不要做又是另外一个问题了这个全都是假动作呢还是说他有可能哪一天真的要做这个拭目以待吧然后除了端到端之外今年各家也都在提的一个东西还有世界模型当然世界模型这个概念可能就是被说的更泛了就不光自动驾驶行业在说比如说理想未来威某都有类似的表述
像这个做大模型的 OpenAI 最开始发 Soro 出来的时候大家也会说这是一个世界模型可以简单说一说就是你理解的什么是世界模型吗行那世界模型这事我得先说就是我现在接下来的讨论就都不是意识形态化的讨论了因为我觉得任何时候谈到意识形态化的话就是狗咬狗了
世界模型这个事如果我们真的去探知一下用一个善意去探知一下每个人去讲这个世界模型的边界其实真的回归到这个 Computer Vision 的祖师爷 David Marr 他在 1970 几年就提出了所谓的 mid-level representation 叫做中层视觉表达
这件事呢就也恰巧就是我对于 computer vision 这个行业的启蒙就来自于 David Marr 的那本书这也是我非常坚信我觉得如果要想了解智能的本质就应该去了解它的 internal representation 或者叫 mid-level representation 我也是怀着这样的信念从 2006 年就好多年过去了 18 年前投身计算机视觉这个领域包括我的博士论文也讲的是 mid-level representation 叫做中层表达嗯
你 06 年是在上本科吗对大二的时候你当时是为什么你大二的时候要去看这本书包括有长期这样一个历史说我就想干这个这个说来话长了那就更早的时候呢我其实之前做网络安全的但是我越做网络安全越发现网络安全我做的再好我也不会凭一己之力去改变世界所以我必须做一个可重复的或者说可复制的一个生意这样的话我做了一份我就能复制很多份并且这很多份都能够产生价值所以在这个
大思路的驱使下吧我其实就挺早就决定要搞 AI 了因为我觉得 AI 这个事情好我只要把一个 AI 做好呢
它的能够产生的社会影响力是会比我什么发现一个著名网络漏洞产生的世界影响力要大得多的所以怀着这样的想法呢我就开始去大一的时候吧就开始去看各种人工智能的东西当然看的也很杂了但是我最打动我的其实是 David Marr 的那些理论就是说一方面我们是从人脑的神经元入门去窥探意识会窥探智能的本质那
往这里边走的话非常重要的一个概念就是 mid-level representation 这个 representation 其实我就是觉得它就是当今大家都在谈世界模型所谈的这个
这个事其实都是在谈 representation 那我就再打个岔比如说人工智能有一个非常著名的一个会议叫做 ICLRInternational ConferenceOn Learning Representation 这个里边也是他把这个坑就占得非常好他就是说我们对于一个外在世界的内运表征或者内运表达都是可以学习并且应该学习这个学习不是指这种什么上学的这个学习是指说机器学习的具体算法就是
叫做学习那么就这些内运表征都是可以被学习的而且应该是通过学习内运表征最终达到智能其实我们如果忘掉无人驾驶啊忘掉机器人我们就谈这个人类的智能是怎么产生的你会看或者说动物的智能怎么产生的脊椎动物的智能主要为主啊
那么基本上都是说视网膜先做了一层分析能够把一些光点啊然后有一些这个具体的颜色啊进行一些最最基础的处理随着这层处理以后呢视网膜处理完以后放
到后脑勺那边有一个初级视觉皮层进行进一步的从很小的区域的处理变到一个更广的区域的处理于是我们能够在初级视觉皮层检测到边缘检测到边缘再往上走到这个次级视觉皮层 VR 检测到轮廓检测到遮挡
检测到甚至物体的概念运动的概念那么这些物体的运动的概念以后再进行的是物体识别一层一层往上走甚至说具体化到人脸识别表情识别那最后呢这些识别有的东西会极致的细化到说你有一个脑子里边有一个神经元能够对且仅对你的祖母就你的奶奶有反应这个就是著名的祖母细胞那么这个过程就是智能
那如果我们把这个过程谈到这种的话你会发现这是一个很长的一个 pipeline 那么在这个 pipeline 里边早一些的处理比如说对于边缘对于轮廓的处理它有没有用当然有用晚一些的处理人脸识别有没有用当然也有用甚至人脸和声音的结合也有用所以在我来看我们应该基于的是一个
mid level representation 或者说应该是基于一个所谓的世界模型去认识这个世界但是不要说只有这个认识过程的最终点的一块有用中间你加了就是作弊加了就是不纯粹就这种观点就是红卫兵的观点了
肯定是要强烈反对的但是在我来看就世界模型只不过是新瓶装旧酒应该是 79 年的时候 David Marr 写完他那本书呢白血病就去世了所以这也是我们行业的一个重大损失但是其实 79 年机器视觉行业的祖师爷就已经提过了这个世界模型了当然我们觉得随着这个一代又一代科学家努力这个世界模型变得
渐渐我们看到它的模样了我觉得这个还是非常令人欣慰的一件事情那简单来说世界模型它要解决一个什么问题了就是它要实现的目的是什么当然每家人讲世界模型讲的东西都不一样了就是以这个侯小迪的理解来看这个世界模型就是说通过一个很漫长的信息处理的过程使得物理世界的各种各样的属性能够在这个信息处理的过程当中涌现出来
它涌现的地方有可能比较偏前面一点有可能比较偏后边一点任何的具体的任务具体的属性物理属性都是能够通过这样的处理过程自然而然的发生那么这个处理过程就产生了一个信息的宝藏就如果我们需要一个产品产生一个具体的任务那么这个具体的任务是可以在这个所谓的世界模型里面找到它合适它使用的原材料的
这些原材料的处理过程是智能的过程。最提到自动驾驶这个领域的话,世界模型可以提供什么功能啊?比如说楼天成就是小马的 CTO,他就会认为世界模型比短道端更重要。他讲的一些东西我理解的啊,是你比如说你可以提供一个仿真环境,同时你可以提供一个裁判吧,就是去评判你这个自动驾驶系统到底进化到了什么程度,它的表现到底是好是坏,你觉得世界模型在自动驾驶里是什么作用?
那你看我觉得我跟他的理解就不完全一样了我是比较原教制主义者的那比如说我们无人驾驶要去把所有的感知任务拿过来那么需要去知道这辆车的速度是什么那我掏一掏这个口袋这个口袋就是世界模型这辆车的速度都在这个里边
信息的智能处理的过程就是把东西从像素一步步的翻译这个处理过程就形成了一个巨大宝藏这个巨大宝藏就是我们说的世界模型在这个模型里边我们能够很轻易的获得我们需要的所有的物理属性完成我们的任务仿真环境在我来看是手段就是你用什么环境怎么样都好
它只是帮助了你的学习过程任务是要把这个物体的内运表征学出来当然有了这个内运表征你怎么用你反过来你可以说仿真环境能用这个内运表征但是除了仿真环境还有很多其他的东西谁都能用你的内运表征接下来想问的一个问题是说现在自动驾驶已经发展了十几年然后大家也目前看到一个路线好像是在逐渐收敛的那沿着我们现在这个路线就可能达到 L4 乃至 L5 了吗
就是大家凡是提到 L5 我觉得是有一个误解就是 L5 本身提出来的时候就不是为了让你达到的这个定义者在定义这个问题的时候其实就是一个我既然都定义了这个问题了所以我也得定义一个这个问题的终极最终乌托邦形态那么这个乌托邦形态就是 L5
所以就像地平线一样你永远能看得见地平线但你永远也达不到地平线就是这样一个意思 L4 反过来就好说了 L4 是产品产品到最后就是你谈产品就得谈怎么挣钱挣钱嘛生意不寒碜我觉得技术问题就是商业问题是一个问题更需要的是说 L4 到底能不能挣钱到底什么样的技术能够让 L4 的运营成本变得特别省心能挣钱呢这件事情今天没有答到还
在这个今天还没有达到目标就是让 L4 挣钱上你觉得有什么绝对性的限制因素吗因为你之前说过余者的一个问题就是不加节制的外推因为大家会忽视一些限制性因素对我觉得首先就是今天甭管是 vimo 还是百度的萝卜快跑都没能挣钱对吧这个是一个大家都承认的事情但这事也不寒碜啊就是我们今天确实技术还在往前走但是可能呃
对于整个行业来讲第一就是说算法的进步是要跟你的软硬件的成熟度所配套的比如说如果我们面临一些非常不稳定的硬件可能就需要在软件和算法上多花更多的精力所以现在还是在一个收敛过程当中吧但是呢我认为这个收敛里边有一些因素它的收敛速度
我感觉可能是遇到了一些瓶颈我举一个具体例子就是说很多人说远程遥控对吧我也听过一些朋友讲远程遥控但是我自己也没有太多的坐 RoboTaxi 所以我肯定这个是以听别人说为主但是远程遥控现在看起来就是大家都纷纷遇到瓶颈也就是说为了能够让一个人类乘客在接受无人驾驶的服务的时候
出现了一些城区内的比如说要么是别人不属交通规则要么是自己的车开得太面这样各种各样的问题的时候能够更快的解决这个问题远程遥控和这个无人驾驶车辆的比例现在考虑 1 比 3 是一个常态但是什么时候能从 1 比 3 变成 1 比 10 这个时候大家其实心里都没底我就在这一点上很有可能我们会遇到一个比
外界估计的花的时间更长的时间才能够解决一个人拖十辆车这样的问题因为第一任何时候车出了情况都需要有人去立刻去看乘客是没有耐心的乘客不会等你一分钟然后你再去给他解决这个问题第二呢城市交通呢又不是那么符合交通规则的比如说前面稍微压一下双横线我可能就蹭过去了那我要不要压双横线呢很多时候
如果你直接去让无人驾驶去做判断很有可能是不要但是在这种情况下是不是人类可以远程遥控一下压一下双方向线我觉得这些事情一方面是需要更多的这种人的社会属性去做一些判断第二就是说乘客的等待时间永远是非常短的所以为了提供高质量的服务远程遥控一个人能拖几辆车这个事情的进化我觉得不一定很乐观
我们最后可以聊聊你自己的创业你刚才也提到了零星提到了一些信息我们可以展开说一说首先是恭喜你们刚宣布了一轮融资 2000 万美元自动驾驶这个行业其实这几年的融资水温都是非常冰冷的没有什么人投所以现在还相信这个方向的投资人他们的理由是什么
我觉得这个里边就是既有这个投人的理由也有投项目的理由就是我觉得一方面可能确实之前至少我在技术和技术管理上还是表现出了很强的竞争力的所以确实很多的人哪怕是一些没有最后投 Bot 的投资人都会有这样的
说法吧但我也很荣幸啊有的人说这个要是谁能在未来五年之内无人驾驶卡车做出来那肯定就是你了小弟但是我们不投是因为我们觉得谁都做不出来所以有的投资人是怀着这样的想法就最后就没有投但是呢凡是投了我们的投资人呢那肯定是首先对我是认同的但是他们的角色数里面第二点呢就是说现在是不是无人驾驶合适的投资时间很多投资人都跟我讲过这样一个事情他们之所以之前按兵不动
是因为他们无法回答自己这样的问题就是无人驾驶当时是不是太早了
但是现在看起来呢我觉得在这个时间点大家都是有比较清晰的共识无人驾驶会发生接下来不是技术问题所以这就是为什么我比较开心的地方就是你看越来越多的人聊 CPM 而且聊的这么自如就是每一例运营成本 CPM 所以这个时候我能看到是有人分分入场的当然而且就是这个无论是 vamo 啊罗伯快跑还有其他的这个呃
文远 Pony 他们其实都在已经在做运营了所以这个事情成不成不是一个技术问题而是一个技术优化问题就是技术优化导致到最后让他变得 CPM 变得有竞争力我相信大家逐渐有了这个共识以后那么接下来我们融资的路可能会走得好一点因为对投资人而言的话
他们也这是最后一波投资无人驾驶机会了因为如果我们这个技术再往下发展发现无人驾驶技术自己就能挣钱了所以其实这个问题就是五年以前可能七年以前八年以前大家担心的是技术行不行技术现在差不多已经没有问题了那就是运营行不行
运营没有问题的时候是不是已经没有 VC 什么事了所以我觉得可能越来越多的人会从这个角度去看这个问题就是这是最后一次 VC 能投不人家时的机会了所以我觉得我们这次融资还算比较顺利而且是超目的你可以讲一下你们现在大概的业务是怎么运转吗比如说你刚才有说到其实你们是不做这种远程托管的所以你们并不会真的去拿掉一个卡车司机是吗
首先我们现在是公司还在早期我们现在还是在有人的在做各种各样的测试公司刚成立一年这个还没那么快这是第一但第二其实就卡车跟轿车比一个特别大的点就是说第一卡车里边运着货这个货不像乘客一样一分钟没人理他他就跟你急了对吧所以我们允许这个车比如说停在路边我就晾你十分钟无人驾驶车也不会跟我们着急
这是第一第二呢就是说大部分的超长的距离都是在高速公路上跑但是高速公路上面它的这个交通规则是相对比较清晰的不会说我必须压双环线绕过前方停着的那辆车我才能够进一步的继续行驶
不太会出现这种说不清道不明的事情而在那个城市交通里面这种情况实际上非常常见所以我觉得我们是比较容易获得一个不需要接管就能够解决绝大部分问题的这样的一个系统所以这是我们比人类司机的一个优势或者说比城市交通比城市的 robotex 的一个优势
你刚才也说到其实在七八年之前或者五六年之前市场都是觉得这个行业非常早期的有一个疑问那回头来看就是你上一家的公司图森是在 21 年就上市了就是你觉得有什么可以复盘的吗整个节奏上
我觉得其实无人驾驶这个事就变成这样就是公司里面有的部分团队呢就是在做技术比如说我是带着一个做技术的团队然后我也把自己很舒服的安排在做技术的位置上但是实际上公司就虽然是一个这个股票代码一个股票代码下呢就产生了两个公司一个公司在做技术另外一个公司呢在搞扩张在搞运营在搞收入
那这种搞扩张搞运营搞输的公司我我觉得我作为创始人的问题就是说我一没有过问这个事情然后第二就任由它发展发展到了运营可能占了公司一大半的成本就是钱全都花到运营上了但是呢技术团队还是那十几辆车还是原来那两三百个人还在做运营做技术这个事情就导致我觉得呃
一个公司如果说一方面认为需要靠运营去刷一些收入刷一些单拿这个单能撬动更大的融资但实际上撬动更大的融资这件事本身就是不可持续的还是应该回归技术本身所以我觉得这次在重新做 boss 的话我确实是有一些思考我觉得我们应该尽可能的避免过早的扩张过早的去搞收入 revenue 这个事儿
以前可能不懂事我也不懂我也没管但是现在就是说我懂事了管了一定是不能有以 revenue 为纲的这样的心态也不能基于 revenue 去建一个团队现在我们要做的事很简单就是以 CPM 为纲一切东西朝着这个 cost per mile 前进
那算法呢要服务运营就像我说的算法的选择是会很大程度上影响运营成本的我们不要让这些最聪明的大脑们高高在上说我们算法最厉害了我们就要这个搞一些特别炫酷的算法我们现在的运营才是最厉害的我们甭管算法高级低级能省钱就是好算法就是黑猫白猫抓着耗子就是好猫
同时呢如果我们的算法并不需要我们有 30 辆车在全美国各地各处跑来跑去那我们就不要去过早的扩张出什么几十辆车在全美各地跑显得好像我们已经建立起了一个伟大的商业帝国一样就是本分一点在一个小区域先把这个 CPM 跑通不要给资本演戏
回到几年前的话你觉得当时包括你们在内的各家同行他有别的选择吗因为那个时候其实竞争是很激烈的你需要一些动作去吸引更多的钱同时他也会带来更多的人才对吧人家都在扩张你一小团队那可能人也都跑了虽然可以说这个历史不允许假设但是我觉得是有选择的那就算图森 1500 个人的时候那 1000 个人都不是我招的呀
对吧就真正你会看推着技术进展推着事情往前走的还是那些可能在这个我们一穷二白的时候加入的这些早期员工这些人构成了一个公司的中介力量这些人推进着这个技术发展
反倒是说这些后来产生了扩张又因为扩张而加入的这些新人他们自己构成了另外一家公司虽然还是独自的名字所以我觉得这个其实是很多这个过早过快扩张的公司都会有这样的诅咒其实你刚才也说投资人愿意投你的有一个原因是你积累了这个技术管理能力嘛当然我觉得可能你也积累了很多技术管理的教训啊你刚刚说的这是其中一个点啊你觉得还有什么吗
我觉得可能最主要就是这个技术管理的教训吧就是公司的战略呢一定是以这个赚钱为目的的赚钱不是赚 revenue 赚钱是赚 profit 如果我们能把这个赚钱赚 profit 这件事从公司 level 想清楚甚至从技术 level 想清楚甚至这件事还能回答我们要不要上激光雷达对不对那如果我们这些事情都能融会贯通的想清楚那就朝着这个目标前进就好了值
这时候你会发现很多可能口口相传的就是硅谷神话里面其实有很多没有必要的操作有很多都是花架子把这些东西都去掉以后你剩下的是什么剩下的就是一堆工程师天天应该盯着卡车搞运营然后运营到什么时候我们的 CPM 能降得比人低了大功告成
你们的新公司这次创业 Botout 是在休斯顿是在美国的中部你之前从上海交大毕业你是去加州理工读了博士然后图森之前在美国的话也是在加州的圣地亚哥相当于就是你有一个从美国的科技创新腹地硅谷往中部迁移的这么一个动作这个主要是为什么还是那句话运营就是我最不能够容忍的就是让聪明的大脑有高高在上的架子
但是我觉得我们很开心的就是团队其实没有这个架子大家都是以那么这件事做出来为最终目的那如果这样的话
我们就不应该去挑我们在哪做那我们公司总部就应该设立在一个最能够帮助我们降低 CPM 的地方那这个地方呢就是一个美国中部的物流重镇就是我觉得可以讲讲硅谷和休斯顿的你感受到的一些区别吧比如说像去年硅谷银行这个事件前后有次我们还聊这个事来着然后你说几对风潮挺有硅谷的风格这里有很多聪明人会无脑的去跟风和扎堆
那你现在去休斯顿的话你觉得两边的区别是什么这个有好有坏了就是好处呢是离产品太近这个 20 分钟就我们就能上车路测坏处呢就是离投资人太远所以时不时的我就得出差但我觉得我宁可我出差我也不希望我们工程师出差以前的情况是什么是离投资人比较近也不算特别近但是离产品太远什么开车坐飞机都得好几个小时你才能去做路测
这是第一个吧我觉得就是离什么近离什么远这件事第一个区别我觉得能够办公室 20 分钟就出去录册这件事情实在是太好了这个事情比一切东西都重要那第二我觉得从这个心态上吧其实还是一个不浮躁的心态这个也很重要就是我当然当时为什么选 San Diego 没有选直接把公司开在 Bay Area 也是一样道理就是我觉得一定不要浮躁
不要说每天一惊一乍的每天经历什么就是 breaking newsoverflow 我这个创造这么个概念就是说你每天看这种号外号外
世界上那么多事哪有那么多需要你关注的对吧你说什么纳达尔退役了你也 breaking news 布吉纳法索政变了你也是这个啊又是个 breaking news 然后黑神话悟空没拿到这个金鸟儿杆奖提名也是个 breaking news 其实这些 breaking news 跟你有什么关系如果我们说一个人的这个认知的能力是有一个范围的话
如果你每天都被充斥着这些 breaking news 来占领了你的这个认知能力的话你其实就没有什么心思去想具体的事情了我觉得在湾区的一个比较大的感觉就是说因为信息流动太频繁了又有很多聪明人那聪明人在流动信息的时候他就能够看到一些一些很小的事件背后有可能对这个世界产生的巨大影响于是任何微小的噪音都会在湾区放大很多倍
就是任何一个小的产品的发布任何一个小的但是新的机会都会让你觉得这件事情就是个 breaking news 于是你每天活在这个 breaking news overflow 里面我觉得在这种情况下我是比较希望我和我的团队能不要那么着急去跟进每天的新闻事件的发展我们又不是香港记者对不对图样图 simple 啊
但是你在休斯顿的话我觉得可能会有一个比较长期的质疑就是说你们怎么招到足够好的人我觉得你要是信这个事能做成在哪都不重要而且休斯顿还便宜呢你看看休斯顿的房价我其实还有一个正好还有一个想法也可以分享一下就是说我们这个公司呢
我认为也没有必要做的很大所以我们现在 40 来个人 40 多应该快 50 了到最后呢可能我觉得如果说真的把这个技术做到这个 cost per mile 比人类司机还便宜的时候甚至可能也不会有特别夸张的说我们再搞个几千人的大团队可能一两百人这个事情就做出来了就我觉得这也是一个新时代人工智能公司的一个新特性就是你发现越少的人总是能够越多的事情做出来
这个事情其实反过来也是一个新时代的底色比如说 2022 年以后随着这个 Chad GPT 的诞生 Pretraining 这个事情变得很普遍很流行 Transformer 也变得很通用
那基于人工智能的大流行呢整个生态系统也变得说你随随便便找一个云计算平台就能几乎满足你的所有的要求你也不需要一个这种软件基础设施的团队并行计算的团队都不需要了然后呢开源平台也会让你这个
很多这种别人已经造过七八十遍的轮子也不需要你重新去造轮子了这些事情实际上都能够让这个团队以一个比较小的团队规模关注到这个产品中最重要的部分这也是我这一次组织团队的一个基础原则所以就是哪怕我们融了资了我也公开在融资材料里边写我说我们不会孤独扩张团队的
这个会招一些人但是只会招很少的人你们今年或者未来一段时间 Bot Auto 有什么计划吗就是希望你可以比马斯克讲的稍微具体点对就是我觉得就是明年明年年中之前我们不会招超过 15 个人嗯
这个人头一个个都算出来不会超过 15 个人每个人要做什么讲得很清楚我觉得今年之内可以给一个预告不知道是你捡的快还是我们开发的快很快我们这个 hub to hub 就能够做出来了就是一个全 L4 功能的车就能在休斯顿路上跑了
是有人搭这个车就是今年的车是有人有安全员坐在车上但是呢这个事情更多的反映的是团队一年零几个月的时间就能把这个技术做出来这些事情当然是有赖于我们的
全面拥抱 generative 没有 generative 我们全面拥抱 pre-trainingtransformers 的这样的一个技术选择今天非常感谢小弟作客晚点聊和我们分享了他看这个发布会的一些感受以及他作为从业者看到的 L4 行业的一些真实进展和烟雾
如果总结一下今天最大的 take away 或者说小迪想表达的一个核心观点就是 CPM 即单位综合运营成本的重要性自动驾驶当然是一项激动人心的技术但是这个技术要落到实际要为人所用其实中间有很多细碎的运营问题工程问题
CPM 可能就是现在这个阶段能把方方面面的问题容纳进来的一个比较好的指引框架再次感谢小迪的分享好的我们今天就聊到这里谢谢曼琪感谢各位的收听大家再见
本期节目就到这里欢迎收听如果你对今天聊的话题有观察好奇或疑问欢迎在评论区分享想法这也会成为我们节目的一部分让整个讨论更完整你也可以把我们的节目分享给对这个话题感兴趣的朋友欢迎推荐更多你想听的主题和嘉宾你可以从小宇宙苹果 podcast 等渠道关注晚点聊 Late Talk 也欢迎关注我们的公众号晚点 Late Post 下期再见