Wang Xiaochuan believes the medical and health sector is promising because it addresses a critical and growing need. While most industries are becoming cheaper, healthcare costs are rising. AI and AGI can help solve this by increasing the supply of medical knowledge and services, which are currently limited by the number of available doctors. Additionally, healthcare is a high-value, high-demand industry with infinite potential for growth, making it a suitable field for AI applications.
Wang Xiaochuan views language as the central axis of intelligence in AI development. He argues that while modalities like video and images are important for interaction, the core of intelligence lies in language. This belief stems from his experience with natural language processing and knowledge computation, which he sees as the foundation of AI's ability to understand and generate intelligent responses.
Wang Xiaochuan categorizes AI applications into three types: those that 'kill time' (entertainment), those that 'save time' (efficiency tools), and those that 'add time' (healthcare). He emphasizes that healthcare applications are unique because they directly contribute to extending human life, making them a distinct and valuable category alongside the more common entertainment and efficiency tools.
Wang Xiaochuan's approach to developing AI applications in the medical field involves creating AI systems that can assist, replace, and even surpass human doctors. He envisions a progression from AI-assisted decision-making (L1-L3) to fully autonomous AI doctors (L4-L5). This approach aims to address the scarcity of medical professionals and improve healthcare outcomes by leveraging AI's ability to process and analyze vast amounts of medical data.
Wang Xiaochuan considers healthcare the 'crown jewel' of AI applications because it is a field with infinite demand and high intellectual density. Every aspect of healthcare, from diagnosis to treatment, can benefit from AI's capabilities. Additionally, the complexity and value of healthcare make it an ideal domain for demonstrating the full potential of AI and AGI, as it requires a combination of reasoning, communication, and multimodal understanding.
Wang Xiaochuan identifies several challenges in applying AI to the medical field, including ethical concerns, the complexity of medical data, and the need for rigorous testing and validation. He also notes the paradox of people fearing AI's potential to destroy humanity while simultaneously doubting its ability to contribute meaningfully to healthcare. These challenges require careful navigation to ensure AI applications in medicine are both effective and trustworthy.
Wang Xiaochuan defines the levels of AI involvement in healthcare using a framework similar to autonomous driving levels (L0-L5). L0 represents complete reliance on human doctors, while L1-L2 involve AI providing single-point or combined decision support. L3 represents partial autonomy in certain scenarios, L4 represents near-full autonomy, and L5 represents complete autonomy where AI can fully replace human doctors. This framework helps clarify the progression of AI's role in healthcare.
Wang Xiaochuan envisions a future where AI in healthcare evolves from assisting doctors to fully autonomous systems capable of diagnosing, treating, and even preventing diseases. He believes that AI will eventually create a 'life mathematical model' that can understand and manage human health at a fundamental level. This vision aligns with his broader goal of achieving AGI, where AI can replicate and surpass human intelligence in complex domains like medicine.
欢迎收听 AI 局内人 AGI Insider 是极客公园旗下的科技创业者社区 Founder Park 出品的 AGI 系列播客节目明明是最懂大型 DAU 应用的大模型创业者却最晚发布 2C 应用
明明 2023 年的动作风驰电掣今年却只迭代了一版模型明明大家都在做泛娱乐效率工具他却频繁地提起了医疗和健康赛道因此很多人看不懂王小川为什么做大模型应用要谨慎医疗和健康赛道有什么特殊以及他为什么说医疗是通往 AGI 的难而正确的事情在 AGI Playground 2024 大会上王小川针对上述问题给出了自己的回答
欢迎收听本期的 AGI Playground 2024 系列采访节目本期的嘉宾是王小川我觉得你瘦了吧是不是瘦了大概瘦了你眼睛很好大概有三斤吧我还那么精准可能是因为跟这个发型和化妆有关但我确实觉得瘦了一点但状态挺好的对 因为这个经常在称体重现在也开始是健身了吗对 健身真健身了是啊
那跟你去年的状态变化还挺大的去年我的印象是你那个时候就是浑身张力拉满我记得当年就是小川叫一个月发一次大模型更新我觉得你那时候的状态就又进入到当年我认识你可能得有几天不洗头然后整个那种状态就很明确今年感觉不太一样是有什么节奏的变化发生了吗
对 我的观察是从我们自己的这个节奏所明显的这个变化嗯那这个行业的变化呢其实去年知道的百川是去年成立的新公司四年四月份成立那可以叫做一脚地板油就
就踩到了这样一个厚的这个滋滋的响冒着烟一脚地板一眼往前冲走 28 天发一个模型其实也很快我们在 4 月份成立然后 6 月份就开始发第一款的这个 7B 13B 的开院模型 8 月份咱们知道在国家发这个大模型牌照就备案全国当时 8 家
八家的话包括像字节然后百度然后商汤创意公司有三家叫百川 minimax 和智普其他两家都是 19 年 21 年成立的我们最晚的一家所以就当年四个月后就拿到这样一个国家的这样一个注册备案 9 月份就发这个百川开源的 7B 13B 那么后来跟网信办聊他们后来这个去备案的 160 个模型里面有一半用的百川开源模型上去搭建的
所以去年是整个一带一个急速的往前去跑然后整个也在团队在这种扩张整个这个行业也是消炎四起这种状态所以到这个到行业来讲也很快到今年你去发展每家都开始在找自己的定位和节奏包括对大模型不管是从这样一个文本的这种语言模型到视频模型有更多的思考虽然就这个今年我们可以看到说虽然每次国外有个新的发布的时候国内还是一阵狂欢
但不像去年那种退背感就每天都有看不完的这个新的信息和新的这个论文现在论文也很多但整个节奏我认为跟去年是完全不一样所以今天我觉得更多能够这个很安静的能够把自己这样的独有的竞争力把内部的这样一个这个怎么算是定义这种成功和这种战斗胜利里面有新的一个疏离了
你说到这个环境的变化甚至带来了创业公司节奏的变化所以百川自己的节奏或者说你给百川设定的节奏是不是也有了明确变化因为去年很明确每个月都要在大幕前上有进展有更新我当时印象很深简单足保一脚地板油那今年这个节奏是怎么设定的呢今年的目标是啥今天我认为大概从一个月为一个单位来做可能会变成一个季度
那今天我觉得跟去年这样的不一样的地方的话呢去年大家这个关注点是在这个模型那今年模型大家已经开始这个更多看它什么性能啊然后这种它的 cost 它的降降成本同时的话呢更多在应用里面大家开始这个探讨怎么能够变成你的这样应用的突破像去年四月份成立的时候我们就提到了几个关键点就叫做理想上慢一步 落地上快三步
这是对美国张鹏当时也在说这个讲完之后大家是不是能去误解觉得没有理想我倒觉得其实并不是这样的一个状态我们都说做超级模型或做超级应用这两个超级我觉得今天依然是成立的而且大家已经开始关注这个怎么叫超级模型怎么叫超级应用不是只是大家在这个拼谁能够卷到那个快一点东西上
所以我认为今年来讲我给大家交付的答卷里面是对 AGI 本身有更完整的思考这个就怎么是 AGI
然后达到它的路径是如何然后以及超低应用该长什么样子今天大家这个看得眼花缭乱但是行业中间在今年也看到依然在争论一件事情是这个理想主义现实主义之间两派在争到底是往 A 阶走还是先落地做应用所以这里面的话我觉得今年这个是按照季度走应该给公司内部也好给国内也好能够交付我们自己的答卷这一年有什么
你能感受到的在跳进来之前没看到但今天你看到比较清晰的这种东西吗比如说我理解当时做模型这件事本身就让人很兴奋因为你做出来对吧然后能够不断的进化这个进程就会让人有一个确定的目标非常兴奋但等你实现这个目标之后你会肯定会看到一些新的挑战和目标有什么新看到的东西吗
我能够更多去切身感受中美之间的这样一个区别就美国在这个时代的话你可以看到它是一种技术的狂想它的登月的这样一种想法那么可以说像之前欧盟说是要 7 万亿美元去造芯片
对吧然后开始搞合共合几变就是总之他们会把这样的一个理想主义东西继续去拉满但国内的时候的话呢现在就发现我们到底是去这个追评甚至在弯道超车这个领域在理想上怎么去跟有很多很多的这样一些怎么说呢这个质感中间大家的这个焦虑感然后
然后以及在应用落地里面现在以前我们中国号称自己的应用比美国落地快但是模型还在继续迭代的时候我们到底是在应用上能够像之前互联网时代里面一下子能够弯道超车还是处于就是 follow 这样的一个状态所以国内中间对于投资人也好对于行业也好我感觉大家在这里面是有新的范式会有变化看起来
觉得这个时代是一个重要的变革大家都是共识但是这个变革到底怎么发生怎么落地其实这件事发现越来越多的非共识和不确定对 依然很多非共识去年到今年的非共识我觉得依然没有减少比如说到底这个 Skin Law 到底什么时候是能够继续维持还是这个就会停下来然后
包括这个我们提到语言跟这个像 Sora 代表的视频之间的这样一些这种关系然后这样的一个这个 2B 2C 现在依然我认为在一个大环境还是有很多不同的观点那我觉得问问你比较明确的观点最近这一年肯定还是从美国的角度从全球的角度还是看到一些技术的进展我们看到比如说 Sora 4O 其实还是有一些变化比如像 Sora 我记得
就是你曾经表达的观点就是你觉得这个事好像是要不跟对吧或者说我希望听到你一些原始你怎么分析 Sora 这件事和为什么这件事好像不是百川接下来要迅速去跟的这个背后的逻辑是怎么样
对,刚才正好这个长虎也在讲视频这么一个情况,所以从去年的话呢,我会认为今天大家觉得大模型做对了什么事情的时候,其实大家第一个关键词都知道是叫做大,所以今天会提到这个已经被验证通的叫 scanning law,这是第一个这个词,但是中间第二个词的话呢,大家开始慢慢就去模糊或者忽略叫做 language,
叫 Large Language Model 就语言在中间扮演了今天通向智能最重要的一个角色其实当时做 SOGO 的时候的话呢我们当时就有两个这个方向一个叫做自然交互一个叫知识计算知识计算其实代表一种智能自然交互使得人跟他能更好的这样一个接触所以在自然交互里面的话呢会提到像这种语音 图像 视频
但是知识计算的话呢中间核心这个智能是来自于语言的今天大家提到说用图像或者用视频去增加智能去年来讲的话呢跟行业伙伴在聊的时候大家就说还有一种争议我是坚定的叫做语言为中轴是做智能的因此在这里面我们的分析就是智能今天来自于以语言为中轴
但是如果我们做交互系统的话呢会有声音和图像因为在这里面在这次创业时我们就会选择我们的这样一个先把什么那种长板给拉满是在这个智能上所以依然会坚持语言为这样一个一个一个中轴
但是当大家提 Sora 的时候更多在调到一种确实很炫其实之前我前段时间跟一些比较厉害的学者聊他也很震惊但慢慢回过神来之后会知道说如果我们把智能当成我们现在重要的一个观点的时候还是得围绕这样的一个语言中轴其他的模态在中间只是帮助你能够在应用逻辑的交付里面更加的更加的这种快所以对百川而言的话如果往 AGI 走
那么我认为依然来讲是要做智能智能背后就是走语言所以这个立场是没有去变过的甚至可以看到这个 Sora 发布的时候大家也很 happy 然后后来发 4 欧的时候大家也有这种惊呼那么交互上都很好后来看 OPI 内部这个分享的时候就开始提到说还是要坚持叫做 Textual Intelligence
就是这个文本后面的这样一个智能那我们在今天我们在看到是叫连接主义符号主义前两个这个这个叫做可解释性或者说是因果性的时候大家都以符号为中心来讲它的这种可解释性今天大模型核心是把这个符号主义的语言包括数学符号或者说其他的代码符号和这个通过这种连接的这种 transformer 做压缩连在一块所以这边的时候这个依然我的关键点是不要忘记了智能跟这个符号主义之间的关系
智能跟符号主义之间的关系这件事也不能忘但反过来你刚才说的一个很重要的点就是如果我听你刚才的表达你似乎是在说
比如说我们看到 Sora 这件事虽然非常 amazing 非常的让人震撼让我们视觉受到巨大冲击但它不是提升那个智能的主轴线就是如果你认为智能是那个最核心的目标它是旁支我这么理解对吗对它是旁支就是你听智能的话语言是这个中枢句语言是白粉的话那你这个视频就是面粉
它的这个里面智能性增加的难度可能是一百倍一万倍所以今天其实并没有这样一个技术能力和技术突破去实现在这个市面中间提升智能甚至大家看到我们今天人在对智能在找规律的时候其实这个智能是把不同事物中间相同规律给它一个名字
像这个庞嘉来之前就讲他说数学的这个艺术是在于叫做 giving the same name to different things 对吧所以一个数学家就讲说数学之美就是把不同的事物用同样一个符号来表达它给它同一个名字所以在这种里面的时候视频里面是没有这样的一个这个智力和抽象的这样一个能力的
所以我们说我们做原子分子实验做电子追踪机的实验今天都不会从这种视频里面获得这样一些智力视频再多就说就像你机器读了一亿本小说它其实也不会增加智力一样的它智力来讲它不是说看到数据多就行而且你这个数据它背后所蕴含的宇宙里面的规律有多少今天机器来讲是在人类智慧的语言中间去学习的
所以某种程度上如果我视频可以去把它压缩然后再还原它有可能在里面并不是真正咱们说的智能而如果要去被抽象就通过语言这一层其实是要经过抽象的这件事实际上是更接近智能就是照于今天的范式我们是没有能力去通过视频去发现新的这种知识去表达它发现都是做不到的
所以这件事情这个技术限制了我们通过视频做这件事情但是他
很酷嘛对吧就是这件事做出来很酷所有人可能估计弄完了一堆一你的朋友都问小川你啥时候做啥时候跟我估计你的团队你团队是不是也有人想干这个事有想干的你怎么回应他们的因为这个就是真实在今天你能做出来你就很酷可能很酷就能拿到更多的投资对吧能够继续往前走你为什么选择你非常态度明确的说这你不跟我觉得很清楚说我们这个时代里面往 AGI 走就是这个智能是核心
所以但凡把 Sora 跟智能中间划关系我就是对技术不太懂所以其实本质上你选择的有深度认同者你本质选择的是在智能上所谓叫掌个不是横向的扩展旁边我们是 AI intelligence 我们讲 intelligence 讲这个事情
充分印证了小川还真的是要 commit 到 AGI 这个目标上的那我们怎么解读 4O 就是 4O 这样的一个技术你会怎么理解因为我们也听到有创业者会说 4O 这种统一多模态的方式可能是接下来做大模型的公司的必答题如果说 SORA 是选答题可以不选但这个是必答题你认同吗
其实我是看这里面就是私人来讲的话我们是看一个技术还是看它的这么一个交互依然把私人带车在交互里面能够 deliver 更好的用户体验而不是讨论背后的技术问题
从交互里面的话我认为丝窝代表的这种语音交互我把分成三个层级的理解如果说是你是要一个简单帮你提高效率的就是用语音去读起来好听起来这个就留上帮我省时间其实你在这个情况下用一个 TTS 加 ASR 也就已经够了所以如果我们把产品定义里面把它放在是一个提高效率其实都用不上这些事
那么如果把产品里面把它定义到是说像人因为我认为今天 AGI 有一个大的特点是不是在造工具我反复讲像之前有一个行业大佬跟我在聊他就说你觉得这个大模型行吗我说咋了他说七位数乘法都不会做好像觉得没有智能我就反问他说你会七位数乘法吗
他也不会啊因此这些判断模型里面不能够以这么一个维度来看其实核心就是能像人一样的这样去这种思考沟通表达共情所以这种层面里面的话呢因此如果在像人在里面走的时候那么在交互层面里面就要像人一样更流畅的表达这个情况下我觉得思欧他的技术能够支持这么一个
一个产品形态那再往下有可能中间从你的语气从你的这里面感觉你的焦虑甚至影响对话的内容那就再到更大的一个境界所以在这里面我认为他今天自我展现出来目前的能力更多是在向人这里面能够在产品层面上有它的意义所以统一建模我们还是要评判对智力本身有多大的提升这方面来讲我认为今天思路也没展出这个目标来
还是这个式子叫产品化和这种在产品落地上有帮助我发现你还是非常要去聚焦在所谓智能的这件事包括你看你对 Sora 和 FoW 的解读你认为其实它都不是在智能上在掌个的核心的问题它其实是在帮助在今天可能能做
能在某些场景里做出更好的产品或者交付一些对应的服务这个实际上是一个旁支能力的对 但有用在这个 SO 离我们要做得更近因为在向人这件情况里面这个这是我们要追求的 ATI 其实要向人所以语言的时候那么我认为这个 SO 是我们这个做智能公司是需要去可以叫做必答题确实是必答题对那这个里面就挺有意思的因为大家过去
我们最近一段时间尤其是最近过到这个 2024 年的时候我们开始看到有好多的产品比如开始投流了开始有一定的量了这个小川你看到这些人有产品你有没有着急或者说我们换一个视角大家都在说我们今天的技术是在持续的要成长我们都知道不成熟要往前走但是有一个思路叫沿途下蛋
对吧哎能做啥我就先做个啥能有点闭环那我也可以练练手对吧就是但如何选择在哪个时刻要做产品和要做什么产品我看起来你应该是有自己的一个判断的因为好像那些挺热的东西你都没动对吧你能不能跟我们分享一下你有什么逻辑在约束自己看起来你可以做的事你其实没选择去做这件事你背后的逻辑是什么因为在我觉得今天大家是
首先是有共识对一个创业公司是需要做超级模型且有超级的应用的如果你做个小应用这不是目的就不代表你最后是能够活下去或者说是达到你公司的最终的一个使命
所以沿途下蛋要看它的这样一个目的是什么你可能是这个只是验证你的这个技术还是希望它长成一个这种超级应用那我自己在上一家公司做搜狗的时候是做过输入法做过搜索引擎其实我知道超级应用是怎么样的你下过很多弹嘛上次你是下了个三级火箭下了三个弹在里面输入法浏览器和这个搜索所以像在我的定义里面如果到一个超级应用的话你至少需要汇集这个 3000 万的 DAU
三千万剩的一个亿这是一个大的所以今天大家你就问他这个蛋能不能长到大家可能就觉得只叫一种畅想所以并不代表它是一个这还叫一种观点甚至观点都没有大家就是说就给大家看一下我有一个产品在这所以我觉得今天就是这个文静今天讲的这个类似于像我们发的这个白小印还有其他家包括文心一言等等的大多数都是叫做模型能力的这么一个对外的一个呈现
这样一个呈现只是模型能力的通用模型的这样一个呈现今天并不代表它能走向一个这种超级的应用而有可能下了蛋放在那个地方之后生了孩子就得养
我就养一个娃可以对吧你要养两个三个沿头下蛋一个两个三个往下下最后甚至说应用工厂最后反而你可能会自己把自己给这个困住的资源无限投入甚至如果你一个蛋下下来一超低应用是有这个走到旁支里去了把你养得特别大可能会把你自己给带偏了所以我觉得特别得谨慎得充分去思考你的这个模型超低应用
究竟是什么这个叫跟这个 TPF 这个 T 我认为是这个叫终极 T 是什么终极 P 是什么我对这个背后的这样一个思考因此在我们的话有今年的这样一个规划就我们在内部对外上是有自己对超级应用的这个定义所以我们今天也会发出一个模型来只是这个认为叫模型今天给大家看到的这个技术不代表今天我觉得任何一家今天这个顺着这个道路往上把模型扩展的就变成超级应用
我理解你说的意思你刚才说这个观点倒是蛮非共识的一个观点但很有道理就是反正下蛋因为下蛋本身也要消化蛋白质对吧然后关键是下完了以后如果真的孵出了一个小筋然后你还得养对吧这个事如果太多了一堆都是小东西你要照顾可能你最终的那个目标会受影响所以可能大家就愿意说下一个蛋就两个蛋你别沿途下这个事情对一个创业公司你就是承担不起的
所以沿途下蛋这个词可能还真的需要被重新定义或者说你下蛋的标准是什么对吧你会选择如果只能下三个蛋它要符合什么要求就是怎么通向你所谓 AGI 的目标
所以我在这里面的话先从模型去看这件事情因为在今天我觉得刚才你也说到了今天很难说你现在做的任何一个东西就是未来的超级应用但是你又不能说我就永远不推应用我只是编模型所以你如何选择又要通向你 AGI 的目标你又要能下出合理的蛋这个里边有什么标准和思考逻辑吗
先说一个结论吧,结论来讲的话呢,像是说,我觉得下这个蛋的话呢,一个说下下来,今天它已经能够比现在市面上这个解决类似问题的成熟的这个方法上,就成功实践,它已经要明显的好,就能够直接落地,同时的话呢,第二件事情是,这个模型在继续增加的时候,它不是个小堵坡儿,
就是说模型增加的时候有可能你发现你的这个这样一个产品它就没有跟着模型块成长或者不需要成长那就是对于大模型就给盖住了所以今天这样的话它是不是说下个弹你可能是造一艘船这个船在今天它有已经它有广泛的这个应用而且的模型增加的时候这模型没涨一分你的这样的一个应用它能也继续去去成长有些领域就不一定比如说
现在大家这个在 2B 里面快速的实际上做广告文案撰写或者说是这个叫客服这样的一个应用的话呢可能用个小模型就已经够了用小模型就做广告文案的这个数学那这个时候你发现这个蛋下在这里面也许你还创造好大的一个收入即便你成功了那这个时候你还愿意投钱做模型吗愿意往下投模型可能三亿美金投进去十亿美金投进去然后你这个蛋
如果你现在这个空间有限或者说对技术依赖有限那你就没有能力或者意愿去投资这样一个模型但是这个代理选择我认为是要代表从今天能够有可行性
且这个能够长久的模型的足够增加的时候它的价值也会不断地放大我觉得有这样的一个选择所以这要对模型和应用里面要有同步的这样一个思考那么我直接抛出这个想法来说在之前做 AI 的时候大家都提一句话叫做自然语言处理是人工智能皇冠上的明珠所以今天的话呢我会认为叫医疗是大模型皇冠上的明珠
这个医疗行业它的需求是无限大的你模型再大对医疗上它都有这个需求以及医疗是智力密度足够高的所以医疗里面的每一个需求都是为大模型能力的展示就模型能力再多医疗都用得到因此我认为在今天选择的时候想医疗就是特别好的一个行业
我如果听你刚才说的我总结一下确认理解的对不对就是你如果要在今天选择一个下单的标准你会非常关注这个东西它是不是最终也是要通向 AGI 的就是它的能力的成长是要模型的能力是要有成长的空间和需求的且这个东西又在今天能够交付对应的阶段性的比较闭环的服务在这种东西上才值得你去下这个单
而不是找到了一个说今天这是一个小市场那是一个小市场最后发现我对于 AGI 已经没有能力或者是意愿去投入我都只是直接去做那几个市场了是不是这么个理解对对就是这个东西它既有可行性然后这个在又代表了这样的未来足够的高度所以才会提出要造收船对吧
就是能够跟着模型能力水涨船高不是今天赶紧在沙滩上建个城堡哪天被模型淹没了我理解你说的这个意思好你终于已经今天就主动提到了医疗这个领域里这也是我非常关心的就是你既然认为医疗这个领域里未来是符合你说的这个下蛋的
百川下蛋的模型的对吧就这个就是说不会多个蛋对吧你可能就那么一个娃两个娃一娃两个娃对吧就是那这那这个里边接下来如果你要真的去交付一个这样的产品我不知道今年有没有对应的计划首先能透露吗今天在医疗领域能看到我们会看到你什么产品吗对我们内部是有有这种 demo 我们看到来讲确实是符合我们自己的这样一个预期因为今天做医疗来讲的话呢大家觉得大家
大家觉得医疗难还是不难我觉得今天来讲我发现出现一个特别矛盾的声音比如说我们跟外界沟通的时候然后人家说我们要做 AGI 然后我们说我们要做医疗大家觉得你是做个 vertical 好像你没有大的理想对 大家认为这是个 vertical 觉得你是这个往小里做的对但是突然间说我们要召唤医生出来他就能做到吗好像太难了
意思今天做 AGI 就变成一种夜工好龙的这种做法大家看 AGI 的时候提的特别厉害但是当你真的是遇到说这个医疗问题的时候大家又躲着在走觉得这个问题搞不定一方面讨论 AGI 要毁灭人类了一方面说在医疗里面有贡献大家就觉得还做不到所以这个问题我觉得特别有意思这个是一个非常非共识的一个点那么大体上我们在划分的时候会把这样一个类比成无人驾驶
对吧 这文价史大家做不做呢对吧 之前也是觉得特别难的一个题目而且觉得也有伦理的问题也有可行性的问题甚至一秒钟出事故你可能车就翻了所以文价史大家就这么看重那么我觉得医疗相对文价史其实是个首先第一个是更有价值的一件事更有价值文价史来讲今天说这个司机吧就没有司机开车我自己开也行对吧 所以有文价史 better 更好但是的话呢你没有医生
你自己是没法去看病的我可以学个车我怎么能去学个医对吧更刚需对啊所以在这里面医疗这个事情医生这样的一个供给是比司机供给会少很多而且跟生命健康高度相关所以它的价值值过大那剩下的情况就是你的伦理问题和难度的问题那这里面医疗里面我觉得可以正好是从类似无人驾驶 L1 L2 L5 那些类比医疗里面也可以划这样的一个级别嗯
你既然提到了跟自动驾驶类比那我们就比较认真的盘一盘你看自动驾驶有非常严格的不能叫严格至少有一些比较明确的定义从 L0 到 L5 对吧那你既然都启动类比了那你帮我们规划一下在医疗这个领域里边智能去起作用的 L0 到 L5 会是什么样的你肯定应该想过这个问题
对没错是那无人驾驶经常通常分成是叫做其实叫 L0 到 L5 的六个级别就 0 就是完全是靠人自己做对吧第一级的话呢是在单点上能够做辅助比如帮你在某些时刻的时候帮你打个方向盘帮你加减一个油门到 L2 的时候的话就开始提到说能够组合了通过外界多种的这种传感器信息能够组合的帮你去这个转方向盘或者是油门
所以在这个情况下都是特别辅助的到 L3 的时候的话相对就有意义了就在部分的这些场景里面在有人的这种监督下那么它就已经能够实现这样一个这种长时间的自动的驾驶到 L4 大家就认为它是一个大部分的时候不需要人大部分没有了就是说只有极端情况需要的人到 L5 的时候就是机器的天下人就靠边站了方向盘都没了对
对所以我觉得今天这个医疗来讲也是这样的 L0 就是属于叫做全靠自己今天我们就是 L0 或者说今天而言的话主要是靠医生在医疗的系统里面大家提一个词叫 CDSS 就叫做这个临床的决策辅助系统
那个算 L1 还有 L2 从道理上讲如果你是单点的这种信息给你一个单点的这么一个这个决策建议这个叫做 L1 但是如果你是通过多样的这种数据的收集比如又看你的片子又看你的语言文本然后这种组合的这种输入然后同时在输出的信息里面是既有一些这个诊断同时对你的这样一个治疗上有这样一个组合的方案这就可以到一个 L2
对吧所以今天我认为这个目前行业里面在 AI 加持之后的话大概在一到二之间比一好一点但是离二还是有距离的但是我们认为的话呢在我们自己判断里面以现在大模型的技术加上我们其他的技术的引入那么我们是有机会做到 L3 所以 L3 就是这个在这个
这种叫做部分的场景里面甚至大部分场景里面的时候这个机器已经能够做出它自己这个长程的这样一个判断和决策但是在关键的时间点里面还需要这个人或者医生来做最终的这样一个决策所以像在这个目前行业在一到二之间可能一点二一点三那我们到 L3 的时候的话呢那么其实对于医生也好对患者也好就有大的这个辅助的作用了那所以嗯
对 你接着说因此的话呢今天大模型这一代里面我们认为是做的 L3 那么我们在理想当中大家提了另一个词叫做 AGI 之前在前面有一次一个会里面我就提到说大家问说什么是 AGI 什么就做到了比如说 Skinning Law 是不是能够走上 AGI 结果大家讨论讨论发现 AGI 是啥也没有定义就是没法去判断你就摸不着这个东西所以因此我认为在 AGI 里面也会有一个这个定义至少把它转换成一个可以评测的
像以前大家觉得智能用图灵测试就是叫做你用语言分别不出人和机器来那你就像个人了这是一个智能的今天 AGI 的话呢我上次有一个定义说如果你能造出一个医生来造出一个高水平的医生来我们就达到了这个 AGI 虽然它是一个 vertical 但是医生这个职业它是能够把它大模型各种能力都充分展现我认为 AGI 来讲尽可能在逼近的时候把它划成一个约等号
一方面的话呢大家一生好像是 AGI 的一个 vertical 是一个垂直但另一方面的话呢大模型的所有能力在一身上都用到比如说你说你的这个推理的能力减少幻觉的能力沟通能力共青的能力多模态的能力记忆的能力现在大模型所有我们在谈谈它的这个能力在一身上都是能够给用到的所以数学里面我们提到说到底自然数和偶数哪个多对啊如果在座各位也想哪个多一样的我们在两个座比较的时候
我们第一想法可能觉得这个偶数应该比自然数少是一个子集对吧 这一半嘛每两个自然数有一个偶数但是数学上不是这么看的因为每一个自然数乘以 2 就得到一个偶数
所以这个偶数不会比自然数少的最后是两个画等号的自然数跟偶数集合是一样多的这实际上严格的一个这种证明有个双色所以今天约等于是这样既然一生是 A 加一个子集同时的话呢大模型 A 加 A 我们要的各种能力在一上都有体现所以我们越是可以把它画成一种等号的因此我认为叫做做到这个一生的话就叫 A 加 A 这个是我们知道 L4 的一个水平
那么再往下我们再往下今天心情有点大再往下的话我内心在创业之前我一直在讲的是我是好奇生命的数学模型是啥
因为以前来讲我们知道物理的数学模型没找到了今天实际上是做世界模型的话解决一个问题叫语言数学模型被找到了世界模型还没找到但往下的话语言模型之上我们还会去找生命的数学模型像 Alpha 4 的 3 也许跟 AlphaGo 再跟今天的 LM 这些合体会最后构成一个生命的数学模型那那个时候就可以做到一个 L5
就是完全不需要医生介入在你的健康的里面从你的这种预防诊断到你的干预最后都有继续去完成那是对生命足够了解甚至说数字暖身那就生命模型最后能做 L50 超越医生在 AGI 的时候就能去找医生今天我们认为叫做做医生的辅助或者是一个健康顾问在 L3 这个水平这样这是我们的一个定义我今天突然对你
我觉得我有一个改变就是过去我会觉得小川对于医疗领域是有一些执着的因为从你上一波创业完了以后你一直在跟我说这件事我感觉好像你对这事充满热情去所以接下来你要做医疗我觉得大概可能跟你原来的一些思维的惯性等等相关但刚才我听到的一点是说你认为其实医疗是通向 AGI 那件男儿正确的事情对男儿正确且还非共识的事情
所以其实这个逻辑就从个人的一个感觉让我今天有一些确实新的认知但是我还是想追问一句因为这个行业里边的主体或者说所谓的一些偏共识的东西你没发现大家都在看娱乐效率工具对吧就是这样的东西
医疗这个事确实很容易让大家理解怎么拆了一个很窄的垂直领域这会不会给你带来很大的挑战因为你毕竟要说服太多的你还有那么多的力量要说服你还有很多技术要挑战你为什么没有选娱乐或者是效率工具娱乐效率工具本身是有它的这个共识的我们说效率工具是帮你省时间的
娱乐是帮你杀时间的我觉得这很矛盾一会儿要省时间一会儿帮你去 Q time 杀时间对 人家很自洽那边省完了那边杀但是我们的医疗健康的话是能够帮你延长你整个的生命时间也有道理这段我觉得要鼓歌长唱对
就是你给我增加总时长是吧对 增加总时长所以这件事情它其实是可以平行于省时间 杀时间和这边一个独立的这么一个赛道所以你叫加时间对 给你加时间对吧而且在这里面的话前段时间我还正好有朋友跟我讲说在美国的话其实我发现你获得各种各样的能力获得各样的福的时候成本都在降低的
比如说获得光线是越来越便宜了但获得这种视频以前看电影很贵现在都变便宜了在美国只有两个行业或者两个服务它的价值是越来越贵的你获得是越来越贵的
其中的话呢一个就是医疗福德获得人的这样的需求是无限多的自古到今天医疗再多供给人都有这样一个需求另外一个的话国内没有叫做成功学这两个事情是越来越贵的因此在所有赛道里面医疗最后它是有个无限空间的这么一个行业所以我并不叫它叫 Niche 中国的医疗行业大概也是十万亿的级别
在美国更多是几十万亿这种应该叫做十万亿往上走美金级别的这么一个行业只是它集中度不够或者说它相对分散但总量很大分散是好事嘛像以前电商一样都很分散的你最后来讲的话你是有办法在中间形成更大的一个平台
去做医疗医疗里面的话以前我当时在 21 年把公司卖给腾讯的时候我说要做医疗健康大家第一问题说你是不是要去做 AI 制药我觉得还是把它看小了因为从我这话从研究生我就做基因测序开始我就知道医疗在今天核心叫医药显三个环境里面
这个医药中间只是一个认知的环节但药道做很多临床的实践它的认知的获得并不是能够只是在实验室里面拿小白鼠获得的医药最大的难点是必须用人做实验所以医生一定要介入这些环节因此叫临床在中间是扮演了获得认知和服务的中心舞台但是之前这个是足够分散药厂是集中的但是医生是分散的
但是今天医生要参与到做科研我们知道医生是一个既是临床服务者也是个科研工作者因此但是中国来讲的话呢叫做得医生者得天下那都很难患者也是求医生药厂也要去找医生但医生供给的量非常有限我们今天做 AGI 核心就是能够通过知识密度扩大知识的供给所以医疗的这个医生供给量
这件事情不是靠生产关系像滴滴美团一样的事帮你撮合一下就够了的你这个棋手你可以这个有些人是工作不顺利的一不开心就当棋手了但是你没法说一不开心我就当医生这个供给而言是今天 A 阶我认为是重要的一个市场空间我觉得特别认同因为在你来之前我刚跟大家讲了半天今天要抓 PMF
能够改变供给是大于改变扩展需求更大于重塑连接的对吧我觉得在这个阶段其实智能的能力如果能够改变供给一定是一件让人很兴奋的事情所以你现在很明确就是在医疗领域里你要造医生了对我们造医生医生要造医生这很清楚这是我们重要的一个方向而且造医生几句话第一个是造医生今天叫做供给稀缺
需求巨大这是有这种市场空间那以我的技术的判断我仍然尽量坚持做 L3 同样 L4 是有这个机会的如果做 A 阶梦想那是 A 生是能造出来的并且的话呢下句是说今天这个医疗行业其实有后面的数据飞轮的因为背后有大量的这个对于精准医疗它的这样一个 know how 是需要在有医生在全病程管理当中间去观察然后去收集数据去做这样一个生命模型
所以这样的话呢不仅是在造医生同时最后是通过造医生之后在服务过程中间是能够去构建生命的数学模型而不是只构建所谓的世界模型世界模型是特别虚的一个词我们知道这个世界是商争的总算热计的你构造一个最后等价于最后一个叫做
叫做不确定的世界不如过到对生命的一个理解的模型因此在这里面我们从今天 LM 走向 AGI 到后面的生命模型因此我们认为从除了这么一个应用领域里面对于技术发展里面有自己的脉络在生命本身是一个商检的状态的商检的事情才有的所以才能建模型对 如果商证世界怎么建模呢有道理
我觉得说到这一点已经呼之欲出了感觉我们对于你接下来要做的产品会呼之欲出但是我再追问就是如何去定义一个好的 AI 医生和一个不好的 AI 医生
看起来都是一个假定都是个 L3 级别的这样的医生因为毕竟 L3 就意味着还是要有人在这里边我们最终的结果里边可能也不一定能看得出来这个人占比是多少怎么样所以一般我们我记得上次我们在聊的时候我们就在谈说这个时代去把产品做好可能很重要的就是如何去定义那个数据级和那个测试级
对吧那什么是一个好的 AI 医生的数据级和测试级呢不知道你这用不着可以分享的所以首先讲的医生是两个维度一个是他的专业性一个是他跟你沟通中间的耐心和共情耐心共情对于这个患者是容易去感触的所以今天在线的这些平台的时候都是特别强调他的这种共情和耐心提供这种快速的这样一个服务这个是不难去定义的但难点是对他的专业性
专业性患者是没法去看的所以这边是两个第一个它是训练级其实今天我们知道所有的医生都是需要去写论文
就是把它的认知把它变成行政级别从你的 case report 到后面我们的 RCT 这个临床双方实验到最后的 meta 分析称为会说分析其实这个医疗表把它变成了一个这种医疗行业所认可的这么一个数据集这是广泛存在的从病例到论文到医学的书籍甚至到互联网上已经有的 case 这个训练集是足够的
而测试级的话呢既可以拿今天的这些论文或者一按做标准去甚至再往下在临床实验当中间是会要看它究竟对你的治疗效果是否有提升这是符合医学的范式的医学里面是有它的这个一套医学统计和这个临床实验方法来保证它的严肃性因此我们要符合医学的这个统计规律来最后验证这个系统所以一边耐心从消费者出发一方面符合医学的整个研究的范式
这一点我觉得看来你想的已经很深入了我们会能期待在今年看到这种 L3 级别的医生出现吗
我觉得按照我们现在的进度是有机会做到的有机会做到的那我好我们已经开始有了一个新的预期我的一个感觉就是确实从去年里来到今年我们感觉你对这个新大陆的探索正在看到越来越清晰的纹理而且我觉得还保留了很多跟别人不一样的非共识这其实是让我们觉得看到最大的价值其实脱掉马甲因为去年的时候的话我们下场是提到是就在讲医疗医生
对当时在百川的时候还讲的是有有创造健康和种快乐对当时来讲的话因为我在那个节点点给大家提我们就做做医生这事的话其实太非共识
其实医生又是需要足够大的体量大模型的支持在这种情况里面如果只提医疗的时候其实这种非共识会使得我们在这种吸引人才在理解这些事包括对头症上都会变难所以这个时候我们的这个理念的话呢随着我们要 deliver 产品之后能大家看到今天的 AGS 等于医生 AGS 等于医生而今天的话呢大模型的只能做到这个医助或者患者的这么一个医疗顾问是给大家交付这样一个路径然后当你知道医生有 AGS 之后其实我们可以做所有的事情
但这样能找到一个 TPF 的一个单点的突破我觉得你今天最大的吸引我们的一点就是我们终于发现有人在帮我们省时间有人帮我们杀时间只有你可能在努力给我们加时间希望你把加时间做好我们都会给你充值好 我们热烈的掌声欢迎小川继续他的探索感谢他的分享谢谢