cover of episode EP 46. 深度解读 OpenAI Sora(下):一线投资人与创业者眼里的AI应用新格局

EP 46. 深度解读 OpenAI Sora(下):一线投资人与创业者眼里的AI应用新格局

2024/2/22
logo of podcast OnBoard!

OnBoard!

AI Deep Dive AI Chapters Transcript
People
季逸超 (Peak)
戴雨森
Topics
戴雨森认为Sora的视频生成能力远超以往,在视频长度、质量和逻辑性方面都有显著提升,解决了物体延续性、物理逻辑等问题,这代表了视频生成领域的巨大飞跃。他关注Sora的训练成本、数据来源和世界模拟能力等核心问题,并认为Scaling Law被低估,而对物理规律的模拟仍处于初级阶段,高估了其对现实世界物理规律的理解和模拟能力。他认为,在AI应用投资方面,应该关注那些能够在模型能力提升后,解决原来无法解决的问题的产品,而不是那些过度依赖工程技巧的产品。 季逸超(Peak)认为Sora在Minecraft demo中展现的画面精度和对游戏规则细节的理解令人印象深刻,这暗示了生成式模型取代传统渲染管线的可能性,以及对虚拟世界物理法则的掌握。他关注Sora的推理速度和用户界面/使用方法,认为推理速度的提升可能带来新的应用场景,而更友好的用户界面则能更好地发挥Sora的能力。他更看好Autoregressive模型路线,认为其更易于实现模型的泛用性和可控性,并对Sora的泛用能力持谨慎态度。 Monica作为主持人,引导嘉宾讨论Sora的技术细节、商业模式以及对创业公司和投资人的影响,并总结了嘉宾的观点。 戴雨森认为Sora的出现并非简单的技术迭代,而是模型能力的质变,这类似于GPT-3时刻,但它还不是ChatGPT时刻,因为其尚未达到产品化的程度,也缺乏与用户交互的完善机制。他认为,对Sora世界模拟能力的评价存在高估,其对物理世界的模拟能力仍处于初级阶段。他认为,创业公司应该避免与巨头在同一条赛道上竞争,而应专注于开发基于现有强大模型的具体应用,寻找差异化竞争优势。 季逸超(Peak)认为Sora目前还处于研究阶段,尚未达到可供广泛使用的程度,因此不能算作ChatGPT时刻,但它代表了视频生成模型本身的一个重要时刻。他认为,人们低估了OpenAI的积累和数据筛选的难度,以及Sora系统中被隐藏的细节;高估了Sora的泛用性和世界模拟能力。他认为,Autoregressive模型路线在灵活性与泛用性方面更具优势。 Monica引导嘉宾讨论了Sora对视频生成创业公司带来的挑战与机遇,以及如何避免成为“套壳”公司。

Deep Dive

Chapters
This chapter introduces OpenAI's Sora, a groundbreaking AI model capable of generating 60-second, high-resolution videos from text prompts. It discusses the model's capabilities and the speed of AI advancements.
  • Sora generates 60-second, high-resolution videos from text prompts.
  • AI advancements are exceeding expectations.
  • Sora's capabilities were previously considered unattainable.

Shownotes Transcript

OnBoard! 终于成立听友群啦!新年新气象,加入Onboard! 听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加小助手微信,Nine_tunes, 发送你的姓名、公司和职位,就可以获得进群链接。期待你来!

OpenAI 在2024年2月16日发布了文生视频模型 Sora,震惊业界。仅仅根据提示词,就可以生成60秒的视频,连贯、高清,有丰富运镜,甚至符合大部分物理规律。这是 OnBoard! 对 OpenAI 开年震撼更新的文生视频模型 Sora 深度解读的第二部分。精彩继续!

Hello World, who is OnBoard!?

在第一部分的技术讨论,我们邀请了两位硅谷顶尖AI研究员:Google Deepmind 文生视频大模型 VideoPoet 第一作者 Lijun Yu ,以及爱丁堡大学博士,大语言模型专家 Yao Fu,给大家从技术角度解读了 Sora 的技术创新,看似暴力美学的 scaling law 背后的技巧,还有未来LLM与视频生成模型进一步融合的可能。相当烧脑也相当精彩。

本期第二部分,稍微轻松一些,我们换一个投资和创业的视角。邀请到真格基金管理合伙人,也是AI领域研究非常深度的投资人戴雨森。还有真格基金EIR,曾经的AI创业者,Peak。从身处一线的投资人和创业者的视角,聊聊他们眼里Sora 的意义:

Sora 是不是所谓的GPT时刻?

Sora的突破对于创业公司和现有的视频领域公司意味着什么?

更多的AI应用公司会变成“套壳”公司吗?

我们还延展讨论了对最近AI应用创业与投资的观察。

如果你对AI创业感兴趣,那么这一期一定不要错过。

别忘了,添加小助手 Nie_tunes,加入我们的听众群哈,Enjoy!

嘉宾介绍

戴雨森, 真格基金合伙人,清华大学工业工程系2004级校友,曾在斯坦福大学管理科学与工程系就读。22岁时参与创办了知名互联网上市公司聚美优品,主管互联网产品、运营、市场投放、品类等。加入真格基金之后,主要关注人工智能方向投资。

季逸超 Peak, 真格基金EIR,猛犸浏览器、Magi 知识引擎创始人。

OnBoard! 主持:Monica,美元VC投资人,前 AWS 硅谷团队+ AI 创业公司打工人,公众号M小姐研习录 (ID: MissMStudy) 主理人 | 即刻:莫妮卡同学

我们都聊了什么

[02:58] 两位嘉宾的自我介绍,Sora 的demo 中,印象最深刻为什么是狗跳过窗台和 Minecraft?

[09:21] 看了这么多 Sora 资料, 最希望了解的核心问题是什么?

[16:19] 行业内对Sora 的出现,有什么低估和高估的地方?真的实现了世界模型吗?

[22:40] 我们会看到很多公司开始追赶 Sora 吗?追赶需要什么代价,真正的挑战是什么?

[26:21] 与移动互联网时代相比,现在要做做颠覆的产品有什么不一样?为什么我们需要基建泡沫?

[31:31] 为什么说我们低估了数据和 scaling law 的难度?

[34:25] 为什么Peak 更看好 VideoPoet 为代表的 AutoRegression 路线?Sora 技术路线可能有什么局限?

[38:52] Sora 是视频生成的 GPT 时刻吗?

[44:45] Sora 的出现,对于做视频生成的创业公司意味着什么?如何避免成为“套壳”公司?

[49:00] 怎样的工具公司是可以产生高价值的?为什么看好而不是看空 Adobe?

[55:45] 给视频生成的创业者的建议:从技术和体验两个角度思考创新

[60:41] 如何理解AI应用“赚快钱”的现象?这是个短期趋势吗?

[64:07] 未来展望:Sora 之后,AI行业会有哪些变化?终极世界模拟器到来意味着什么?

我们提到的内容

欢迎关注M小姐的微信公众号,了解更多中美软件、AI与创业投资的干货内容!

M小姐研习录 (ID: MissMStudy)

欢迎在评论区留下你的思考,与听友们互动。喜欢 OnBoard! 的话,也可以点击打赏,请我们喝一杯咖啡!

如果你用 Apple Podcasts 收听,也请给我们一个五星好评,这对我们非常重要。

最后!快来加入Onboard!听友群,结识到高质量的听友们,我们还会组织线下主题聚会,开放实时旁听播客录制,嘉宾互动等新的尝试。添加小助手微信,Nine_tunes, 发送你的姓名、公司和职位,就可以获得进群链接。期待你来!