cover of episode AGI 2024特辑01 | 对话爱诗科技王长虎:AI创业不做平台,是因为不想吗?

AGI 2024特辑01 | 对话爱诗科技王长虎:AI创业不做平台,是因为不想吗?

2024/8/21
logo of podcast AI局内人 | AGI Insider

AI局内人 | AGI Insider

AI Deep Dive AI Insights AI Chapters Transcript
People
王长虎
Topics
王长虎:爱诗科技成立于2023年4月,比Sora早一年进入视频生成赛道,当时该赛道尚属非共识。Pixverse产品于今年1月上线,用户量已突破百万。在字节跳动的工作经历为我带来了宝贵的创业经验、技术能力和价值观,也让我坚信创业应选择非共识但正确的事。选择创业是因为大厂难以专注于非共识项目,创业公司更有机会抓住时代浪潮。视频生成赛道与语言模型不同,视频内容更复杂、更贴近用户,商业化潜力更大。视频生成的数据量巨大,关键在于如何找到高质量数据并进行有效标注和建模,最终实现用户友好型产品。字节的经验在技术层面可以继承,但在产品层面,AIGC时代的产品经理需要更敏锐地了解技术发展,并以此挖掘新的需求。爱诗科技的产品理念是技术普惠,并通过与用户互动迭代产品功能,例如Magic Brush功能的开发。筛选AIGC时代优秀产品经理的三个问题:能否对现有AI产品提出模型层面的优化建议;能否准确把握行业动态并理解技术创新;能否亲身实践并对AI技术有深入理解。视频生成赛道在达到GPT时刻前,技术至关重要;之后,产品将成为决胜关键。AIGC时代存在平台级机会,但其形态并非预设,而是需要通过迭代发展逐渐显现。 张鹏:就视频生成赛道、爱诗科技发展历程、产品理念、团队建设等方面与王长虎进行了深入探讨,并对AIGC时代的产品经理能力提出了独到的见解。

Deep Dive

Key Insights

为什么爱诗科技能提前预判视频生成的机会?

爱诗科技创始人王长虎认为,视频生成虽然当时是非共识的领域,但他们坚信这是正确的事情。他们基于对视觉内容和语言内容本质差异的理解,预见到视频生成将成为一个重要的赛道。视觉内容是原生的、未经压缩的,而语言是高度抽象的,视频生成需要对世界进行建模,难度更大,但也更贴近用户,商业化潜力更大。

视频生成赛道与语言模型有何不同?

视频生成与语言模型有本质区别。语言是人类对世界的高度抽象化表达,而视觉内容是原生的、未经压缩的。视频生成需要对三维空间进行建模,还原物理规律,难度更大。此外,视频更贴近用户,商业化潜力更大,尤其是在移动互联网时代,视频内容的需求和消费是不可逆的趋势。

如何找到高质量的视频数据用于模型训练?

视频数据量巨大,每天都有数以亿计的视频被创造出来,但关键在于如何从海量数据中找到高质量、能解决用户痛点的数据。爱诗科技利用AI能力,结合多模态语言模型对视频进行标注,帮助筛选出高质量数据。同时,视频模型需要进行极致的压缩建模,并在生成时进行无损还原,这对技术提出了更高的要求。

爱诗科技的产品PixVerse如何实现用户增长?

PixVerse于2024年1月上线,支持文生视频、图生视频等功能,用户量已突破百万。爱诗科技通过社区产品(如Discord)吸引早期用户,积累口碑,随后推出Web UI,逐步扩大用户群体。他们还通过用户反馈不断优化产品,如引入图生视频功能,提升生成效率,最终目标是让普通用户也能轻松使用视频生成技术。

视频生成赛道的未来终局是工具还是平台?

王长虎认为,视频生成的终局可能是平台性机会。AIGC时代,内容生产从UGC向AIGC升级,视频生成效率大幅提升,未来需要大平台来承接这些内容和流量。此外,人与内容的交互方式也将发生巨大变化,实时视频生成将打破生产和消费的界限,带来全新的交互体验。平台性机会不是设计出来的,而是通过迭代发展逐渐形成的。

Chapters
本节回顾了王长虎在字节跳动的经历,以及他为何选择在这个时间点创业。他分享了在字节跳动期间的收获,包括对创业的理解、技术层面的积累和价值观的塑造,并解释了离开大厂的原因:大厂难以全力投入非共识项目,创业公司有更多机会创造伟大的产品,以及对AGI时代浪潮的把握。
  • 王长虎于2017年加入字节跳动,参与了抖音等产品的AI技术研发。
  • 他认为创业应专注于非共识但正确的方向。
  • 字节跳动的价值观和文化对他产生了深远的影响。
  • 他选择创业的原因包括大厂的限制、创业公司在创造颠覆性产品方面的优势以及对AGI时代浪潮的把握。

Shownotes Transcript

视频生成赛道上已经挤满了新玩意儿,如今国内的可灵、即梦、清影、Vidu、Haiper等纷纷上场。

这个赛道的头部之一爱诗科技比Sora出生还早一年,当时还没什么人看好视频生成。

只花一年时间,它已经做出了产品。国际版产品PixVerse今年1月上线,据说用户量已经破百万。

为什么能提前预判视频生成有机会?

怎么理解视频生成赛道?

如何做一款好的视频生成产品?

在刚过去的AGI Playground大会上,爱诗科技创始人兼 CEO 王长虎与极客公园张鹏聊了聊这些问题。

王长虎说,AIGC 时代有同样的大的平台性机会。那么,机会在哪?

以下是这次访谈的录音版,听听王长虎到底怎么说。

时间轴

00:01:47 17年去字节从0到1搞AI,成为抖音背后的男人

00:06:00 张一鸣告诉我,创业要做非共识但正确的事

00:09:48 跳下去,众神愉悦!all in 到这个时代浪潮里

00:11:59 视觉内容和语言完全两码事,而且视频更难

00:15:19 视频数据不担心Scaling law,但怎么找到好数据?怎么训练模型?

00:19:20 一开始就决定让产品第一时间面向普通用户

00:24:05 从文生视频到「垫图」,抽卡效率嘎嘎涨

00:31:01 AI产品经理三道必答题:懂优化吗?能折腾吗?上手做过吗?

00:37:50 视频生成的GPT时刻之前,技术一定比产品重要

00:39:44 谁不想做成平台啊?成为剪映还是抖音,你选谁?

00:40:59 抖、快早期全靠猥琐发育才躲过巨头狙击

00:41:23 AIGC 时代也有大的平台性机会,但具体在哪?

相关阅读

对话爱诗科技王长虎:视频生成赛道存在平台级产品的机会)

关于我们

这里是极客公园旗下的科技创业者社区 Founder Park 出品的 AGI 系列播客节目。

「AI局内人」,国绕 AGI 相关领域的技术发展、产品方向以及新的商业模式进行探讨和交流。

Founder Park 正在搭建 Al Native 的产品交流群,群内聚集着致力于在大模型相关领域创业的创业者、产品经理、研发工程师、对大模型技术和场景应用开发进展感兴趣的学者及投资人。

对更多内容感兴趣,欢迎关注公众号「Founder Park」。