cover of episode EP.1 00后一份课堂作业，如何让AI生图10倍加速

EP.1 00后一份课堂作业，如何让AI生图10倍加速

2024/2/28

Diffuseum

Frequently requested episodes will be transcribed first

Shownotes Transcript

00 后 AI 研究者 Allen 的课堂大作业 LCM 让 Stable Diffusion 推理速度加快了 10 倍，让 AI 生成图像迈入了实时推理的台阶，也因此在开源社区获得了数百万的下载和应用。

本期播客除了分享这位年轻研究者的个人背景以及社区故事外，也抛出了一个开放性观点：生成的“实时性”对C端用户构成了AI交互体验的质变，因此蕴含着绝佳的产品机会。

那么，哪些形态的应用会因此得到变革？我们期待和听众们一起头脑风暴，欢迎和我们分享任何想法。

本期人物

Allen Luo：清华大学交叉信息研究院硕士，LCM（Latent Consistency Models）、LCM-LoRA作者
宙宙Jo：美元基金 AI 投资，热爱开源，Diffuseum社区及播客建造者

时间线

00:35 00后研究者Allen的学术经历
02:36 为什么会对推理加速这个方向感兴趣
04:57 3个月内从课堂大作业发展到完整开源项目
06:10 LCM的原理，为什么可以让Stable Diffusion推理加快10倍
08:32 从理论到社区易用性的里程碑：LCM LoRA
11:10 百万下载，超出预期的开源社区影响力
12:16 和Huggingface的合作方式
13:06 LCM当前的用户和代表应用案例
15:25 总结出圈的核心原因：“实时性”对终端用户交互体验带来了质变
17:27 社区对Allen的改变：从个体研究者到关注用户反馈
20:20 LCM的Roadmap：探索视频/AR媒介上的产品想法，关注实时推理对交互形态的改变
25:14 Sora发布的感受：对Diffusion的上限充满信心
30:00 观察95后AI研究者的共性：更追求结构性变化；动手能力强

相关链接

Consistency Model：https://arxiv.org/abs/2303.01469
LCM Hugging Face页面：https://huggingface.co/docs/diffusers/main/en/using-diffusers/inference_with_lcm
X社区中的LCM用户案例展示：https://twitter.com/search?q=%23LCM&src=typed_query

联系我们

Diffuseum 是一个对生成式图像、开源人工智能感兴趣的社区，这档播客记录我们关注的一线开发者的故事。

X/WeChat: Jozhangsh