cover of episode 作者拆书 | 解密妙鸭相机背后的扩散模型

作者拆书 | 解密妙鸭相机背后的扩散模型

2023/8/25
logo of podcast 先见未明

先见未明

Frequently requested episodes will be transcribed first

Chapters

Shownotes Transcript

AI在人类世界的应用,从理解、识别拓展到生成,离不开模型的进步。当下热门AIGC产品背后,主要有两类生成式模型:大语言模型,源自AI的自然语言处理分支,代表产品ChatGPT;扩散模型,源自计算机视觉分支,代表产品妙鸭相机。

本期请到新书**《扩散模型:生成式AI模型的理论、应用与代码实践》的作者杨灵**,带我们入门这个适配场景极丰富(远不止于图像)的模型。

*感谢出版社友情赠书!评论区留言,先到先得。

【本期嘉宾】

杨灵 | 《扩散模型:生成式AI模型的理论、应用与代码实践》)作者

【时间轴】

02:22 什么是扩散模型?与早期生成式模型、大语言模型的区别

09:58 都是AI,过去的美图秀秀P图和今天的妙鸭,技术有何差别?

12:20 如何基于扩散模型开发你自己的“妙鸭相机”

14:18 扩散模型生成速度慢,有什么解法?

18:40 视觉生成模型很难效仿语言模型的大力出奇迹

22:34 多模态还处于早中期,要解决数据间的语义对齐

28:08 扩散模型在生物医药领域是新宠

30:52 中、美在研究上基本平齐,落地应用上有些差距

【很高兴认识你】

散装智能,一档有人情味的科技播客。我们寻找科创和商业的交叉点,挖掘真价值,讲好真故事。

想交流?想表达?微信添加ziyuanao,或关注公号:散装智能