#128. 计算机视觉遇上大语言模型

2024/6/8

牛油果烤面包

Frequently requested episodes will be transcribed first

Chapters

整整4年前，计算机视觉领域专家孙晨首次做客节目，介绍了计算机视觉领域的发展。如今，他再次做客，详细讨论了大语言模型对计算机视觉带来的巨大冲击与新机遇，并回顾了过去4年的显著变化。他提到生成式模型的崛起，使图像和视频生成技术取得了突破性进展，以及扩散模型在生成高保真度图像中的应用。孙教授分享了他的研究成果，包括一个用于测试模型在新环境中表现的宇航员测试集。他还探讨了大语言模型在医学、教育等领域的广泛应用和未来趋势，强调了工程能力在该领域的重要性，并提出了未来发展的挑战与机遇。

嘉宾：孙晨主播：斯图亚特、Vindy 剪辑&时间线：季雨清

00:01:53) 学校做科研和企业做研究的区别
00:09:39) 短短4年，做菜视频生成菜谱的理想已经实现
00:19:34) 学术界寻找自我
00:22:37) 计算机视觉的最新进展
00:29:01) AI具备“理解”能力吗
00:37:16) 给AI打工
00:44:41) 计算机视觉的可能未来
00:51:24) 如何进入计算机视觉领域

欢迎您在每期节目下方给我们留言，和我们的主播互动交流。如果您对我们的志愿者工作有兴趣，请点击这个链接) 看我们的招募帖；你有什么有趣的话题，想来作牛油果烤面包的嘉宾，或是对节目有任何的意见或建议，欢迎发邮件和我们联系。我们的邮件地址是：[email protected]

片头片尾音乐： Courante 1st Cello Suite Exzel Music Publishing (freemusicpublicdomain.com) Licensed under Creative Commons: By Attribution 3.0 http://creativecommons.org/licenses/by/3.0/)

#128. 计算机视觉遇上大语言模型

牛油果烤面包

Chapters

学校科研与企业研究的差异是什么？

4年内，做菜视频如何生成菜谱？

学术界如何寻找自我定位？

计算机视觉的最新进展有哪些？

AI真的具备“理解”能力吗？

给AI打工意味着什么？

计算机视觉的未来可能是什么样的？

如何进入计算机视觉领域？

Shownotes Transcript

#128. 计算机视觉遇上大语言模型 55:06 Share

牛油果烤面包

Chapters

学校科研与企业研究的差异是什么？

4年内，做菜视频如何生成菜谱？

学术界如何寻找自我定位？

计算机视觉的最新进展有哪些？

AI真的具备“理解”能力吗？

给AI打工意味着什么？

计算机视觉的未来可能是什么样的？

如何进入计算机视觉领域？

Shownotes Transcript

#128. 计算机视觉遇上大语言模型