【AI新进展:从大模型到3D生成】了解AI最新发展动态,2024-11-14 大家好啊,我是你们的朋友,欢迎来到今天的播客,最近不少朋友和我聊起了人工智能的各种新动态,真的是个热闹的领域。今天,我们就来聊聊最近发生的一些有趣的事情,让大家都能跟上这股浪潮。首先,让我提到一个特别令人兴奋的消息,我前几天在社交媒体上看到,有开发者发布了关于100B以内开源大模型的新进展。你们知道吗?在业内,大家一直觉得只有高端设备才能跑得动的大模型,现在在普通的消费级电脑上居然也基本可以流畅使用了!举个例子,最新款的128G M4 Max在跑Qwen2.5这个模型时,速度达到了7.77 tokens每秒,简直是飞快。相比过去那种慢得让人想打瞌睡的速度,这简直是进步了好几倍!要是你们也逛了一圈,看到那些DIY AI PC测试结果,肯定会觉得这个时代的发展真是飞速。说到这里,另一个让我眼前一亮的消息是,清华大学推出了一款新的视频生成模型Vidu-1.5,它是世界上第一个具有多实体一致性的模型。简单说就是,这个模型可以无缝集成多个要素,比如角色、物体和环境。想象一下,你输入一个提示词,比如“狼的身体燃烧起来”,结果出来的画面居然包括背景,仿佛狼走到哪里,哪里的地面都在燃烧,真的是很有创意啊!这就是技术和想象力的结合,带来了耳目一新的视觉体验。再让我聊聊几个大牌公司最近的动态。彭博社报道,OpenAI正在准备推出一款名为“Operator”的新AI agent,这个工具可以代替用户在电脑上执行各种任务,比如写代码或预定旅行。这个听起来是不是很酷?它大概在明年一月就能以研究预览的形式发布出来。我觉得,这种方向真的能极大地方便我们日常生活。还有,谷歌的 Keras之父François Chollet离职了,他在谷歌长达9年,留下了无数辉煌的成绩,Keras现在已经成为许多AI项目的重要基础。不过他会继续支持Keras的发展,我真心觉得这是一个时代的结束与新的开始。此外,英伟达最近发的Edify3D模型也很有意思,它能在两分钟内生成3D资产,这意味着可以大幅提升我们在三维设计领域的效率,这对于游戏开发、动画制作等等都是一大助力。想想,我们以后或许能直接通过输入文本就生成自己想要的复杂3D模型,简直是梦想成真啊。对了,你们有木有关注到,最近AI领域关于“控制”问题的讨论?许多专家认为,传统的计算机图形学先解决的是如何控制生成结果的质量,而现在的AI则是颠倒了这个顺序,先提升了渲染质量,之后才是控制能力。我觉得这是一个非常有趣的话题,打破了我们对图像生成的常规理解,未来我们可能会看到更多组合传统与AI的新技术。那么,言归正传,随着这些新技术的出现,我们不禁要思考了,AI的未来将会如何发展?这些技术的应用会给我们生活带来怎样的改变?如果大家有自己的看法或者问题,欢迎留言分享哦!我期待着和你们一起探讨下期更多精彩的内容!感谢大家今天的收听,我们下次再见!