本期节目深入解读五大AI前沿研究,从加速大型语言模型推理的“压缩注意力”,到实现工业粒子流实时模拟的NeuralDEM,再到优化内存管理的“Pie”框架。我们还探讨了如何利用语言模型突破推荐系统的冷启动难题,以及通过“Cut Cross-Entropy”技术降低大型模型训练的内存消耗。
完整推介:https://mp.weixin.qq.com/s/qKBKLFH29gsfmATR8Sxe6w