在几天前,OpenAI 的前安全系统团队负责人翁荔(Lilian Weng),在自己的博客上更新了一篇关于强化学习中奖励黑客的万字长文,迅速引起了大家的围观学习。这篇博客之所以受到广泛关注,是因为奖励黑客问题在当前的人工智能发展中具有重要意义。
https://lilianweng.github.io/posts/2024-11-28-reward-hacking/#in-context-reward-hacking
成为此频道的会员,即可享受提前一天,观看频道最新发布视频的福利: https://www.youtube.com/channel/UCGWYKICLOE8Wxy7q3eYXmPA/join