因为互联网的数据是有限的,AI 需要的数据量太大,但只有一个互联网,数据增长已经放缓,未来可能转向合成数据。
合成数据和推理阶段的计算是未来值得关注的方向,合成数据意味着生成数据来继续训练 AI,而推理阶段的计算则涉及更复杂的模型。
因为如果相信人工神经元和生物神经元相似,且生物神经元的反应速度较慢,那么十层的神经网络就能完成人类在几分之一秒内完成的任务。
如果自回归模型能足够准确地预测下一个标记,它就能捕捉并掌握接下来序列的正确分布。
因为当时没有更好的建议,流水线并行化使用 8 个 GPU 将速度提升了 3.5 倍。
预训练时代由 GPT 二模型、GPT 三模型和规模法则推动,这些发展依赖于在海量数据集上训练的超大规模神经网络。
未来的模型如果具备推理能力,可能会通过推理来识别和理解幻觉现象的出现,从而实现自动纠错。
超级智能将具备真正的推理能力,行为将更加不可预测,且可能与自我意识结合,形成与当今系统截然不同的系统。
因为推理越多,系统的行为就越难预测,这与直觉反应不同,推理涉及更复杂的思考过程。
深度学习本身就是生物启发 AI 的成功案例,但更详细的生物学启发仍然有限,主要集中在使用神经元上。
❤️ Support & Connect
ETH:
0x28d611998436877565691d2dabc10716f248c098
SOL:
7gEkf4uQUjHwyJLkFzP1EsEZUf1sE4YarbBRSudcS93r
BTC:
bc1q3lwutny9jjg9cd72uk4sr2uq4npf5cyr9jqt0g
微信公众号: SurgeLong