AGI 2024特辑03 |对话面壁智能李大海：AGI是千里江山图，咱刚打开一条缝

2024/8/23

AI局内人 | AGI Insider

AI Deep Dive AI Insights AI Chapters Transcript

People

李

李大海

Topics

李大海: 面壁智能的8B参数小钢炮模型在多模态能力上可以与去年的GPT-4V对标，这体现了对Scaling-out的独特理解。尽管OpenAI强调Scaling-out是大模型的关键，但GPT-4在过去一年中缩小了10倍，面壁智能通过高质量数据和算法优化，实现了在较小模型上的高性能表现。

Deep Dive

Key Insights

为什么面壁智能选择聚焦端侧模型？

面壁智能选择聚焦端侧模型是因为端侧离用户最近，能够更直接地与用户互动，并且端侧模型在落地时更具象化和现实。此外，端侧模型能够在隐私保护和环境互动连续性方面提供更强的能力。

面壁智能如何在端侧模型上实现高效训练？

面壁智能通过注重数据质量和算法优化来实现高效训练，而不是单纯依赖模型规模的扩展。他们使用高质量的训练数据，并通过合成数据的方法提升数据质量。此外，他们还采用了动态学习率调度器（WSD）等创新训练方法，针对模型的不同阶段进行精细化训练。

面壁智能的端侧模型目标是什么？

面壁智能的目标是在2026年底推出一个达到GPT-4水平的端侧模型。这一目标基于他们对大模型智能密度（每8个月翻一番）和端侧芯片算力提升的预测。

面壁智能如何看待AGI的发展？

面壁智能认为AGI的发展是一个马拉松，而不是短跑。他们强调通过高质量数据和算法优化来推动大模型的进步，并认为AGI的实现需要大模型与Agent技术的结合，才能形成更完整的智能体。

面壁智能的商业模式是什么？

面壁智能通过2B2C和2B2B等多种方式探索大模型的商业落地，并在金融、营销、法律等多个领域进行了尝试。他们目前聚焦于端侧模型，认为端侧是离用户最近且更具现实落地潜力的途径。

面壁智能如何应对巨头在端侧AI领域的竞争？

面壁智能通过与国内生态公司合作，通过2B2C的方式让用户感受到价值，同时寻找自己的场景。他们认为端侧AI的发展需要生态合作伙伴的紧密合作，并已与华为云等公司达成端云协同的合作。

面壁智能的“面壁定律”是什么？

面壁定律是指大模型的智能密度每8个月翻一番，即在同等参数规模下，模型的智能水平会显著提升。这一规律基于面壁智能对行业发展的观察和自身模型的实践。

面壁智能的端侧模型如何与云端模型协同？

面壁智能将云端模型定义为“无所不能的智能”，而端侧模型则是“无所不在的智能”。端侧模型需要在隐私保护和环境互动连续性方面更强，同时克服能耗限制。他们通过与华为云等合作伙伴进行端云协同，推动大模型在用户最近的地方落地。

Chapters

李大海分享了他从知乎投资面壁智能到all in AGI的经历，以及他与团队成员对AGI的共识。他认为AGI的未来发展空间巨大，并决心在通往AGI的马拉松中占据一席之地。

李大海在知乎期间投资面壁智能，后全情投入AGI赛道
他认为AGI是一个充满机遇的领域
他与团队成员对AGI发展方向达成共识

Shownotes Transcript

OpenAI 说，Scaling Law 是大模型的关键。

但AI创业者中，有人看到Scale之外的另一面。

面壁智能的小钢炮模型，只有 8B 大小，却可以跟去年GPT-4V 的多模态能力对标。

CEO李大海说，面壁不玩资源游戏，而是注重数据质量与算法。

面壁如何进行精明的模型训练？

为什么聚焦端侧？

开发端侧，如何距离用户更近？

本期播客，我们请来了面壁智能联合创始人兼CEO李大海，讲了他的AI创业，面壁开发的端侧模型，还有与云端协同的未来。

嘉宾介绍：

李大海，知乎联合创始人、CTO，面壁智能联合创始人、CEO。Google中国创始员工之一。

时间轴：

00:01:51: 我被时代感召，all in AGI

00:05:57：只有LLM可不行——AGI离不开Agent

00:09:06：宗旨是距离用户更近，从端模型到边模型

00:16:18：小目标：26年底，端侧模型达到GPT4水平

00:22:04：训练效率大增：不靠Scale，靠高质量数据

00:26:03：公司一年商业模式全摸了一遍，多个场景落地

00:30:20：走向用户的路，怎么个走法儿？就两点！

关于我们

这里是极客公园旗下的科技创业者社区 Founder Park 出品的 AGI 系列播客节目。

「AI局内人」，国绕 AGI 相关领域的技术发展、产品方向以及新的商业模式进行探讨和交流。

Founder Park 正在搭建 Al Native 的产品交流群，群内聚集着致力于在大模型相关领域创业的创业者、产品经理、研发工程师、对大模型技术和场景应用开发进展感兴趣的学者及投资人。

对更多内容感兴趣，欢迎关注公众号「Founder Park」。

AGI 2024特辑03 |对话面壁智能李大海：AGI是千里江山图，咱刚打开一条缝 35:54 Share