cover of episode Vol.30|对话 MiniMax 闫俊杰:「Her」已诞生,下一代 AI 助手长啥样?

Vol.30|对话 MiniMax 闫俊杰:「Her」已诞生,下一代 AI 助手长啥样?

2024/6/6
logo of podcast 开始连接LinkStart

开始连接LinkStart

AI Deep Dive AI Insights AI Chapters Transcript
People
张鹏
闫俊杰
Topics
闫俊杰:AI 的价值和能力远大于单个公司,全球众多研究者和资源共同推动其发展。大模型创业公司应采用“产品+模型”双轮驱动模式,但这种模式风险高,成功与否难以预测,最终取决于产品能力和市场占有率。AI 产品的涌现取决于技术发展阶段,技术进步到一定程度后,相应产品自然会出现。大模型领域的创业公司面临巨大挑战,需要在创新方面有所突破,否则就应该失败。GPT-4 的语音交互技术实现难度低于最初的 GPT 模型,因为语音处理速度低于模型处理 token 的速度。OpenAI能够从底层思考问题,并巧妙地将语音合成与大模型结合。Google I/O 展示的多步推理和视频理解能力远超其他 AI 产品。Google 的搜索技术壁垒在于对实时本地信息的处理能力。Google 在多步推理和视频理解方面领先,并能利用 YouTube 视频数据提升搜索体验。多模态融合将成为中国大模型创业公司下一个目标。在效率类 AI 产品领域,多模态融合是必答题。AI 助手能否成为超级应用取决于产品能力和用户时长,拥有设备的公司更有优势。拥有设备的公司在 AI 助手领域更有优势,但能够做出优秀产品的公司仍有机会。苹果和 OpenAI 的合作符合逻辑,但 OpenAI 仍有机会独立挑战现有生态。在 AI 助手领域,拥有设备的公司更有优势,但能够做出优秀产品的公司仍有机会。AI 助手可以提升手机操作系统对用户时间的掌控,但产品体验至关重要。苹果和 OpenAI 的合作符合逻辑,因为这涉及到用户时间的分配。OpenAI 是否能独立挑战现有生态取决于规模。“产品+模型”双轮驱动模式风险高,但对模型公司来说几乎是必然选择。即使只做模型或只做产品,创业风险也很大。模型公司自建产品是必然选择,因为这能更好地控制模型优化过程。模型公司自建产品能避免信息损失,并缩短优化周期。AI 模型的通用性使其更容易吸收社区的进展,避免闭门造车。AI 产品形态的出现取决于技术发展阶段。不要基于当前模型问题打补丁,应关注技术本身的进步。在资源有限的情况下,提升效率才能提升模型上限。模型开发不能跳跃式发展,需要循序渐进。创业需要一步步前进,掌握未来。创业的本质是循序渐进地掌握未来。AI 助手类产品竞争激烈,核心在于解决用户问题和提升用户满意度。AI 产品普及率低是因为用户容忍度低,GPT-4 没有显著提升产品价值。MiniMax 的目标是提升用户单次回复满意度。目前 AI 助手类产品 DAU 较低,无法定义行业发展方向。目前 AI 助手类产品 DAU 较低,约为 400 万。AI Native 产品投流是因为中国互联网流量集中,AI 能力有限。AI Native 时代与移动互联网时代不同,PMF 的定义也需要改变。 张鹏:OpenAI 的 GPT-4O 突破在于工程能力和产品场景的结合。语音交互是否会成为主流,取决于其能否提升 AI 产品的普及率。Google 的 AI 技术能够分析长视频,并精准识别事件和参与者。

Deep Dive

Key Insights

为什么闫俊杰认为语音交互方式不会成为主流?

闫俊杰认为语音交互虽然在某些场景中非常有用,但目前全球每天使用 AI 产品的人数只有 4000 万,渗透率不到 1%。语音交互的主流化取决于能否提高使用率,尤其是在不方便打字的场景中。

为什么 MiniMax 选择同时做模型和产品?

MiniMax 的创始人闫俊杰认为,同时做模型和产品可以更好地优化技术,提高产品体验。他认为这是创业公司提高竞争力的必然选择,尽管风险较大。

为什么闫俊杰认为创业公司需要在技术和产品上同时投入?

闫俊杰认为,创业公司需要在技术和产品上同时投入,以确保技术能够快速进步,并且产品能够满足用户需求。他认为这是提高公司竞争力和市场占有率的关键。

为什么闫俊杰认为语音助手的商业价值取决于用户时长?

闫俊杰认为,语音助手的商业价值主要取决于用户时长。用户在使用语音助手时花费的时间越长,产品的商业价值就越高。这直接影响了产品的变现能力。

为什么闫俊杰认为创业公司需要更高的要求?

闫俊杰认为,创业公司需要更高的要求,因为市场竞争激烈,大公司已经布局。创业公司需要在研发效率、产品体验和用户交互等方面建立壁垒,以提高成功概率。

为什么闫俊杰认为未来的 AI 产品需要基于现实世界的需求?

闫俊杰认为,未来的 AI 产品需要基于现实世界已存在的需求,而不是凭空想象。他认为,产品应该解决实际问题,提高用户满意度,这样才能获得成功。

为什么闫俊杰认为语音交互的成本比文字便宜?

闫俊杰认为,语音交互的成本比文字便宜,因为一秒只能说三个字,而文字一秒可以处理 20 个 token。尽管语音处理的技术难度较大,但总体成本更低。

为什么闫俊杰认为 AI 产品的用户量和满意度低?

闫俊杰认为,AI 产品的用户量和满意度低是因为产品在多次错误回答后难以获得用户的信任。只有提高回复的准确性和满意度,才能增加用户量和使用率。

Chapters
本节讨论了OpenAI发布的GPT-4o,以及它在语音交互、视觉理解和语言捕捉等方面的惊艳表现。同时,探讨了语音交互在未来AI助手中的主流地位,以及如何通过大模型实现语音合成等技术问题。
  • GPT-4o在语音交互、视觉理解和语言捕捉等方面表现惊艳
  • 语音交互方式在未来AI助手中的主流地位值得探讨
  • 通过大模型实现语音合成,关键在于将语音模型与语言模型对齐

Shownotes Transcript

【本期内容】

**和多数人一样,在看到 OpenAI 最新发布的「AI 智能助手」GPT-4o 时,MiniMax 创始人、CEO 闫俊杰的第一感觉是「惊艳」。**他也为那些演示效果着迷,如丝滑的语音交互、实时的视觉理解、语言捕捉甚至包括了「呼吸声」。

2021 年底,闫俊杰创立 MiniMax 时,ChatGPT 还没有出现、业内也没有人相信大模型,而促使他一定要创业的动力是,**「把人工智能做成通用、服务大众这件事是很重要的」。**在这个目标驱使下,MiniMax 是行业少有的同时做模型、产品的公司。

在发布会结束两天后,这位以神秘、低调著称的从业者,罕见地做客极客公园直播间,和极客公园创始人兼总裁张鹏进行了近 2 小时的实时访谈。从这场发布会切入,他聊到了技术和成本、行业赛点、开源与闭源之争、投流和 PMF等关键问题。

本期播客为访谈的精华内容,enjoy~

【嘉宾】

张鹏:极客公园创始人 & 总裁

闫俊杰:MiniMax 创始人、CEO

                                                                       

【精彩时刻】

02:47 先聊聊观看 OpenAI 与 Google I/O 发布会的感受

07:07 拆解 GPT-4o 的技术实现路径:怎么通过大模型来做语音合成?

08:48 未来的 AI 助理,语音交互方式会成为主流吗?

11:19 GPT-4o 能让用户更愿意说出「真心话」吗?

13:06 MiniMax 多久可以产出类似 GPT-4o 的产品?

14:01 大模型技术栈曝光:关于 MoE 的下一步是什么?

16:27 本土大模型领域的创业公司们,要追逐和解决的下一个目标是什么?

17:51 大模型:产品竞力取决于产品能力,商业竞力取决于用户时长

20:33 怎么看苹果将与 OpenAI 达成合作?

21:15 对创业公司而言,「产品+模型」的双轮驱动风险大、收益也大

23:04 新形态的 AI 产品涌现,由技术进步的周期决定

24:40 一个千万 DAU 量级的语音助手产品,需要烧掉多少成本?

27:36 创业的本质:你只能在时间中逐渐行进,去尝试掌握未来

28:24 如何看待 AI 语音助手这类产品未来的竞争格局?

29:24 国内最大的智能(语音)助手类产品,日活只有 400 万 DAU

32:24 娱乐类产品和效率类产品,变现逻辑是什么?

35:24 AI Native的产品,需要「嫁接」在现实世界已存在的需求上生长吗?

37:10 对创业本身的信仰,或许和相信 AGI 一样重要

                                                                

【对话稿件实录】

《对话 MiniMax 闫俊杰:现在的 AI 应用不会成为 Super App,但这不重要》)

                                                                                       

【关于节目】

「开始连接LinkStart」是一档由极客公园出品的科技商业播客。在这里,我们会邀请各行各业的嘉宾一起跨界对话、碰撞思想,用科技、商业和人文的视角一起描摹这个时代。欢迎同步关注「视频号-极客公园」,第一时间,带你追踪科技热点。

                                                                  

本期编辑:xuxu

剪辑:Katherine

公众号/视频号:极客公园