闫俊杰认为语音交互虽然在某些场景中非常有用,但目前全球每天使用 AI 产品的人数只有 4000 万,渗透率不到 1%。语音交互的主流化取决于能否提高使用率,尤其是在不方便打字的场景中。
MiniMax 的创始人闫俊杰认为,同时做模型和产品可以更好地优化技术,提高产品体验。他认为这是创业公司提高竞争力的必然选择,尽管风险较大。
闫俊杰认为,创业公司需要在技术和产品上同时投入,以确保技术能够快速进步,并且产品能够满足用户需求。他认为这是提高公司竞争力和市场占有率的关键。
闫俊杰认为,语音助手的商业价值主要取决于用户时长。用户在使用语音助手时花费的时间越长,产品的商业价值就越高。这直接影响了产品的变现能力。
闫俊杰认为,创业公司需要更高的要求,因为市场竞争激烈,大公司已经布局。创业公司需要在研发效率、产品体验和用户交互等方面建立壁垒,以提高成功概率。
闫俊杰认为,未来的 AI 产品需要基于现实世界已存在的需求,而不是凭空想象。他认为,产品应该解决实际问题,提高用户满意度,这样才能获得成功。
闫俊杰认为,语音交互的成本比文字便宜,因为一秒只能说三个字,而文字一秒可以处理 20 个 token。尽管语音处理的技术难度较大,但总体成本更低。
闫俊杰认为,AI 产品的用户量和满意度低是因为产品在多次错误回答后难以获得用户的信任。只有提高回复的准确性和满意度,才能增加用户量和使用率。
【本期内容】
**和多数人一样,在看到 OpenAI 最新发布的「AI 智能助手」GPT-4o 时,MiniMax 创始人、CEO 闫俊杰的第一感觉是「惊艳」。**他也为那些演示效果着迷,如丝滑的语音交互、实时的视觉理解、语言捕捉甚至包括了「呼吸声」。
2021 年底,闫俊杰创立 MiniMax 时,ChatGPT 还没有出现、业内也没有人相信大模型,而促使他一定要创业的动力是,**「把人工智能做成通用、服务大众这件事是很重要的」。**在这个目标驱使下,MiniMax 是行业少有的同时做模型、产品的公司。
在发布会结束两天后,这位以神秘、低调著称的从业者,罕见地做客极客公园直播间,和极客公园创始人兼总裁张鹏进行了近 2 小时的实时访谈。从这场发布会切入,他聊到了技术和成本、行业赛点、开源与闭源之争、投流和 PMF等关键问题。
本期播客为访谈的精华内容,enjoy~
【嘉宾】
张鹏:极客公园创始人 & 总裁
闫俊杰:MiniMax 创始人、CEO
02:47 先聊聊观看 OpenAI 与 Google I/O 发布会的感受
07:07 拆解 GPT-4o 的技术实现路径:怎么通过大模型来做语音合成?
08:48 未来的 AI 助理,语音交互方式会成为主流吗?
11:19 GPT-4o 能让用户更愿意说出「真心话」吗?
13:06 MiniMax 多久可以产出类似 GPT-4o 的产品?
14:01 大模型技术栈曝光:关于 MoE 的下一步是什么?
16:27 本土大模型领域的创业公司们,要追逐和解决的下一个目标是什么?
17:51 大模型:产品竞力取决于产品能力,商业竞力取决于用户时长
20:33 怎么看苹果将与 OpenAI 达成合作?
21:15 对创业公司而言,「产品+模型」的双轮驱动风险大、收益也大
23:04 新形态的 AI 产品涌现,由技术进步的周期决定
24:40 一个千万 DAU 量级的语音助手产品,需要烧掉多少成本?
27:36 创业的本质:你只能在时间中逐渐行进,去尝试掌握未来
28:24 如何看待 AI 语音助手这类产品未来的竞争格局?
29:24 国内最大的智能(语音)助手类产品,日活只有 400 万 DAU
32:24 娱乐类产品和效率类产品,变现逻辑是什么?
35:24 AI Native的产品,需要「嫁接」在现实世界已存在的需求上生长吗?
37:10 对创业本身的信仰,或许和相信 AGI 一样重要
【对话稿件实录】
《对话 MiniMax 闫俊杰:现在的 AI 应用不会成为 Super App,但这不重要》)
【关于节目】
「开始连接LinkStart」是一档由极客公园出品的科技商业播客。在这里,我们会邀请各行各业的嘉宾一起跨界对话、碰撞思想,用科技、商业和人文的视角一起描摹这个时代。欢迎同步关注「视频号-极客公园」,第一时间,带你追踪科技热点。
本期编辑:xuxu
剪辑:Katherine
公众号/视频号:极客公园