cover of episode S8E05 | 深度解析GPT4o、谷歌AI助理:留给OpenAI和Google的时间不多了  | 硅谷徐老师

S8E05 | 深度解析GPT4o、谷歌AI助理:留给OpenAI和Google的时间不多了 | 硅谷徐老师

2024/5/17
logo of podcast What's Next|科技早知道

What's Next|科技早知道

AI Deep Dive AI Chapters Transcript
People
李志飞
硅谷徐老师
郑玉典
Topics
李志飞:从语音助手到生成式AI,人机交互方式的演变与挑战;多模态AI助手提高了用户期望值,但实际应用中可能达不到演示效果,需要时间来观察;低延迟、端到端、多模态的实时交互是革命性的进步;AI硬件成为主流设备面临软件、硬件和生态三个方面的挑战;Google需要更开放和激进,不能过于保守;留给OpenAI的时间越来越少,需要更加专注于核心技术;ChatGPT产品形态和商业模式的可持续性问题。 郑玉典:OpenAI GPT-4o发布会现场观察;GPT-4o是一个多模态模型,支持实时视频输入,价格相对便宜且速度快;相比GPT-4o,Google Project Astra的demo更注重记忆和上下文理解,但GPT-4o在API发布和产品化方面更胜一筹;Google Project Astra演示令人印象深刻,能够实时理解环境和用户行为,但目前仍处于demo阶段;OpenAI面临两大挑战:ChatGPT产品形态和商业模式的可持续性。 硅谷徐老师:OpenAI模式是“小而美”,专注开发者和killer app;Google模式是“大而全”,利用现有生态系统;Google CEO应该辞职,因为其发展战略缺乏激进性和远见。 丁教:Google已经比一年半前快了很多,但仍需加快速度;关于开源闭源的讨论。

Deep Dive

Chapters
讨论了 OpenAI 和 Google 在 AI 领域的最新发展和竞争态势,特别是 GPT-4o 和 Project Astra 的发布。
  • OpenAI 的 GPT-4o 模型在发布会后立即向开发者开放,价格比之前的模型更便宜且速度更快。
  • Google 的 Project Astra 展示了多模态和实时交互的能力,但目前仅限于演示阶段。
  • 两家公司都在努力解决多模态和实时交互的技术挑战,但用户体验和期望管理是关键问题。

Shownotes Transcript

5 月 14 日,OpenAI 在产品发布会上发布了最新 GPT-4o 多模态大模型,通过实时的语音、视频和文本交互震撼了全世界。然而就在这场发布会后一天,谷歌举办了 2024 年 I/O 开发者大会,发布了令人眼花缭乱的AI产品,名字都快多的记不过来了。当然最令人瞩目的还是和 GTP-4o 对标的 Project Astra。

本期节目邀请到三位业内人士进行访谈,其中包括两位 AI 领域的创业者:出门问问创始人兼 CEO 李志飞与 jobright.ai 联合创始人郑玉典。大家分享了在这两场发布会后的感受和思考,志飞从行业以及技术的角度大家分析了 AI 助理发展成真正可以日常使用的产品还需要解决的问题,以及 Open AI 和谷歌这两家科技公司各自现存的问题与挑战等。

本期人物

  • 丁教 Diane,「声动活泼」联合创始人、「科技早知道」主播

  • 硅谷徐老师,AI高管、连续创业者、斯坦福客座讲师,小红书和微信视频号:硅谷徐老师 |公众号:硅谷云| YouTube: Byte into Future

  • 李志飞,出门问问创始人兼 CEO,美国约翰霍普金斯大学计算机系博士,自然语言处理及人工智能专家,前 Google 总部科学家

  • 郑玉典,AI /数据库博士,ex-Twitter/Newsbreak 广告推荐负责人,jobright.ai 联合创始人

主要话题 [05:19] 嘉宾来自 OpenAI 发布会现场的观察 [11:51] 多模态虚拟助理将引发新一轮人机交互革命 [16:36] Demo啥时候能照进现实,GPT-4o 是否过度抬高期望值? [24:26] GPT-4o VS Astra,多模态模型第一轮较量谁胜谁负? [31:33] 「小而美」的 OpenAI,与「大而全」的谷歌 [34:23] 「船大难掉头」? 皮查伊应该辞职 [39:36] 智能硬件成为主流设备还有多远的距离? [47:41] “渣男”苹果选 OpenAI 还是谷歌?可能是一招定生死 [53:36] OpenAI 两大挑战:产品形态与商业模式 [01:01:34] 开源闭源的终局,留给 OpenAI 的时间还多吗?

关联阅读 GPT-4o让人机交互这个渣男有望重新做人)

幕后制作 监制:丁教、Xinlu 后期:Jack、迪卡 运营:George 设计:饭团

商务合作 声动活泼商务合作咨询)

支持我们,加入新一年的播客创新 2021 年我们发起了「声动胡同会员计划」,这是一个纯支持项目,支持「声动活泼」在播客内容上不断探索和创新。回顾 2023 年,得益于这些支持,「声动活泼」的每档节目都不断突破,不仅荣登苹果中国的年度热门节目榜单,还在 CPA 和喜马拉雅等平台都榜上有名。2024 年全新付费节目「不止金钱)」现已上线,欢迎收听。同时,新一季「跳进兔子洞」即将上线,敬请期待! 胡同

加入我们 声动活泼正在招聘全职「节目监制」、「节目营销」、「商业化项目管理」,查看详细讯息请 点击链接)。如果你已准备好简历,欢迎发送至 [email protected]), 标题请用:姓名+岗位名称。

关于声动活泼 「用声音碰撞世界」,声动活泼致力于为人们提供源源不断的思考养料。 我们还有这些播客:声动早咖啡)、声东击西)、吃喝玩乐了不起)、反潮流俱乐部)、泡腾 VC)、商业WHY酱)、跳进兔子洞) 欢迎在即刻)、微博等社交媒体上与我们互动,搜索 声动活泼 即可找到我们。 期待你给我们写邮件,邮箱地址是:[email protected]) 声小音

欢迎扫码添加声小音,在节目之外和我们保持联系。

Special Guests: 李志飞 and 郑玉典.