cover of episode 对话Lepton AI产品负责人:探索AI基础设施的设计与技术哲学

对话Lepton AI产品负责人:探索AI基础设施的设计与技术哲学

2024/2/19
logo of podcast AI Odyssey

AI Odyssey

Frequently requested episodes will be transcribed first

Shownotes Transcript

【主播的话】

大家好,新年快乐!

农历新年的第一期节目,我们有幸邀请到 Lepton AI 的产品负责人鱼哲。他将与我们深入探讨 AI 基础设施领域的最新动态和未来趋势。嘉宾不仅是一位从开发者转型为产品经理的 AI 行业专家,还曾负责高性能 AI 计算架构平台的工作,对 AI 应用层开发者的需求有着深刻的理解。

在本期节目中,我们将聚焦于 AI Infra 的核心挑战,探讨如何通过产品和技术的融合提升 AI 应用的性能和效率。嘉宾还将分享他对多模态模型、结构化输出以及 AI 应用开发者需求的独到见解。

本期节目为我们探索 AI Infra 的重要一步,我们将继续带来更多深入的解析和讨论。

嘉宾和主播长期在北美工作生活,夹杂英文在所难免,不接受抱怨!Enjoy!

【本期嘉宾】

Yuze 鱼哲,毕业于美国伦斯勒理工大学。前阿里云高性能AI平台产品负责人。专注于AI在金融量化,风控,搜索推荐,自动驾驶,互联网娱乐等行业落地及应用。目前在北美明星AI架构平台Lepton AI 就任产品负责人。推特 @YuzeMa5。

【本期主播】

Leo Zhao 硅谷大厂高级机器学习工程师,GenAI LLM发烧友

【本期焦点】

01:56 AI Infra 的目标用户和需求分析

03:45 AI 应用开发者的特点和需求

06:21 AI 应用开发的路径和挑战

08:25 AI Infra 的覆盖面和优化方向

10:10 具体案例讨论:动画片分镜制作的 AI 应用

13:44 AI 模型的可扩展性和后端服务的挑战

15:28 AI 推理方向的技术探讨

18:53 AI 性能优化的具体方法和案例

22:51 AI 模型的定制化开发和技术选择

27:12 RAG 在 AI 应用中的挑战

32:30 AI 模型推理的优化方向和实践

38:01 AI 模型推理的算法和硬件优化

42:36 AI 应用开发的优化策略和业务取舍

47:20 Lepton AI 的收费模式和用户成本

51:04 AI 应用开发的未来趋势和发展方向