cover of episode 03 打工的尽头是创业?你所不知道的「Motion GenAI」,是下一片蓝海|对话海外创业家

03 打工的尽头是创业?你所不知道的「Motion GenAI」,是下一片蓝海|对话海外创业家

2024/7/14
logo of podcast AirCafe

AirCafe

Frequently requested episodes will be transcribed first

Shownotes Transcript

你听过「动作生成 / Motion Generation」吗?当所有公司都在卷语音生成、文本生成、甚至视频生成时,本期嘉宾 Mia,一位 20 岁出头的女创业家,她创立的「MockAI)」公司,在「动作生成式 AI」的赛道上一骑绝尘。

作为多模态 AI,「MockAI)」可以利用文本、音频等多种输入形式,为虚拟角色生成动画人物,实现自然、实时的虚拟角色互动。如果说 ChatGPT-4o 赋予了AI「语言表达」的能力,那 Mia 的「MockAI)」,则是给 AI 装上身体,让它拥有与这个世界「拥抱」的能力。

未来,我们可以大胆预测,「动作生成式 AI」将不再局限于游戏和元宇宙,更有:从无人驾驶车上路前的模拟测试,到城市规划时的自然灾害场景模拟,再到企业培训……当 3D 交互被「动作生成式 AI」彻底打通后,我们也即将迎来一个新的时代。

大家都说「打工的尽头是创业」。然而,在每个赛道都趋于饱和的时代,创业还有机会吗?我们该如何找到属于自己的护城河?华人在海外创业是一种什么体验?本期节目,我们将以「一个产品被“生”出来」的时间顺序展开,一起聊聊 Mia 从转行到创业,每个决策背后的故事。

不论你是打算创业、正在创业、抑或是止步不前,这期播客也许会对你有所启发。也欢迎你将这期播客分享给身边你认为可能会需要的人!

☕️ 本期嘉宾

Mia

  • 帝国理工化学本科,人工智能硕士
  • MockAI)」创始人、「动作生成式 AI」个人创业者
  • 领英主页 Mia Wang)

☕️ 时间线

【为「热爱」迈出的第一步】

01:58 放下分子模型,拿起键盘,她找到了新方向

05:53 拿下客户的功臣却是最后一个知道?打工人能创造的影响力是多有限?

08:02 「躬身入局」比读博更能让我认识自己的能力边界

【创业的门槛不用太高,难的是每一步】

16:42 用「妈妈测试 (The Mom Test)」洞察用户真实需求,及早获得市场反馈

22:54 被欧洲最大的孵化器之一「Entrepreneur First)」选中,海外孵化器为什么是个人创业者扩大边界、加速产品验证、增加资源渠道的机会?

33:01 个人创业者 (Solo Founder) 的苦与甜:合伙人可以让困难减半,快乐加倍,吗?

38:02 做决定与迭代的速度,决定一家公司的存亡

40:52 如果你是一个「完美主义者」,你很难能是一个好的企业家

【不想做旁观者,我想要亲手去推动 AI 动作生成时代的发展】

41:24 「MockAI」是做什么的?「动作生成」又是什么?

43:03 「视频生成」vs「动作生成」

49:40 除了游戏和元宇宙,「动作生成」还能应用在哪儿?

52:39 找投资人就像「家族联姻」,想清楚自己要什么很重要!

55:26 为什么「动作生成」赛道正在闷声发大财?

58:39 创新还是微调?打造差异化也是一种创新,找到自己的护城河比“捡漏”赛道更重要

01:03:38 英美融资有什么区别?为什么最终决定留在欧洲?

01:06:16 “一个公司不会死,除非它的创始人决定放弃”

☕️ Reference & 所涉部分术语

  • 《The Mom Test》:一本由 Rob Fitzpatrick 撰写的关于创业者如何有效进行市场调研和客户访谈的书。书名的含义是,许多创业者在向他人(尤其是自己的母亲)介绍自己的创业想法时,往往会得到过于积极和不够客观的反馈,因为听者不想伤害他们的感情。作者通过这本书,教导创业者如何通过有效的客户访谈获取真实市场反馈,聚焦用户实际需求。【👀 结尾有隐藏福利直接送英文官方 PDF 版本电子书 🎁】
  • **「Animate Anyone」**是由阿里巴巴智能计算研究院开发,你只需提供一个静态的角色图像和一些预设的动作(或姿势序列)然后会生成该角色的视频模型。提及的论文:《Animate Anyone: Consistent and Controllable Image-to-Video Synthesis for Character Animation)》。
  • **Foundation Model(大模型):**是指通过大规模的数据、算法和计算能力训练出的高精度深度学习模型,通常具有千万亿次的计算能力,可以在语音识别、自然语言处理、图像识别等领域,实现人类甚至超越人类的性能表现。
  • **Multimodality Models(多模态大模型):**是一种能够处理多种模态数据的人工智能模型。这些模型可以同时处理文本、图像、视频、音频等多种数据类型,通过融合不同模态的数据,提供更为全面和准确的理解与分析。
  • **Defensibility:**护城河

☕️ 关于我们

  • Victoria: 帝国理工大学化学系本硕 // 做不被定义的理科生 // 领英主页) // 即刻&IG @victoritse
  • Jecci: 剑桥大学社会人类学硕士 // 做自己的生活艺术家 // 领英主页) // 小红书&公众号 @杰西西Jecci

☕️ 关于AirCafe

《AirCafe》是一档将不同学科和领域里的人链接在一起的播客节目。通过「第一视角」的对谈与碰撞,我们想要打破海内外信息壁垒,建立一张属于你我的人脉网。

💌 欢迎大家多多在评论区与我们互动,或者点击 AirCafe听众留言) 与我们联系,期待你的来信!

欢迎在 Apple Podcast)、Spotify)、小宇宙) 订阅我们,不要错过我们的「云端聊天」~

🎁 听众福利

扫码添加「AirCafe小助手」,我们将为【点赞💙→评论→收藏本期节目】的听友们,免费发送《The Mom Test》英文官方正版 PDF 电子书!也欢迎大家在播客之外,与我们进一步链接~ ☕️ 声明

  • 由于话题的专业性和嘉宾的表达习惯,本期节目中很多专业术语都是用英文来表达,如果存在不清楚的术语或者词汇,可以在评论区和我们讨论!
  • 本播客的内容仅代表个人观点,并不代表任何公司、律师事务所、投资机构出具的任何形式的意见或建议。未经本播客的授权,不得转载或使用播客节目中的任何内容。
  • 感谢您对本播客原创内容的喜欢。如需转载或引用本播客所述内容,请注明出处。转载前请与我们联系并取得同意。