cover of episode Why AI Voice Feels More Human Than Ever

Why AI Voice Feels More Human Than Ever

logo of podcast a16z Podcast

a16z Podcast

Anish Acharya
Olivia Moore
@Anish Acharya : 我认为AI语音技术之所以取得突破,主要是因为模型和技术的成熟,以及电话作为新的分销渠道的出现。现在,AI语音模型能够进行自然流畅的对话,甚至在某些方面比人类更好。许多企业已经开始使用AI语音进行数万通电话,这表明AI语音技术已经不再是遥远的未来,而是正在发生的现实。 在过去的一年中,AI语音技术取得了显著的进步,尤其是在延迟降低、语音拟人化、情感表达和对话结构等方面。延迟已经从几秒钟降低到半秒钟甚至更短,语音也更加自然流畅,能够表达情感,并进行打断和被打断的自然对话。 AI语音技术的应用范围非常广泛,几乎每个垂直领域都有AI语音代理公司。AI语音代理主要通过减少人力成本或将人力资源分配到更有效率的工作上来提升效率。在呼叫中心、金融、医疗和政府等领域,AI语音代理的应用尤为成功。 AI语音代理的定价策略多种多样,包括按分钟收费、平台费和基于结果的定价等。未来,AI语音代理的定价策略可能会结合多种模式。 AI语音技术的护城河主要体现在集成、用户界面和自学习数据等方面。垂直领域的AI语音公司可以通过积累特定行业的数据来提升模型性能,从而获得竞争优势。 AI语音技术的未来发展方向是将语音作为一种新的操作系统平台,构建更高级的软件和系统。同时,AI语音技术也将在消费者领域得到广泛应用,例如在心理健康支持、教育和语言学习等方面。 @Olivia Moore : 早期AI语音产品(如Siri和Alexa)之所以令人失望,是因为语音听起来像机器人,并且背后的引擎(技术)过于简单,缺乏个性和真正的“大脑”。 而现在,AI语音产品已经能够像人类一样进行自然流畅的对话,甚至在某些方面比人类更好。许多消费者已经通过语音与AI互动,只是他们可能没有意识到这一点。 AI语音技术的发展经历了三个阶段:1. 早期的IVR电话树;2. 基于关键词触发的AI;3. 能够进行更全面理解和自然对话的AI。 在过去6-12个月里,AI语音技术取得了显著进步,尤其是在延迟降低、语音拟人化、情感表达和对话结构等方面。情感表达能力的提升,使人们能够以全新的方式感受到AI的情感,这对于提升用户体验至关重要。 AI语音代理最容易取得成功的领域是那些已经拥有呼叫中心且呼叫流程清晰的企业,以及那些对结果的衡量标准明确的企业。AI语音代理的定价策略多种多样,包括按分钟收费、平台费和基于结果的定价等。 在消费者领域,AI语音技术的应用潜力巨大,但具体的应用场景还有待探索。大型科技公司可能会在一些特定领域占据优势,但新兴公司在其他领域拥有更大的发展空间。

AI voice technology has been around for years — think Siri or Alexa — but the magic has been missing. That’s changing, and quickly!

In this episode, Anish Acharya, General Partner at a16z, and Olivia Moore, Partner at a16z, explore why AI voice is reaching a breakthrough moment, how today’s models feel more human than ever, and why voice is poised to become the primary way people interact with AI.

With businesses already making tens of thousands of AI-driven phone calls daily, AI-powered conversations are no longer a distant vision—they’re happening now. Whether it's AI companions, customer service bots, or enterprise applications, voice tech is here—and it’s improving faster than anyone expected.


