cover of episode Making human music in an AI world

Making human music in an AI world

2024/11/17
logo of podcast The Vergecast

The Vergecast

Chapters

Ge Wang discusses his unique approach to computer music, which involves playful and exploratory interactions with technology, and his journey from founding Smule to conducting the Stanford Laptop Orchestra.
  • Ge Wang founded Smule, a company known for music-based apps like Ocarina and Magic Piano.
  • He created the ChucK programming language for music synthesis.
  • Ge conducts the Stanford Laptop Orchestra, which uses laptops and gadgets to create unique music.

Shownotes Transcript

跟着判决走,这个灵活的播客,播放你用嘴在手机上玩的音乐应用。我的意思是,似乎,我承认华盛顿特区的联合车站出现了。

现在是凌晨四点五十四分。我现在在纽约的路上,等待着和一些其他 Verge 人进行计划会议。我现在在 Verge 工作两年半了,他们是一些我从未见过面的同事。

我们生活在一个奇怪的疫情后大学时代,但我将要与一个人单独会面。这是我们关于音乐未来的系列中的第三也是最后一集。我们已经谈论过曲目、明星和 TikTok。

我们已经谈论过自动调音。今天,我将与一位名叫戈·旺的斯坦福教授交谈。戈·旺很有趣。

他长期活跃在音乐界,但他也是一名学者。他还是一位前企业家,创办了一家名为 Smule 的公司,你可能听说过。他一直在音乐界思考这个问题很长时间了。

所以我想要和他谈谈人工智能、虚拟现实以及它们对音乐创作意味着什么。在一个技术、媒体等所有部分都在不断融入这一过程的世界里,我们进行了一次非常愉快的谈话。它完全出乎我的意料,但我真的很享受,我希望你们也喜欢。所有这些内容马上就要来了,但火车真的很好。请记住,这是 Verge 播客。

Verge 播客的赞助商是新歌启动。嘿,Nissan Kicks 经历了彻底的改造,以城市冒险为重心,重新定义了紧凑型跨界车,拥有引人注目的新外观和全面升级的内饰,配备高级皮革。

Kicks 的体验得到了全面提升,以帮助您更好地驾驭城市生活,而重新设计的 Kicks 配备了智能全轮漂移系统,让您无论刮风下雨都能继续前行。请访问 www.nissanusa.com/2025-kicks 了解更多信息。智能四驱系统无法防止碰撞,也无法在所有条件下提供增强的牵引力。请始终关注交通和天气状况。

欢迎回来。让我们进入我和戈·旺的谈话。我想和戈·旺谈谈,因为他在这个音乐与科技的宇宙中占据了一个非常独特的位置。

几年前,他创办了一家名为 Meal 的公司,它仍然存在于元宇宙中。他们制作了许多非常受欢迎的音乐应用程序。其中一个名为 Smule 的应用程序,仍然非常受欢迎。

还有一个名为 Magic Piano 的应用程序,它有点像吉他英雄或节奏大师,但它是为弹钢琴设计的。戈·旺还编写了一种名为 Chuck 的编程语言,它允许你编写输出音乐的代码。看着有人用它工作非常酷,也很神奇。

他现在在斯坦福大学工作了很长时间,还在音乐与声学计算机研究中心任教,这是一个我刚刚了解到的非常酷的事情。他还写了一本关于设计的书。多年来,他一直在教授音乐与技术。

而且,在业余时间,他还是斯坦福笔记本电脑乐队的指挥,这正像它听起来的那样。一群学生在舞台上使用他们的笔记本电脑和其他设备创作音乐,创作出你从未听过的音乐。

如果你能想象的话,这个声音正是由戈·旺本人创作的,他站在舞台上,戴着连接笔记本电脑的手套,随着他在空间中移动双手,声音也在变化。这太神奇了。你应该看看。

他们的音乐会非常酷。我想和戈·旺谈谈音乐的未来,因为我觉得他会从一个独特的视角看待这一切。他创作音乐。

他教授音乐。他是一位程序员和工程师,在两者方面都接受过训练。他以前也创办过公司。他从各个方面都了解过这一切,我认为他会对我们如何创作音乐、如何与计算机互动来创作音乐以及他可能感兴趣的一些新人工智能应用程序有一些很棒的想法。我们的谈话与我预期的完全不同,而且以一种我非常喜欢的方式不同。

实际上,我们谈论的比任何事情都多的是,在一切都被优化、简化、更方便、更高效、更引人入胜的时代,创造力意味着什么。你几乎在任何地方都能看到这一点。这比我们节目中谈论的许多事情都要哲学得多。

但是,我喜欢他谈论在所有这些技术中如何保持人性以及如何保持自我。我希望你们也喜欢。所以,让我们开始深入探讨。

我要求你们尝试一下,从他的角度理解这些词语。在采访和自我介绍中,我多次提到他创作电脑音乐。但是,现在是 2024 年,几乎所有音乐都是用电脑制作和演奏的。那么,戈·旺版本的电脑音乐现在是什么样子?他最初是如何如此着迷的?

从小时候起,我就对电脑着迷,这可能与电子游戏有关。事实上,我第一次看到电子游戏是在北京,我那时大约七或八岁。在那之前,我从未见过电脑。

所有这些都是大事。当我们拥有九色电视时。你知道,这发生在中国 80 年代初期,我第一次看到妈妈带我去游戏厅,一个电子游戏场所。我不知道听众们是否还知道这些是什么。

他们可能在电影里见过。是的,就是这样。

有更多地方你可以去,把硬币放进去,玩游戏,那里有这些巨大的机器,游戏厅机器。当我第一次看到电子游戏以及像素时,我觉得它真的吸引了我,就像火焰吸引了飞蛾一样。我想这并不是一个糟糕的比喻,但从那时起,我就一直对电脑着迷。

但我认为随着时间的推移,我真的很喜欢电脑和计算机科学这门学科。但我认为我将尝试以一种奇怪的方式解释这一点。

我的学位不是计算机科学。我的博士学位是计算机科学。在某种程度上,我是一个奇怪的计算机科学家。

但我认为我称之为奇怪,是因为我倾向于用电脑构建一些没有人真正要求的东西,并且似乎没有解决任何存在的问题。例如,Okra,对吧?这是 2008 年为 iPhone 设计的。你可以看到,我在这里玩一下,这里有一些东西。

我拿着手机,就像拿着三明治一样,对着底部麦克风吹气。手机上的多点触控控制音调,手机的振动由手机的冷热控制。所以我几乎看不到屏幕,但它是一种物理的东西。所以有人尝试用这个来预测未来。

例如。所以,我对着我的 iPhone 和 Okra 应用程序吹气。我会说,他投入了大量精力,你知道,它需要软件工程、软件设计、交互设计、信号处理,所有声音都在手机上实时生成,使用在 Chuck 编程语言中编写的音调生成器,这是我在普林斯顿大学的论文,我仍在开发,就像 23 年后,我仍然在与一个大型团队和社区的人们一起工作。人们致力于解释……

Chuck 对了解它的人来说只是音乐。

所以,Chuck 是这些工具之一,我们已经谈论过。Chuck 是一种用于音乐语句的编程语言,你用代码生成声音,但你也可以用代码编写算法,来确定或生成接下来出现的音乐类型,或者它实际上可以从人类互动中映射出来,在这种情况下,在 Okra 中,人类与计算机的互动。

我使用我的物理互动来控制正在发生的声音。所以,这通常是两者的结合。其中有一部分自动化。

但同时,它也在尝试找出一种有趣的方式,将人类互动融入我们正在构建的东西中。再次强调,没有人要求这些东西。没有解决任何存在的问题。我认为,对我来说,以及我的研究小组的学生来说,这始终是一个贯穿始终的主题,我们思考工程、技术,以及我们能用这些技术解决哪些问题。虽然解决问题是人类需要做的事情,而且我也很乐意去做,但我认为作为一名工程师,我们也可以构建一些并非总是由实际用途驱动的产品。

告诉我你是如何通过这种创造性过程的。我认为我花了很多时间与工程师和开发人员交谈,他们说,你知道,他们中的一些人只是说,然后他们会做一些小的、小的飞跃。现在我制作了另一个 AI 聊天机器人,对吧?我认为有一种简单的方法可以从相反的方向入手,例如,我可以解决哪些问题来帮助人们?

我认为,使用技术来服务于相反的方向,并问自己,我可以制作什么,这是一种非常有趣且不同的创造性过程,特别是当你必须教给学生这些东西时。你是否已经完善了如何做到这一点的过程?

是的。我用这个。我写了一整本书,关于在追求崇高的过程中,艺术设计与技术。这实际上是关于将工具构建视为工程师,但也是批判性工程师,你知道,批判性构建者。

批判性部分实际上与这个问题有关,你为什么要做这件事?我为什么设计 Okra?这不是因为我想弄清楚人们需要什么,你知道,像戴维一样,你需要什么?你可能会说,我需要一个可以对着手机吹气的应用程序。

我需要一个流动的应用程序。

我需要一个流动的应用程序。同时,我也需要让世界各地的人们能够通过手机互相倾听。这缺少了。

这是一个缺陷。不,这并没有发生。所以,这并不是一种传统的,至少不是传统的想法。

现在,当我们想到工程时,我们想到的是,好的,需求是什么?问题是什么?陈述问题。然后我们可以找到解决方案。这至少在那种意义上不是基于需求的设计。

那么,为什么设计这个?这可能是人们所说的,也许缺乏一个更好的词,价值。通过设计来创造空间和价值,意味着你并非基于明确的当前实际需求来设计,而是基于你作为一个人真正深信的东西。因此,对于像 Okra 这样的东西,以及我与学生一起构建的许多其他工具,我们试图在设计中传达的核心价值观之一,就是简单地认为音乐创作是好的,并且音乐创作对人有益。这不仅仅是关于获得产品,而是关于演奏和学习乐器的过程,有时就像学习如何玩一个制作精良、也许具有挑战性的电子游戏一样,因为在游戏制作精良的情况下,这会带来巨大的满足感,即使游戏很困难,你可能也会欣赏这种困难,因为一旦你感觉自己掌握了系统,你就可以用系统表达自己,然后克服游戏的挑战,最终会感到非常满足。

这是否开始让你觉得人工智能是一种,我不知道,正在消亡的现象?在这个充满便利和效率的世界里,任何东西都可以通过按钮或应用程序轻松获得,做一些仅仅为了服务而做的事情,其乐趣和快乐以及努力是值得的,这感觉就像一种美丽而深刻的、以一种非常独特的方式看待世界的方式。

不幸的是,它感觉就像它已经过时了。在以便利性、优化和竞争为导向的社会中,它不是一种我们所处的社会所认可的东西。嗯,它感觉非常不符合我们构建有趣、充满乐趣的东西的时代。

但与此同时,我认为这正是我们是谁,我并不是指构建事物。我的意思是任何让你感觉像你自己的东西,无论那是什么,我希望至少提供这样的可能性,它实际上是你想要做的事情,你关心的事情。事实上,你可能会放弃许多实际需求,只为了去做。

这就像一种充满激情的爱好。而充满激情的爱好通常不是关于结果,不是关于优化,对吧?所以,我认为这与构建事物本身或做事情本身有关,这感觉已经过时了,但它也并非完全如此,我认为我们仍然会做一些事情,通常不是在工程背景下。

例如,当人们因为喜欢烹饪而为自己烹饪时,他们会从走入食品储藏室、找到错误的食材并制作出各种各样的东西中获得巨大的乐趣,就像你调制菜肴一样。这道菜的味道不会因为你做了它而不同,你知道,特别是如果你喜欢烹饪。我认为工具也没有什么不同。

我认为,在一个我们所创造的东西只关于优化、便利和降低劳动力成本的世界或社会中,存在一个危险,那就是这些工具实际上会让我们与我们真正是谁疏远,因为,你知道,让我们再次回到音乐,让我们停止在人工智能中使用音乐,对吧?嗯,今天我们有 AI 可以生成非常令人印象深刻的图像、视频和音乐,嗯,这是一个棘手的词。即使歌曲也是一个棘手的词,你知道,什么是歌曲,但让我们假设 AI 可以生成所谓的歌曲,只需几行代码,这就像人们一直想要的东西,如果我脑海中有一个音乐想法,我只需要让它实现。

这会很棒吗?你和我不需要压力,我没有音乐教育,从不花时间,但我只想在我的脑海中实现这个想法。这难道不会很棒吗?从某种程度上说,人工智能现在在某种程度上做到了这一点。

但我随后想到的问题是,这意味着什么?你知道,我会在这里引出另一个知识点,我称之为,我想,有点像气泡枪效应。我的意思是?对吧?所以,要吹气泡,大卫,当然。

是的。好的。所以当……

你嚼一块口香糖时,当第一次嚼口香糖时,一个气泡口香糖。

对吧?感觉怎么样?很棒。美味。

是的,它爆开了。就像味道很棒。你通常嚼那块口香糖多久?

我的意思是,这取决于口香糖,但有些口香糖,有些口香糖在10秒到3分钟之间,然后就结束了。当它结束时……

你用那块口香糖做什么?

呃,把它扔掉。然后你……

你认为你会再想一想那块特定的……

口香糖,哪怕一秒钟?

好的。我想我试图在这里画出一种类比,那就是,是的,也许我可以去一个通用的人工智能系统,说,给我生成一个巴尼恐龙从ATM取款的图像,但只有破烂的钱出来。我认为实际上,今天的人工智能会做得相当出色。

是的,这看起来很酷,是的,是的,就是这样。我可以去和我的朋友分享这个,说,看看我做了什么,我认为这实际上有社交功能。然后,更有可能的是,我会说,太好了,下一个。

是的,这花了3分钟、5分钟,我们政治的时间,一块或两块口香糖,无论如何。再想想那件事,可能比我丢弃的那块口香糖多一点。我认为这就是我所说的气泡效应。事实上,它有点像自动化和毫无疑问的自动化推动的极限,基本上试图将劳动力成本降到零,在所有可能的情况下,对吧?

嗯,其中有一个论点。我认为你经常在任何创造性事物中听到的论点是,过程很重要,对吧?一个事物的来源和它来自哪里,它的故事,以及制作它的人,以某种方式与事物不可分割地联系在一起,即使你并不总是理解。

但以某种方式,它很重要,这很难量化,也很难谈论。嗯,我真的很认同这个承诺,但我也很想知道,人工智能创造的是完全不同的东西,也许我们想要从人工智能那里获得的不仅仅是制作听起来像泰勒·斯威夫特的歌曲,而是制作完全不同的东西。这就是我认为你的工作如此有趣的原因。

以及为什么你关心你如何思考使用人工智能,就像你把你的职业生涯都投入到让计算机发出它们本不应该发出的声音,我认为这最终会产生一些不同的事情,对吧?你没有编写代码来制作泰勒·斯威夫特的歌曲。你正在制作其他东西。我觉得如果你把人工智能当作这种工具,既可以弯曲它,也可以尝试弄清楚它会发出什么声音。

我想我的总体人生哲学可以概括为,或者说,我的愿望是,应该有空间容纳这些东西,好吗?我的意思是,以我父亲的方式,我认为在音乐方面,我认为在社会中,人们应该有空间容纳这些东西,只要这些东西不是有害的、危险的,但这还意味着,我想,我真正想说的就是,应该有多元化。我们应该有能力拥有一个多元化的视角,对价值观、历史、社会背景进行批判性思考,这将是我对人工智能在哪些方面可能具有高度影响力的看法,但它也可能是人类能够蓬勃发展的必要条件,这个想法是拥有多元化的能力,嗯,所以从这个意义上说,我认为有必要思考如何利用人工智能来探索未开发的声音领域。但我们如何做到这一点,首先,我认为非常重要,因为它回到了你所说的关于我们赋予事物意义,我们称之为艺术的东西。

好了,我们得休息一下,然后还有很多要谈的。

马上回来。

对《The Verge》播客的支持由日产Kicks提供。嘿,Kicks经历了彻底的改造,成为重新定义城市冒险的城市级跨界车,拥有引人注目的新外观和经过全面翻新的内饰,拥有高级装饰。Kicks体验得到了极大的提升,以帮助你更好地驾驭城市生活。

而且,重新设计的Kicks配备了智能全轮驱动系统,因此无论刮风下雨,你都能继续前进。访问www.nissanusa.com/2025-kicks了解详情。智能全轮驱动系统无法防止碰撞或提供所有条件下的增强牵引力。请始终关注交通和天气状况。

回来。所以回到计算机音乐的想法,多年来,盖伊谈论过很多关于寻找与技术和计算机互动的新方法的想法,比如手套。我一开始提到过,使用计算机的新方法,如果你把它完全放下,他思考的方式更明确、更具游戏性,更具探索性。

与其只是尝试最有效地使用应用程序来完成工作,不如采用完全不同的方法来处理所有这些事情。我认为,从尝试学习如何使用技术到弄清楚技术能够做什么,这可能是一个难以实现的转变。但我认为,这种转变、这种过渡,就是盖伊每天与他的学生们所做的事情。

所以我问过,我看到过你写或说过关于你的音乐和人工智能课程的一些内容,其中一个目标是教他们如何与人工智能互动。我们不以这种方式谈论人工智能。这看起来是什么样子?玩这些系统是什么样子?

嗯,这看起来是什么样子?你问我的学生,例如,构建交互工具,嗯,他们可以将其部署到他们自己的生活中,但通常还会涉及人际互动。嗯,我的学生们制作了一些乐器,基本上跟踪你的手张开和闭合的动作来生成唱歌的声音。转动你的手会改变声音的音高。张开和闭合你的手会使声音更清晰。

你现在可以用基于提示的系统做到这一点,对吧?但这并不是它的全部意义。但这意味着你需要学习如何使用这种乐器。另一个是,它很有趣,这意味着它很有趣,而且它具有交互性。另一个有趣的是,如果它是一个计算机视觉系统,基本上经过训练来区分,例如,识别秘密的表情和像国际象棋一样的选择性音乐。当它检测到它时……

这就是它所做的全部。就像通过创造者的权威来发出……

像这样……

这很愚蠢,但它很有趣。在定义中,游戏实际上不是关于结果,而是关于过程,对吧?因为如果你玩,但如果你关心的是可以产生的结果,那么这更像是工作。我知道如果你需要离开活动,带着我们通常称之为作品的产品离开,那么游戏几乎完全相反。

对吧?我还没有真正想过,在将这些技术,或者说人工智能,视为工具与将它们视为乐器之间有什么区别。我认为我们特别将人工智能视为工具,对吧?它是一个锤子,你的工作是去寻找钉子,这就是它的用途,我们不一定知道所有的钉子是什么,这就是探索性的方面,但你正在寻找钉子,嗯,但你描述的是完全不同的东西,就像这里有一个具有特定能力的东西,我可以做很多事情。所有有趣的事情都出在弄清楚如何使用这些东西以及它们如何混合在一起,以及这些能力的新颖、意想不到的组合,这与我有一个锤子来敲钉子,我必须找到更多钉子完全不同。

我找到更多钉子。是的,让我们换个说法,假设我们画一个维恩图,这意味着画一个圆圈,这个圆圈代表人工智能可能擅长的事情。另一个圆圈代表……

我们称之为人类想要做的事情,并且可能擅长的事情,比如打乒乓球、创作音乐,或者不是,在维恩图中,让我们画出重叠的圆圈。但那也是它们的交集,对吧。所以,从某种意义上说,在空间中,它在两个圆圈中。

这是人类擅长的事情,人工智能擅长的事情。我觉得我们几乎毫无疑问地被困在与人工智能的交集中。

值得不断寻找人类已经做的事情吗?现在我们只是想让人工智能做同样的事情?事实上,越是这样,我越能做到,我越能做到。进步肯定必须是,你知道,我们称之为图灵陷阱,实际上是这个想法,我们一直在走这条路,人工智能的进步是根据一个系统对人类的模仿来衡量的,对吧?其危险在于,这成为我们想象人工智能进步的唯一方式。

但是,如果你回到维恩图,人工智能可能擅长的事情中,有一个整个区域与人类擅长的事情的领域没有交集。我们如何利用这一点?也许人工智能可以做的事情要大得多。

我认为这需要探索,需要玩弄它,需要想象力。我认为,在我的课程中,我们经常学到的是,实际上,当你摆脱了成为有用或有竞争力的外部义务时,你可以简单地做你自己,玩耍,你实际上会产生一些非常不同的事情,可能,可以说,很快就会变得不同。但可能也更具表现力,所以,在我的课程中,我试图帮助人们利用人工智能,但试图探索未开发的空间,同时也探索人工智能和人类相交的空间。

但人工智能正在做人类没有做的事情。人类正在做人工智能没有做的事情,这不仅仅是碰撞或一夜之间发生的事情,而是某种……嗯……嗯……嗯……批判性思考,但像一种有益的融合,两种不同部分的结合,我喜欢的甚至不是我们思考人工智能的方式,是你的观察。我喜欢的是,你知道,它仍然保留了人类的创造力,以及人类的意图,以及我们可能称之为人类智慧的参与,你知道,即使它只是生成一首新歌。

但我没有,你知道,来源是它来自哪里,这背后的故事……嗯,我没有想出这个,但我确实知道是谁说的,但它是由某人说的,艺术的作用,艺术的想法,也许是人类努力理解自己情感的东西。但他们大多失败了。但这就是艺术。你知道,这是我们努力理解自己,但大多失败的东西。所以,如果我们认为艺术可以是那样,那么是的,来源很重要,并且从根本上很重要,知道想要传达什么,想要表达什么,甚至更重要的是,你知道,我们认为艺术也是一种看待事物的方式,你知道,如果我创作了一件艺术品,它不仅仅是在说,嘿,这就是我看到的,你知道,是的,这是艺术家所看到的,但也是对体验者的邀请,说,嗯,你可以通过这个镜头来看待世界,看待你自己,以及你从中得到什么。现在,你知道,一件好的作品,我认为任何媒介都是如此,都是一种看待事物的方式,电影、写作、音乐……所以,我认为这需要人类参与,如果我们接受这种定义,艺术家所做的事情就是努力理解自己情感,但大多失败了。

是的,我会说,我担心这种思考方式,人工智能尤其会面临破坏它的风险,因为如果你认为人工智能是所有训练数据中最低的共同点,你得到的是所有输入的混合物,这会给你带来混合物,它会给每个人带来同样的混合物,我们以这种方式结束,好吗?你有一个合作者,它可以访问大量信息。但我喜欢的是,它在你们谈论的一些方面实际上并没有用,也许访问所有曾经创作过的歌曲实际上会阻碍创作出伟大的新歌曲,而不是仅仅创作出与之前创作的所有歌曲平均水平相同的歌曲。

嗯,你的意思是,你说的仍然完全在交集区域。我们仍然在世界的中间,对吧?这实际上是维恩图的意义。从某种意义上说,我们现在处于艺术家的位置。

我认识的所有艺术家通常都不希望人工智能也许他们希望人工智能帮助他们完成一部分工作,但他们不希望人工智能完成核心写作部分。对我来说,活动似乎就像一个复选框。我可能从活动中获得的意义,尽管活动可能很耗时,我认为,正如你所阐述的那样,是我担心我会迷失。

你知道,那种意义,以及从事那项活动的意义可能会消失。我认为,我们正在谈论的这种思维方式,与人工智能领域普遍存在的思维方式截然相反,那就是一种不加质疑、不加批判的思维方式,就像一种优化竞赛、一种为了超越人类而寻求帮助的竞赛,而没有问,我们真正想要的是什么?什么时候这样做是好的,什么时候这样做是不好的?

好的,我们必须再休息一会儿。然后我们将讨论一切将走向何方。稍后回来。

对《The Verge》播客的支持由日产Kicks提供。嘿,Kicks经历了彻底的改造,成为重新定义城市冒险的城市型跨界车,拥有引人注目的新外观和经过全面翻新的内饰,配备高级配置。

Kicks的体验得到了完全提升,以帮助您更好地驾驭城市生活,并重新想象配备智能车轮干燥功能的非Kicks车型,让您在风雨无阻地继续前行。访问www.nissanusa.com/2025-intelligent-wheel了解更多信息。智能车轮无法防止碰撞或在所有条件下提供增强的牵引力。请始终关注交通和天气状况。

回来。我不知道我现在是警告你们,还是让你们兴奋,或者两者都有点。但关于这次谈话的内容,即将变得非常深刻。到目前为止,我们一直在谈论所谓的资本,一种明确、创造性的艺术,是为了创造而创造的。

我认为,这种东西在技术未来的AI中会遇到一组问题。但在光谱的另一端,您有,例如,驾驭政府官僚机构和填写表格,有人提到过为医疗保健系统设计AI,对吧?我认为这是几乎每个人都乐于交给某种机器的东西。

关于这些机器是否足够可靠,我们如何依赖它们,它们如何融入企业,所有这些问题都是棘手的问题。但总的来说,这似乎是技术的一种良好用途。然后是这个混乱的中间地带,里面装的是什么?我不知道。

写电子邮件。给工作团队写电子邮件,这其中有一种意义深远的人性。但是所有这些AI工具都承诺为您撰写电子邮件。但在另一端,AI工具声称会为您总结它。

在某个时候,你会想,我们到底在做什么?在这个循环中还有哪些人类?所以也许这里的三个部分是艺术、生活和无意义。我们很乐意将无意义的东西交给技术,我们不愿意放弃我们的,我想这在生活中是因情况而异的。

那么,我们如何在这些事情之间划清界限呢?我们如何决定哪些值得外包、卸载和拥抱AI,哪些不应该?然后,也许最重要的是,我们如何保护光谱中值得保护的东西?这是我接下来提出的问题,继续。他回答说,谈到了电子邮件。

所以,这实际上是另一个我们可能没有考虑到的问题。首先,我不。对我来说,我记得第一次使用电子邮件。

我是在1996年上大学的早期。这是一所大学,我得到了一个电子邮件帐户,我当时想,哦,太棒了。这太方便了,我给爸爸写信,说,爸爸,我准备好了。

电子邮件,我没什么可说的。我不发电子邮件,好的,再见。这就像一封没有目的的电子邮件,只是为了说,我太喜欢电子邮件了。

我不知道今天有谁会觉得电子邮件很有趣。不,我知道。不,这对我来说是1996年,现在是2024年。

而且,细节也是我完成工作所必需的,对吧?事实上,这次采访就是通过电子邮件安排的。事实上,我想你可能和我一样,都通过电子邮件在数据中,是的,不幸的是。

所以,我认为一开始它很有趣、有用和方便,因为它方便。你会想,哦,这是一个节省劳力的东西,而且它适用于电子邮件。但是由于节省了劳动力,我们都在使用它,我们都节省了劳动力。可悲的是,你会想,哦,我们有更多时间去做更好的工作,从你第一次使用电子邮件到现在,你感觉你的工作变得轻松或更容易了吗?不,我也不清楚。

关于这个问题的所有研究都令人震惊,就像你回头看,每个人都像,哦,由于效率的提高,我们每周都要工作六个小时,是的,我每周工作六个小时就能完成你们以前需要做的事情,现在我有48个小时。

小时的工作,是的,也许这就像几乎就像,而且有许多不同的原因,为什么这还没有像,哦,不。如果我们将这个类比应用到今天的AI电子邮件中,如果AI在电子邮件上节省了我们更多时间,你认为这是否会让我们有更多时间来,实际上,我不知道,过我们的生活,做我们的饭菜,陪伴家人,你知道,在外面?

不,我,我,我非常不认同我们现在在电子邮件上的处境。我会非常怀疑这种可能性。我认为,不幸的是,随着我们开发的通用人工智能技术的出现,可能会发生的事情是,不仅仅是电子邮件,还有其他被认为足够好的写作,现在我们只需要雇佣更少的人来完成它们,例如,嗯,例如,严格来说,用于电视节目。

你知道,我有一个在该行业工作多年的叔叔。他住在附近,他谈到,曾经有一段时间,电视节目的写作团队实际上会在片场与制作团队、演员交谈,在这个过程中,每个人都参与进来,真正弄清楚这到底是什么,每个角色实际上可以是什么。这会为事情可能走向何方打开各种想象力。

然后你就会遇到这种情况,现在很难,就像一种可互换的房间,由人类作家来撰写每个角色,事实上,他们会得到,会做最糟糕的事情。然后有了AI,我可以想象,现在劳动力已经节省了,我们甚至不需要雇佣那些可互换的作家房间。相反,让我们找一个人,准确地监督眼睛系统的输出。

结果可能不好,但它可能足够好,足以让观众付费观看。我认为这不仅是巨大的生活损失,而且是巨大的文化损失,就制作的艺术类型而言,现在我们有节目,会说,嗯,这很有趣,但有趣并不意味着它有思想性或有趣或你知道所有或充满活力,它只是意味着它比无聊好。

是的,它是一件可以做的事情。它是内容。它就像,是的,它使用了这个词,像内容一样。它指的是你可以做的事情,我认为我们所担心的,我们生活在一个世界里。

我们有经常出现的内容,但它可能永远不会被供应,你知道,这是一个通用和泛滥的时代。是的,我们许多流行文化都是非常通用的东西,对吧?所有通用的东西都是人类创造的,对吧?

但是,是的,人类也能做坏事。我们和任何东西一样糟糕。是的,是的。

但是,如果我们有机器来做所有这些事情,那么我如何改变真正的人类表达方式?嗯,我不知道如何改变它,但我可以想象这不会改变它,对吧?我认为,在这个与生计交叉的点上,你知道,我认为许多艺术家,包括我自己,所担心的,是生计,但不仅仅是生计。

恐惧不仅仅是我们被机器取代,而是我们被更通用、更不有趣的东西取代。但这对那些掌握权力的人来说是可以接受的,因为足够好就足够好,足以让某人赚很多钱。对,对,现在更大的恐惧不仅仅是失去生计。这是一个巨大的问题。但是,生计的丧失,是为了更通用、更不有趣的东西,这似乎是不受欢迎的,在多个层面上。

也许我们的标准下降得足够远,以至于我们不再关心。

我们的标准下降到呼唤。而且,那些试图追求任何形式的艺术的人,可能没有空间去做。是的,是的,即使有人想,嗯。

我认为这最终回到了如何对待这些工具,对吧?因为我认为这种乐观的未来版本,你实际上描述了这一点,而不是使用AI将所有东西拉到最低的共同点和平均水平,而是学习如何像乐器一样演奏它,并学习如何使用它来扩展我们可以做的事情的范围。但是,如果你想描绘一个美好的AI未来,我们学习如何使用这个工具,就像那样。这是你所描述的那种游戏精神,在所有这些AI中都适用,对吧?这是唯一可能奏效的希望。

他说,这可能会有所帮助。我的意思是,但有充分的理由去思考这种场景的挑战,每个人都像我说的那样演奏,这只是人性本身,包括我自己,我们谈论的那种游戏精神,实际上需要时间和精力投入。

我认为,在做任何我认为有价值的事情,从中获得意义的过程中,我可能会经历很多挫折和困惑。这就像玩一个困难的游戏,或者学习一件事,或者在乐器上变得更好。所有这些事情都伴随着挑战,或者基本上,爬山就像爬山一样。

所以,我们真正需要的是一个支持性的环境,让我们能够这样做,有时间和精力去做,以及有动力去做。但正如我们所说,生活对大多数人来说并没有变得更容易,事实上,它变得越来越难。我希望这种情况能够发生。

但越来越难的是,能够有时间去做事情,仅仅因为你知道这是我们现实的艰难部分,而且它只会变得更难。例如,就像我提到的,使用你的手和计算机视觉以及AI来跟踪开合、重音,这需要一种不同的思考AI的方式,需要一种不同的人机交互方式。这也许是没有什么的。

摆脱提示工程。我说,是的,应该有其他与AI交互的方式,它会以不同的方式释放,并且实际上会触及我们是谁的所有其他方面,包括我们的身体或肉体。嗯,以及所有人类的能力,或者可能的能力,都应该在如何做事情时得到更全面的考虑。不幸的是,我认为有更多的证据表明AI的方向不是包容性,而是提取性,就像我们如何从人们身上提取价值一样,这并不是一种促进人类繁荣的工具,而是一种最大化利润的工具。

这涉及以某种方式将人类从循环中移除。就像在这个领域赚钱很容易,就在图表中间,然后你就会想,我如何从人类手中夺走工作。

但你不需要问这个问题。现在我们有了这个。如果每个人都像使用电子邮件一样使用这个东西,那现在是什么,对吧?他们没有想到这是一个需要考虑的文化问题。

不,这没有被考虑。是的,我作为联合创始人的身份,我可以理解,创业从来都不是一件容易的事。

创业是一件极其困难的事情。我经历过,但我认为,在AI中,有一个额外的维度,即社会责任。因为你使用的东西,你将由你从未见过,但其生活将受到你影响的人使用,你不仅影响他们的生活,还影响他们的社区和家人、孩子。虽然你可能只想着如何生存到下个季度,但我想,是的,我明白了。

但我认为,有一个额外的维度,即,我认为,社会责任,去思考,如果我们创造的东西被广泛使用,那会怎么样?这就像,如果我创造的东西实际上很有价值,而且很多人使用它,那么它如何改变我们所处的文化?我认为所有这些问题中的一条主线是,对我们所做的事情进行批判性思考,以及除了所有其他维度之外,还有美学、社会和文化维度。

还有另一条主线是,游戏和表达?我们如何帮助人类感觉工具,让人们感觉更像自己?我认为游戏就是这个。我认为,如果我们能做到这一点,我会把这些视为胜利。

你知道,如果有人为了好玩而演奏音乐,但房间里没有人,特别是没有人,我认为这已经是一个胜利。我认为,如果我们只是这样做,它会以某种小方式让我们感觉更像自己。这就是我所抱有的希望,仅仅是因为希望必须存在,我们可以使用它。

科技,首先是人类的工具,它能帮助人类更真实地展现自我,更真切地感受自我。要做到这一点,你需要感到被接纳、安全、自由地做自己,并且感到被理解。我认为这是我的希望。天啊,还有很多工作要做,很多挑战要克服,而这并非世界发展的方向。但我认为,这仍然值得我们努力追求。

好的?这就是今天 Vergecast 的内容。再次感谢 Ge Wang 的参与。感谢大家一直以来的收听。

我会在节目笔记中附上我们讨论过的所有内容的链接,包括 Arena 应用、所有关于气味的内容、笔记本电脑管弦乐队以及学生们为我们完成的一些有趣作品。你应该看看所有这些内容。这很奇怪。

我的意思是,用最积极的方式来说。本系列的其他内容,包括未来音乐以及其他所有内容,都将在 Verge 网站上提供更多信息。

我们喜欢它。和往常一样,如果您有任何想法、问题、感受或其他歌曲想让我在 Arena 应用中学习,这真的很酷。您可以随时通过邮件发送至 [email protected] 或致电热线。

热线号码是 866-VERGE11。如果您对今天谈论的任何内容,或者本系列中任何内容有任何想法,请致电我们,我们很乐意听到您的声音。

本节目由 Liam James S. Wilpon 和 Argo 制作,是 Verge 制作的节目,也是 Box Media 播客网络的一部分。我们将于周二和周五继续播出您的常规节目。新闻不断发生,有很多新闻。但我确实设法在周二的节目中暂停了一次关于 13 世纪佛罗伦萨的对话。所以,敬请期待。

Vergecast 的赞助商是日产 Kicks。嘿,Kicks 经历了彻底的改造,成为重新定义城市冒险的紧凑型跨界车,拥有引人注目的新外观和经过全面翻新的内饰,配备高级配置。

Kicks 体验得到了全面提升,以帮助您更好地驾驭城市生活,并配备智能全轮驱动系统,让您无论刮风下雨都能继续前行。请访问 www.nissanusa.com/2025-kicks 智能四轮驱动系统无法防止碰撞或提供所有条件下的增强牵引力,请始终关注交通和天气状况。