cover of episode  #129. AI的阴暗面:繁荣背后的残障人士困境

#129. AI的阴暗面:繁荣背后的残障人士困境

2024/6/23
logo of podcast  牛油果烤面包

牛油果烤面包

AI Deep Dive AI Chapters Transcript
People
邵梅
Topics
本期节目探讨了 AI 技术对残障人士的影响,尤其关注 AI 技术如何加剧残障人士的困境。例如,语音识别技术对口吃人士的识别错误率高达 40%-50%,语音助手常常打断口吃者,造成沟通障碍并加剧焦虑。此外,许多 AI 产品的设计并未考虑残障人士的需求,反而成为新的障碍。例如,智能盲杖的设计缺乏残障人士的参与,导致其设计与实际需求脱节;视频会议软件中显示参会者面部图像的设计,会加剧口吃者的焦虑;AI 模型生成的残障人士图片反映了社会偏见,加剧了对残障人士的负面刻板印象。嘉宾邵梅分享了她创办非盈利组织的经历,强调残障社群在产品设计中的参与和话语权,推动更加公平和包容的技术发展。她认为,AI 产品的改进需要完善的评价标准,以及残障人士的全程参与,并呼吁 AI 从业者能够真心地与残障社群合作,分享权力,共同创造更包容的 AI 技术。 嘉宾邵梅分享了她研发 Facebook 图片描述功能的经历,以及在与残障人士合作过程中的感悟。她指出,许多 AI 产品未能真正满足残障人士的需求,甚至加剧了他们的困境。她认为,AI 产品的设计应该从一开始就考虑残障人士的需求,并积极寻求他们的参与。她还分享了她在创办非盈利组织过程中的经验和挑战,以及如何通过收集更具多样性的数据来改进 AI 模型,并呼吁社会各界共同努力,推动 AI 技术的包容性发展。

Deep Dive

Chapters
本节探讨了 AI 技术对残障人士,特别是口吃人士的影响。语音识别技术在处理口吃语音时的错误率极高,且语音助手常常打断口吃者,加剧他们的沟通困难和焦虑。
  • 语音识别技术对口吃者的错误率高达 40%-50%
  • 语音助手打断口吃者,加剧焦虑
  • 技术公司倾向于移除图片而非解决图片描述问题

Shownotes Transcript

新的一波 AI 革命给很多人的生活带来了便利却让很多残障人士感到利益受到了侵害甚至心理受到了伤害这是为什么呢这一期我们来聊一聊 AI 对残障人士的影响就是说给这些市障人士让他们看不到图片说你反正看不到我们就给你移掉这样的话你就所有东西都可以给你读出来了是吧

他们对于没有口吃的话他们的错误率是大约百分之五但是呢对于口吃的时候通常是到百分之四十或是五十那就说有一半的时间他们都是听不懂的并且更糟糕的是就是说人与人之间沟通的话要是我有口吃我要是结巴了大部分时间你是可以发现我有口吃然后呢你会等着我说

但是呢,这些大模型,他们通常你要是卡壳了,没有办法说出来,他们呢,就会开始插嘴的,就会说 sorry, I don't understand, can you repeat,什么什么。这里是牛油果烤面包。大家好,我是斯特亚特。我是 Shawn。我是 Kat。这期节目我们有幸请到了邵梅啊,

邵梅创办了一个和 AI 有关的一个非盈利组织 NGO 对吧大家好很开心能够来到你们的 podcast 久仰久仰邵梅最有名的经历至少我知道最有名的经历是她在当时 Facebook 工作的时候她给 Facebook 著名了一个非常著名的一个特性对吧这个特性还被大张旗鼓宣传过是不是这个扎克伯格还发过这个 Facebook 来说这件事是

好像有吧,Sheryl Sandberg 好像也有发过,反正他们做了很多 PR。所以那个特性是什么东西,我很好奇。所以我们当时就是训练了一个视觉模型,然后它就是可以描绘图片,所以说它就是可以把当时 Facebook 上面的那些图片都可以转化成一个 automative text,

叫什么叫什么就是文字注释就是说他那个替代这个图片用来说一下话用用话描述没错所以说他实际上是一个专门给那些读平器软件就

读屏器就是读出来你的屏幕啊在读屏器我们很多时候有功能可以读出来文字的吧对但是它实际上是一种就是给市占人群呃就是人群用的一种辅助技术所以说呢要是你要是看不见或者是市占的话那你上网你就可以打

然后呢他会把这个内容全部给你读出来但是呢图片的话内容就会比较困难所以说所以说就是有一种规范就是说你要是写一个晚夜的话那你的图片要加上这种 art text 是一种

属性吧 attribute 就是说这是规定的是吧就是说你如果写网页的话这个图片下面要写写个文字说这是什么什么东西没错就是要是是你是政府网站的话这个是反正是法律是有规定就是说这个是 W3C 他们的规范之一这样的话你就可以保证任何比如说系统的产家都是可以读到那个就是这样的图片描述

所以这就有点类似于在美国有很多人很多时候保障这些残障人士比如说他会规定比如说饭馆或者是一些公共的一些部门他必须要有那种轮椅可以走的路像这样的这类似于是在网页版的有点像这种在城市规划的这些规范也有一些规范要求你的网页你的网络服务必须要有这样的规模

对 但是呢 先前是因为很多的这些图片就是上传的图片嘛 用户他们传的图片所以说呢 先前 Facebook 上是没有这个 RTX 的嗯 就是你如果一个这个残障人士他去用 Facebook 别人上传的照片 我上传他大家评论的非常好的 他就看不到他不知道是什么 对吧 确实是非常的困难 是吧

对,并且我们这个设计实际上是因为我先前去采访了很多市站的朋友然后我们就想说他们的一些困难或者调整的需求会是哪些我们当时做这个研究之前我们想说可能是一些比如说我们没有写一些比如说那个

就是网页没有写好啊或者是说有的时候有一些按钮没有加一些就描述啊什么之类的但是呢我们采访了十几个人以后很多人聊的实际上是一个更大的问题就是说很多市站的朋友他们也发现现在的整个就是网络环境都会变得越来越多的这种视觉元素

就是图片啊视频啊就都很多并且呢好像就是这个科技的浪潮也是推动更容易的发图片或者是就是发一些视频就很多都是就是个人上传的内容他们不会遵循那个规范是吧就包括传媒他们不就是一直在说吗说什么文字已死现在可是视频的时代这些东西没错对啊所以一说呢就是这个整个大的趋势反而是对于某些没有办法看到的人

就说他们呢就会感觉非常的被排斥在外了对吧他们呢就感觉好像没有办法参与很多这些讨论或者说这些分享所以说呢我们当时研究发现实际上这个是一个更大的问题并不是说你就只要修好有一些按钮啊或者是加一些什么加一些什么 level 什么的就能够完全满足市长那个社群的需要

所以我们当时回来就在想说这样的一个问题可能也是没有说是单个产品可以解决所以回来在想说有没有什么方案的时候其实这样很搞笑但是我刚刚做完研究回来跟很多同事讨论这些问题的时候

其实蛮多工程师的想法是说 OK 图片他们感觉有问题那样的话我们可以移掉全部的图片没错

大家很多人认为最快的方式就是移掉图片 instead of 说有图不要说他们是有点问题啊就是说给给这些视障人士让他们看不到图片说你反正看不到我们就给你移掉这样的话你就所有都可以给你读出来了是吧

眼耳道灵的感觉反正你没有筷子这个菜就不给你上了我觉得当时很多人就是说这种简单厨房反正他们就是说 OK 你对反正你的问题就是你和食物看不到

对呀,你抱怨嘛,你干嘛抱怨嘛,你不知道是什么嘛,我们没有了,你就没得抱怨了嘛,对吧?对。不过我觉得从公司执行的角度来讲,我觉得也是可以理解,就是说他们会觉得,反正我们可能,我们这个组的 KPI 就是没有人抱怨,那我们让他看不到就没有人抱怨了,我们就达标了。对,但是我当时我就觉得不对劲,我就觉得……

这个好像对啊反正我我我当时看完会听了后我就蛮失望的就是说他们那些产品组的一些建议我都觉得我就觉得好像反正我就没有特别喜欢他们的一些题的一些方案然后我我回头想可能是因为

我觉得我可以共情到为什么想要去参与到这些图片视频的一些讨论中因为我觉得可能我本身的一些少数身份吧我觉得作为女生比如说你在这些大厂里面经常也会好像有些活动

他们就会假设你就没想去一些什么去喝酒去打枪什么我也不知道反正就是所以说我觉得作为这种边缘社群的体验我觉得我更可以共情然后我也更可以理解说为什么我想要参与或者是说我想要有一个这个选项就是说我要是想要参加的话我来选择参不参与

所以我就回去想了一下,然后我又找了一些市站的朋友讨论一下,我们就开始试验用 AI 来做一些简单的描绘。

就把那些图片里的说的是什么把它给变成文字对 但是当时是 2015 年所以说他们当时就是还是没有特别强所以说描绘的东西还是比较基本但是呢我们做了很多研究发现就是其实有一些非常非常基本的东西描绘出来也是很有用的

比如说有没有人,然后人的表情在笑还是怎么样或者是说你是在室内还是在室外就是有一些基本的东西其实上就可以很大程度的搬到看不见的朋友去理解很多比如说 comment 啊或者是很多这些别的讨论

就那个时候的质量还是比较一般是吗质量还是比较一般所以说我其实还做了很多 model 的 retraining 你还亲自去做那些机器学习的那些模型对我还要去 label 了一些就是请人去 label 了一些就是常在用户他们他们最在意的一些关键性其实做了一些重新的 label 比如说我记得印象很深是有一个是狗

因为很多盲人他们有狗嘛就是那种导盲犬

对比如说就弄导盲犬就是辅助狗所以说呢他们实际上很多图片里面或者说他们的那个 feed 里面很多就是都是有狗的图但是当时我记得我们那 2015 年版的 model 经常会把比较小的狗跟猫搞混所以反正就是说也是我们在就是通过很多去那个试验然后去调整然后呢就是收到反馈以后

后来我们重新券了那个狗的马头狗和猫我们就是又去就是做了很多就是家常训练所以说后面大概半年后我们都发了第一版然后就可以描述一些大家就是最在乎的一些东西像狗和猫就有然后呢还有小孩然后还有什么什么一些就是背景吧是一个很比较像看来是一个比较

简单的一个描述但是当时就反正挺受欢迎的而且我们当时发布了以后也有做了很多调研大概我们做了我们调查大概两三万的的市占用户

我觉得他们当然也是知道这个是很简单的一个描绘肯定还是有很多别的信息他们想要了解但是没有办法描绘到的但是我觉得大家喜欢最大的一个原因就是因为他们觉得第一次他们就是真心感受到我们这个平台在乎他们就是想要包含他们想要让他们来参与进来

所以说这种感觉就是被人看到被人在乎是一种很赋能的一种感觉就是很多我们收到很多大家写信给我们我觉得很感人都写信啊真的有感谢信吗真的有真的有没有就是发邮件或者是但是很多人有 firebug 但是呢看一下结果都是说谢谢谢什么就是说啊这是我们头一次感觉到

就是有被看到有被包容所以说但是对吧因为当时发布以后我就还是 on call 一直做到我走所以说呢每个上船的班 7 成 24on call 是吗对大概做了 8 年 on call 那个产品都是我还有一个另外还有两个那个工程师我们三个人 vulnerate

这也是确实是一个非常非常改变世界的一件事情了在这么大的一个平台有这么大的一个社区没有人看到我还蛮开心的是我觉得我们代表了有一种可能性吧所以说到了后面就是图片的话你要有这种 art text 就会变成就是说变成一种大家认为应该要做到的事

因为我觉得以前很多人就会感觉说这些图片要是没有的话就是一种标准有的话你要感恩建立工业界的标杆所以大家都要达到这个水平之前大家觉得多一次不如少一次对大家觉得好像要是有给你提供 RTX 的话是一个

施舍或者是一个恩情之类的但是我觉得现在就是说这种标准会提高因为大家的这种期待值就会提高所以我感觉这个是一个除了一个产品上的一个功能以外我觉得一个

就是说一个社会的一个意识的一个进步是我最感动的就为社会指明了前进的方向没有不敢推动历史的前进没有没有我是一个非常小的一个非常小的一个部分但我觉得对我个人我也是

看到了一些新的可能性我们这些年 AI 大发展吧有时候大圆模型啊怎么怎么样你和这些残障社区的人聊起来他们怎么看待这个最新的这个浪潮我觉得大家可能也是有很多期待的吧因为我觉得现在在市场上的很多话术也是就是很多的模型我觉得

都被宣传成是可以帮助残疾人或者说是可以就是说解决人类很多的问题的我觉得像那个很多这些 speech to text 就是这些语音识别软件他们常常都是说对可以帮助那些聋哑人我听不到的反正我有看到真的好那他们怎么看待这些东西呢怎么看待这些说法

我觉得大家是既期待但是又有很多的犹豫因为我觉得长暂的朋友一方面是看到很多这些发展但是呢都是有点远远的看到大家就很少真的有去参与

他们的开发或者是说产品的设计他们就是本能的有些害怕这个东西虽然他这么说但是不像是给我们用的没有我觉得并非是本能的害怕其实很多厂商的朋友他们都非常乐意去试验这些新的模型新的产品但是大部分就是 99%都是失望都是说试验以后买来以后后来失望

好像前两年我有听很多人讨论就是那个就是有一种眼镜他们呢可以把环境里的语音变成文字直接就是说陷在你的那种眼镜上面嘛 AR 眼镜那样然后呢当时就是

他們很大的一個賣點是說就是可以給那個聽不到的人聾人可以這樣現實就是可以就是實時看到別人所以其實有人買然後他們買完後就說

很不准确或者说他打的那些字幕有的时候也是很多错误语法错或者是说就是写错的话反而是会让人非常的分心就是你在交流的时候还要看那个眼镜上的字然后又写错了然后你还要猜说 OK 他们说的是什么为什么会错就是

反而是没有办法让人就是参与到这种人与人之间的交流就还不如看看嘴型猜猜的好是吧看那个字对或者是说有人口译或者是说别的方式就是有人手语翻译这种然后与此同时很多这些产品

因为没有办法达到实际生活中的使用精度的要求但是与此同时很多比如说大机构他们就会认为我们可以买一下这些产品然后我们就可以 replace 以前有的那些人的 support

对吧我还说给你翻译就不要了因为我们现在有科技了给你买个眼镜但是你其实这又达不到要求对常常就会这样子的现象或者或者说是一些保险公司他们呢就会说 OK 你就可以去用这样的产品然后呢我们呢就可以不要付你的比如说翻译的钱就是那些手语翻译的钱了这样

所以說其實上反而是造成了一種 barrier 就是新的障礙這相當於是大家只是想要看到表面上這個問題有沒有東西解決但是其實不關心這個解決的質量如何

对啊,因为我觉得问题是说他们的这些质量并不是真的让他的这个受众来决定,就是说受众实际上话语权非常少,残渣社群他们反正他们现在他们是没有办法改变这些产品的,无论是投钱或者是说开发或者是设计,他们就没有被参与进来啊。

所以说你这个产品开发以后可能是比如说一个湾区的开发者吧工程师自己做了以后呢自己试一下比如说试个十分钟哎呀好办可以了但是呢你要是要就是说要让你的那个参照人士

从早到晚用并且是让他聋人的时候就是完全就是听不到手用的话跟你是一个听人带着他试用 10 分钟你的这个感觉是差很多的对不对就是你是没有办法去就是说感受到那些失望或者是 frustrating 或者是这些很多障碍的

我上次听这个上面说还有一个什么盲帐是吧这个盲人的手帐这个是吧对现在好像也有蛮多人就是想要做一个智能盲帐反正这个也是我好像也有听说有一些人拿到钱 VC 什么投的钱哦就认为是个大市场是吧反正就是有这种 AI 盲帐然后可能他们我有我上次看了一个

Pitch 就是说拿的时候, 满站可以说话,然后呢,可以同你说前面有什么东西,或者是有什么债务吧,就是一个类似导航加满站。那这个盲人群体怎么看这样的导航加满站?我上次去有一个,

机会然后里面有一个 Berkeley 的就是做长站研究的一个教授他说他有做过一个反弹面用大家都很害怕他没点非常合理

没错就是满站他们是你从早上起床就要一直拿到晚上睡觉的这个是一个非常重要的一个让你可以行走啊就是说出门的一个工具所以说呢大部分人就是说就是所以他需要非常可靠你要是没电的话

好像他们又怕说要是没电的话打不开或怎么样现在的满站就是很便宜的 10 块钱一个的已经是发展了几百年了满人社群

一直在改进它加了很多你知道它的颜色比如说为什么是白色或者是说它那个材质就是轻便性然后呢可以就是说能够用这个满站的这个底部可以呢有一些材料的反馈让你就是小的前面走的地是水泥还是草地什么的这些都是几十代满人探索改进出来的

就是所以说他们这个反而是一个非常非常 Taylor 就是这种就解决的并不是一个非常重要的问题没有没有没有是一个非常重要的问题但是我觉得他们就是真正的是一个就是说

是一个社群参与的设计的一个产品对吧他们大家慢慢改进出来的但是很多现在我觉得一些智能产品反而是没有社群参与就带有这种健全人士的自以为是在里面没错就说和他们社群非常远的人自己在一家车库里面坐坐坐就说 OK 好了 Thank me

所以这些人就是瞄准了保险公司的钱是吧认为保险公司可以付钱是吧我给你瞄准了钱但保险公司付了钱其实可能又占用了其实其他方面的经费它还并不是一个就像前面说的是一个无害的帮助你的它还是一个占用你本应该有的资源让你本来其他资源变得更少了

对啊,我觉得很多时候他们的产生是一些市场行为,并不是说真的是一些马来人群体的需求。我们去年做代言的时候,口称群体都很害怕这些,就是都,反正就是没有说害怕,但是呢,就会很,就是担忧现在很多这些那个。代言模型还是什么?

主要是那些就是 speech 的就是类似于那些云助手是吧比如这个云助手比如上次这个

语音助手的粉丝嘛但是他们就是对于这个语音助手这些东西会有一点忌惮是吧没有就是说他们通常是没有办法理解就是说经常会没办法理解口吃哦是吗比如说 Google 智能助手会经常理解不了口吃说的话对啊就是我们做了一个 audit 就是说好像他们对于没有口吃的话他们的错误率大约是 5%但是呢对于口吃的时候通常是到 40%或是 50%

然后就说有一半的时间他们都是听不懂的对并且更糟的是就是说人与人之间沟通的话要是我有口吃我要是结巴了大部分时间你是可以发现我有口吃然后呢你会等着我说话

但是呢,这些大模型,他们通常你要是卡壳了,没有办法说出来,他们呢,就会开始插嘴了,就会说 sorry, I don't understand, can you repeat,什么的。你话说了一半,他就开始 process,就开始运行来看什么意思。对,没错,所以说,我记得很清楚,我们有一个口诗朋友跟我说,他说他先前很怕打电话给那些客服,

因为他就觉得口吃的话好像就是这种反正就是会比较困难但是呢他说他现在最怕的是去打的话呢是被一个那个 robot 接的自动电话对对他说那样的话他就完全没有办法接通了他说先前人的话就让他口吃慢慢的说总是可以就是

有一个服务最后还可以搞清楚怎么回事是吧虽然时间长一点对就还是可以有一些服务但是呢他说现在的话就是完全没有办法解决完全没有办法就上来就什么普通话请人一一就一页不出来了是吗现在有些其实都没有让你按键的有些他们就是会让你说话描述你的你的问题或者是你要的服务是什么

请说出你的信用卡号码,让人说一下。其实我觉得我们这种英文不是母语的人也可以一定程度上理解这种难受,就是有些时候我会碰到那种 AI,就是 AI 没有做得很好的 AI 的自动语音服务的那些接电话的部分,然后我说了英文,我觉得我说的很标准,但是可能有些口音他就听不懂,然后我就卡在这边了。

还真的是这样就是说真有那种就是让你说说你信用卡什么之类的好像前段时间有一次我真是说了五六次他都没有说对他都没有弄对

对啊没错所以说呢实际上他们是在变成了一个 barrier 变成一个障碍对吧本来呢是想说可以说让你的这个生活变得更加方便实际上没有对于一些少数未必是少数其实是更加多元的这些群体来说反而就是一个创造的障碍

嗯就太大了因为现在大家就是这些公司都觉得人工客服很贵嘛是吧所以大家就会尽量的我觉得在未来两三年会越来越多的这个趋势就是把更多的人工制服要用这个大模型来取代取代之后可能就会变得可能过去虽然现在找人工已经很难了是吧但至少还经常能够找到取代之后可能很多时候就变得非常非常的对于这些口吃人士可能是非常困难了

这个听上去是一个非常阴暗的前景啊

所以说我们就想说现在呢我们就要行动起来要去改变这些模型但是这是为什么呢为什么呢因为现在各个东西的识别率都已经计算机 AI 已经超过人了呀为什么它反而还不如人呢我觉得可能是一方面就是你看那个判断的标准是什么就比如说你说超过人的那个测试机里面可能就是没有口吃的人

对没错从来都没有口吃的人加入那些测试机他们像常用的一些测试机有的就是读书的音频书嘛那些都是非常标准非常流畅的或者或者是些新闻播报 BBC 反正就是都是一些人为性的流畅并不是就是普通大家讲话那种

就是说那种说话程度对吧所以说他们这个训练集就是说他们看到的人的

这些说话都是非常 artificially 的就是一场流畅或者说都是通过剪辑过的所以说我就其实蛮担心的我觉得很多这些模型其实是在降低人与人之间表达的这种的这种丰富性就这种多样性他们比如说你看现在写作也是吧

这些大模型写的东西虽然说很流畅但是其实都有点牵偏于就是比较牵偏于嗯就一个模子跳出来的对我就觉得降低了人的这种人类这种分布性确实是啊就是不仅仅是他说的话越来就是趋同并且我要跟他说话我也说的越来越趋同因为他都把我就把我校对好了我只有这么说话他最容易懂是吧我也开始越来越这么多的说话啊

我觉得这个还这个不仅仅是在于残障人士我觉得普通人也是一样就没有人我没有听到任何人说他喜欢自动语音服务就是电话自动语音服务没有人没有任何一个人说他喜欢这个东西没错所以说现在谁在喜欢资本家可能 AI 公司加上一些资本家为了省钱我看我看你还说好像黑人对这些

语音助手这样服务会有一些他们会有些看法是吧对啊黑人他们也是非常受歧视的语音助手阿斯坦福前两年发了一篇论文他们是说黑人的话识别率是比白人要高两倍以上就是那个错误吧错误率该两倍以上错误率是要高两倍以上然后呢所以说导致并且好像他们就是发现很多黑人发现说如果他们用他们黑人口音说的话就会

很多错就 black English 所以说呢很多黑人就会他们要去换用用那种白人口音说的话才能才能行得通就所谓的标准美国口音啊 white accent 对

所以就是说他们感觉到受到了侮辱是吧我说的话不够标准就是连 AI 都听不懂我说的话对不够标准就是会 invalidate 吧就是会觉得好像你的话是一种不对的是一种没有办法被认可的一种说话方式中国也有吧我觉得很多有口音的人

可能也有或多或少接受过这种 microaggression 吧因为我当时去北京的时候我就经常被人说我听不懂

AI 能够听懂吗你是过 AI 吗不过谷歌的中文口音就是台湾口音可能更能听懂你说的话比我们现在更好一点谷歌后好像还行但是其实我是不太喜欢跟那些 AI 说话我不晓得为什么可能是我有点害怕了

但是好像國內也是吧,很多模型我上次看到一個視頻就是一個,好像是福建口音的一個阿公在跟小杜還是某個人說話他們也是完全聽不懂那他們不會覺得非常的自卑他們那個視頻好像就是說他在說的時候然後他小孩錄的,然後在那邊狂笑就在笑他說話,不知道怎麼反正這個反正算是對,可能大家就覺得是他的問題

可能这个国内的模型也不行大家会觉得当然国内可能会觉得推广普通话还又利于公

确实是很大的问题嘛比如说我们我们这些外语学习者到了美国我们的英语我的我们英语听不懂还听不懂然后那可能会有一些自卑感觉对没错真的吗对你有没有感觉如果你跟美国人讲话如果他听不懂然后有时候让你 repeat 或者是重新说或者是说有

有的时候可能是我加上口吃加上有口音然后我在他跟别人说话以后他们会开始用很慢很慢很慢的语速跟我回答好像就是说他们就会默认我就是没有办法听懂或者说好英文就会用那种 ESL 英文跟我说话的时候一开始

就还好现在我会觉得有一些烦躁如果这种事情发生的话会让我觉得有一些烦躁对我个人可能有一个更大的改变是我也开始正式会是了解我本身的一些残障身份

啊你有成长身份吗对我有口吃哎我一口吃没有我严重吗我也不知道但是因为我从小对口吃的羞耻感很重可能是因为我也很重啊对啊就是我觉得可能就是小时候成长的环境然后口吃是一个被父母或者是被老师都是认为是一个很严重问题 helloing 然后就会嗯

我不晓得你小时候有没有这种情况我好像一开始发现口吃的时候我爸妈就会他们会让我想清楚再说我觉得这个感觉就是好像你口吃是你没想清楚是你一个心智的问题并不是你一个语言的问题为什么我小时候他们都跟我说你说话不要着急一着急就说不出来

对我爸妈导致可能也有但是我觉得小时候还有一点就是很多人觉得口吃是传染的你们小时候有没有觉得对的我想是跟我说你不要学别人你学者就知道对所以说导致的结果就是我发现如果我表现口吃的话很多人的爸妈就会让他们小孩不要和我说话或者是和我玩就是说口吃是一种非常孤立的

就是说你要是口吃的话你好像变成一个传染源然后呢别的小朋友就会或者是笑你或者就是疏远你反正这个是我小时候我反正是非常小可能就是五六岁的时候刚刚上学的时候这些体验反正各种这些情况吧导致我对口吃有一种非常抗拒的心理然后我可能

因为口吃也是一种神经多元性所以说实际上你是没办法就是所谓的治好的但是有很多的办法不说话所以我就很多时候就是有少说话或者是说

换词我不晓得师徒你有没有这种行为我经常说不出来话嘛所以那你就是试着换有的词就特别难发对没错特别容易接吧但是有的时候就会就是换一种说法但是有的时候就会完全改变我我先前想要说的比如说特别是我记得小时候有的时候去快餐店点餐的时候就会因为害怕口吃而点别的东西就是

就是没有点我想吃的。你就说这个吃的东西这个音特别难发,你就会换一个词典吗?我好像很久我都很怕那个,现在还是会有害怕,那个 cappuccino,卡布奇诺,那个卡子我就一直会卡住,所以说虽然我很想点它,我每次都想点,但是我每次都是都会去点拿铁,

所以我喝了很多年的 Latte 一直喝不到 Cappuccino 这我还蛮共情的因为有些英文单词看着就很难发我没有口吃味觉得我发不出来那个标准英文就不会点那种东西有什么法文的菜什么之类的

那个和那些售货员说话是特别难的我经常说不出来话来是吧对那售货员会觉得 OK 我问你问题他不说对我现在就无所谓了就 who cares 有时候还挺尴尬的反正你是花钱的你怎么说他都要想办法听懂啊

对,但是我觉得我可能以前我就没有办法那么坦然我会感觉我要是发不出来或者是口吃是我的问题我是有一个我是一个非裂就是有个人的自卑感是吧觉得啊我影响大家了啊我给大家造造成麻烦了啊对就是羞耻感非常重

所以说就没有办法那么坦然的接纳他甚至我觉得一直到近几年我都没有办法接纳说我是口吃粥我好像还是有那种感觉要是我不接纳的话有可能某一天他会消失

就是会我觉得对于有一些你觉得好像很羞耻就是或就是你觉得很抗拒的一些 identity 或者是一些问题的话好像就会有那种鸵鸟心态就是说我要是不去简单还要说不定某一天他会消失因为好像也有蛮多

口齒能表达过说我小时候有后来就没了他就某一天就会小死了所以我也心里幻想说相同的奇迹也会发生在我身上但是我觉得当我跟残战群体工作越来越多的时候我其实慢慢的就是这种去羞耻感吧就会觉得就是说残战也是一种状态而非是一种病态

你知道就是因为我觉得从小很多人就是给我观点就是口吃是一种病你要去治是一种病态就是你是不正常的别人是正常的有些人就叫正常你不正常是吧就这种感觉对啊我后来就是我有去参加那个市长的会议以后我就发现每个人都是市长然后呢其实像大家有他们的文化有他们自己沟通这样的就是反正就是也都活得好好的

就是说大家去那边交流啊开会并不是说想要去治好我的视力或者说让我可以看到就是大家就是就是反正就是做那些每个人都要做的事吃饭聊天开会对就是没有觉得说肾脏是一种是一种病或者说是一种很大的缺失就是我也有接触比如说听战的朋友然后还有别的各家多元社区的朋友我就慢慢的

对我就可以慢慢的正视禅宅我就可以慢慢的理解实际上并非是非病态除了是一种状态我觉得甚至还是一种力量这样讲可能有一点

但是我觉得它就是它总归对于我们的人类肯定是有它可以找到它存在的意义是吧存在能够给这个社会做贡献的方法对因为我觉得像我吧我就觉得可能可以让我比较会倾听别人

因为我觉得可能是我自己的口词自己常常体验到那种没有办法被人好好倾听的感觉会让我对一些好像在开会的时候被就是没办法说话或者是被就是被容易被忽略的人我会比较我会比较注意到然后我会去比如说比较就是更有心的或者更耐心的去倾听一些别人

当然这也未必是百分之百都是因为口齿但是我觉得因为口齿会让我经常会去更容易去反思一些人与人之间怎么去认真地去倾听怎么去理解或者说怎么去尊重别人说话的方式这样对刚才我们刚开始录音的时候上门我们说这个你们这个录音软件不可以把那个画面关掉因为我们一般用 zoom 或者 Google Meet 都可以有一个 selfie 不

不仅关音频还关视频对看来上面给我们解释说这个是因为可能口吃的人如果看到自己的脸会有一些问题是吧也没有但是我们前两年做了一个研究就是我们和那些口吃社群一起研究说就是说对于像他们这些产品吧特别是这种这种开会或者是说人与人间交流的产品对于他们有没有一些什么影响

很多人就提到说他们非常不喜欢能够开会的时候看到他们的脸自己的脸他们是自己看到脸还不希望别人看到自己的脸自己看到自己的脸就是好像这种镜子一样

但是我觉得其实后来我去就是看了一下文献其实很多先前就是那种社交心理学都有发现说要是你让人一直看着他的脸讲话的话会有会有更多的这种焦虑或者是说各种的这种 self consciousness 就会更强就是说先前已经做了很多实验有了很多数据了

所以说我就反思说为什么我们这种工具它的那个这个产品就没有呢没有它的 before 就是你要看到你的脸你有没有觉得很奇怪要看到自己的脸对啊是因为要是我们想要实现的是模拟线下开会的话线下开会的时候你是没看到你的脸的对啊真的为什么要看到自己的脸呢

对啊,所以说它这个设计的来由是从哪里为什么我们在设计这样子的产品的时候会假设说开会的人都想要看到他的脸就是想要看到自己的脸所以说我就觉得反而是因为跟这些口吃

社群的研究让我可以更好的反思或者说看到有一些产品里面先前我就没有想过的问题我在脸书的时候最后我有接触过毒血障碍症 Dyslexia 的群体他们也算是神经多元我在跟他们合作之前其实我也不是特别了解但是

合作以后我就发现这个好像其实也是一个非常污名化的一个群体我们中国人连概念都比较少因为你在中国没有听说过毒气的障碍证给大家科普一下因为好像是一些神经元的问题会导致有些人没有

其实没有办法很好的联系那个形状和声音或者是说这个形状和它的那个意义他们之间这个 link 就是在你神经里面他们这个看的话他们就没有办法 fire 一些神经元的交流所以说呢导致结果就是

有些人看到了字的话他们没有办法认出这个字的意思或者说没有办法要读出来然后写作的时候也是一样

有的时候找的字要写什么但是写出来的话就会变了就是他不是不努力或者说是就有智力障碍他就是他就是读也读不出来写也写不下去这也叫读写障碍这是一个群体是吧对所以我当时接触以后

我也是没太了解后来接触后我就发现他们其实跟口诗也是很多相通的事他们也很被污名化很多小朋友读写要是有这样的问题的话通常就会被老师认为是学习不努力或是擦身或者是懒

好像美国我前几年有一个统计就说三分之一的有这种就是 condition 的小孩就是没有办法上高中所以很多人都是只上到初中因为就是很多这些学校里的一些很负面的体验或者是同学嘲笑老师一些压力什么的很多人就会厌学或怎么样所以说也会大大影响你的升学和你将来

找工作因为对啊因为要是连高中都没上的话其实你可以选择的这些工作也是很少的所以其实说除了影响你在你读写外之外对你整个人生都会有一个很很深远的影响对所以我们当时有一下研究就是问他们说他们要是上脸书他们最大的困难是什么

我们先前想说有可能是阅读吧可能是就是脸书上的一些文字可能太难但是很多人都说没有脸书上大家都写很简单的没有什么好挑战但是更困难的是写作因为你写作等于是说你在

表达你是谁很多人通过写作就向这全社会就表现我是谁吧就是我也可以感同身受因为我觉得我作为一个非母语写作者我常常发脸书或者是花 linkedin 的时候也会想要去 check 我就也怕写错因为感觉好像很多你的同事或者是老板或者就是有人会看到

所以说要是你有这种毒血障碍症的话你就是写完你是看不出来哪里写错的所以说你也没有办法自己去纠错然后你要是破出去以后很多人会来

所以说实际上也是就很痛苦的

所以我们当时是有就是设计了一些写作辅助的东西特别是说针对他们的一些情况比如说他们很容易把同音质弄混所以说我们有特别帮他们 check 一下这些东西因为现在很多这些市面上的一些就是拼写检查对拼写检查他们是没有办法自动救资没有办法就是发现一些同音质他们就是大部分可以发现的是一些

这些就写错的字那个拼写错误所以我们我有做一些这些工作但是我觉得通过跟这个社群合作我也

我也可以更理解到口词因为我觉得相同也是一种神经多元因为我觉得很多时候别人也是没办法理解为什么我说不出那个词就是我本身我也很挣扎就是我懂得我要说什么脑海里已经有了但是我就说不出来我觉得就跟他们写作一样就是我就是我晓得我要写什么但是我就是写不出来那个词就是没有办法写对

然后别人就会觉得很奇怪 What's wrong with you?就会觉得说是你有问题是你没想好是你没有准备好是你太紧张了就会自动的加很多别的 assumption 或是标签到你身上的这种挑战我觉得我也常常要面对并且我觉得一个

比起一些比如说就是一些蛮人或者一些龙人的话这些更加 invisible 或者说更加多元的一些其实你也很难跟别人解释我觉得要是蛮人比如说要是一些大家更熟悉的一些常见的话就是说很多人就会大概就会知道你的眼睛看不到

这样的话他们就会有一个调整他们对你的一些期待或者说他们可以更加理解为什么就是有一些行为就会发生但是对于比如说阅读障碍加上或者是口质或者是别的一些比如说那个啊奥地震就别人就没办法就是你就要一直去 justify 一直去告诉别人说这是什么为什么然后就是所以这个也是一个非常

也是一个非常消耗能量的东西科技对这些东西的影响是正面的还是负面的最近这些科技发展对于这些神经多元设计我觉得往往负面的发生是没有让这些社群参与到科技产品的时候就会有一些负面的发生比如说自闭症之前

有很多的研究是说通过一些 VR 产品让那些小朋友去训练他们的社交技能吧但是很多产品就是说让他们该笑的时候要笑然后就是说该要做就是做就是某种表情的时候要

就是要改变他们脸部肌肉训练他们可以做出对的表情有我记得前两年有一篇文章就叫好像是 UCLA 的一个医学院做的就是有很多这种科技用于这种医疗化或者说对于残障的一种治疗化

就是要把你这个认为你不正常的地方纠正成正常的对然后呢因为有了科技可以更有效的去纠正你或者是其实有点让我想起电肌疗法你知道吗就是你要是没用到上电然后呢那你就慢慢的就是强迫你去调整有点像这个叫这个同性恋转换治疗是吧

就是你不正常应该要正常一点我们现在有更好的科技能够让你更正常所以治疗你一下是吧就这个感觉对所以说我觉得很多这样的产品实际上也是一种对于少数群体的一种压迫你知道吗就是一种是一种压迫性的工具然后同时像我先前说也会拉掉很多资源比如说很多保险公司他们就会

选择去付那样子的产品而非是说去就是说付你你你本身真正需要的这些服务对不容易那个上回上回好像提出过一个一个一个概念是是说这个 AI 对一些群体有一种叫什么就是有有这侮辱是吧叫什么 microaggression 是吧这叫什么嗯就有吧我觉得你在口吃的时候然后呢你的那些

就是你要是打一个电话或者是你要是跟小杜或者是什么 Alexa Home 说话的时候他们就会一直打断你

你不觉得也是一种侮辱吗你不觉得也是一种很不礼貌的行为吗很多地方都有吧上个月我去开会然后我又看到一篇文章一篇论文 Google 的一些的他们就研究好像也是他们的 Gemini 他们的新的大模型就可以生成图片的然后呢如果你让他生成一个残障人士的图片的话就会

都是很恐怖的背景很破的房子然後呢有一個看去很痛苦很悲傷的一個人坐在裡面帶著就是說某種殘障反正就是給人這種印象就是殘障是

你就笑笑了就是他把这些整个社会对这些他把整个社会对这些残障人士的这个偏见或者说叫做刻板印象就赤裸裸的反映在了这个科技产品里面让这个产品看上去好像是一个好像是一个非常公正客观的一个产品一样好像 Google 一样的但是结果是一个

所以说你能够想象如果有一个比如说小孩就是说口吃或者是一些有一个别的这些别的那个残障的小朋友他们要是看到这些图片他们他们对于他们人生的定位可能有可能就是非常灰暗的他们可能就以后就是要

很痛苦的住在很破的房子里孤孤单单就是可能反正就是重新去强化一些很多社会上的一些刻板印象我觉得他们肯定是非人他们反正就是并不是说他们的选择但是我觉得就是训就是训练他们的人你在训练的时候其实你是有很多选择的你在设计训练这些模型的时候你在美你是在做出

conscious choice 你是在选择你要训练他用的数据是从哪来然后你那个参数的设的要设成什么为什么所以我觉得是我们实际上是我们从业者的责任那你后来还和这个群体还有联系吗事实上群体有啊我其实我们后来还有做一些别的产品然后我们有写一些 paper 但是真的要做到产品后来

还挺难的因为实际上我不晓得能不能说就是实际上我觉得公司虽然得到了很多好的 PR 但是呢实际上你要是真金白银要去投资这样子的项目还是很难的我们那个 R-TECH 的产品能够写出来大部分是我

就是说花些时间公寓时间写然后我还参加了两个 hackathon 就是在那些 hackathon 上大家帮忙做的就是我们其实是没有一个很正式的一些资源所以说你想要长期的做一些项目的话

还是挺难的,对,就是我有常常去参加那些就是这样子的那些 hackathon 但是你做两天以后你要把它变成产品的话你要什么法务啊这种政策啊各种都人都来了以后其实对就是还是蛮多

不能说主力吧但是就是有很多这些事务性的工作对就是说除了你这个产品外还有很多别的事务性的工作所以所以说我们有做了一些别的像是一个

research 或者是一些 prototype 就是有然后有发文章其中一个挺有趣的是我们用那个脸部识别的那个模型做了就是做了一个 app 然后呢就是可以帮助蛮人可以认出他的身边都有水这个也是我们我当时去参加一个美国的蛮人的会议的时候我们就发现

到了会场非常大声他们你要是到了以后他们会发给每个人一个就是扬声器目的呢就是每个人找人的时候

大喇叭!没错,大家就是喊名字,说"嘘嘘嘘嘘"过来这里这样,就是每个人都是在用那种扬声器在喊。天哪,这感觉像是一个无线网络信道干扰的问题。对,但是没有,但是我当时就有一个很大的感觉,就是说你们就是很多人在同一个空间里面,但是你就找不到你的朋友,因为你看不到。

所以说就是大家都通过喊的所以说这个我们后来做了很多调研那边后来回来我们就开发了这个 APP 就是你可以通过 APP 去扫描一下环境然后呢你就可以听到谁是谁有在你哪边或者是多远斯图亚特在你的六点钟方向反正就是反正就是类似这样吧反正我这是九点哈哈哈

反正我们当时做了很多实验,但是当时就有发现有一个问题,是我们的那个识别的模型,对于盲人来说其实很难用,精度很差,因为他要求比如说你的那个冷脸是要在很适合的光线,或者是说你要,

你要拿那个手机的时候你要稳你要就是找到脸的那个时候你要停一下才能够扫就是它会有一个就是延迟这样可关键对于保安人来说我都不知道脸在哪里我怎么知道在哪里停呢没错对就是说它扫的时候它的高度它的高低是在哪里并且并且这个关线环境里的这个关线足不足他们实际上没有办法很容易阻止

这听上去这些技术问题都是可以可以有很大改进的一种广角镜头然后你 model 都能好一点对问题是就是我们当时反馈了以后视觉主也没有没有人想要就是他们都很忙嘛 Manda 都很忙可是他们就很多的事情对这就是一个非常 low pride 的一个东西呢优先级太低看上去是一

依靠企业这种自己是发善心还是怎么样是很难的还是需要全社会推动有更多这样的人制定这种社会的标准社会的规范能够让这些企业跟他的压力才可以

对,我的感觉好像就是大家可能对做一个比较简单的产品其实可能不需要那么多的资源,但是如果真的要做一个好用的并且是没有什么问题的这样一个真正的产品,其实需要一定规模的资源,然后获得这样一定规模的资源至少在大公司内部会有一些困难。

很多困难我的体验困难从头从刚才的几个例子当中我在那边想我就感觉好像这个负残障人士的问题我觉得它可能有几个核心的问题一个是多好算好

就我觉得可能刚才提到说盲账也好包括说做了很多 VC 投资的项目之后盲人反而会觉得不够好甚至替代我本来好的那些服务好像都是因为没有一个很标准的方式大家可以说是说在通过这种方式这些人说好到这个程度了我们觉得 OK 就缺少这样的一种测试的方法

对,没错,所以说现在我们也在做一些产品我们的,我们算是创新吗?但是实际上我感觉也是一种非常基本的方法

就是我们的产品要让我们的受众一直参与就是全程参与就是我们每一个版本都是要让比如说那个口试者来试用然后改然后是用改然后呢我们的 feature 也是大家一起设计的所以说我觉得这样的话你就可以保证它是好的因为呢你全程都有你的受众来一直就是

就是参与嘛并不是说我是关着门自己想我是一个天才我是一个乔布斯什么的我就可以做一个东西然后我就保证它是好的

所以说就是希望能够增加这些残障社区对于这些产品的参与是吧能让他们加入到研发的这个流程过程中没错就是说我觉得就社区的反馈然后呢他们的这种他们的这种主动权话语权是非常重要的接着说上个问题呢你可能有评价标准的问题可能有这个训练级的问题各种各样的问题

这些问题归根结底的问题就是说你都没有去问你都没有去问残疆社区这个东西我的标准怎么样你都没有去问就这些东西你就认为就把它们无论是给残疆社区的产品还是说通用的产品有些残疆社区的人可以用就根本就把它们就排除在外了好像他们不存在一样你做一个产品就可以了这个问题感觉好像也

也是很难解决的一个问题因为整个社会就算即使在美国这样的地方这些残障群体还是并不处在一个非常让人看到的地方是吧就很容易大家就好像这些人不存在是吧

对而且所以我们都在大公司做过嘛你就可以可以想象说我们做一个新的产品我们可能最后他是不是真正推广了那个判断标准就是他是不是比如说总体上来说使得某一项指标提升了比如说总体上来说更多的用户在上面待了更长的时间做更多的事情钱嘛钱多了嘛

然后这样的话就很容易比如说你可能社会上面 98%的人你提高了 1%然后 2%的人他的体验下降了 50%但是就总体上来说最后看到总体上来说是提高了

对这个整个就涉及到一个基本的社会公正的一个基本理念的问题就是说你是不是你可以不可以牺牲少部分人很多的代价来换取整个经济的发展或者是没有啊但是很多时候我是觉得没有必要变成这样的一个对立是吧或者是说某一方面的 game 必须要是谁的牺牲因为我觉得这种 zero sum

Gam 的这种 mindset 就是很多时候我觉得就被来用来反对对于一些少数社群的服务或者是一些关系我觉得大部分时候如果你先为一些少数的或者说先为一些最他

它就是最有可能影响到的人去设计好的话产品最后也是会就是说造福所有人比如说 ramp 嘛就比如说那个坡度是一个非常经典的一个例子所以就美国经常在美国经常看到有些这个除了楼梯之外有一个非常远的一个那个坡你可以轮椅可以上去啊

对但是很多你要是推车婴儿车或者拉行李其实我是经常用因为我有小孩我们常常推车都要靠那些 RAM 法所以说实际上很多这些产品如果你为了一些你先考虑好这些更加多元的群体的话实际上结果是会对于整个社会都会有利嗯

就是说如果你的训练集里面包括一些口吃人的话你的语言识别可能对大家都更好对吧我们可能你们所有人可能有有说的不太好的或者怎么怎么样呢都会变得更好对那为什么他们他们不从这个角度考虑问题因为要花时间啊因为那样的话你要去收集到更加就是就是说比如说更加多元的这些数据的话你要多花时间现在我觉得大家或者是至少

硅谷吧或者是这些这些大家就会有那种 OK 我就找一下现有的一些最容易拿到的比如说那些语音书网络上已经有好多了那我就给他

那我就就该拿来劝就好了我觉得可能是有这种盲目追求效率和速度的一种的这种行为方式整个这个资本主义的这种这种竞争有的时候是一件好事情因为只有竞争大家才能做得更努力但另外一方面可能就对于这种

到产品上快速的去上市场的压力可能是让大家走很多的捷径没有考虑问题非常的全面你要找到最快最快的方法能够到市场上去就变成了跌币去出凉币就肯定大家就都变成了用心反正这个可能也不仅仅是 AI 我们很多方面可能都是这样的最操控的方法把事情出去要不然我们可能就 VC 拿不到钱了要不然这个产品可能就拿不到第一第二第三可能大家都没有根本就没有曝光了

对啊对啊比如说先前我们也是每半年就要做一个 perf review 嘛所以说很多人就是想要你要就是考评每年的这个绩效考评对吧对所以说很多

很多团队或者是很多人他们也会想 OK 如果我要去做一个什么产品的话我要保证可以在这个半年内给它 lan 出来然后呢我就可以拿一个好的绩效或者怎么样所以说呢你要是同样说不行我要慢慢做我要去找到一些受众然后我要去迭代的话大家就会觉得

这个我不知道是个有多普遍的问题还是某公司的特殊的问题某公司大家据大家众所周知某公司是一个绩效评测为核心的公司很多公司现在好像很多都是这样吧因为我觉得这种是一种制度化的所以说我也没有认为我同事都是什么梅兰心或是什么黑心禅没有啊我也没有

我也是非常理解大家的这种压力然后我也所以我觉得并不是说大家心里面不想要去做更就是更公平或是就是更好的产品我觉得大家也是 respond to 它这个系统的一个设置嘛大家都是活在同系统里对其实不管是考评包括你上次公司公司大家看什么公司就你的股东会给你压力压力是什么压力就是你的营收

对说白了股价就是你的考评结果或者说是对于你是个创业公司的话 VC 也会要求你在某些关键指标上面能在半年内怎么样对归根结底我们又说到资本主义的问题对啊

对啊所以说现在我就开始做一个非盈利机构我就想要把这个 profit 拿走然后想要看看说能不能有一种新的方式能够更加真诚的去做产品的方式上门现在是在做这方面技术方面的努力是吧

对其实方面我们去年联合了有一个国内的长站的一个组织叫做口吃说然后呢我们收集了 70 个口吃说的那个数据语音数据然后我们现在有一个比较虽然说没有很大就是比起那些那些大公司他们都是收集几千个小时或者是说好的

就是很多很多人但是呢我们用那个我们收集到的一个 70 个人的数据我们做了一些模型的 tuning 什么的已经可以看到很明显的改进所以说呢我觉得肯定是这个是肯定是可行的就是说只要这些大公司愿意去花时间精力去收集到更加多元化的数据

就是完全可以让它们变得更好模型完全可以变得更好

然后呢我们还有发现一些模型里他们有他们的一些参数这样设好比如说现在很多那些就是那些回答就是语音交互的助手里面实际上他们是有有设一个参数说就是要等多久以后他们要回答你就是当你比如说向他问了一个问题以后他们会等比如说两秒钟

然后呢他们就会认为你已经说完了然后呢这个参数经常是 Hackle 的就是直接写一个数不管什么情况都是两秒钟是吧不说话就是他该回复了对反正每家公司他们会可能有一些改变但是很多时候都是 Hackle 的然后呢他们这个 Hackle 的这个值可能有的时候是通过他们现有用户

的一些数据什么学来但是有的时候也就是可能是是他这个开发经理想的吧产品经理想的可能 I don't know 但是总之这个很短对于口试者来说他非常的短所以说这个也是他在设计上他就没有考虑到可能有人

说话的时候中间会有一个很长的停顿对吧所以说你在这些设计上除了就是你的这个你的这些参数是你要写多少是为什么你是就是这些东西我觉得也是可以通过通过让更就是更多元的人来参与然后再来调整

所以你们的这个现在你们的现在这个非盈利组织主要就是做这些比如说帮助这些模型做得更好的工作吗我们没有想要帮助模型做得更好我们是想要让少数社群过得更好

让他们过得更好过得更富能有可能通过要改变模型来做到我觉得通过改变这些模型只是我们发誓的一部分并不是唯一的一个途径对吧

我们想要有一些更大的改变除了是说训练好就是说除了说有一些更好的模型吧技术上的改变我觉得有一些别的也是要一些行动性上的改变就是一些政策上的改变立法或者是一些 ADA

也是已经出来三十几年了 ADA 出的时候是八十年代请问什么是 ADA 是美国残障法吧好像是 American Disability 怎么说

就早些提到的说政府的网站图片上面一定要有文字描述就常常是 ADAD 部分对没错就是美国就是很就是几十年前就是出的第一个就是保护这些反正就是让这些残障权利保护的一个法律但是他们当时说的时候根本就没有现在很多的一些残疾或者是技术对没有弹模型是吧没有语音电话啊

对啊所以说他们也就没有规定说就是这些产品应该怎样所以说我觉得还蛮就挺蛮重要是因为他们当时出了以后其实也是非常有用的现在很多学校啊或者是公司都要有那个那个那个 pull 嘛那个 ramp 嘛其实都是因为当时法律规定了以后就会有这个其实是会有一些非常大的一些结构性的影响对吧

所以说我觉得可以也是可以通过改善那些立法或者是说即使立法然后也是可以改变大家这个大家的意识吧比如说我觉得现在大家也会对有没有坡度会有一个意识对吧如果你去一些一些就是一些大的集会什么大家

会有人会在想就是会在提出这些问题就是也是因为社会大家就慢慢的会有这样的意识了所以我觉得除了就是说技术上比如说我们要收集更多数据或者说改变这些模型这些结构怎么样劝这些模型我觉得还有别的很多维度我们可以

可以做出变化嗯确实啊比如说在法律上做了这件事情的时候这就大家就会变得理所当然吧比如说我们在美国现在你会觉得这些场所啊不不美国有点大了比如说比如湾湾区是有这样立法的你会觉得让让比如说坐轮椅的人可以去到这个公共场所里面是一件理所当然的事情对吧不会觉得我去不了 I'm sorry 这个东西很遗憾就是他会觉得这这这件事情是你没有做好啊

你作为一个公共场所你没有做好我去不了没有做好这在比如说 20 年前的中国现在中国我也不了解了那就不可想象对吧大家就不觉得这是应该是一个坐轮椅的人去一个地方这是你的权利吗有了这样的法律整个社会的整个期望值就不一样就完全不一样没错所以盈利组织和盈利组织组织起来有什么不一样的地方吗

对于一个做 AI 的盈利组织这是我们第一次听说这样的事吗没有啊 有啊现在的老大 OpenAI 最早就是一个非盈利组织可是他废弃了他的初心好吧 所以你也是也是一个 AI 新的一个 AI 非盈利组织对 但是其实最大的不同就是没有钱没有人赚钱对

因为赚不到钱啊,就是因为我们没有 promise 赚到钱,就是我们不会给 investor,就是投资人回报吧。那你们会怎么找钱吗?你有没有渠道?

大家爱心捐款啊你有没有看我每年底我都有在 Facebook 上面希望大家爱心我现在不太像 Facebook 这一项我有吧就是大家的捐款我们现在的所有的经费都是来自大家的捐款我们是完全没有大金主完全独立就是大家五块十块捐来的你们有那种大公司的 match 吗

有啊大公司有 match 是可以 match 的是吧就跟你的那个扣的反应对是捐的人自己可以就是要是他们单位有 match 他们可以申请 match 我们没有没有金主所以一般来说这种捐款都是残障社群他们自己自发的捐款还是说有一些非残障社群的人或者是基金也会捐赠相关的你们这样的费益力结构

残障社群自己也有权但是有一个现实就是说中国肯定也是吧残障群体他们普遍的就是说经济上是会比非残障局更弱势的群体所以说我们并没有特别的像残障社群

要他们捐款但是我们现在很多我们的工程师我们的设计师其实在他们本身都是口吃者他们很多都是学生然后就是口吃的学生然后他们没有捐款但是他们花了很多时间他们是真的是心里面是有内驱力想要就是说做出符合他们想要的产品所以说他们有花很多时间我们有在 mentor 他们带他们就是带他们做产品然后说回

我们也有很多以前的同事啊比如说 Meta 的老同事他们可能也觉得认同或是鼓励吧他们也有同事朋友捐的就都是 friend and family 是一非常曹哥那个组织非常不容易对 我们很曹哥你们有网站吗有啊 有啊

那我们到时候把这个网站放在我们的收纳里如果有兴趣的听众朋友们可以在上面看看我也不知道上面有没有连到捐款捐款链接吧总之是我一个网站肯定必须得有是吧有 link 但是没有很大我们说不定要去设计上面捐款 link 大大大跳出来可能才行有一个 link 对吧

所以现在这种捐款的大头还是是社群内部吗还是说因为我在想就是如何可以获得更多的捐款来资助这个事业吗如果比如说如果这个捐款都是来自残障社群的话呢相当于是它的社会影响力或者还是比较小那么可能残障人群它本身的群体不是很大并且你刚刚提到就是他们经济实力也不是很大那么相当于是就是我的理解就是可能会对于这件事情的呃

运行会产生一些障碍那如何去获得一些额外的力量来支持这些事情对我们就现在又申请各种的基金吧然后又去申请一些大的基金会啊然后还有申请一些科研经费的一些但是这些也都挺难的因为

很多人申请 争多揍少吧反正就是并且我觉得我目前的体会好像长暂至少在科技里面也还并不是一个很多机构会想要支援会给就是会去优先

就扶持的一个领域比如说前几年很多大机构你去看他们的一些优先级比如说现在很多都是一些环保啊气候变化啊或者是一些 racial equity 啊种族问题或者说是一些民族制度啊 election 这些的什么这个 LGBTQ 是吧

對,但我也認為他們都是非常重要的議題但是可能也是看媒體生態上大家在說的什麼隨和纏戰在整個這種慈善捐款業裡面也是一個小眾就算在這個 Civil Rights 這些權力的

争取上他们的优先级就至少现在这个大气候下的他们优先级还是算比较排在比较靠后的一个位置所以经费就会更困难一些对所以可能你就就是还有更多要要去教育或者说未必是教育就是要去告诉大家为什么就是为就是为什么这个事情重要然后

然后去 measure the impact 这种有点像是去跟那些投资者但是你的 matrix 就是不一样那这个那最后我们节目一般来说哎呦一般来说我们会问嘉宾这个如果大家想要进入这个行业有什么建议但是看上去这个

我们问问少梅如果你是一个从业者如果你是 AI 从业者你希望他做到什么方面能够为残障社区提供更好的服务我觉得就是能够真心的合作吧就是分享你的

就是 Power sharing 中文叫什么就是说你在产品的设计你在每一个阶段你都可以

真心的来合作不要把残障社群作为一个缓之或者是作为一个你就是宣传工具就是真心的尽取大家的力量然后真心的相信残障社群有他们就是他们有他们非常有用的一些知识和一些因素可以真的扳倒这些 AI 的发展让他们变得其实更好

我觉得对我觉得就是说不要害怕参加社群对因为我先前我在 Facebook 的时候我有叫我们听的人一起去参与反弹很多人就处于一个害怕的状态或者看剧状态就觉得好像就是好像太不一样可能有些人会觉得跟他们很不一样的他们会有一些

进而远之的态度其实他们并不那么远如果想要咨询可以找一下少梅给大家聊一聊其实你去教了以后你会发现其实我们的乡是大大大大大于不同就是很多人会觉得

我跟你完全不一样太就是会可能会觉得没有办法沟通什么但是其实不是我在反弹里面经常哭就是我就觉得经常就是心心相系觉得我能理解我就经常跟我们就是是在我们研究的时候跟我们的反弹对象一起抱在一起哭可能我也没有非常专业但是我觉得大家其实面对挑战都很像

好今天非常感谢上边来到我们的节目给我们说了一个我们过去谈一直都比较没有想到的话题一个残障社区对于 AI 技术的他们产生了一些我们意想不到的影响我们科技业可以做得更好更好地服务他们谢谢师徒谢谢师安谢谢你们的平台还有很多的准备工作你们做得很棒谢谢你们

好那就感谢收听我们节目请在各大泛用型播客平台订阅收听喜欢我们节目请在各大泛用型播客平台点赞转发没有打赏键没有打赏了对那我们就后会有期下期再见拜拜拜拜