欢迎收听内核恐慌,一档尽量围绕信息技术主题的娱乐节目。
我们号称硬核,但是也没有什么干货,想听就听,不想听就别听。
我们网址是 pan 到 ICU, 你可以在网站上找到订阅节目的方法以及联系我们的方式。
我是吴涛,大家过年好啊啊?
我们发布节目就是过年对吧?
对,我们作为一个年更节目,能够支持到现在实在是不太容易。
这是我们今年的第一期节目,当然也不希望这是我们今年的最后一期节目。
不过谁知道呢?
你那边都对还没出正月呢!
哈哈哈,还没出正月,但是这个节目上线的时候可能已经我也不知道二月二龙抬头了。
anyway, 嗯,今天我们延续了一个仪式已久的程序员访谈的一个主题。
嗯,今天我们请到一个我的朋友陈龙先生,成龙博士啊啊,现在还不是马上就是了对,陈龙不是刚到 b 嗯我先来介绍一下我跟陈龙是怎么认识的,就是呃至至于陈龙是谁这个事情,我们听完节目大家也会更了解一些,怎么说呢,就是听到陈龙这个呃熟悉的山东口音出现在节目里面,我有一种世界就是世界线碰撞的感觉啊,我跟成龙是滑雪认识的,学友对学友我们就是怎么说呢,就是在如果你经常滑雪的话,你会有一些季节性的朋友啊,你们冬天的时候好的跟什么一样,但是夏天的时候就消失不见了,就彼此彼此不想往来,然后随着气温一点点降低,你们的感情才会一点点回暖。
但是呢,哈哈哈因为陈龙所在的城市叫亚琛,亚琛附近有一个室内学生,所以我们是嗯,即便在夏天也会保持联络的朋友。
大概是这么一个人。
这么一个情况全靠制冰机维持的友谊是吧?
哈哈哈。
可以这么理,冰箱里的朋友?
对对,印象有朋友呃,对然后成龙所在这城市叫亚琛。
亚琛?
嗯玩过文明 6 的朋玩过文明 6 的听众可能会对呃如果你选过德国的话,德国有两个领袖,一个是比斯曼吧,还不是比斯曼是谁?
巴巴 Rosa, 然后还有一个是路德维奇二世。
如果你选巴巴的 Rosa 的话,你在德国用殖民者建立的第一个城市叫做亚琛。
为什么?
因为亚琛是呃,德国历史上非常非常重要的一个城市,它是呃神兽罗马帝国开国君主查理曼大帝出生和登上王位的地方,然后他在接下来的大概嗯 500 年 左右就是一直是神圣罗马帝国啊,君主登基的地方。
然后低价车现在属于哪个州啊?
德国他是北威种北莱因?
对,北莱因为他法轮。
事实上这个州应该叫北莱因西西法轮,但是 somehow 中文里面叫他北,就第一个北翻译出来了,但是 v 这个西没有翻译出来。
这德语地名有时候挺挺挺神奇的。
嗯对。
然后成龙呢?
是亚成功大了?
亚成功大反正成龙可以自己说一下,但是我反正我对亚成功大的理解就是一个叫号称德国清华是德国应该是第二第二大的一个学校吧,虽然应该是 19 世纪见校的,就是德国最老的大学是海德堡大学,但是海德堡大学好像 14 世纪吧,但是亚成功那相对来说年轻一些应该,但它还是比德国的年龄早,就是德国是 19187 年 统一的,但是亚趁空纳是 1870 年 成立的好像。
如果没记错的话。
我感觉你知道的比我的多,哈哈哈。
我觉得都是这样的,如果你住在一个地方,你就不会去了解他,因为我在德国生活了十几年才第一次去了,雅晨就是我,我知道这个城市的存在,我也知道它很重要,但是我从来没有想去看看,一看就是因为滑雪,就是因为认识了成龙,以及就是我们有一个滑雪协会嘛,认识了协会的这些人,才对亚春这个城市有了更多的了解,然后我每次去亚春都是住在城东家的,所以对,大概是这么一个概念啊。
那成龙你来介绍下自己吧。
呃,介绍下我叫我叫成龙,然后呃,从什么说起呢?
就是对喜欢滑雪。
然后可以从滑雪说起。
对对对。
喜欢滑雪,然后我可能现在绝大部分的朋友都是滑雪认识的,然后我在亚深工大读书,研究生就在这里读书,然后后来在这里继续读博,现在博士可能马上就要结束了,然后也要离开这个城市了。
呃,成龙是 9 90 年 吧,是吧?
对,还是 9390 90 年 的。
当 93 的也行。
real 终于不是节目里面最小的人了哈哈哈哈哈哈谢谢谢谢谢谢论资排辈,终印都不是老弟了。
对,因为我们之前有一些节目,那个跟别人一起录嘛,然后他们说我们是中文播客界的活化石。
我我对这个这个这个评价的呃反应是比较五味杂陈的,就是不知道是觉得自己资历老呢,还是应该觉得自己已经该入土,已经有种快被扫入历史垃圾堆这种感觉了。
没关系。
我觉得我觉得涛哥的你心态年轻这个比较重要。
划水人都是年轻的心态我们先从滑雪说起吧。
就是虽然这是一期技术主题娱乐节目,但是我们反正要做人物访谈的话,也是要涉及到这个人在不做技术的时候干嘛的,就是我们这期是有主题的,因为成龙是搞计算机视觉的。
然后也是就是怎么说呢,最近 AI 这么火,他也是做 AI 的深度学习,然后他签了国内一个大厂。
但是这些我们都到到后面再说吧。
先说娱乐部分。
嗯,成龙是滑雪非常非常好的人,就是我,我叫他师傅。
嗯,我我我,我觉得我是一个比较不那么容易认师傅的人,但是我进了协会之后,一下子认了三个。
然后成龙走的对。
原来滑雪里是弟弟。
对,我滑雪里我绝对是个弟弟。
成龙可以,我们可以试着把视频放到 shownotes 里面,就是可以让大家看一下成龙滑雪究竟滑雪是什么样的。
就是没事划,他们划单板,划双板,划单板。
划单板,我们都是划单板。
对,说一下这个协会的缘起吧,就是就是,我们有一个划水协会,叫 c two, 然后这个 c two 的协会是呃从亚琛出来的,亚琛在德国最西边,也非常靠北,就是他为什么会出一个滑雪协会离山那么远,就是因为他附近在荷兰有一个室内滑雪场啊,这滑雪场应该是欧洲最大的。
哎呀,这不是靠比利时吗?
对,他在比利时,荷兰和呃几乎是在荷比卢的交界上对那个地方啊!
对对对对对!
因为什么马帝国最开始是包含比利时和呃荷兰的一部分的嘛,后来他们独立出去了,然后亚琛就变成了一个边境上的城市,所以他渐渐失去了就是一个地理中心的位置。
然后就然后这个神手马帝国的呃所谓加冕帝就就变成法兰克福哈哈哈所以我们是对到了你的城市神兽宝马帝国的两个对两个帝国,两个帝国自由式的市民这样对。
然后呃,亚琛为什么会出这样一个滑雪协会,就是因为我的大师傅,也就是这个协会的会长,他在亚琛的时候选修了一个亚琛的体育课,就是亚琛体育课里面是有滑雪这一项,就很神奇,你在大学里面选修可以选修滑雪,然后他们滑雪的课对,他们滑雪课的内容就是去亚去这个室内滑雪场滑啊。
所以他们不是在山里面对吧,这好像没山啊这个地方。
我看这个室内的滑雪场对。
它是在一个建在一个斜坡上,大概有个一点几公里的雪道吧,然后用用冰心。
没有四五百米好像是。
对,它总长嘛,就是它,它们计算水道都是这种,就是有几条道。
然后把总长加起来这种啊哈哈哈对就感觉跟那个 Wifi 算代宽一样对对没错!
耍耍赖皮理论理论可滑跟跟实际上一条单单一学到的长度是有差别对然后呢,这个大师傅就嗯开始安利周围的朋友,然后嗯他们有那么一个滑雪的小团体,嗯一起快乐地滑了几年后来大师傅要毕业了,就说我毕业之前咱们要把这个滑雪的这个氛围传下去,然后就召集了是七个人嘛,德国好像要求最少是七个人签了一个 charter, 就签了一个这种宪章这样的东西,然后去那个啊真的成立了一个组织的对,这个组织是在一个就是在公证处就他们有个专门德国有一个专门的 register, 就是注册这个协会的地方注册了啊。
登记在案的协会。
对。
然后他是校园社团的一部分。
呃,然后每年这个对等一下。
我问一下这个 c two 作何解释?
c two 陈龙你来说曾经有一个,有一个,就最初的成员里边有一个人,他可能口音有点重,就是大家想说 she two, shee 就是德语里边 ski 大概叫 shee, 然后 tool 就是 tool 嘛,然后他那个口音比较重, she tool, she tool 到最后就说成了 c to, 然后对。
竟然是个谬误的读法的缩写。
就是这么随意。
对,太随意了你们,嗯,一点都不德国啊。
对,我们,我们后来试图给这个 say to, 就是取很多,那个叫什么 back chronidom, 就是试图把这个缩写重新事后诸葛亮对吧?
对这不是什么 crazy covers 呃当时想了一大堆之类的就两个 c 嘛反正你随便拼就行了只要跟滑雪有关这个协会再 double 下赛边 c for 啊哈就可以炸了是吗哈哈哈效果太冷 OK 然后这个 c two 是一个注册在学校里面的社团然后他们每年迎新的时候会就就是会迎迎新的时候会去招新就是很很像大学里面的那种传统的社团现在好像已经不是了啊啊是吗?
因为太太久没交钱还是太久没打招呼?
就是首先就是注册的这个时候跟那个学校是没有任何关系的,它就是一个社会上的组织民间组织然后后来就是说可以挂到学校在学校因为很多都是学生嘛,可以挂一下,挂一下之后可以用学校的很多资源。
呃前提就是需要一个教授去做你们的就类似联络人之类的,然后我就让我们教授去做了这个联络人就在学校就是挂上了可以用学校的一些教室啊乱七八糟的东西。
那个室内学场是在学校里面的吗?
还是在外面都可以用呃雪场也是外面的就是不是学校的啊雪场甚至是荷兰的就是雪场对甚至不是一个国家合格哈哈哈对哈哈甚至 OK 对他们每次滑雪技术上是都是在出国滑雪对然然后再后来也没怎么用也没有续这个事情然后就现在好像应该已经不不属于学校了但是你们每年新生入学的时候还是会去招一批对吧?
对,会宣传一下,让大家知道有滑雪的一个事情。
呃 anyway, 现在这个协会已经有个 100 来人吧,就是正式会员,正儿八经的会员是有 100 来人。
然后嗯这个协我们因为滑雪到后面就是你会有那种 preference, 你会倾向于划某一个特定的风格或者划某一种特定的场地。
然后 c to 是以单板自由式啊为主的。
但是啊我们已经那那我我爆肝那一期应该已经解释过了单板自由式是什么,反正就是跳各种障碍啊跳转跳转跳的各种坡。
然后陈龙是跳得非常好啊!
为什么又变成我了?
来,陈龙继续嗯?
你是怎么喜欢上滑雪的?
就是我介我介绍了,你是创始人之一,但是你自己是怎么喜欢上滑雪?
嗯,滑滑雪事情就是我入坑的,这个契机也挺偶然的,就是我记不清是哪一年了,然后有几个我们六七个人吧,一起出去玩,去春游,去福莱宝附近,然后这几个人呢,可能也都是 p 人,就是大家也没有做什么计划,去了 Flyball 之后,在 Flyball 周围就是看了看那些 b 区的景点啊,转了转,然后就没什么事情了,就在家打牌,然后打了几天之后实在是觉得不行,得出去转转,然后就有个人提议说我们去滑雪吧,因为那附近好像有个雪场,到现在我也不知道那个雪场叫什么,然后有两个人滑过,她就带着我们一群人去了,然后就租装备让上去试一试,然后就这么机缘巧合的试了一下,然后就开始了。
而且很有意思的是,因为那两个滑过人都是滑双板,然后就是有人带嘛,然后所以其他人也都是选了双板,然后我当时就觉得单板这个就很利索,就一块板子嘛,然后鞋好像也挺舒服的,我就选了单板,然后阴差阳错入坑了滑雪,并且选择了单板。
那不是因为他当然看起比较帅嘛。
呃。
其实进那个雪局大厅的时候也并不知道滑雪是什么样子。
就是纯醉瞎蒙的。
对对对一一个 p 人的故事唉。
所以你是在德国之后才学的滑雪?
对。
我记当时应该是读研究生最后一年的时候,当时试了之后觉得挺好玩,然后就回回到亚琛了,然后我当时写毕业设计的时候做完了,到最后只在写的时候就是很无聊,因为每天就只是在码字,然后那时候好像是怎么知道了然后这附近有这个这个室内滑雪场,然后就慢慢的跟别人一块去,在这里慢慢才滑起来的。
诶,等一下,你说当时是哪一年?
一期吧,你觉得你是那个时候才开始学滑雪?
对,吴涛,你看看你在德国干了些啥?
我 2013 年 开始学滑雪,但是我遇到成龙的时候,他已经是就是他已经我也可以已经可以拜他为师了,你就想想吧,就是我的运动天赋有有有多差?
你的雪玲竟然比我长这么多,哈哈哈。
想不到功力如此的差。
对,我是 2012 年 在跟朋友一起去瑞士的时候啊,在那座山叫什么来着?
英格 bag, 英格堡的呃,它的中文叫铁力士,对,英格堡铁力士 titles。
我在那租了一块,就是我跟几个朋友一起去,他们也都是租的双板,因为双板看起来好像更符合人的直觉。
然后我觉得双百应该跟汉冰鞋没什么,呃,差不了太多,因为我划过很长时间汉冰鞋了,我想换个换个不一样的,然后我就选了个单板,呃,当时觉得这玩意看起来太简单了,有腿就行,但是哈哈,划了之后发现自己完全不会,然后 13 年 的时候才正式去上,报了个班,然后学了两个周末才学会。
感觉大家选单版选的都挺随机的。
就好像我前年去考教研证的时候,有一个呃,法兰克福去的妹子,她是 17 岁,然后他去考教研证,我说你为什你是怎么划起来是单板的,单要聊嘛,然后他说他们体育课的时候啊,他最好的闺蜜选了单板,然后班里面所有其他人都是双板,然后她闺蜜怕自己落单,就叫她也选了双,选了单板,但是她闺蜜后来自己就不划了,然后就她一个人就发现了这个东西还是非常上瘾的,然后就一路拷到教研,这总之都是有点巧合的吧。
一切都是命运的安排。
然后我可以跟大家描述一下,就是陈龙滑雪是一个非常流畅的姿态,就是很多人滑雪,你会觉得他在,他是那种 reactive 的,就是你他,他可能身体被板顶了一下,然后他会有一些微小的反应,但陈龙他是一个,你会觉得他其实是一个整体在画,而且他总是保持着一种微妙的将衰不衰的状态,然后看起来是非常的优雅,哈哈哈。
就是衰不衰是个什么形式?
主要他确实懒,不想动。
对,如果你很熟悉一个人的那个他的滑雪的姿态的话,你可以隔着很远就认出他来,就是比如说你坐缆,坐在缆车上,然后下面离得很远,但是你就是我,真是很很远,一眼就能看出来的。
陈龙因为他滑的那个风格就是看起来特别流畅,跟其他人是不太一样。
滑雪这个事情反正作为一个技术主题娱乐节目,好像稍微差得有点远,虽然我们也可以聊一聊什么,就是滑雪现在有很多很科技向的设备,但滑雪本质上还是一个作为一个工科生来说,你还是要有点运动的,就是不然的话就生活非常的乏味。
我不知道陈东是怎么觉得,但是我其实挺后悔的,在读书的时候没有一个比较喜欢的户外运动啊。
我我我其实也觉得,就是我现在也经常想,就是如果能早点就是接触到滑雪就还挺好的,其实是怎么说呢,这个运动如果你想就是尝试更多的东西的话,年轻还是挺挺大的优势的,然后我接触到滑雪的时候应该年纪也不小了,如果早一点的话可能能嗯,就感觉能尝试一些不同的东西,有时候觉得还有点小可惜。
嗯,对。
就像我们协会里面现在最年轻的成员是本科生嘛,就是 00 后。
对,现在 00 后很多了。
都是就他们你会觉得他们将来的呃天花板是不是我们要是要比我们高很多。
是,至少肯定要比我高很多。
对,我觉得就是一代一代人吧就是嗯,他们能带动的另一拨人肯定会更更更更好一些。
嗯诶国内好像这个滑雪也这两年也火得比较好,就应该说是从那个冬奥之后哈都就比较兴盛了。
就冰雪运动吧,传统是我们不是一个热门项目啊,像冬奥之后这个事情就开始热起来了。
对,而且国内单板是几乎是一半一半的吧,欧洲还是以双板为主,单板是一个相对来说比较小众的群体。
对!
单板帅呀。
单单板不实用。
单板在不管谁管实不实用。
帅啊哈哈哈。
这帅有滑雪有什么实用性?
可以你跟我说玩的就是一个浮夸。
对。
我觉得滑雪还是有实用,这就是双板还是有实用性的,因为人类的双板历史已经有 1 万多年了。
单板?
你的意思是说什么?
阿拉斯加好像 SG 膜也要靠双板在雪地里面前行打猎吗?
对啊,就好像芬兰是怎样抵抗着俄国入侵的,不就是靠着冬季两项嘛。
这划水加步枪的他家属于这个什么国防项目对吧。
对,真的在欧洲我觉得以前就是没有指什么火车之类的汽车的时候,滑雪是山民生存的一个必须的技能,当然现在已经对基本上是一个纯粹的 recreational。
那国内的话只能啥我想想什么时候有有这个实用性啊。
这个川林海过雪原那个时候有实用性?
东北的滑雪传动其实还是有的,只不过没有那么呃,主要还是呃,以前的猎户们也不会穿着学校去打猎,这我不知道有没有啊,但至少我理解是没有的。
然后阿勒泰,他们去阿勒泰滑雪的人说什么当地的小孩脚上拴着两块木板,滑得就比你好。
嗯。
他他们也是那些童子功好吧。
对,是这样的。
OK, 我们觉得滑雪可以先说到这了。
来介绍一下今天的主题 computer vision。
嗯,陈龙是。
呃,你来介绍一下你的专业吧,就是你本科,你研究生就是做 config vision 的吗?
嗯,没有。
我其实我本科最初是学微电子的,就是,而且我是在西电读的,西电的微电子是偏那个基础性的东西,做微电子有很多个方向,有偏设计的,就比如你设计一个功能性的电路,然后有偏工艺的,就是怎么造出来。
还有一些就是偏器件,就比如说一个电路里边的这个器件该用什么样的材料在这个就是规上去实现。
怎么说呢,这个东西就很偏理论,然后就导致了我就是,而且本科的时候不太容易,就是塌下心来去去去去研究一个比较枯燥或者说摸不着的东西。
然后我研究生的时候就选了一个这个方向,就会学很多偏应用性的东西,比如语音处理啊,视频处理啊,然后语那个图像处理啊,各种各样的东西。
就是德国的这个研究生呢,他就是有各种各样的方向,你可以去上他们的课,然后去他们研究所里做各各种各样的那个辅助性的工作,然后到最后基本上到你选你毕业设计的时候才就是可能能敲定一个自己比较喜欢的方向,大多数人是这样的。
对,然后我就是到最后的时候进了这个门,然后所以博士也继续做图像和视觉这个方向了。
诶,你当时为什么选择去德国读研了?
本科要毕业的时候吧,就只是想着我想出国,然后去哪呢,然后也没想过每个国家他留学有什么区别呀,生活有什么区别啊,我也不知道,然后我有一个发小,然后他就说他要去德国,然后他在学德语嘛,要来德国的话,我说那我也学学德语吧,就是刚开始去报了大学里边的一个德语选修课,再后来去那个外面的班学德语,然后尤其是外标本学德语的时候,你会就在那里学的人大部分都是已经决定好打算要来德国留学了,然后就跟他们混到了一起。
最终的结果就是导致我来了德国有点随机啊。
感觉跟刚才那个滑雪的妹子学单板是一个逻辑。
对对对对,都是命运安排。
我这跟跟我也差不多,我是当时有一个大学的他,他已经大三了,我我高中毕业,然后他要去德国交换,打算学个德语,然后我爸说你跟着他去学吧,不然你这个暑假就浪费了,然后我就学了个德语,他后来也来交换了,但是我是先比他先来了的。
我挺神奇的。
你在学选这个 config vision 的时候,呃,这个基于大模型的唉,不基于统计学的这种方法还还不是主流吧?
是吗?
你在读研的时候还是就已经开始接触人工智能,深深度学习这种方法。
那时候大家开始用那个神经网络去做图像处理,就是在学术界或者是在那个学校里边其实用的已经比较多了,只不过在社会上还没有这种现在这种影响力。
这里是不是给大家普及一下这个 comprevision, 它当时有哪些主流的这个技术路线?
除了这个现在比较火的这个神经网络这一块啊。
你如果说传统的方法的话,做视觉这些东西就是太多样化了,就是每一个不同的那个任务的话,它的方法就是千差万别,就是很难捋出一个像现在这个神经网络一统天下的这样的一个东西,比如单纯做分割或者检测,它就有各种各样的吸银巧机在里边。
神奇网络之前这个 comprevision 就是 CV 降级视觉,可能更多的是根据不同的这个应用场景来定制不同的这个方法论。
对,但是自从发现这个神经网络可以大力出奇迹之后,发现都那些都不要搞那些什么雕虫小技了对吧?
对,就来搞这个这个的拼音规模就好了。
呃就是传统的方法,它原来存在的一个很大问题就是你比如有各种各样的方法摆在那里,就是相当于一个大的工具箱,然后但是当你真正要去实现一个目标任务的时候,就需要比较有经验的这个程序员或者是呃研究人员去把这些东西挑出来,然后去用到合适的这个东西上,他才能得到一个比较好的结果,这是当时的一个现状。
就通用性不强嘛,对。
是的。
我记得我在 13 年 14 年 的时候面试过一个应该是印刷某种光伏器件的公司,他们面现在有个问题,就是他们要检查呃刻在这个光伏原件上的电路是不是符合要求的,检查方法就是用用光拍还是用 x 光照一下,反正然后就是得到和每一个原件的图片,然后问问我要怎么样才能识别出这里面的这个线它排得好不好,你用传传统方法的话,这个应该怎么实现?
呃,你如果说先要提取出里边他的这个你那个印刷的线路的话啊,这个属于一个比较 CV 的问题,就是你可能要做分割啊,然后提取出它的路线之类的啊,原来的方法看你成像的质量,你刚才说不是他会在一个有有什么特殊的东西拍出来,如果这个成像的质量就很好的话,其实这一步是很简单的,就比如说你取个阈值啊之类的,可能就能比较好的提取出这些东西来。
然后像原来很多比如工业生产线上,或者就你这个也算工业问题了,它解决的一个方式就是它在一个设置好的环境中,然后让你拍出来的照片最大化的去把你想要的这个目标给就是比较干净的放到那里了,然后后续的处理也就会相应的比较简单一些。
然后至于他印刷的对不对,这是另一个问题了,就是他他得有一个标准,什么是对什么不对,是不是连续啊之类的。
但是如果现在要解决这个问题的话,那就还是用就是上一个深度学习的模型,然后看这玩意印得好不好,是吗?
对,但如果是我现在觉得的话,还是要要分出来,然后先把这个线提取出来,然后再进一步的用其他的方法对应的去分析,但是提取这一步如果用现在的方法的话,就省很多事,比如说不需要严格的这个成像条件啊,然后处理的也会正确率可能也会更高。
工业探商他有很多那个现实的问题,我之前投了一个,我刚刚同学他就做那个 x 光嘛,他们做那个,那个就是探测器,然后他们是拿去做那个,就是现在不是汽车用那个电动车嘛,那个电池,锂电池如果它那边有有缺陷的话,它是比较容易出问题嘛,什么起火啊那些东西,所以它需要在那个产线上,就要看这个内部有没有这种这种明显的缺陷,所以他要用那个那 XX 光去拍,拍完之后也是用那个图像处理方法去看嘛。
但我理解就是他这边有几个要权衡的点,一个是刚才你说这个拍得好不好,其实是有讲究的,因为它那东西也是要靠算法调优,调出来的就不一定是那么完美的一个环境。
第一个呢就是说这个拍出来,它还有一个它是流水线生产的嘛,他每次出那么多片,你还有个速度的问题,你要他你要拍得太慢,呈现太慢,要求出一个完美的图,你比较就是那个烫伤的那个进度可能赶不上那个流水线的这个产那个那个流速对吧,就会就会形成一个瓶颈,把它堵了嘛,就还有很多这种限制条件。
对,然后你这个用那个 CV 来做,或者是用那个神经网络来做,还要看它这个计算的速度够不够快,就还是有很多的限制的,就可能是一个软实时问题。
对,其实现在在工业上就是呃,大部分还都是用的传统的方法作为一个主力,你像那个跟我们所平时就是合作比较多的一个亚趁当地的公司叫 INTERFACE, 他们是做那个玻璃啊,或者是塑料瓶,然后那个生产线上的一些问题的检测的,然后他们就是几乎 80% 啊可能的任务还都是用传统的方法去做的,我感觉虽然都在试图把它用那个机器学习的方法去替代一下,但是速度就刚才说的那个速度问题还是一个主要的问题,对于他们工业上来说。
我感觉就像那个神奇网络去就是要要判断一张图还是有点慢对,那这个确实如果是那种大批量的流水线那种就还是比较恼火的一个事。
是的。
就是其实现在你比如说处理正常尺寸的一个图,就就比如 512 乘 512 的这样一个图的话,嗯,一个比较好的 GPU 应该是已经比较快了,就在我们的感觉来说的话,但其实工业生产线上那个速度还是达不太到的对。
他大概大概是个什么级别的处理速度啊?
秒级吗?
毫秒级吗?
还是你要是像我说的刚才那个 512 的这种图的话,一秒钟做到 30 帧,这个是没什么问题的。
那也够了。
你你说用 deep learning?
对对对,用好的一秒钟对。
用比较好的硬件对后台那个流水线,如果像这种大流流线,它可能它一秒钟跑得很快。
来不及。
对啊。
这个还是个问题啊。
吞吐量是吞吐率受到这个探测延迟的限制。
对。
而且你像他们的照片,呃,分辨率其实很多时候要比这个 512 要大很多很多。
你就跟班来对他们很多。
也有一些技术路线,就是我先用一个那个传统的比较快但是比较粗糙的方法,先大概把它把这个问题空间缩小一下,然后再用那个呃厉害一点的模型去进一步处理,也有很多人是这么做的。
像这样流水线就会变得很复杂嘛,就要跑两次。
对,就是你在那个实现上会复杂一些。
但是也是没有办法的办法感觉那成龙你现在博士的研究方向是什么?
就是我跟成龙虽然就是经常见,但是我们大部分时候都是在聊滑雪和玩游戏不务正义对对对,就我,我为什么一直没有聊过?
就是我总觉得应该可能这些这些事情应该在一个节目里面说,就是保持那种新鲜感,因为你如果聊过的话,你会觉得有些事情可能你就想不起来问。
但是我觉得现在是一个很好的契机,就是让我也就是彻底详尽了了解了解一下成都每天写作文都在写什么?
虽然我看过程度写文文这这程度写作文是用 Lark 德文?
对,也是蛮屌的哈哈哈啊对!
如果大家想要知道 Lark 是什么,可以回去听我们的很久很久很久之前一期的节目。
介绍一下你的博士论文吧,就是你即将要答辩的这个论文是什么。
我先说说我做的什么吧。
对,我做的东西其实是比较基础,就是 CV 里边有几个就是很基础的问题。
就比如说图像分类,图像的分割,分类就是这张图片属于哪一个标签,属于哪一个类别,然后这是自己定义的。
然后分割呢,就是一张图片里边可能比如有一只小狗,然后你需要自动的把这个小狗哪个趋势小狗给它画出来。
对,分割的话一般指的就是像素级别的,哪一个像素属于这个物体啊,检测呢,一般说的就是像你说的那个,用一个 bondbox 把这个东西圈出来啊,用一个告诉他这里有一个物体,然后我做的那个叫实例分割。
我前面说的这种分割,它可能不区分个体,它只是区分,比如里边有两只小猫,他就把所有的猫都画出来了,他也不分这只还是那一只。
然后实例分割呢,就是我要把这个东西找出,把这个物体个体找出来。
就两只猫分别标出来。
对对对,我主要就是做这个实例分割的,我偏的方向属于就是处理生物医疗图像比较多,就比如说细胞啊,然后显微镜下的各种各样的乱七八糟的东西啊,还有啊,比如说一些植物啊,然后也都是实验环境下的一些东西,这一类图像数据呢,有一些跟我们平时这种自然图像不太一样的特点,就是首先它相对来说形状比较单一,这是一个这是一个好的地方,一个优势的地方。
你像如果这些东西的形状变化特别多的话,这其实是一个你需要用更多的数据去去去学习去推动这个事情啊。
形状比较单一的话,需要的数据量可能会少一些啊,但是它有其它的问题,它问题就是它会特别密集,比如你拍了一张细胞的图片,一张图片里边挤了几百个细胞,每一个细胞都是挨得特别近。
还得把它一个个分出来。
要稳定的把它一个个分出来。
然后我其实主要就是偏向于解决这个问题啊。
这个的应用场景是什么?
就是比如说拍了一个组织的这个,这个切片,然后去把那个癌细胞找出来吗?
这种类型的应用。
应用有很多,就是它,这是一个属于基础性的一个工作,然后应用的话我可以举几个例子,比如说我们所里另一个人做的,他是分析那个血液里边,就是血液里边有各种不同的细胞对吧?
那红细胞白细胞的对。
如果你提取了一个样本,然后拍了一个照,然后这个这个算法可以立刻告诉你里边有多少个红细胞,多少个白细胞,然后通过它这种比例可以做很多后续的分析。
就是那个叫什么呃,我们体检的时候会有那个叫做呃红细胞那个技术对吧,它是一个体检的一个指标,我记得对。
你可以数出你这张图里边你想要的物体有多少个嘛,就是数数数这个事情其实在很多场景下都是一个就已经是一个很重要的一个一个一个信息来源了。
唉,他这个要求精度很高嘛,就是你要达到一个什么,就是你评判你这个算法做得好不好,是什么就数得准不准。
对呃,如果应用的话,取决于应用场景,有的严格一些,有的就 OK 一些,但是对于我们来说,就是肯定想把这个数字呃精确度做得越高越好。
那代价可能就是这个计算的这个复杂度的问题吧。
对。
你可以用一个很复杂,运算量很高的模型去提高一点精确度,但是如果应用层面根本不需要的话,其实也没什么必要啊。
就可以就是水一点,然后就数得快也行。
对啊,那这个程序场景还是蛮多的,比如说什么如果拍一个什么无边机拍个图对吧,数人头之类的。
数车有人是专门去做数数这个事情的。
数数你可以像比如说你先做我说的这个实例分割,分割完了之后然后数出来。
但是这个其实是一个呃,就是那个过过分的解决这个问题了啊,因为你不需要知道他明确的边缘轮廓啊还是怎么着的,你就可以数出这个数来。
有一些专门做啊技术这些工作的人呢,他就是他就检测一个特别的点,就比如说眼睛或者怎么着的,然后这种特征很明确,然后能够比较稳定地找出来的点,然后直接数这个东西也可以。
成龙之前写了很多篇论文,然后还要去呃欧洲各地参加各种 conference 刚才说的这个问题就是,是你所有这些 conference 和你之前所有论文都在就是围绕着这个展开的吗?
嗯,基本是就是都是围绕着这个主题在做的就是你你当初为什么会选择这个方向?
嗯我我回忆一下哈是怎么进的这个坑哈哈哈呃首先我们教授是一个很就是他虽然很也不能说 push 吧,就是对我们的毕业要求比较高,然后但是他在你做什么这一件事情上是特别开放的一个一个教授啊,这取决于教授风格吧,有的教授就是说你去帮我做我我认为的这个方向啊,然后但是我们老板就是你做什么都行,随便啊,然后我当时就是觉得我倾向的这一个方向就是解决实际分割的这个这个方法的这个方向我觉得还挺有意思的,然后我就尝试着去做,然后慢慢的也就一直在这个方向上越做越深下去了。
也是一个随机发生的故事。
感觉给我打个叉问个那个在德国读博这个打工感强吗?
打工感还好吧,就是我觉得他的工作氛围比较好。
主要是因为国内有些地方就是打工人,博士生就是打工人哈哈哈比较比较惨博士博士生是教授的私人奴隶?
不是。
在德国倒是没有这个,没有这个感觉,但是在德国读博更像是在工作感觉因为就是他就是你说可以是赌博,但是尤其是对理论课学生来说,他就是你跟学校签订了一份你做研究的工作合同,然后你平时的工作就是有教学任务,有研究任务,然后要做老板的项目之类的,然后你到最后拿不拿到这个学位,其实就是到最后你写没写这篇文章,然后提交上去进行答辩。
这个东西很多人也是工作几年觉得就不想拿着学位了,或者不适合就就走掉了,当工作了几年?
这不是 rail 吗?
啊哈哈哈,这里可以插播一下, rail 是在逃博,是独博。
读了一下,然后觉得还是现实世界花花世界比较有比较有意思。
我我是想明白这个东西还是不太适合对我我觉得其实这是一个正确的方式。
我觉得啊。
我觉得能在德国把博士读下来是需要某种特定的人格特质的,哈哈哈然后德国对德国读博不是非常容易的事情,就是首先我前两天在朋友圈发一篇转发一篇文章,就是德国一个学校因为挂科率太高已经上新。
你看哈哈。
我们学校虽然是化学,但是那科那科的挂科率达到了 85%, 就是哈,因为德国的学制是,如果你进了这个学校,然后你选了这个学位,那你每一门考试都只有两次办的机会,就是如果你两次都没考过,第三次有可能再让你考一次,也有可能是让你考试一次,如果你第三次还没过的话,你就永远没有办法从这个学校拿到这个学位了,你就只能转学或者是另投另外一个专业。
良考定终身对吧?
对,然后你就可以想象他们的博士的难度有多大了。
就是,我真是 literally 认识某些德国人,他们从呃年轻时代开始读博,然后就这个好,就好像泛禁中举一样。
这种感觉头发已经花白了吧?
对,读,读完的时候已经是一个中年人了。
这种感觉对你对成龙你读过?
读了几年?
差不多 5 年多。
5 年已经算快了其实唉。
也没有那么就不涛说的这个这个这么可怕,我觉得就是首先他时间周期长。
我觉得是因为牛人都觉得这个事很 easy 你知道吗?
不是不是不是这个意思。
嗯,就是就就很多人拿这个时间长来说事嘛,就是呃,我觉得他长主要是长在他这个方式上,因为他中间有很多工作性质,你需要去去干很多研究之外的事情。
你你要去教学呀,去做那个项目呀,项目其实很多时候是在做教授的奴隶。
对,工程型的东西。
对唉。
你你做了做了什么项目吗?
就是在这个期间。
对,我其实第一个项目是做嗯,线重,不知道你们知不知道这个东西,一种虫子。
不是你把线程咋了?
对对,线程。
呃,我没有线虫,应该算一个钢吧,还是一个木,我也不知道这个门。
对,一个门。
好像是有的寄生在动物体内,有的寄生在呃,植物上,有的它就可以独立在土壤中生活啊之类之类的。
对,然后我做的这个项目呢,就是跟另外两个组织一起合作的,然后一个组织是德国的,就是类似农科院还是农农业研究所之类的这种一个一个实验室,农科所的,对,就是他们的农业部门下的一个类似什么实验室,然后另一个是一个公司,这个公司就主要是做植物表型学的,就是一个植物放到那里,他们收集一些数据之后去分析这个植物它的形态上呀有什么变化。
那这个跟现成什么关系?
呃,对,属于他们的支线任务。
然后 OK, 对。
我们一起做这个项目呢,是去检测一种寄生在植物身上的一个线虫啊,这个线虫它其实它有点像病虫害,检那个监测一个东西,如果它太多了,它会直接影响很多植物,比如玉米啊,然后甜菜啊,乱七八糟很东西减产,所以各个国家其实都有专门的实验室以及部门去做这个事情,这个事情现在很无聊,就是一群人,那个通过首先把土壤样本处理完之后,然后把剩下的东西放到显微镜下数啊,真的就是数,左手有一个计数器,右手有一个镊子,然后捏掉一个,然后摁一下,捏掉一个,摁一下啊。
就跟那个飞机上那个空尘哒哒哒哒,数人头哒哒哒,一拿手,手上一个东西一直在点那个是一样。
对,但是比那个更无聊,因为真的是我去他们实验室看过,你盯着那个显微镜下看那个东西,真的是一看一两个小时,真的是很难受啊。
所以你你用那个 CV 的方法把他们这个步骤给自动化了。
对。
而且这帮人 10 个有 9 个都是有博博士学位的,你就想想让一堆受过高等教育的人上这种非常无聊的。
他们会不会数着数就睡着了还在数羊哈哈哈很正常。
只羊两只羊一一条虫两条虫对这个人工数的这个这个偏差是很大的,就是嗯你累了之后可能就看不到了或者怎么着的他会边数边标记吗还是怎么着就我?
我发现我数东西的时候也会,就是经常诶那个数了没忘了已经数完了拿出来对。
他会把那个拿出来,用一个镊子把它捏出来,然后但是他那个样本里边其实是剩下很多那个植物的那些残渣之类的,所以很杂乱那个图啊。
我突然理理理解你说那个那个你的研究课题的应用场景,就这种场景就可以解放很多这种就重复低效的劳动力嘛?
对,是的,我接触过很多项目之后才发现,在我们觉得好像科技很发达的今天,还有无数的工作都是用这种很原始的方式去做的。
嗯,甚至是在这种实验室里。
这那像这种场景,你用这个 CV 的方法去做,需要做一什么前置条件吗?
还是说你搞一个什么通用算法,他就可以直接把那些东西都数出来?
你肯定还是要要不要什么要训练一把吧之类的?
对。
要训练一把,尤尤其是这个场景下有很多乱七八糟其他东西,其实呃,如果想做得特别精确的还是挺难的。
然后但是我们作为这个项目来说的话,也不是特别是这个重点,因为还要做很多硬件的东西,比如要搭建一个台子,然后上边安装光源啊,然后镜头啊,架相机对对对!
然后让它自动地扫描这个东西就怎么先把那个底片给拍好对吧?
对对对,不然你没有一个质量好的图你们捏那个 CV 算法也比较难去搞的。
对对,这个一个理想的状态应该什么样子?
就是你搭完之后拍完那个他拍完那个照,然后他在电脑上选中某一个啊,帮我数这种类型的东西,然后把数说全部都标出来,然后多少个记个数。
最理想的应用场景应该是这样对对对,但但实际上呢,做的就现在的这个业界,不管是学界还是工业界,做到什么样的程度了?
嗯,这其实算一个比较小众的方向吧,就是因为也只有做这方面的研究的人才有这个需求,嗯,就做的也没有一一套现在特别好用的设备供大家用。
我觉得这个之所以没有出现是因为没有人干这个事情,之前做生物的这些人呢,他对这些技术的东西不是特别的嗯精通,然后他们也不会去想着我去做这样一个事情啊,我觉得这个是主要原因。
这就很有意思了,我觉得就是如果从我你和我的角度来看,说这个东西,就比如说 AI 这个图,图像识别技术刚出来的时候,我就想说这个东西肯定能在我的某个工作里面起到作用,但是为什么你说这些帮搞生物的人,他虽然是填坑专业吧,但他们也肯定对外确实科技发展是有所了解的,为什么?
他会不会主动想到这种这种用场景他会想。
但是这个东西还没有发展到一个就像我拿过来直接用的工具一样,他还是需要很多的工程专业的这些人和事情,把这个事情搭建起来做成一个产品给他们的。
就好像 ChatGPT 一样,如果我们有一个 CV 方向的什么 CV GPT, 然后呃,你可以就是上这个网站说你看我这有这些这样的一些照片,然后里面我要挑出这样和这样的东西,然后他就可以直接给你,就有一个泛用型的 general purpose 的这么一个在线的工具来给你解决这样的问题。
就是这样的产品,你觉得短时间之内有可能出现啊。
其实这是现在 CV 的一个大的大家努力的方向吧我觉得嗯,就是传统的这种有监督的学习,就是我标注好很多东西让你去学一个任务,我自己觉得其实是有一些瓶颈的大家其实 CV 界是奔着像 GPT 这种的,然后可以运用到大量无标注数据去训练一个更通用的一个模型,这是一个目标。
我觉得就刚才那个场景吧。
以后就是可能如果这个比较成熟的,大家想就是对吧,我都把那个架起来,手机装一个可能微距的镜头拍下来,然后直接在图上选,然后框一个,哎,把这个全部可以选出来对吧,都不用专门的相机什么的。
前几年其实有一个,就是 Facebook 做的一个在 CV 领域挺有影响力的一个工作,他那篇文章叫 segment anything, 到最后其实最后结果还是收集了大量的数据,然后去训练了一个模型,然后其实在网上是有这个 demo 的,如果有人有兴趣可以试一下。
然后就是你可以用比如说一个小框,然后框一个东西说诶,我想要这个图里的这个东西,然后他就会尝试着把这个图里其他这个东西给你找出来,怎么说呢,是个努力,但是我觉得效果还是没有达到大家理想中那么智能的一个一个一个方式。
所以它还没有像摘拆的 GP 那样,就是应用的门槛非常的低。
或者至少是像什么在那个抖比那个 Photoshop 里面对吧,会是一个插件,然后可以把那个都变高亮出来,然后不是一键删除这种。
对或者我觉得还是不够聪明吧,就是还没聪明到那个地步。
瓶颈在哪里?
嗯,大家有很多看法,其实一个主流的看法就是语言这个东西之所以能够比较好的去实现这个事情,是因为语言是一个高度浓缩了信息的一个一个载体,就是一句话它的信息含量是很高的,但是在一个图里面它的信息很丰富,但是你的目标信息其实在所有信息里边占比是很少的,所以你就很难从这么多的东西里边去捕捉到这一个小的信息出来。
就适应信噪比不太高嘛对吧?
对,如果你把不相关的信息理解成噪声的话,那么就是信噪比比较低。
提取那些你想找的那种东西是比较难?
对有什么 break through 吗?
最近比如说一二十年这个方向一一 20 年尺度有点大。
这个 CV 都是以一两年为尺度的哈哈哈最近 5 年对其实我近一两年去参加会议的一些感觉就是,我觉得现在其实有一点瓶颈期,会有很多不同心的工作出来,但是那种让你觉得在方法上或者想法上特别眼前一亮的没有很多。
那所以你这个 paper 主要的创新点什么?
诶怎么变成那个?
嗯变成答辩。
提前答辩?
呃对对来来。
解释一下你的这个方法的创新之处。
对。
我们应该先看一遍成功论文可以可以预答辩了,针对性地提几个问题。
对我的这个方法呢?
呃,想法也挺简单,就是一张图片是有很多个像素组成的对吧,然后我们想要把就是某一个物体分割出来,那其实是对像素做了一个聚类啊,比如这十个像素它聚成了一类,所以它是这一个物体。
我的方法就是我用一个神经网络把像把这个图片中的每一个像素点去映射到一个空间中,一个一个向量空间中,然后在这个空间中呢,它就是这一个物体就形成了一个类,另一个物体形成一个类,那么我就可以用一些简单的聚类方法,可以把每个物体分出来。
听众朋友们,你们学废了吗?
哈哈哈,对,就是这么简单!
结束了?
这没了啊,答辩完成啊,恭喜恭喜恭喜恭喜恭喜!
有点复利页变化那个思路是不是啊?
对,反正就是把这些东西映射到一个好处理的空间中去。
就之前说那个信噪比的问题,不是很好处理,但是换就是转换一下可能那个就好了啊对。
你在这个就是这个处理过程中会用到比较或者你觉得最复杂的数学方法是什么?
如果说很深入的数学也没什么。
这或者这么说吧,你是接受了这么多年的呃工科的训练,你觉得在你最后写论博士论文的这个过程中,数学是你需要精进或者说克服的一个障碍吗?
嗯,我觉得对于做我们这个方向的人来说不是。
或或者这么说吧,就是现在的机器学习或者人工智能这个东西,它涉及到的概念特别多,但是又不要求你每一个概念去认识的特别的深刻啊,但是你必须都得知道有一个呃正确的,然后中等程度的理解。
如果说深入成都的话,我觉得其实是不是很需要的。
比如说有什么概念是你觉得一定要了解,然后又不用那么深入?
嗯。
就像你刚刚说的,你比如你搭建一个神经网络,当然现在库都很很很很好用了,你直接写代码一行一行下就行,但是它中间是怎么运行的,你这一层到那一层其实就是一个矩阵乘法呀,或者说牵扯到一些变化了的,线性代数的一些变化呀这些东西。
如果你做这方面研究的话,你对这些东西首先是得有一个正确的概念的,而不是说只会去一层一层的去搭这样一个模型,然后你比如说你去设计一个损失函数的时候,他训练其实是计算梯度的一个过程嘛,就是求导什么样的梯度的信号能够比较好地训练出来,什么样的是没法训练的。
对,这就求个岛,也是就高等数学的一些基础的东西,所以这些东西都是要知道一些的。
嗯,在你需要深入的时候,可能你得有这个能力去找到正确的方向去可以深入,我觉得这个是最重要的。
嗯,你刚才说的那个应用场景用现在用神经网络这个方法去呃去做,你怎么去验证它的有效性或者可靠性?
假设刚才说那个数红细胞的这个事,它要求你比较精确对吧?
你怎么保证这件事情?
嗯,现在其实通用的方法也都比较简单,就是我收集了大量的数据,然后我用比较随机的方法呃去分成一个训练集,一个一个 validation 级,还有一个测试集,然后我训练的时候就只在训练上让它学,中间的过程中可以用这个 validation, 我也不知道怎么翻译啊 validation 集,去看看它是不是验证集吧,对,验证集,看看看是不是呃过度训练了,然后啊控制他过度训练这个事情。
那不知道过拟合了对吧?
对对对,然后训练出了模型,去到测试集上去看一下,然后如果测试集上还不错,那么我们认为啊,那这个模型大概率可能能能能行一些。
但其实也是有很多问题的,就比如说你可能收集测试集的时候,它跟你的训练集比较相似,然后实际用的时候又出来一些你也不能控制奇奇怪怪的乱七八糟的。
对。
就我觉得工业场景这个就特别,就是要求就很严格嘛,比如说他对某一个这个工艺的结果,他的量率要求会就是那个比较高对吧,就是或者他要求那个范围会比较窄,可能就你一个,比如千五或者千三。
但是你我听完你用的这个呃思路之后,好像你也没有办法保证说训练好的这个模型跑完测试集跑完验证集之后,你也能保证说它还是这个前三的这个通过率啊不确定的地方嘛,就这个怎么解决啊。
所以现在其实无间路的学习是一个比较重要的一个事情,就是我刚才描述的是一个典型的有监督学习的这样一个一个流程。
无监督的学习呢,就是在很多场景中收集这个图片,收集数据是一个比较简单的事情啊,主要问题在于标注上,你像生产线也是,那我就开个摄像机拍呗,一直拍对吧?
拍足够上的时间,这个图片是很好找到的。
如果有一种方式,我不标注这些图片,就能让它呃进入到这个训练过程中去啊。
他这个泛化的能力就是他能够看到更多呃各种各样场景,能够处理各种各样不同场景的能力,比起监督学习来说更好一些。
他能够在就是不断的这个应用过程中去提升自己的这一个识别率吗?
就有没有那种反馈式的?
你可以做反馈式的,就比如说你给那个客户了一个模型,然后他们说,诶,这一类的图片好像不太行啊,他们又给你一批数据,然后你再把这数据再去再再训一下这个网络,这个其实是一个正常的一个一个迭代的过程嘛。
就是。
但归根到底,这个事情还是落到了我需要收集更多的标注数据上去。
那谁来标呢?
这种情况下还是要人工来标?
对,还是要人工来标。
但是非监督学习啊,他就是想你直接给我一批数据,我不标注,我想个什么样的办法让他去学这个事情啊,然后把标注这个事情省掉了。
对,就是就完全不用人工了嘛,一劳永逸。
对对对,但是现在就是还没做到那个理想的状况。
大多数都是用这个非监督来做一个预训练啊,让你看很多,然后我也不告诉你那个我到最后的那个目标是什么,然后你就预训练,训练训练,训练出一个好像差不多的网络,然后我再让他去具体的 focus 到某一个小的任务上,然后他的泛化能力就会比没有预训练的好一些。
既然你是觉得有很多问题听起来都是比较简单的。
但是就听见描述很容易描述对吧,但是很容易很很难实现。
对他描述起来很简单,就就好像我们可以通过分析语法,或者是我们在上语文课的时候就会去理解说人是怎样理解一个句子的,虽然这个这个过程可能不一定对,但是至少你是有有那么一个分析性的方法在那了。
但是近段视觉给我的感觉就是他有很多问题,你好像人做起来很简单,但是你没有办法解释人脑是怎样做到这一步的。
比如说你,你你,你能把一个东西看成,把一个房子的窗户和门看成一个五官,呃,你为什么会产生这样的错觉?
这这是一种人脑的过拟合,对吧?
但是你要怎么样解释说你看到的一个东西,然后你辨认出了它是什么?
这么一个过程你要交给计算机去做,我觉得它是就很难有一个分析性方法去完成。
然后现在这个深度就是深度学习的这样一个方法,事实上还是一种仿生学,就是你用我一个神经网络去去让他做到这件事情。
但是回到 real, 刚才说的就是你可解释性上面他仍旧是一个比较黑洞的东西,他做到了对我给的这样参数,设计这样一个神经网络,他又能做到这样一件事情,但是他是怎么做出来的?
我没有一个什么特别好的理性的数学方法能够把它描述出来。
跟业界、工业应用好像不用追求这个可解释性吧,只是做学术研究才需要追求这个可解释性。
但我觉得可解释性是是科学的一种精神,就是对吧?
我练单,我我要什么科学?
我在练单呢。
哈哈哈。
也是。
其实现在有很多人去尝试做这个事情,但是就是确实像你说的就是挺困难的,就像学生物的现在企图去理解人类是怎么运行的一样。
我那天有一个挺悲观的一个想法,是不是如果这个东西复杂度到了一定的量级就不要妄想去追求什么可解释性了对吧嗯就我其实是个实用主义者对我就觉得嗯可控好用能用就行哈哈哈就挺好的哈哈哈我们做这个怎么我们是做一线?
我我也不能说我是做一线的,就是我们这种做应用的人会更倾向于实用主义但是我我总是在想也许我们缺乏某种数学工具或者是缺乏某种就好像很早就有人发明了几何学,很是很早就有人发明了复数但他们最开始被发明出来的时候都没有什么实际的用用途只到只有到后来的时候人们发现复数和什么三角定理或者是非欧几何这种事情事实是可以用来解释现实之中的某些问题的。
那我就在想说神经网络没有被解释性是不是因为我们缺失某种工具对吧,就就纯理性上面的一种一种范式科学的某种工具,所以我们没办法解释。
嗯。
我觉得这个对这个答案肯定是是的,就是还没有一个方式去更深入的理解它。
我看很多做生物研究的我就觉得,嗯,他们的方法也挺简单粗暴的,都感觉哈哈哈对。
我有一个朋友也是读也也在那个哦,他是开一天的卡鲁大学,他就是读生物博士,每天工作的内容就是用某种荧光剂给染色体给蛋白质染色,然后试图验证某种猜想。
对,这非常的啊对他们反正生物界的自嘲已经够多了,我们就不用再再雪上加霜,但是你会觉得这个东西好,好像是在浪费生命一样,你也不知道自己做的东西有什么意义,你也不知道它它能不能成功。
对,也很有可能你所有的博士学位,你你所有的人生目标和声望都基地都在你不知道行不行的路上,那就有点绝望。
诶,现在这个 CV 这个界,有了这个神经网络这个新的工具之后,呃,有那种趋同的趋势吗?
比如我之前听说像那个自然语言研究,自从有了这个对吧 GP 这这条路之后,好像之前那些传统方法都基本上就是弃之不用了对吧?
就是 CV 有没有这个类似的这种情况?
呃,你如果说传统的那些方法,就是咱们说神经网络之前的这个传统的这些方法的话,现在基本上就很少了。
对,你如果只从效果上看,就是那个好坏这个那个表现上来说的话,就是现在的机器学习的方法是绝对的助力它这种会不会形成一种就是过于这叫什么 Mono culture 对吧?
就是单一的这个解法的问题,然后反而可能就其他的可能性就探索的反而少了。
或者说就是啊,如果神经用网,神经网络这个方法论是目前流行的一个范畴,那下一代的就是比较有潜力的,会是什么?
嗯,我现在还看不太到啊,感觉就在各个任务上,在效果上能够挑战到神经网络的很少。
对,你就发现好像自从有了这个东西出来之后,好几个这种传统那种学科的方法论都叫什么 converge, 收敛到了这么一个单一的一个解法上面去。
对,也不知道是好还是坏啊。
对。
我觉得之所以这样是因为就跟吴涛刚才说的一样,他跟那个人去学习或者完成某一件事情是类似的一个方式。
因为当我们对一个事情没法总结出规律来的时候,我们又想解决它,那只能就依靠于这种范式。
之前是没有一个工具可以完成这个模式的,就是我们想达到一个目的,但是不知道该怎么去做的时候。
然后但是现在有了这样一个神经网络,可以完成类似于人的这个这个操作的时候,那么它就会被填补到很多这样的这个 list 中去,那个应用中去啊,所以它现在特别的广泛,因为这这个这个需求在现实中太多了。
大爆发就是有了这个东西之后,很多之前不太好解的问题,现在都有比较明确的解法嘛,对吧,至少你可以有一个明确的方向去尝试。
对。
我就是想干这个事情,但是我不知道怎么做,你帮我做吧,就是这样。
哈哈哈。
求圣节,但求能用。
对对,会遇到什么样的这个瓶颈吗?
就是这这这条路走下去,至少在 CV 这个领域上面。
我其实现在觉得的话,就在很多场景中效果其实是能做得很好的,但是就像最近其实讨论的比较多的就是这个东西的实现成本,包括硬件上,能源上,现在可能是一个我觉得是一个需要大家去努力的一个方向。
对,怎么用便宜的硬件,然后少的能让消耗去把这个东西实现掉。
贵在哪个部分?
是在还是在训练那个那个环节嘛?
嗯,训练当然是需要耗费大量的能源和那个硬件,你正常用的时候也是需要很多的这个算力的,虽然比训练要少很多。
但是就是 inference 这一步也是比较费劲的。
对,会有一些什么专,不是现在都有什么各各家都在搞什么 NPU 嘛,什么什么 neural processor 搞这个 inference 那块的加速这种专用的一个,呃,就是芯片吧,会解决这个或者是就是减减缓这个问题吗?
嗯,我觉得肯定是,这是一个很重要的方向嘛。
对,我自己也不是特别懂,就离开硬件已经很久了,也不是很懂这个东西,但是我觉得肯定能想象到的。
呃,解决途径的话,那肯定是就是做专用芯片,专用做 inference 的芯片,这是最直接能够减少这种能耗的一个方式。
对,你看现在几家大厂都在往那个芯片里面加对吧?
英特尔现在最新一代也要也要加那个 NPU 的模块进去了对吧?
之前像什么移动手机那些,它它限于这个能耗也好,就是算比好,它就扎根早呗,就可能这块还是相对好一点,但反而是训练那一块,好像你们也是用显卡去跑嘛?
对对。
用显卡是个什么样的规模?
几十块?
100 块显卡是有的。
什什么型号?
呃。
各种各样的型号,就是它不停地换代,每出来一个新的呢,就买几块新的,然后呃,旧的就会被慢慢地抛弃掉。
哈哈哈,还换代比较快,对,现在国内反而做这个比较惨,不让你买那个先进的型号了,不知道怎么办啊。
对啊不知道,现在不是好像也在想自己搞不知道搞到什么程度了。
这不就没对还比较远嘛,至少落后好多年。
是啊对的,不知道怎么解决这个问题。
这就我们可以过渡到我们接下来要说的成龙现在是一个他正在等待他的博士毕业答辩,然后毕博士毕业答辩之后他就会不是刚答辩完了吗?
博工作啊刚才答辩完了哈哈哈 OK 哈哈哈全部是现在已经答辩完了,那他接下来就要回顾工作了,那么他要去华为那。
诶?
去华为哪里?
呃杭州是什么部门啊?
呃 2012 实验室下面的就媒体实验室啊这属于还是偏就是研究性质多一点啊对。
是华为的人来找的你还是我记有点记不清了。
就是华为好像他们 HR 给我发邮件还是加我微信忘了,然后就说他们这个实验室在招人。
有没有意向面试一下就是人人老不是有那个计划嘛,就各种去欧洲美国挖这个先进的人对,挖人才对。
嗯然后后来面了一下就就是这样一个过程什么时候回?
就答辩完?
对, leader 答辩完本来是想去年明天,然后结果答辩一直拖拖拖拖到现在然后还没有答辩然后这个 offer 其实已经延过一次了然后但是马上又到那个延的新的时间了,我得去问一下还能不能再延。
那你在就是你拿国内 offer 的时候你有什么心路历程吗?
就你比如说你之你在华为接触你之前,你的设想是什么?
我其实没有什么太多的设想,就是我是挺想回国去看一下的,因为在欧洲待了很多年了,然后想回去感觉一下,因为对于我来说,我其实我是在想工作这个事情无论怎样都是会占掉你生活中绝大部分的时间的,我就要试图去在工作上找到一些乐趣,或者说去做一些我喜欢的事情,如果说以这个事情为前提的话,那我还挺想让自己进入一种比较集中的一个状态的。
而在欧洲这个工作的感觉呢,我就觉得有点比较松散,可能不太适合我。
太闲了是吧?
对对对对对,所以我就想回去看看吧,也可能回去之后会觉得呃过度不松散了就过紧了是吧?
对对对,不知道,所以反正尝试一下也没有什么,我是这么想的。
反正这个应用场景那肯定是对吧。
国内这块是比较多的有可能性的地方。
对,我觉得国内一个好处就是大家做什么事情节奏比较快,如果你对这个事情有热情的话,那我觉得是一个很很爽的事情。
我不是刚才说那个我做的第一个项目那个例子嘛,我们不是要搭建一个硬件的平台,他们就只是去找这个型号,然后下这个订单,把这个镜头什么买过来,就花了一年的时间,我当时就觉得 what 有些发指了。
我们的这个提纲上面还有一个,就是我在 Lark 滑雪的时候,成龙的一个校友跟我说成龙独博士独到一半的时候老板跑路了嗯啊这是这啊,这是切实发生过的事情吗?
这是怎么一个由来?
呃对。
我们老板跳槽了其其跳槽到了其他的学校啊那你咋整?
如果你是在读博的中间的话你你你可以选嘛?
要么你就是留在这个学校,然后去尝试着联系其他的导师或者大多数老师都可以就是直接带着你走去别的学校?
别人有寄子你就想寄生的啊对, student 哈哈是这个意思。
然后有很多同事他们赌博,现在在中间阶段,甚至刚刚开始的他们就比较比较惨,需要做一个抉择。
然后我其实影响相对比较小,因为我当时就已经在最后写论文的那个阶段了,然后他走了,然后我只需要在这个学校再找一个我答辩的能接入你的人对对对,然后完成答辩就好了。
虽然也造成了一些影响,就比如说他这边离职,那边入职,在很多呃就是文件的工作上耽误了一些我的进程,但是整体还好。
像菲菲那种半道老板走掉的,那就是属于是没有人管的孩子了。
就项目做了一半对吧,老板没有了对吧,包空投跑了。
孤独。
我做这些节目其实也有一个想法,就是我觉得成龙要走了,就想给他算一个礼物吧,就是呃,留下一点这个在德国留学的记忆就谁知道呢,就很多很多年之后,成龙已经在华为做到大佬的级别,大家呃这回顾的时候啊,成龙当当年在德国求学的这个心路历程,可以听一听。
当时的当时的一个总结,当时的说法。
你来德国留学,然后你读博的这个过程,你觉得是是一个怎么样的反馈呢?
就是你觉得这段经历对你的人生有什么会让你成长吗?
就是你你会怎样总结这段赌博的过程?
升华了,同学们,升华了啊!
对。
要是推不推荐我们的这个听众朋友们也说个重蹈覆辙。
对,就比如说我们的听众里面也许有就是不是也许有。
可能有,有人有人明确地问过我这个问题,你知道吗?
对,甚至甚至可能有我们的听众,他们的孩子都快要来中国留学了。
那个你对你可以,你可以对你介绍一下你的这个心路历程,然后你你你会推荐他们走,你走过路吗?
嗯如如果就是如果我自己评价走过这条路的话,我肯定是觉得我是觉得挺开心呃走过这几年的,然后我也觉得成长了很多。
但是我觉得其实比起选择走哪条路来说,嗯,我觉得整个的那个心态和人的状态更重要一些。
就包括之前聊到怎么来的德国呀,怎么选择的滑雪,怎么读的博,就是我都是觉得就挺随机的。
嗯,我觉得我自己的一个优点就是,反正我选这条路的时候,不管我当时偏向还是不偏向,然后我选了之后还能比较用一种正常开放的状态去走这条路,我觉得结果不会太差。
所以你如果说推荐的话,我还挺推荐的。
那你在读播过程中有过很绝望的时候吗?
就是你会觉得你会怀疑人生吗?
因为有时候会在某些渠道看到有些刘德的学生在抱怨说我为什么要来读这个国家这么难的课程,然后呃,压力这么大,没有朋友,然后没有没有娱乐,然后又会失去方向。
你会有这样的时刻吗?
如果只就读博这件事情来说的话,首先我觉得就得想想清楚你喜不喜欢这件事情,你像 real, 他读了一下,觉得自己不适合,立马弃坑,我觉得这个是最正确的。
如果你能走进这个过程中去的话,剩下的路其实你也不会觉得太艰难。
在很多时候,我觉得大家其实是选了不适合自己的路。
我也有认识一些赌博的,如果是我主观的感觉的话,我觉得他可能不太适合走这条路,但是他还一直坚持在那里就可能会比较痛苦。
再一个就是回到读我本身这个事情来说的话,每一个博士生我觉得中间都会要经历一段自我否定的过程,这个我在我身边的同事身上就是,每一个人都是这样的。
基本上你刚开始肯定是抱着对某一个事情的热情和兴趣去做这个事情,你会觉得哇,这个东西很伟大,很有意思,然后你就做做做,然后做的中间,当你对他的认识慢慢增多了之后,有一段时间你会觉得这东西好像没什么意义,也没什么意思,我花了这么多时间好像就做了一坨。
嗯,对,然后你需要再经历一个过程重新去认识他,可能就是退掉那种过度的积极和过度消极的这个东西之后再认识他,这个过程我觉得是都必须要经历的。
七肯之前要想一想这个是常见现象对吧,并不是你个体独有的问题。
对,我甚至于就是我自己的经历。
到现在为止我对很多事情都是这样,包括滑雪也是。
刚开始我觉得滑雪特别的有意思,特别酷,特别上头,然后中间有一段时间就觉得滑雪什么意思,你就在那雪道上乱蹦的,然后就会经历了一个从极其呃 positive 到极其 negative 的过程,然后再重生一下啊,就到一个新的比较,一个新的状态。
怎么感觉有点像聊人生了?
这我们节目就是这样的。
我们不是一个知识类的节目吗?
不不不不,我们是个娱乐节目哦。
你你没有听我开头说的吧,就是我,虽然我们号生硬核,但是也没有什么干货,大部分时候我们都是在传播失货的,就是谈不上什么人生失败学传播者,但是我觉得就是你,因为有时候你纯谈技术,或者是纯粹聊这个太干的事情,你会觉得嗯。
比较枯燥。
枯燥是一方面,主要是你会失去对一个人的立体认知,就比如说我们请这个程序员来做访谈,其实大部分时候这你你说每个人做的事情对于都是对于他来说非常有意义的,但是在听众听来可能就是了解一下,哦,就这样。
但是如果聊起来人生的话,大家会觉得会,会更有共鸣,然后会更能更鲜活的对会会会更想要代入一点,然后也会说,就是对你的了解也会更全面更立体一点。
嗯。
就我觉得可能更多还是说给同样在这个泥泽里面坑里面挣扎的朋友们看一下,就是说诶,过来的人是怎么样的一个心态和一个感悟吧,因为很多时候他有时候在这个坑里面他觉得挺绝望的,就也需要有一些第三方的角度去看这个问题,去看这个事要不要走这条路,对吧,该什么时候弃坑,要不要弃坑,对吧,确实就可能给大家更多的这种借鉴的意义要多一些。
该弃就弃,喜欢就继续哈哈哈。
不,我觉得不你在你在弃坑之前,你在弃坑之前一定要想出想,想明白你出了坑之后要干嘛,因为就有时候弃坑本身就是一个坑你你本来可能有开始一条路,你觉得自己走不下去了,但是你从那条路上出来,你站在一个十字路口,你不知道下一条路是什么,这个状态同样是很折磨一个人的。
对,其实我我自己现在也有点这种状态,就是当你结束了一个事情之后要站在一个新的路口的时候,会有点挺迷茫的感觉,因为你面前的每一个选择你只能看得见,但是你根本就摸不着他是什么感觉,然后就也挺迷茫的。
我就是说两眼一闭往前冲呗。
对,也只能这样做了,所以我就觉得有时候其实选择不是那么那么重要,就是你选了你觉得 OK 的一个方向,然后就一个好的状态走下去就行,实在不行就再换。
我们这期差不多就这样吧。
嗯,我们在这里预祝成龙回国工作先。
先答辩顺利。
是答辩先顺利。
反正预答辩这么顺利,我觉得答辩应该也没什么好的呃唉对了,陈龙,你在你工作的那个,那个锁叫什么?
2012 实验室?
2012 实验室 OK, 2012 是怎么来?
我也不知道,我当时就是查过很多资料,为什么叫 2012,一直没有得到一个答案。
说是那个老老任在看了这个 2012 这个店以后得到的启发,所以叫了啊。
末日实验室是吗?
危机感啊就未来嘛。
对未来的一些一些这个想法对那反正中华有为吧希望哈哈哈。
成龙回去下半年可以在杭州约到了对吧?
哦?
你是在上海对吧?
我在深圳啊!
深圳 OK!
你可以找成龙教你滑雪!
如果你想要试一试深圳哪里有雪?
深圳有融创!
广州有一个很很大的室内学生对啊真的吗?
对对对我还不知道哈哈哈 oh my god!
对对你可以!
你可以尝试一下真的!
我这强行安利一下你你你你去试一次试一次再回来告诉我行不行!
你们也可以!
你们也可以去约日本因为中国就是你去从从杭州去日本滑雪还是蛮方便的而且杭州附近就有一个叫什么桥波滑雪场也是蛮好的 OK 怎么又扯回滑雪了总之滑雪几滑雪脂嘛,很正常对对我跟黄成龙还是滑雪的朋友就是我们是第一次就是聊跟他工作相关的一些一些事情但是我觉得还是嗯对定位还是在滑雪的朋友哈哈哈 OK, 您刚刚收听到的节目是内核恐慌,一档尽量贴近计算机科技主题的娱乐 podcast。
我们号称硬核,但是也没有什么干货,想听人听,不想听就别听。
我们的网址是 PIN Dot ICU, 您可以在网站上找到订阅我们节目的方法以及联络我们的方式。
如果您期待我们更频繁的更新节目,欢迎您到爱发电为我们捐款,详情可以在我们的网站上找到。
先发店,后催更,文明催更,从你做起。
如果您觉得意犹未尽,也可以去收听 Rio 和黄海主持的节目风头圈, Rio 和任宁节主持的节目提前怀旧,以及不基本不由我主持的节目自弹自唱 weirturnelpanic the whole system just crash。