👋** 来互动**
🫸** **Flow_第三浪 @Linktree )
🫸 Flow_第三浪 @即刻)
🕵️** 听本期英文原声**
🎸** 背景音乐**
👫🏽** 本期对谈人 & 发言人**
📝** 目录**
李飞飞教授简介
寒武纪大爆发与视觉智能的进化
计算机视觉的历史与发展
人类视觉识别的快速与精准
物体识别的三个发展阶段
ImageNet项目及其影响
视觉关系与Visual Genome项目
视觉智能在医疗保健中的应用
计算机视觉中的偏见与隐私保护
以人为中心的AI策略与斯坦福人本人工智能研究所
未来展望:AI的深化应用与视觉技术的革命
对话环节:AI在图像计算机视觉领域的前沿进展
对话环节:语言模型与图像领域的挑战
对话环节:数据集的多样性与偏见问题
💁🏻** 本期(不完全)提及人物 & 事物**
Ranjay Krishna: 李飞飞的学生,曾在谷歌担任副总裁,是谷歌云平台AI与机器学习首席科学家。
Andrew Parker: 澳大利亚动物学家,提出了关于寒武纪大爆发的一个领先理论,认为视觉能力的快速进化是导致物种多样性急剧增加的原因。
Jaden: 李飞飞的学生,与李飞飞共同推动了ImageNet项目。
Biederman教授: 认知心理学家,研究视觉并探讨了人类视觉智能的规模和广度,提出了人类一生能够识别的物体类别数量的估计。
Randy: 李飞飞的学生,推动了关于图像和视觉表征的新思维方式,特别是在视觉关系上的研究。
Andrej Karpathy: 李飞飞的前学生,与Justin Johnson等人在图像描述、密集描述和段落生成方面发表了开创性的论文。
Huancarlos Neablos: 负责结合硬件和软件来保护人类隐私,同时识别重要人类行为的研究者。
Joy Blue Windy: 曾在麻省理工学院的人,创作了揭露计算机视觉偏见的诗歌。
Ted Adelson: MIT的研究人员,创作了著名的视觉错觉,如棋盘错觉。
George Miller: 创建了多语言词汇分类体系,使得图像数据集能够向多种语言转换。
✂️
ImageNet项目:由李飞飞和她的团队发起的一个大规模视觉识别挑战,旨在创建一个包含大量图像和对应标签的数据集,推动了计算机视觉和深度学习领域的发展。
寒武纪大爆发:地球历史上的一个时期,大约5.4亿年前,生物种类数量在短时间内急剧增加,被认为是生物多样性的起源。
视觉智能:指生物体(如人类和动物)通过视觉系统获取、处理和理解环境信息的能力,是生物进化中的关键因素。
卷积神经网络(CNNs):一种深度学习模型,特别适用于处理具有网格状拓扑结构的数据,如图像,是现代计算机视觉的核心技术之一。
Transformer模型:一种深度学习模型,最初用于处理自然语言处理任务,但后来也被应用于计算机视觉等领域,因其强大的序列建模能力而受到关注。
Visual Genome项目:旨在创建一个包含丰富视觉信息的数据集,包括图像、图像中的对象、属性以及对象间的关系,以促进视觉理解的研究。
环境智能:利用智能传感器和机器学习算法来监测和理解环境,特别是在医疗保健领域,以提高护理质量和效率。
VoxPoser项目:专注于探索机器人在自然环境中执行任务的能力,如开门等,旨在实现机器人学习的泛化和适应性。
CPN(Commonsense Physics Network):一个研究项目,旨在为机器人学习创建一个逼真的模拟环境,以促进机器人在真实世界中的学习和应用。
HAI(Human-Centered AI Institute):斯坦福大学的一个研究所,专注于开发以人为中心的人工智能,强调AI技术应增强而非替代人类能力。