#21 李飞飞 AI 重塑我们看待世界的方式 | From Paul G. Allen School

2024/2/4

第三浪 SurgeLong

Shownotes Transcript

👋 来互动

🕵️ 听本期英文原声

What we see and what we value: AI with a human perspective—Fei-Fei Li (Stanford University)

🎸 背景音乐

Moonlight - Red Dead Redemption 2

👫🏽 本期对谈人 & 发言人

Fei-Fei Li: 李飞飞教授最为人所知的成就之一是ImageNet项目，这是一个大规模的图像识别数据库，对推动深度学习技术的发展起到了关键作用。她的研究工作不仅在学术界产生了重要影响，也在实际应用中产生了广泛的社会价值，特别是在医疗保健、自动驾驶汽车和图像识别等领域。

📝 目录

李飞飞教授简介
寒武纪大爆发与视觉智能的进化
计算机视觉的历史与发展
人类视觉识别的快速与精准
物体识别的三个发展阶段
ImageNet项目及其影响
视觉关系与Visual Genome项目
视觉智能在医疗保健中的应用
计算机视觉中的偏见与隐私保护
以人为中心的AI策略与斯坦福人本人工智能研究所
未来展望：AI的深化应用与视觉技术的革命
对话环节：AI在图像计算机视觉领域的前沿进展
对话环节：语言模型与图像领域的挑战
对话环节：数据集的多样性与偏见问题

💁🏻 本期（不完全）提及人物 & 事物

Ranjay Krishna: 李飞飞的学生，曾在谷歌担任副总裁，是谷歌云平台AI与机器学习首席科学家。
Andrew Parker: 澳大利亚动物学家，提出了关于寒武纪大爆发的一个领先理论，认为视觉能力的快速进化是导致物种多样性急剧增加的原因。
Jaden: 李飞飞的学生，与李飞飞共同推动了ImageNet项目。
Biederman教授: 认知心理学家，研究视觉并探讨了人类视觉智能的规模和广度，提出了人类一生能够识别的物体类别数量的估计。
Randy: 李飞飞的学生，推动了关于图像和视觉表征的新思维方式，特别是在视觉关系上的研究。
Andrej Karpathy: 李飞飞的前学生，与Justin Johnson等人在图像描述、密集描述和段落生成方面发表了开创性的论文。
Huancarlos Neablos: 负责结合硬件和软件来保护人类隐私，同时识别重要人类行为的研究者。
Joy Blue Windy: 曾在麻省理工学院的人，创作了揭露计算机视觉偏见的诗歌。
Ted Adelson: MIT的研究人员，创作了著名的视觉错觉，如棋盘错觉。
George Miller: 创建了多语言词汇分类体系，使得图像数据集能够向多种语言转换。

✂️

ImageNet项目：由李飞飞和她的团队发起的一个大规模视觉识别挑战，旨在创建一个包含大量图像和对应标签的数据集，推动了计算机视觉和深度学习领域的发展。
寒武纪大爆发：地球历史上的一个时期，大约5.4亿年前，生物种类数量在短时间内急剧增加，被认为是生物多样性的起源。
视觉智能：指生物体（如人类和动物）通过视觉系统获取、处理和理解环境信息的能力，是生物进化中的关键因素。
卷积神经网络（CNNs）：一种深度学习模型，特别适用于处理具有网格状拓扑结构的数据，如图像，是现代计算机视觉的核心技术之一。
Transformer模型：一种深度学习模型，最初用于处理自然语言处理任务，但后来也被应用于计算机视觉等领域，因其强大的序列建模能力而受到关注。
Visual Genome项目：旨在创建一个包含丰富视觉信息的数据集，包括图像、图像中的对象、属性以及对象间的关系，以促进视觉理解的研究。
环境智能：利用智能传感器和机器学习算法来监测和理解环境，特别是在医疗保健领域，以提高护理质量和效率。
VoxPoser项目：专注于探索机器人在自然环境中执行任务的能力，如开门等，旨在实现机器人学习的泛化和适应性。
CPN（Commonsense Physics Network）：一个研究项目，旨在为机器人学习创建一个逼真的模拟环境，以促进机器人在真实世界中的学习和应用。
HAI（Human-Centered AI Institute）：斯坦福大学的一个研究所，专注于开发以人为中心的人工智能，强调AI技术应增强而非替代人类能力。

#21 李飞飞 AI 重塑我们看待世界的方式 | From Paul G. Allen School 47:19 Share

第三浪 SurgeLong

Shownotes Transcript

#21 李飞飞 AI 重塑我们看待世界的方式 | From Paul G. Allen School