我作为播客主播,在2024年7月19日微软Windows蓝屏事件后,紧急录制了这期节目。这次事件不仅导致个人电脑蓝屏死机,更严重的是微软Azure云服务中断,引发航空、医疗、金融等多个领域的瘫痪。这反映出数字化系统和基础设施的脆弱性,以及我们对这种脆弱性的应对。
我认为,这次事件并非简单的技术故障,而是数字化系统复杂性、高度集中化以及缺乏透明度等深层问题造成的。CrowdStrike安全软件更新与Windows系统冲突是直接原因,但更深层次的原因在于,数字系统的构建如同基特勒所言的“后现代巴别塔”,各部分之间相互依赖,却又缺乏整体的理解和控制。安全软件拥有最高权限,其更新行为不受Windows完全控制,潜在的bug在更新前难以预知。
此外,生成式AI的决策黑箱问题也与本次事件类似,我们无法完全理解系统,却不得不依赖它。这引发了对信任的质疑,以及如何降低系统性崩溃带来的影响的问题。我们需要更充分的知情权,了解系统运作方式和权责关系,并推动责任方整改。同时,我们也应该避免将所有资源依赖于单一公司或产品,以降低风险。
从历史上的空难和航天飞机事故中,我们可以看到,即使经过充分测试,也无法完全避免这类问题。数字化系统崩溃的影响范围和后果没有上限,这需要我们更加谨慎地对待数字化技术的普及。我们应该主动追求知情权,了解系统运作方式和权责关系,并推动责任方整改。同时,我们也应该避免将所有资源依赖于单一公司或产品,以降低风险。
Deep Dive