图灵测试能否经得起时间考验?
四位某中心科学家就著名数学家艾伦·图灵对人工智能的定义是否仍然适用发表见解,并探讨哪些现代进展会让图灵感到惊讶。
测试的当代适用性
**Alex Smola(某机构副总裁)**认为核心问题与70年前同样重要,但建议采用更渐进的评估方式,例如通过机器能欺骗人类的时间长度来衡量进步。当前单轮查询系统已表现良好,多轮对话系统也具备相当能力。
**Yoelle Maarek(某购物研究副总裁)**指出这并非完美定义,因为缺乏对"智能"和"人类"的统一定义。但该测试仍能激发灵感,如在象棋和围棋领域的显著进展。当前研究重点包括对话购物和计算幽默等AI挑战领域。
**Nikko Ström(AI副总裁)**提出批判性观点:基于与人类智能无差别评估AI,如同根据与鸟类无差别评估飞机。智能的核心在于泛化能力——在系统设计未考虑的新情境中取得成功的能力。这需要推理规划、世界知识表征、学习记忆及目标整合等认知能力。
**Gaurav Sukhatme(计算机科学教授)**强调需要更全面理解智能的广度,包括对世界的深层理解、社交能力、共情和持续学习等多维度能力。
令图灵惊讶的现代进展
Sukhatme认为图灵会对技术产物的进展程度感到惊讶,但对其智能水平感到失望。
Maarek推测计算幽默可能令人惊讶,因为"笑是人类特有"的观点自16世纪就已存在。
Ström指出莫拉维克悖论的解决:传感器运动任务和感知任务已通过深度学习实现,但通用智能仍是未解难题。量子计算机也将令人着迷。
Smola强调数据量及其可用性是最显著差异:万亿级文本的语言模型、数亿图像资源,使语音生成、文本翻译、图像识别等技术成为可能。同时指出计算能力的指数级增长:从UNIVAC的4000 FLOPS到现代服务器的PetaFLOPS级别。
2090年仍待解决的理论问题
Sukhatme提出:人脑如何实现能效如此高的运作?意识是什么?
Maarek认为Winograd模式挑战等硬AI问题将解决,但赋予机器真正幽默感可能仍需突破。
Ström预测70年后AI将在实际应用层面解决,但NP=P问题、物理模型完整性、生命起源问题仍将困扰人类和合成科学家。外星智能生命是否存在也可能尚无定论。
Smola指出创新与个人自由保护的平衡、统计工具实证能力的完整表征、从数据获取因果理解等挑战将长期存在。同时预测自动驾驶等自主系统将取得重大进展,未来一二十年图灵测试本身也可能获得重大突破。
本文基于2021年AAAI人工智能会议背景,探讨图灵测试在现代AI研究中的持续影响与局限性。