机器推理三大挑战与突破

本文深入探讨机器推理领域的三大核心挑战:自然语言到结构化语言的转换、真理定义问题以及确定性推理的复杂性,并介绍某中心通过自动推理检查功能在Bedrock Guardrails中的创新解决方案。

机器推理的三大挑战

生成式AI的兴起使得机械化推理领域迎来前所未有的发展机遇。计算机行业乃至公众开始关注逻辑学家长年探讨的核心议题:语言、语法、语义、有效性、健全性、完备性、计算复杂性甚至不可判定性。这些曾经晦涩的学术概念如今已成为热门话题。

挑战一:自然语言到结构化语言的转换

人类交流常使用不精确且模糊的语言,依赖上下文进行消歧。当涉及关键信息时,人们会尝试澄清(“你的意思是……?"),但有时即使应该澄清也不会这样做。

例如:雇主将HR福利资格定义为"拥有0.2全职等效(FTE)或以上的雇佣合同”。如果某人声称"我花费20%时间在工作,除了去年请假协助家人手术恢复",该人员是否具备福利资格?“花费20%时间在工作"是否意味着按照合同约定投入20%工作时间?

这种陈述存在多种合理解释,每种解释对福利资格产生不同影响。自动推理检查采用互补方法,多次尝试将自然语言转换为查询谓词。这类似于面试技巧:通过不同方式询问相同信息,验证事实一致性。系统使用形式逻辑求解器证明/反证不同解释的等价性。如果语义层面存在差异,应用可要求用户澄清(“请确认您拥有20%或以上全职时间的雇佣合同”)。

自动推理检查使用大语言模型生成自然语言到形式语言的多种可能转换,并标记转换间的差异,用户可通过自然语言交互解决这些差异。

挑战二:真理定义难题

群体就规则含义达成共识异常困难。复杂规则和法律常存在细微矛盾,直到需要解释共识时才被发现。例如英国《1988年版权、设计和专利法》存在内在矛盾:既定义可版权作品需源自作者原创智力创造,同时保护无需人类创造性投入的作品——这种不一致在AI生成作品时代尤为突出。

第二个问题是规则持续变更。例如美国联邦政府的每日津贴费率每年变化,依赖这些值的系统需要持续维护。

最后,很少有人真正深入理解所遵守规则的所有边界情况。以驾驶时佩戴耳机为例:阿拉斯加州违法;佛罗里达州允许单耳佩戴;德克萨斯州完全合法。非正式调查显示,很少有人在最近驾驶地区清楚了解相关合法性。

自动推理检查通过帮助客户在其关注领域(税法典、HR政策等规则系统)定义真理应有的样子,并提供随规则变化持续优化定义的机制来解决这些挑战。随着基于生成式AI的聊天机器人出现,通过自然语言查询使复杂规则系统对公众可访问成为可能。未来聊天机器人可直接回答"在日本东京驾驶时能否掉头?“等问题,而自动推理检查通过解决真理定义挑战确保答案可靠性。

挑战三:确定性推理的复杂性

假设有规则集R需验证陈述S。例如R是新加坡驾驶法规,S是关于新加坡交叉路口掉头的问题。我们可以通过组合布尔变量将R和S编码为计算机可理解的布尔逻辑。

假设编码R和S仅需500位(约63字符),这是极小的信息量!但即使规则系统编码小到可放入短信,需要检查的场景数量却天文数字。原则上必须考虑所有2^500种可能组合才能权威声明S为真。现代强大计算机眨眼间可执行数亿次操作,但即使用全世界计算机从宇宙诞生开始以这种速度运行,至今仍无法检查所有2^500种可能性。

幸运的是,自动推理社区开发了称为SAT求解器的复杂工具,使得这类组合检查在许多(非所有)情况下可能且异常快速。自动推理检查在验证陈述有效性时使用这些工具。

但并非所有问题都能以发挥SAT求解器优势的方式编码。例如规则系统规定"如果每个大于2的偶数都是两个质数之和,则预扣税率为30%;否则为40%"。问题在于要知道预扣税率,需要知道每个大于2的偶数是否都是两个质数之和——这就是1742年提出的哥德巴赫猜想,至今无人知道真假。虽然不知道答案,但知道要么真要么假,因此可以确定预扣税率必为30%或40%。

有趣的是考虑用户能否定义依赖于自动推理检查输出的策略。例如策略编码规则"当且仅当自动推理检查说不允许时允许访问”。这里没有正确答案,因为规则通过递归引用自身检查过程创造了矛盾。最多只能回答"未知”(这确实是自动推理检查在此情况下的回答)。

类似自动推理检查的工具无法对此类陈述返回"真"或"假"的事实,最早由库尔特·哥德尔在1931年发现。根据哥德尔结果,此类系统无法同时保持一致性和完备性,必须二选一。我们选择保持一致性。

技术实现路径

2025年8月6日Bedrock Guardrails推出自动推理检查功能,通过组合互补方法应对这些挑战:应用交叉检查方法将模糊自然语言转换为逻辑谓词;提供灵活框架帮助客户开发和维护规则系统;采用复杂SAT求解器同时谨慎处理无法获得明确答案的情况。通过提升产品在这些挑战上的性能,不仅推动技术进步,还深化了对从哥德尔不完备定理到法律政策框架演变等推理基本问题的理解。

在追求健全推理的道路上,AI领域的前路充满挑战——而我们已做好准备迎接这些挑战。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计