Credit Karma专家分享AI治理框架实战经验

并非每家公司都具备Intuit旗下Credit Karma的规模与技术实力，但该公司数据科学负责人为其他企业规划AI治理框架提供了可借鉴的起点。

Credit Karma能够使用Intuit的GenOS AI操作系统，该系统包含AI模型、智能体和软件开发工具目录。在GenOS的辅助下，Credit Karma团队近期创建了多智能体系统，在允许AI输出进入生产环境前自动进行审查。

这些技术构成了由Credit Karma数据科学与工程高级总监Madelaine Daianu领导的AI合规计划的基础。但她强调，这些努力始于人工协作实践，这是所有公司都能够且必须效仿的，因为每个企业和行业都需要制定量身定制的方法。

“在创新与安全、合规或任何相关因素之间找到平衡至关重要，在快速推进前适当放缓脚步非常关键，“Daianu表示，“让内部红队去破坏LLM生成的响应并从中学习，为您的用例开发全面、定制的评估框架。”

在Credit Karma，通过红队测试打破由大语言模型驱动的工作流并识别其弱点后，团队设计了一套五步AI治理评估框架：

“在这个框架中，合规性环节需要我们极度创新，因为手动检查LLM生成的摘要将耗费大量时间，“Daianu解释说，“例如对于信用卡，我们需要确保准确呈现该卡与合作伙伴品牌对应的权益。为此，我们必须从摘要中提取与利率或费用相关的字段。”

这正是多智能体系统的用武之地。 specialized AI智能体检查LLM生成摘要中的每个特定数据字段，确保其向用户的展示符合合作伙伴品牌要求。在评估框架的这个及其他阶段，LLM还被用于评判智能体组的整体响应质量。

这些模型通过Credit Karma客户成功团队的人工反馈进行训练，该团队仍会执行抽查。据Daianu介绍，AI智能体只是将评估过程重新应用于新摘要，速度提升高达50倍。

然而，Daianu强调在评估AI工具时避免过度使用同样重要：“我们在框架的某些环节使用GenAI作为评判者，特别是在合规方面，但并非所有环节都适用。对于AI安全性，我们可以使用传统机器学习。不过度依赖GenAI很重要，因为这通常能提供更好的准确性、可解释性，且不那么像黑箱。”