公共部门AI工具Humphrey:效率提升还是数字误导?

英国政府推出名为Humphrey的AI工具包,旨在通过自动化行政任务和数据处理提升公共部门效率,但面临数据质量、AI幻觉和员工数字素养等挑战。本文探讨其潜在效益与风险。

我们应该信任Humphrey提升公共部门效率吗?

工党将赌注押在名为Humphrey的AI工具包上(其名称源自《是,大臣》角色),以推动公共部门效率提升。

在一项官僚智慧的巧妙转折中(《是,大臣》粉丝会欣赏这一点),公务员系统正在推出一套名为——没错——Humphrey的人工智能(AI)工具。

该AI倡议以汉弗莱·阿普比爵士(Sir Humphrey Appleby)命名,这位“乐于助人”的公务员实际上是通过合作进行阻挠的大师。该计划旨在简化服务、减少延误,并帮助公共部门每年释放450亿英镑的生产力增益。

但对于熟悉BBC经典剧集的人来说,这一名称选择感觉不像是对创新的致敬,而更像是一个警示故事。因为就像其同名角色一样,这位新的数字公务员可能最终会微妙地将我们引向错误方向。

Humphrey AI是一套工具,包括Consult、Parlex、Minute、Redbox和Lex,针对官僚痛点:重复管理、数据孤岛和决策缓慢。如果执行得当,它可以减少对外部顾问的需求、加速决策并提升公众体验。

这是将国家带入数字时代更广泛倡议的一部分。它将通过提供在线数据处理、自动化日常行政任务和加速耗时的研究(这些研究可能拖慢政策制定)来简化公共部门的流程。通过实现安全、可互操作的数据流,Humphrey可以改善公民体验,同时降低公务员成本并克服对处理和数据分析外部顾问的依赖。

不,大臣,AI无法解决您自己的数据问题

然而,《是,大臣》中有一个教训仍然适用——一个善意的助手可能在显得有帮助的同时误导人。这对于最新一代AI工具尤其如此。这些系统的好坏取决于喂养它们的数据。还有越来越多的证据表明,随着其推理和其他专业能力的提高,这些系统倾向于更多“幻觉”。 poorly curated数据集可能导致AI工具提供听起来自信但荒谬的结果,这对公众信任构成严重风险。

一个引人注目的例子涉及一个基于14万条内部Slack消息训练的GPT-3.5模型。当被提示编写内容时,它回应:“我将在早上处理。” Smart Connections插件没有执行任务,而是模仿了其训练数据中嵌入的拖延习惯。它执行了一个完全不同于预期的功能,使用了一个根本不适合的数据集,尽管该数据集由于其规模而表面上显得合适。

除了拥有正确的训练数据外,AI还需要访问AI就绪、治理良好的任务相关数据集。尽管在data.gov.uk等平台上有大量开放数据,但其中大部分不易用于训练或微调AI系统。开放数据研究所(ODI)最近的分析显示,截至2024年4月,大多数AI模型使用的关键公共数据集并未充分利用此类政府门户发布的统计和其他权威数据。

从data.gov.uk抓取的13,556页包含在像CommonCrawl这样的流行AI数据集中,很少有助于准确回答公民关于公共服务的问题。在195个此类公民问题中,AI模型仅在五个案例中正确引用了data.gov.uk的统计数据。相反,它们依赖次要或不可靠的来源,如社交媒体帖子或观点文章,或干脆编造答案。这种脱节是危险的:它为政府部署的AI工具生成错误信息打开了大门。

一个原因是政府数据通常不以AI就绪格式发布,例如缺乏机器可读的元数据或可访问的摘要,这基本上使信息对AI模型不可见。此外,我们对AI驱动的数字服务应优先考虑哪些来源的理解有限。与上一代AI工具(如传统搜索引擎)为确保公民关于公共服务的问题将政府页面和其他权威来源排名高于次要信息而实施的技术解决方案相比。我们才刚刚开始生成式AI的旅程。

数字化糟糕决策

使用AI处理数据、研究政策或编写文档需要了解这些技术的工作原理、它们依赖的数据及其局限性。这是工作人员验证AI输出的唯一方式。然而,哈佛商学院的研究人员发现,虽然AI提供真实价值,但其不可预测的故障点使利益和风险难以衡量,对个人、组织和政府都是如此。

上一届保守党政府发布的《国家数据战略》承认了诸如“领导力分散和各级数据技能缺乏深度”以及过度强调误用数据风险的文化等问题,导致“数据长期未充分利用和对其价值的可悲缺乏理解”。这迫切需要改变。如果公务员不理解AI的工作原理,他们如何质疑其输出?

高层理解不足具有特别后果。例如,学校缺勤数据跟踪数据点,如年级组和弱势背景指标,如“需要帮助的儿童”状态,但忽略了细粒度细节,如神经多样性,尽管有证据表明,出勤困难儿童中很大比例是自闭症。这使政策制定者看不到许多长期缺勤学生是自闭症的事实,鼓励了像家长罚款这样的惩罚性回应,而不是量身定制的支持。更好的AI素养,辅以深思熟虑地使用AI工具本身,可以帮助公务员不仅理解数据,而且学习如何质疑它。

其他国家已经在前进。例如,爱沙尼亚引入了Bürokratt,一个旨在减少公务员工作量和加速服务交付的AI聊天机器人。但关键的是,爱沙尼亚不仅投资工具;它还投资培训员工。爱沙尼亚经济事务和通信部推出了数字国家学院,为公务员提供关于数字治理、AI和数据处理的免费课程。

英国应注意。虽然已有努力提升英国公务员技能,但大多数倡议侧重于高级数据技能,而非全面所需的基础数据素养。政策制定者不需要用Python编码,但如果他们无法发现数据集中的偏见或质疑AI的输出,那么再多的自动化也不会带来更好的决策。它只会将糟糕的决策隐藏在光滑的数字界面后面。

简化“吱吱作响的旧官僚机器”

1980年,大臣吉姆·哈克在《是,大臣》中乐观地宣布:“我们将切断所有红胶带,简化这台吱吱作响的旧官僚机器”。四十多年后,政府希望AI最终实现这一承诺——并在此过程中推动广泛的经济增长。仅公共部门,技术大臣彼得·凯尔估计,如果公务员系统成功采用AI,公共部门将获得“450亿英镑的意外之财”。要解锁这一点,需要投资,不仅投资像Humphrey这样的工具,而且投资培训和支持其使用的基础设施。

ODI呼吁制定一个10年国家数据基础设施路线图来实现这一点。该路线图将通过关注三个支柱——互操作性、AI就绪数据和隐私保护技术——来支撑AI机会行动计划。虽然该计划设定了强方向,但缺乏关于如何设定和监控标准以及如何资助基础数据基础设施的细节。

关于用于训练和操作公共服务的AI的数据集的来源和谱系的透明度至关重要。没有它,我们无法审查AI如何影响我们生活的决策。为了建立公众信任,我们需要探索关键数据集的参与式管理,以便受公共部门算法影响最大的人可以帮助塑造其数据的使用方式。

这就是像ODI的新AI就绪数据框架这样的框架至关重要的地方。它设定了四个核心原则,用于准备数据集以在AI中有效和合乎道德地使用:技术优化、数据质量和标准、法律合规性和负责任收集。它超越了像FAIR(可查找、可访问、可互操作和可重用)这样的通用原则,指向非专业数据发布者可以遵循的实际步骤,以确保数据不仅机器可读,而且有意义、合法和公平。

为了利用数据促进公共利益,我们必须长远思考,建立坚实的数据基础,并最重要的是,对数字化功能障碍的风险保持警惕。否则,白厅最强大的新公务员将不是人类,而是一个名为Humphrey的AI。就像其同名角色一样,它将显得无限有帮助,同时微妙地塑造结果以适应其训练的数据。公务员有可能成为现代的吉姆·哈克,勇敢地试图简化一台吱吱作响的旧机器,同时被他们的新数字同事悄悄智取。

埃琳娜·辛珀尔是ODI的研究主任。

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计