机器学习让计算机拥有嗅觉感知能力

一家研究机构通过图神经网络构建了气味分子映射模型,能够预测分子结构对应的气味特征。该技术不仅可用于香水创新,还具有开发新型驱虫剂和疾病诊断工具的潜力,为计算机嗅觉感知奠定基础。

机器学习能否让计算机拥有嗅觉?某研究机构正在尝试

某研究机构的工作得到了某中心语音基金的支持,这项研究在从香水到疾病检测等多个领域都具有重要应用价值。

Alex Wiltschko在12岁时购买了第一瓶香水Azzaro pour Homme。他在自己最喜欢的书籍——Luca Turin所著的《香水指南》中读到过这款香水,并在当地的TJ Maxx以超低价购得,这让他兴奋不已。这瓶香水成为他大量收藏中的第一件。Wiltschko自记事起就一直对气味着迷。“这是我的天性,“他说。他的另一个爱好?计算机。“在青少年时期,对香水和计算机的兴趣并不是社交成功的秘诀,“他补充道。

然而,这却造就了Wiltschko深入研究嗅觉神经科学和尖端机器学习的人生轨迹。这种结合使Wiltschko走在了数字嗅觉这一新兴科学领域的最前沿——即让计算机拥有嗅觉。

Wiltschko现在是Osmo的首席执行官,这家机构是从某大型科技公司研究部门分拆出来的,位于马萨诸塞州剑桥市。2022年9月,该公司获得了6000万美元的初始资金,其中包括来自某中心语音基金的投资。

短期来看,Osmo旨在开启商业香氛创新的新时代。长期而言,该公司设想其技术有潜力通过开发更好的驱虫剂,甚至是通过检测人呼吸中的严重疾病来进行数字诊断工具,从而拯救生命。

主要气味图谱

所有这一切的关键在于团队的突破性进展:创建了所谓的主要气味图谱(POM)。

在视觉能够被数字化之前,需要一种称为RGB的图谱:它显示了每种颜色如何由不同比例的红、绿、蓝组成。在Osmo分拆出来之前,Wiltschko的团队在气味方面做了类似且卓越的工作。他们使用机器学习将分子结构直接映射到人类如何感知该分子气味的方式上。换句话说,他们建立了一个模型,只需观察分子就能告诉你它闻起来是什么味道。这就是POM。

“这对我们来说是一个’顿悟’时刻,类似于通过气味图灵测试。我们构建了具有真正商业价值的东西,并经过充分验证可以推向世界,“Osmo首席产品官Jon Hennek表示。

技术实现方法

以下是他们创建POM的方式,以及关键的是,他们如何证明它是有效的。他们首先使用来自多个香精和香料数据库的约5000个分子训练了一个图神经网络(GNN)。所有这些分子的气味都有详细记录,含有多个人类判断的气味标签,如牛肉味、花香味或薄荷味。由此,模型能够学习分子结构和气味之间的联系,而无需了解人嗅闻气味时鼻子或大脑中实际发生的情况。

这已经很了不起了。关键问题是,POM能否推广到仅基于分子结构来预测它从未见过的分子的气味?而且能否做到与训练有素的人类评估者一样好,这是气味表征的黄金标准?为了找出答案,团队选取了POM之前未见过的400多种气味分子的多样化集合,并让模型盲目预测它们的特征。然后一组训练有素的人类评估者嗅闻并标记了这些相同的气味。

当Osmo团队比较结果时,他们感到高兴。模型不仅成功预测了这些未见分子的气味,与训练有素的人类一样好,而且其预测的气味特征比任何个别小组成员更接近小组的平均结果。

气味岛屿

POM不是典型意义上的地图,但可以与RGB地图相比较。在二维颜色地图上随机选取两个点。这两个点越接近,颜色越相似。POM中的气味也是如此,尽管这个地图存在于令人费解的256维中。例如,所有闻起来像郁金香的分子都彼此接近。闻起来像白兰地的分子也是如此。

“稍微放大一点,所有的花都彼此相邻。在这个气味地图中有一个完整的花卉泛大陆!我们没有告诉它这样做,“Wiltschko说。这种分组也适用于木材、面包店类型的气味、酒精气味等等。我们的大脑似乎以嵌套的层次结构组织气味,Wiltschko说,所以玫瑰气味在玫瑰类别内,在花卉类别内,在植物类别内,在愉快类别内。

“我们能够在POM中观察到这一点而没有告诉它,这是令人惊讶的,“他说。

商业应用前景

虽然Wiltschko对Osmo技术的未来有大胆的想法,但首要任务是将公司建立在坚实的商业基础上。目前,Osmo专注于为全球香氛类别开发新成分。

Osmo团队正在使用POM探索气味分子的世界——数十亿个分子——并专注于POM预测具有有趣和强烈嗅觉特征的分子。

“我们在这方面比世界上任何人都做得更好,“Hennek说。“因为我们不是从经验法则和化学直觉开始,而是从我们可能合成的每个分子的气味预测开始。这让我们找到化学家可能从未考虑过的分子。”

团队正在与顾问合作,包括法国调香大师Christophe Laudamiel,潜在客户包括香料公司和包装商品公司。

“我们反复收到反馈,我们的成分有潜力在商业上非常成功,“Wiltschko说。“这闻起来像是产品/市场契合。“主要想法是将这些分子授权给香料公司。

这是一项及时的努力。全球香氛类别价值超过100亿美元,并且稳步增长。但一些传统成分,如檀香油,可能导致过度采伐或其他生态危害,而随着对更安全、更可生物降解产品的需求增长,其他成分的特性越来越不足。

借助POM,Osmo正在为安全、合成香味的调色板铺平道路,这些香味使用环保且易于合成的分子重现自然气味。为此,Osmo正在研究仅由少数原子组成的组合:碳、氢、氧、氮、磷和硫。

“然后我们将它们带入我们的实验室,进行类似于药物发现流程的过程,“Hennek说。“我们正在努力获得这些分子的监管批准。”

图神经网络的兴起

所有这一切在大约过去六年才成为可能。Wiltschko说,启动这个科学项目的核心见解是,由于最近GNN的兴起,机器学习"在分子方面变得非常擅长”。

以前,机器学习方法主要将输入——如图像或数据数组——转换为矩形或数据网格进行处理。分子不适合这种模式:一个分子可能是两个原子,也可能是20个原子,具有完全不同的结构和连接性。它们根本不能简化为矩形或网格。

相反,分子中的原子可以被视为节点,它们之间的化学键可以被视为边,形成图结构。这种表示允许GNN建模和处理分子数据。

“这些技术中的一些是由我在某大型科技公司的朋友开发的。所以,这是一个极好的、肥沃的土壤来开始探索这个想法,“Wiltschko说。

拯救生命的潜力

以蚊子为例。能否使用POM来找出什么气味能驱除这些携带疾病的昆虫?

为了找出答案,他们用额外的数据源增强了POM。第一个是一份被遗忘已久的美国政府报告,发表于1940年代,其中包含测试19,000种化合物的蚊虫驱避性结果。第二个是由开发疟疾控制技术的荷兰公司TropIQ提供的信息。增强的模型很快就能预测出全新的分子,其驱避性至少与最有效驱蚊剂中的活性成分DEET一样强。

更便宜、更有效、更安全的驱虫剂的开发可能对全球健康产生巨大影响。Wiltschko尚未有任何宣布,但表示这项研究正在与某基金会合作进行。

将POM应用于蚊子也是一个概念验证,Hennek说。“我们可以设想将我们的产品不仅应用于蚊子不喜欢的东西,而且应用于蟑螂不喜欢的东西。或者任何数量的农业害虫。”

捕捉气味永恒

展望未来,Wiltschko的愿景是数字化我们的嗅觉。这个想法并不像听起来那么牵强。考虑几百年前。一个视觉瞬间——你孩子脸上转瞬即逝的表情或一片开花的苹果园——能够被瞬间捕捉并以完美的颜色永远保存下来的想法,简直就是魔法思维。

到1820年代,出现了第一张照片,随之而来的是人类掌握光世界的第一步。今天,冻结那些视觉记忆并永远保存它们感觉像是一项基本权利。听觉世界也是如此。

“我们知道数字化人类感官需要什么,“Wiltschko说。“而且我们不必等待视觉所做的任何发明——特别是集成电路。”

事实上,借助现代计算能力和机器学习的利用,Wiltschko认为计算机将在一二十年内拥有"嗅觉”。需要三个阶段:“读取"气味、理解它和"写入"它。Osmo希望理解并最终策划一系列安全的合成分子,可以重现整个人类气味景观。Wiltschko说,目前,读取(感知)有气味分子需要庞大而昂贵的实验室设备,如气相色谱质谱仪,而按需写入(产生)气味在消费者层面仍然是科幻小说。

通往内部的窗口

Wiltschko说,高水平的感知和理解气味可能足以预示强大的健康应用。例如,众所周知,包括某些癌症在内的严重疾病可以通过它们对呼吸的影响来检测。能够拍摄该气味特征的快照——用Wiltschko的话说是"Osmograph”——可以揭示我们体内发生的大量情况。

“我们不知道这项技术最终是否会对医疗保健产生变革性影响,但我打赌它会的,“他说。

对Wiltschko来说非常重要的是,在未来,Osmo发展到开发临床诊断应用。“那是我心中的北极星,我们到达那里非常重要。但所需的巨大成本和人才是罕见且昂贵的,“他说。“所以,它不能是我们攻击的第一个海滩。”

随着Osmo的发展,它将寻找同样热情的人来推动使命前进。“我们发现,有一些人是秘密的气味爱好者,他们 secretly 渴望在机器嗅觉领域工作,“Wiltschko说。“只是说出来:有一个地方可以做到这一点,那就是Osmo。”

与Wiltschko和那些受启发与他一起工作的人交谈,可以清楚地看到Osmo是他终身热情的结晶。对他来说,这是情感上的。“一旦你闻到某种东西,你就无法停止从中获得的感觉。有一种非常基本的感觉和情感成分,“他说,“我认为这很美丽。”

comments powered by Disqus
使用 Hugo 构建
主题 StackJimmy 设计