Press "Enter" to skip to content

Nature子刊:AI检测毒品准确率达86%,没见过的也能测

智东西(公众号:zhidxcom)

编译 |  程茜

编辑 |  李水青

智东西11月16日消息,本周一,据外媒NewScientist报道,加拿大哥伦比亚大学研究小组创造了一种机器学习工具——DarkNPS,可以用AI快速筛选新精神活性物质(new psychoactive substance,NPS),这是与可卡因和海洛因类似的兴奋剂药物。

 

由于NPS的化学多样性及其在非法市场上的存在时间短等性质,目前该药物的检测措施面临重大挑战。DarkNPS可以大大缩短新出现的NPS识别时间,并有效缩短对其化学结构的搜索范围。

 

该论文发表于Nature子刊Nature Machine Intelligence。

 

链接:https://www.nature.com/articles/s42256-021-00407-x

 

 

一、AI查毒只需几小时,准确率达86%

 

新精神活性物质又称“策划药”或“实验室毒品”,是不法分子为逃避打击而对管制毒品进行化学处理所得到的毒品类似物,具有与管制毒品相似或更强的兴奋、致幻、麻醉等效果。

 

加拿大不列颠哥伦比亚大学研究小组成员Michael Skinnider和他的同事创造了一种名为DarkNPS的机器学习工具,通过AI工具进行简单的分析,快速提取出精神活性“新型药物”化学结构的可能分子结构。

 

该工具可以快速开发实验室测试服务,以筛选与可卡因和海洛因等毒品具有类似效果的、且无法在当前测试中检测到的药物使用情况。

 

研究小组从世界各地的法医实验室收集了大约1700种已知新型设计药物的化学结构,对其进行训练。训练集包括每种药物的串联质谱结果,也就是翻译并分析其部分重组蛋白数据,可以提供有关分子质量及其包含的元素的信息。这使得AI能够识别串联质谱数据和化学结构之间的模式。

 

Skinnider表示:“我们的方法可以将识别NPS所需的时间从几周或几个月缩短到几个小时。”

 

给定一种以前未知的NPS的串联质谱数据,DarkNPS可以猜测其分子结构。该过程准确度约为51%。如果AI能够对其分子结构的前10项进行预测,其准确度将增加到86%,这意味着该工具能有效缩小对分子结构的搜索范围。

 

Skinnider说:“这不仅节省了大量时间,还能更快识别新上市的新精神活性物质。”

 

二、1700个实例生成稳健AI模型

 

研究小组在论文中表示,DarkNPS可以仅使用质谱数据自动阐明未知NPS的化学结构,并基于化学结构的深层生成模型。

 

该研究小组的模型横跨化学和深度学习领域,因为它们有可能根据需要生成具有任意物理化学或生物性质的分子,从而解决所谓的“逆向设计”问题。

 

这项工作的大部分集中在分析具有活性的特定药物对策分子结构可能性上。

 

研究小组表示,他们在研究过程中寻求生成与一个或多个分析测量特性相匹配的类NPS分子,并使用适用于处理低级数据存储区的策略来实现这一目标。

 

从约1700个实例中学习设计药物的稳健生成模型,并从这个模型中取样,随机产生与现有的NPS存储空间类似的新的分子结构。

 

研究过程显示,从模型中取样新分子的频率可以用来表明最有可能解释观测到的精确质量的化学结构。将生成的结构与串联质谱数据相结合,进一步提高了结构解析的准确性。

 

DarkNPS最先阐明了2021年2月首次出现在欧洲的NPS的分子结构。

 

该模型的最终结果是建立新型精神活性物质的深层生成模型。

 

三、AI生成数据,为模型提供数据库

 

许多计算工具已经开发出来,能够在质谱数据中自动识别药物及其代谢产物。然而,所有这些工具都需要一个已知化学结构的数据库,可以将观察到的质谱数据与之进行比较。因此,这些工具无法用于识别现有数据库中未发现的新合成设计药物。

 

该研究小组推断,通过生成一个新的、类似核动力源的化学结构数据库,就可以自动识别完全未知的核动力源。因此,研究人员着手学习核动力源化学结构的深层生成模型,从中随机取样新的核动力源结构(图1a-b)。

 

目前包含NPS结构最新、最全面的资源数据库是用于NPS筛选的数据库HighResNPS,来自世界各地数十家法医实验室的贡献者在生物样本或执法部门缉获的物品中检测到新物质时,会向HighResNPS提交数据。尽管如此,在2020年6月初,该数据库仅包含1753个独特的NPS结构。

 

 

这一数据集的有限规模反映了非法市场上出现并随后被法医实验室检测到的核动力源数量。然而,通常用于训练化学结构生成模型的数据集将包含数十万个数据。

 

之后,该研究团队获得了194种NPS药物的数据,发现其中176种出现在AI生成的数据中。研究人员还通过使用AI推断1亿种可能的化学结构,研究未来可能生成的药物。

 

此外,哥伦比亚大学梅尔曼公共卫生学院的研究人员正在研究使用机器学习来评估法律及其与处方阿片类药物分配模式的关系。

 

“机器学习方法越来越多地应用于类似的高维数据问题,并可能为其他形式的政策分析提供一种补充方法,包括作为筛选工具来识别需要进一步关注的政策和法律规定相互作用。”哥伦比亚大学流行病学副教授Silvia Martins说。

 

结语:AI+医疗,落地场景更广阔

 

“机器学习方法越来越多地应用于类似的高维数据问题,并可能为其他形式的政策分析提供一种补充方法,包括作为筛选工具来识别需要进一步关注的政策和法律规定相互作用。”哥伦比亚大学流行病学副教授Silvia Martins说。

 

NPS特殊的化学结构,使得不法分子有可乘之机,而AI模型能够快速识别其分子结构,并利用AI从药物分子结构中预先推断其可能的情况,提前阻止某些药物流入市场。这为AI工具的应用提供了新范例,能够评估类似的药物分子结构、药物分配模式等问题。

 

来源:New Scientist、哥伦比亚大学官网

Be First to Comment

发表回复

您的电子邮箱地址不会被公开。 必填项已用*标注