数字孪生如何在处方药开发过程中节省时间、金钱和生命
数字孪生为成本高昂、容易失败的制药过程注入了一针强心剂。但巨大的数据需求和伦理问题意味着实现个性化医疗的梦想需要时间。
多年来,该行业通过在计算机上创建对象的模拟版本(称为数字孪生),简化了喷气发动机等技术产品的维护。
通过在数字孪生上运行模拟操作,工程师可以实现在现实世界中不可能实现的壮举,例如测试哪些条件可能导致发动机发生故障,以及发生故障可能需要多长时间。我们的想法是预测这些情况并避免它们。
多年来,人们一直在努力将数字孪生的相同理念引入生命科学。
数字孪生可以在计算机上模拟器官的结构,例如肺、心脏或大脑;药物可以结合以治疗疾病的细胞区域;或临床试验中患者的整体健康状况。
可以随着时间的推移跟踪这些模拟对象的发展,以预测器官衰竭、药物可行性或患者结果。
作为“数字孪生促进健康”这一更广泛现象的一部分,利用数字孪生推进药物开发是该技术最有前途的用途之一。尽管还处于早期阶段,但来自初创公司和制药公司的数据表明,数字孪生模拟可以加快药物开发并降低成本,从而提供明确的挽救生命和经济激励。
Unlearn AI 在为药物开发构建数字双胞胎的竞赛中充满希望,他们认为最终的成就将是个性化医疗,即针对每个人的生物学量身定制的药物。
“数字双胞胎是医学的未来,”成立七年的人工智能初创公司 Unlearn AI 的创始人兼首席执行官 Charles Fisher 在接受 ZDNET 采访时表示。 “它们基本上取代了我们的整个医疗系统;你基本上将医学变成了预测科学,进行实验,并优化患者的治疗。”
Absci 的创始人兼首席执行官肖恩·麦克莱恩 (Sean McClain) 正在寻找利用数字孪生与生成人工智能相结合的新疗法,他同样看好缩短新药审批时间、提高成功率和降低成本。 “你做了这一切,你就开始实现个性化医疗。”
数字孪生在健康领域的应用范围。
药物开发的新时代
无论如何衡量,药物开发都需要彻底改革。创造新药,甚至重新利用旧药都需要巨大的成本。一种新药的开发从基础化学到临床试验再到监管批准平均需要 10 年时间。它可能花费近 30 亿美元,而且大多数新候选药物的失败率为 96%。
尽管需求很大,但人工智能(尤其是生成式人工智能)提供的越来越多的机会正在推动数字孪生的发展。
数字孪生需要大量数据才能进行高度详细的模拟。生成式人工智能已被证明能够消费和建模如此海量的信息,这为构建更复杂的模拟提供了一种新工具。
超越产品开发
大约 20 年前,在产品开发领域,或者更具体地说,在“产品生命周期管理”领域中概述了数字孪生的概念。动力是制造更好的产品。
最初,它只是相关资产的数字复制品,是计算机上的模拟,类似于化身。多年来,数字孪生已经从静态发展为动态,并通过反馈循环中的新数据进行更新和改进。
用于健康的数字孪生涉及现实世界中的事物(左)和计算机上模拟的事物之间的连接反馈回路。
这样的复制品可以通过多种方式应用于健康。没有单一的数字孪生,但根据复制或建模的内容,孪生可以采取不同的形式。
例如,数字孪生可以模拟医院流程来预测资源利用率。 2020 年,俄勒冈健康与科学大学的科学家探索了此类应用程序,以预测 COVID-19 大流行期间呼吸机的使用情况。
芬兰坦佩雷大学的研究员 Frank Emmert-Streib 对数字孪生提出了严格的、基于理论的定义。
数字双胞胎还可以模拟身体的各个器官来预测器官衰竭或疾病进展,就像纽约西奈山医院伊坎医学院的“活脑”项目一样。
然而,近年来,数字孪生在新药的探索中展现出了最大的前景。市场研究公司 Visiongain 估计,今年通过数字孪生加速药物发现和开发的工具市场规模略高于 3 亿美元,预计未来十年复合年增长率将达到 31.3%。
人工智能的使用正在放大数字孪生,这可以帮助构建模拟。 美国食品和药物管理局去年发布的一份白皮书将数字双胞胎定义为人工智能的一种应用。
FDA 药物评估与研究中心主任帕特里齐亚·卡瓦佐尼 (Patrizia Cavazzoni) 在论文中写道:“数字或计算机化的患者‘双胞胎’可用于模拟医疗干预,并在患者接受干预之前提供生物反馈。”
卡瓦佐尼表示,人工智能在数字孪生中的应用“可以帮助更快地为患者带来安全、有效和高质量的治疗。”
新的湿实验室
McClain 的 Absci 正在尝试改进药物开发的前端,即药物发现的环节。该公司的人工智能驱动的软件工具与自己的湿实验室相结合,是对实验室程序的虚拟重塑。
Absci 的首席执行官肖恩·麦克莱恩 (Sean McClain) 表示:“我们将能够减少新药获得批准所需的时间,提高成功率,并最终降低成本。”一代人工智能。
在这种情况下,数字孪生涉及模拟蛋白质的结构,以测试如果选择性地改变氨基酸碱基会发生什么。
从某种意义上说,Absci 正在制造现实世界分子的特定数字孪生体。然而,愿景更为广阔:个性化医疗。
他说:“你可以采集病人样本,让人工智能能够预测你应该针对该特定病人、特定疾病寻找什么目标,然后能够设计一种抗体来治疗它。”
如今,该公司使用生成人工智能“从头开始预测可以与感兴趣的目标结合的抗体,”他解释道。
今年 3 月,Absci 报道了针对所谓“人表皮生长因子受体 2”(HER2)的新型抗体的开发,HER2 是一种与某些形式的乳腺癌有关的人类癌基因。
AI 模型没有获得有关现有成功抗 HER2 抗体的数据,也没有获得有关如何成功附着或“结合”HER2 的明确信息。
麦克莱恩称其为突破。传统上,湿实验室中的科学家会利用动物的免疫系统来产生抗体。通过生成人工智能,可以将抗体创建为计算机模型。
“我们已经从大海捞针的模式转变为现在能够制造针,”他说。
Absci 的主要候选药物 ABS-101 是一种治疗肠易激疾病的药物。这种新型抗体是利用生成式 AI 开发的,可与免疫细胞中的 TL1A 蛋白结合,而免疫细胞中的 TL1A 蛋白的过度表达与多种炎症性自身免疫性疾病有关。该抗体从头开始开发仅用了 14 个月,成本不到 500 万美元。
“你开始看到这些人工智能生成的抗体和小分子进入诊所,”麦克莱恩说。
用另一个比喻来说,如果正在设计的抗体是一把锁的钥匙,那么锁本身——抗体应该附着在抗原上的部分——仍然是一个谜。
Absci 的抗体模拟过程使 gen AI 神经网络接受真实世界的数据,将其转化为新型抗体设计,然后将该设计提交给湿实验室测试。该过程可以在现实世界和模拟之间的对话中迭代地继续。
麦克莱恩说,在接下来的三到五年里,我们的目标是“真正开始预测抗体应该在哪里与靶点结合,从而产生我们想要的生物反应——开始预测生物学。”
这将需要更多的生物数据,并需要将这些数据输入到数字孪生中,以修改和改进锁和钥匙的图像。
简化临床试验
与 Absci 流程的前端相比,数字孪生通过模拟人类参与者来补充临床试验流程。
正如 FDA 白皮书所阐述的那样,“人工智能/机器学习可用于构建个体的计算机表征或复制品,可以随着时间的推移动态反映分子和生理状态。
“与接受研究性治疗的临床试验参与者相比,数字双胞胎有可能提供全面的、纵向的、通过计算生成的临床记录,描述该特定参与者在接受安慰剂时可能发生的情况。”
为此,制药巨头拜耳利用模拟来“预测成功通知胰岛素剂量的血糖水平”。拜耳开发了数字双胞胎来模拟对照组或服用安慰剂的对照组,据称这可以取代人类作为对照组。
成立七年的人工智能初创公司 Unlearn AI 的创始人兼首席执行官查尔斯·费舍尔 (Charles Fisher) 表示:“如果我们能够预测患者的反应,那么就可以在没有对照组的情况下进行临床试验。”
这些刚刚起步的努力正在催生新的试验工具。
拜耳发布了一个开源软件项目来推进此类模拟,称为开放系统药理学。 该公司还与加拿大多伦多风险投资支持的初创公司 Altis Labs 合作,该公司开发专门用于人工智能试验模拟的软件。拜耳指出,此类创造是有限的,但缺乏作为数字孪生形成基础的“可靠”数据。另一个限制是缺乏监管机构可以接受此类模拟结果的标准。
Starutp Unlearn AI 使用深度学习 AI 的形式从患者数据中进行推断,以预测随着时间的推移将发生的结果,以及它们如何随着干预措施而改变。换句话说,这是药物试验的模拟。
Unlearn AI 于 2019 年对阿尔茨海默氏病进行的一项研究模拟了 1,909 名患者的可能结果,这些患者的认知数据是从名为“对抗重大疾病联盟”的现有数据库收集了 18 个月的数据。
Unlearn AI 的神经网络经过数据训练,能够“预测患者的未来状态”,即它可以利用 18 个月的数据的一部分并预测多个因素(例如患者回忆能力的变化)的变化。的话,就会转变。
在本月《临床转化科学》杂志上发表的一份立场文件中,Unlearn 研究人员表示,“人工智能生成的 DT(数字孪生)可以帮助解决困扰临床试验的许多问题,例如成本高昂、实验过程漫长等,而且故障率高。”
一种方法是使用过去的临床试验数据来“创建概率预测”,以预测新试验的参与者对治疗的反应。反过来,“可以通过多种方式使用来优化临床试验设计。”例如,数字孪生可以说服监管机构在试验中允许较小的对照组,从而减少收集参与者所需的时间和成本。
该公司已获得 1.3 亿美元的风险投资支持,将此类患者模型应用于临床。 Unlearn 目前正在参与临床试验,费舍尔未透露其姓名。这些试验尚未报告结果。
“如果我们能够预测患者的反应,那么就可以在没有对照组的情况下进行 CT 扫描,”他说。实现零人为控制,从而减少需要招募的人员数量,将“节省大量时间和金钱,并显着加速医疗创新。”
这也将使患者受益,因为他们都将接受正在测试的治疗,而不是某些人接受安慰剂。 “这就是为什么患者首先参与的原因:获得访问权,”他说。
费舍尔预计,随着时间的推移,临床试验中对照参与者的数量将逐渐减少。
“今天,我们有能力将对照组的正常规模从 25% 减少到 50%”,这可以将试验的典型入组时间缩短四到六个月。很大程度上取决于特定的适应症和治疗方法他说,正在试验中进行测试。
费舍尔说,Unlearn 创建的模型为该公司提供了数学确定性,它可以预测试验需要什么样的控制。
同样,对于罕见疾病或儿科病例,当难以聚集足够的参与者时,数字孪生可以提供帮助。 Unlearn AI 希望使用历史控制数据来扩大较小试验的样本量。
该公司正在研究使用生成人工智能开发更复杂的数字双胞胎的方法。今年 5 月,它在一份预印本研究报告中描述了所谓的“数字孪生生成器”,这是一种用于制造试验参与者数字孪生的工厂。
AI 模型根据来自三个不同治疗领域的 13 种不同疾病适应症的数据进行训练,包括阿尔茨海默氏症等神经退行性疾病、类风湿性关节炎等免疫疾病以及高血压等一般医疗问题。
该模型可以摄取大量数据并从中学习,包括已完成的临床试验、观察性研究以及从 156 项临床试验和 33 项观察性研究收集的登记数据,总计 400,000 名患者和超过 380 万名患者就诊。
Unlearn AI 的数字孪生生成器可以生成预测患者结果的 AI 模型,然后用于完善现实临床试验的设计。
与 Absci 一样,最终目标是使用更细粒度的患者数据来实现个性化医疗。正如费舍尔所说,这将把医学变成一个主要是数学优化问题。
费舍尔说:“从长远来看,我们的重点是研发方面,以释放从临床试验进入其他更大领域的能力。” “这要求我们转向更通用的疾病模型,更通用的数字双胞胎。”
他说,“更通用”的数字孪生将依赖于广泛的健康“基础模型”,该模型可以处理多种疾病,而不仅仅是一种疾病。反过来,这将需要人工智能未来的进步,他预测这将超越当今基于变压器的生成人工智能的局限性。
Unlearn AI 的患者模型是使用 AI 预测临床试验结果的更大趋势的一部分。
初创公司 Insilico Medicine 提供了一款名为 InClinico 的软件程序,该程序使用生成式人工智能来预测 II 期临床试验的结果,这是确定初始疗效的部分。该公司表示,该技术可以以 79% 的准确度预测 II 期试验的结果。
初创公司 Insilico Medicine 的软件程序 InClinico 可以以 79% 的准确度预测 II 期临床试验的结果。
这些努力刚刚得到监管机构的支持。美国食品和药物管理局于 2022 年授予了一种名为阿纳白滞素 (anakinra) 的药物的紧急使用授权,该药物的商业名称为 Kineret,用于治疗 COVID-19 引起的肺炎并预防严重呼吸衰竭。
由于最初用于开发阿那白滞素的临床试验在美国无法进行,FDA 的批准部分基于神经网络预测美国患者接受该测试后可能会如何反应。
ZDNET 独立联系了 FDA,以进一步评论药品中的数字孪生技术如何更广泛地影响消费者。我们将在与他们交谈后更新故事。
未来的工作
人工智能和模拟的有趣结合仍然需要证明它是可行的。 《纽约客》最近的一篇专题文章明确指出,在基础化学的初始阶段和人体试验的复杂性中,许多意想不到的因素可能会扰乱这一过程。
Absci 的麦克莱恩表示,对能够设计抗体或模拟临床试验的数字双胞胎的探索是十多年的努力。
正如 FDA 的 Kineret 例子所示,像 COVID-19 这样的事件可以注入一定程度的紧迫性,从而加快新技术的使用。即便如此,数据收集和数字孪生模拟通过学习循环的速度仍然有限。
正如 OpenAI 的 GPT-4 等生成人工智能模型需要大量数据收集一样,生物数据和临床试验数据也需要数年时间来收集、处理并输入到模型中。
正如 Unlearn AI 在其立场文件中指出的那样,“电子健康记录 (EHR) 包含在护理点获取的大量信息,但收集的格式多种多样,并且通常包含标签不明确的疾病和状况。”
这意味着“由于疾病过程固有的异质性,现有的人工智能模型受到这些数据的可用性和算法从这些记录中学习的能力的限制。”
如此规模的数据收集将引发有关患者隐私的伦理和监管问题,这些问题尚未得到阐明,更不用说解决了。除了几十年来人们一直为如何管理医疗记录而烦恼的所有方式之外,患者生物数据可能会成为一个更加棘手的问题,既因为数据的规模,也因为现在可能更加复杂的方式用于训练 AI 模型。
如果使用维基百科对书籍作者来说是有争议的,那么人类对于成为数字双胞胎的“基本事实”会有什么感觉?
区块链技术是解决患者自主权和隐私问题的一种可能答案。可以想象,区块链可以提供对子宫颈抹片、X 射线或超声波检查中收集的所有医疗数据的托管、经过身份验证的访问。然而,此类实现尚未设计。
生命科学中的生成式人工智能也需要更严格的审查,不仅是在数据方面,而且在设计方面。
这一事实在医疗专业人员测试生成人工智能的初步工作中显而易见。波士顿著名的 Dana-Farber 癌症研究所的研究人员在 4 月份描述了在实施 OpenAI 的 GPT-4 几个月后,聊天机器人如何产生不准确的响应。
Absci 的麦克莱恩表示,数据收集、从数字孪生模拟的输出中学习以及改进人工智能本身等许多障碍意味着需要整个生态系统才能使数字孪生实现个性化医疗的目标。
“归根结底,这是一项团队运动,”他说。 “没有一家公司能够解决这个问题,这需要我们所有人作为一个集体来解决。”