AI 在药物发现和开发中的应用场景广泛,从疾病靶点识别、药物发现、新 药设计、合成规划、临床前研究到临床研究及上市后监测,覆盖从靶点发现到临 床试验的全流程。
创新靶点识别和挖掘,AI 基于大数据分析,对疾病相关的基因表达谱、蛋 白质组学数据进行挖掘。AI 可以对蛋白质相互作用网络进行分析,找出与疾病 相关的关键节点蛋白,这些蛋白也可能是潜在的药物靶点。最近的研究使用 NLP 技术(例如 Word2vec 嵌入)将基因函数映射到高维空间中,尽管存在稀疏性, 但仍增强了靶点识别的敏感性。有效地集成了多基因组数据并确保 AI 模型的解 释性是具有挑战性的任务[2]。
如 Verge genomics 建立人类脑组织基因组数据集,超过 6800 个人体组织样 本的人体数据集,此外还包括有关基因表达、基因分型、患者特征(如年龄、人 口统计、疾病进展)等各类数据。这些数据帮助 Verge genomics 先通过表型筛选 发现有效分子,再通过 AI 逆向推导作用靶点,仅用时 4 年确立了肌萎缩性脊髓 侧索硬化症的新靶点。 将多组学数据与科学和医学文献相结合到知识图谱中,可以识别基因与疾病 之间的关系。生物医学大语言模型与生物网络或知识图谱功能深入整合时,为建 立疾病、基因和生物学过程的联系提供了有效而精确的方法。如 PandaOmics 平 台(https://pharma.ai/pandaomics/)成功地利用了多组学数据和生物网络分析来识 别 TNIK(TRAF2-和 NCK-相互激酶)作为抗纤维化疗法的潜在靶标,导致抗纤 维化治疗特定的 TNIK 抑制剂的开发[3](INS018_055)
AI 在药物设计中通过生成新的分子结构并优化其药理性质,极大地缩短了 104 / 120 设计周期。AI 在药物分子设计方面具有多种方法。一是基于结构的药物设计, 利用深度学习算法对蛋白质靶点的三维结构进行分析,预测小分子化合物与靶点 的结合模式,从而设计出具有高亲和力的药物分子。如结合 AlphaFold 预测的蛋 白结构,实现结合口袋精准匹配。Schrödinger 公司搭建的 Combinatorial Library Design 平台,设计创新药物管线。
二是基于配体的药物设计,通过对已知活性化合物的结构特征进行学习,建 立结构-活性关系模型,以此模型为指导设计新的药物分子。此外,生成式对抗网 络(GAN)产生候选分子、图神经网络预测活性等新兴 AI 技术应用于药物分子 设计领域,生成全新的、具有潜在活性的化合物结构。 如药渡 CyberAIDD 基于药渡集团 10+年医药生物领域大数据积累,并通过 海量文献数据挖掘,现已成为国内一流的 AI 新药设计和靶点探索平台。 药渡 CyberAIDD:国内首个面向药物化学家的“AI 赋能+交互式”FIC 新分子 结构发现设计平台。分为CyberX-SAR(已知构效关系图谱);CyberX-Discovery(AI 早期药物发现新分子生成);CyberX-Virtual library(真实虚拟化合物库)三个模块。 其中新分子生成包括基于靶点的 CyberX-Hit 子模块用于苗头化合物的发现。 CyberX-Lead 子模块是基于可溯源的生物电子等排体生物活性试验证据,对先导 化合物的侧链、骨架进行优化,用于先导化合物的发现。
AI 在确定药物疗效和安全性方面起着至关重要的作用。虽然需要进行湿实 验评估才能获得市场批准,并且不能完全取代模拟,但早期的 ADMET 预测可以 帮助减少由于特征差而导致的失败。AI 已成为使用预定义特征(例如分子指纹 或描述符)预测 ADMET 性质的有价值工具。如拜耳(Bayer's in Silico ADMET Platform)使用机器学习技术,例如随机森林和支持向量机,使用循环扩展连接 指纹等描述符来确保准确性和相关性[4]。
AI 可以帮助优化临床试验的设计和预测临床试验结果。在临床试验设计阶 段,通过对患者的临床数据、基因数据等进行分析,利用机器学习算法可以进行 患者分层,将患者分为不同的亚组,针对不同亚组设计更有针对性的临床试验方 案,提高试验的效率和成功率。临床试验模拟与优化,运用 AI 和统计模型模拟 不同临床试验设计的预期结果,包括样本量需求、预期疗效、潜在风险等,指导 最有试验方案的选择。如 Owkin 等公司利用深度学习技术分析历史临床试验数 据、电子健康记录以及分子生物学数据,建立预测模型来优化临床试验设计。