国际制药企业如何运用"百亿"化学空间加速药物研发 制药企业构建的专属化学空间 越来越多的全球制药巨头,如礼来、辉瑞、阿斯利康等都构建了企业专属的化学空间,以加速药物研发进程。 但是,当化学空间突破百亿、万亿规模,常规检索方式已经无法满足药企对效率和质量的双重需求。 围绕这一核心挑战,FTrees、SpaceLight、SpaceMACS三套算法应运而生。 药物研发的第一类场景 —— Scaffold hopping / 寻找全新骨架,突破IP 已经有了一个活性分子,但是因为化学结构、专利等等限制,需要寻找全新骨架(IP)。基于模糊药效团和特征树匹配的 FTrees 算法完美满足 scaffold hopping 需求。 FTrees 算法可以在保持关键药效特征(如氢键供体/受体、疏水中心)相似的前提下,实现跨骨架的相似性搜索。 https://pubs.acs.org/doi/full/10.1021/ci800272a 以Boehringer Ingelheim在 TGFβ 项目中的研究为例,尽管上述化合物的核心骨架完全不同,但关键药效特征一致, FTrees 便可化学空间中成功识别这些分子。 在实际项目中,当 FTrees similarity 位于 0.75–0.90 区间时,可高效富集到大量具有骨架跃迁潜力的候选分子。 药物研发的第二类场景 —— SAR analysis / 围绕母核优化,做深做透 当已有先导化合物,希望系统性优化活性或ADMET时。基于 ECFP/CSFP 分子指纹 + Tanimoto 相似性计算的 SpaceLight,可在超大规模化学空间中,快速富集与目标分子结构相似的候选分子。 https://dx.doi.org/10.1021/acs.jcim.0c00850 当母核基本保持不变,变化集中在局部杂环、取代基或连接模式上,SpaceLight 可快速进行 hit expansion 和 SAR 分析,把一个系列做深、做透,做到极致。 药物研发的第三类场景 —— Substructure matching / 固定核心结构,扩展外围化学空间 在很多药化场景中,都是基于结构分开进行优化,这个时候我们只关心某个核心子结构必须保留,至于分子其余部分怎么长、往哪里扩展,可以再看。 这时就可以基于最大公共子结构(MCS)的子结构相似性搜索算法 SpaceMACS。 https://doi.org/10.1021/acs.jcim.1c00640 SpaceMACS 可以快速在化学空间中找到含有该核心片段的可合成的分子,特别适合 fragment growing 和 R-group exploration 。 对药化来说,这类搜索的价值非常直接,因为你可以先固定已经验证过的核心结构,再把外围部分在 make-on-demand chemical space 里尽可能探索。 上述算法均已集成到 infiniSee中,同时集成七大商用化学空间,用户可在本地电脑上实现轻松实现百亿级别的化学空间检索。