+
  • 2tjutruyrurtu.png

【COSMOlogic应用实例】纯离子液体中活性药物成分(APIs)的溶解度:σ-profile描述

本文使用COSMOlogic软件计算了14种API在BPCOSMO-TZVP能级的电荷分布面积。

所属分类:

化工设计


方案详情

摘要:

基于类导体筛选模型,以阳离子、阴离子和原料药为分子描述符,利用描述符的σ-profile计算出阳离子、阴离子和原料药在不同离子液体中的溶解度。在不同温度范围内,收集了83个API-il体系的850个数据点,包括14个API、12个阳离子、7个阴离子(25个il组合)。学习方法选择混合改进灰狼Grey Wolf支持向量回归算法(简称I-GWO-SVR(r))。通过对11种不同模型、各种统计因素和图形分析(包括外部验证检验、方差分析(ANOVA)和敏感性分析)的综合比较,对该方法的能力和有效性进行了评估和验证。整体研究证实,提出的新模型在预测API在il中的溶解度方面提供了最好的结果。

 

引言:

离子液体作为一种可替代传统有机溶剂的可持续发展的绿色溶剂越来越受到人们的认可。1,2它们在学术界和工业界日益增长的吸引力3,4很大程度上归因于其独特的特性:低挥发性,化学稳定性,低熔点(通常低于100℃)的广泛液体范围,密度,溶解度和混溶性优于分子溶剂,2以及大多数il的不易燃和不挥发性。

 

本文介绍了一种新颖的混合I-GWO-SVR(r)模型,用于预测活性药物成分(API)在离子液体(ILs)中的溶解度。这种开创性的方法在利用从COSMO-RS计算中得到的σ矩(Sσ剖面)描述符作为关键输入参数方面是独特的。该方法代表了il的QSPR研究的重要一步。通过利用这些高级描述符,重点关注il和API的分子结构,作者的模型超越了严重依赖实验数据的传统方法的局限性。这不仅提高了预测精度,而且拓宽了模型的范围,使其成为该领域的开创性贡献。作者的研究特别值得注意,因为它开创了这种方法在模拟API在il中的溶解度方面的应用,这是一个明显缺乏这种先进预测模型的领域。

 

计算细节:

目前,COSMO-RS是用于模拟溶解度的最流行的理论技术之一这种方法是一种新兴的模型,试图将化学的分子和热力学水平联系起来。在QSPR模型中,σ-moments被用作分子描述符,它只根据分子结构计算而不需要实验确定的数据这些描述符来源于σ-profile,σ-profile是由COSMO量子化学方法得到的筛选电荷密度(σ)的空间分布的直方图。它们就像统计分布的矩,可以作为一种方法,将存在于σ-轮廓中的高维信息简化为描述该σ-轮廓的更少的描述符。因此,这些描述符被报道为QSPR模型中潜在的/有价值的描述符COSMO-RS的几个优点可以列举出来。最吸引人的是,这种方法是快速的,只需要化学结构和分子的拓扑结构来执行计算。在这篇文章中,有三类基于COSMO-RS的描述符,即阳离子、阴离子和原料药的σ-profile。阳离子和阴离子的电荷分布区域取自Paduszynski s22论文。独立反离子(正离子和阴离子)的σ-profile分别分为4个不同的区域,分别为S1-4和S5-8。每个部分由σ(e/nm2)的区间定义。根据Gonfa s58论文进行剖面划分(见表2)。作为COSMOtherm套件的一部分,使用COSMOlogic软件计算了14种API在BPCOSMO-TZVP能级的电荷分布面积(泛函:beckeperdew;22三ζ价极化基集;22与标准COSMO空腔22);在支持文件中提供了14个API的σ-profile图。在筛选电荷密度范围为2.5-2.7e/nm2的条件下,得到了与每种原料药最相关的一组构象。考虑概率分布(或直方图,峰值)Px(σ)的平均值来计算σ-moments。图1显示了在BP-TZVP-COSMO水平上计算的筛选电荷(σ)分布和相应的14种原料药的σ-profile。每个σ-曲线都有一对不同的峰。这种多样性强烈依赖于每种原料药的分子结构。表2显示了所使用的σ-profile描述符,以及阳离子、阴离子和API描述符的边界限制,最后一个描述符也被分为四个区域σ-profile(S9 12)和12 σ-profile。利用这12个分子描述符和温度T(K)作为输入参数,进行本研究相应的QSPR模型。

 

结果与讨论:

为了确保稳健性,处理器被重复了几次。图2给出了支持向量回归结构,图3给出了所提出的I-GWO-SVR(r)的流程图。

 

 

 

图4显示了实验API在各种il中的溶解度与仅从外部验证数据集开发的I-GWOSVR(r)模型的预测的交叉图。

 

 

实验与预测溶解度误差如图5所示,预测偏差直方图如图6所示。

 

 

图7显示了William的I-GWO-SVR(r)模型图,这是杠杆值与标准化残差的关系图。图8描述了I-GWOSVR(r)模型基于与训练数据点的结构相似性和溶解度估估值(即Insubria图)的可靠预测区域。

 

从图7的分析可以看出,整个数据库超过97.29%的数据落在3和+3两条水平线之间,不到2.71%,只有21个数据点在可疑范围之外。该图清楚地突出了所提出模型的适用范围。

 

 

Insubria图是著名的Williams图的改进版,它可以在没有实验数据的情况下用于筛选化学物质,如图8所示。该图验证了I-GWO-SVR(r)模型的高统计性能和广泛的结构适用范围。考虑到图7和图8,训练/测试和外部验证集的数据点似乎具有大于警告h*(0.0682)的杠杆作用。

 

 

图9显示了所开发模型实验输出的操作输入参数的相关因素。如观察到的,溶解度对命名为T(K)、S1、S2和S6的描述符显示出直接依赖(积极和直接的影响),对其余描述符显示出反向依赖(消极和相反的影响)。相关因子分析的结果表明,API-IL的溶解度与温度密切相关,因为温度是测量溶解度的重要参数。

 

总结:

本文建立了一个新的QSPR模型,即I-GWO-SVR(r),用于预测14种原料药在纯原料药中的溶解度,该模型是13个描述符、温度以及原料药和原料药的COSMO-RS、σ-profile描述符的函数。实验数据从文献中精心挑选,并进行严密的统计分析。该模型运行了一个包含83个API-ILs系统的数据库,该系统由14个API,12个阳离子和7个阴离子(25个ILs组合)组成,代表13个输入,1个输出和850个数据点。770个数据点用于模型开发(80%用于训练,20%用于测试集),而80个数据点被隐藏用于外部验证测试。将该模型与4种神经网络拓扑(ANN-lm-tan、ANN-lm-log、ANN-br-tan、ANN-br-log)和7种混合支持向量机(I-GWO-SVR(g)、MVO-SVR(g)、MVOSVR(r)、MFO-SVR(g)、MFO-SVR(r)、SCA-SVR(g)、SCASVR(r))进行比较。基于各种统计因素,所有模型在训练集和测试集上都表现出良好的性能,表明所开发的模型可以用于所选属性的预测。而所提出的方法显示出明显更好的结果。非线性I-GWO-SVR(r)预测模型具有较高的预测精度、较强的泛化能力、良好的鲁棒性、适应度和预测能力。所进行的灵敏度分析显示,输入参数的相对重要性显著,其中最高的参数属于操作条件,即温度。此外,杠杆方法表明,大多数数据点都在可接受的范围内,证明了模型的统计可接受性。值得一提的是,这种优先排序提供了有用的信息,以减少测试化学品的时间、成本和数量。如果未来数据的σ-profile可用,则总体结果可用于预测可接受域范围内的未来数据。为此,本文提出了COSMO-RS理论与QSPR技术相结合进行预测的巨大潜力,并首次对API的σ-profile进行了计算。在作者的工作中提出的描述符是非常相关的,适合于在预测溶解度时定义il和API的分子特征,尽管没有一个描述符可以普遍适用于所有情况。与许多传统的分子描述符相比,它们提供了更细致和全面的见解,这使得它们在复杂多样的il和药物物质世界中特别有用。作者相信这个想法会引起很多关注。

 

文章详情:J. Chem. Inf. Model.2024, 64,1361−1376

 

北京泰科博思科技有限公司是COSMOLOGIC官方指定代理商,有关软件详情或者技术支持请咨询北京泰科。


电话:010-64951848

邮箱:sales@tech-box.com.cn

 

北京泰科为广大学习分子模拟科研人员提供了交流讨论平台,泰科建立了Turbomole交流群,群里有专业老师解答问题,如有兴趣一起交流,欢迎来电/邮申请入群,作者期待您的参与!

 

北京泰科涉及行业

材料研发

基于BIOVIA Materials Studio材料设计平台,提供涉及电池、航空航天、国防军工、建筑、涂料涂层等多领域材料研发软件及综合解决方案。

 

药物研发

针对药物设计、药物研发等提供基于Discovery Studio、COSMOLOGIC等软件的ADME、构象比对、溶剂筛选、结晶、成盐、共晶筛选、稳定性、溶解度pKa、分配系数等性质的模拟预测软件及方案。

 

化工设计

面向精细化工、新能源、石油化工等领域提供精馏萃取催化剂设计、热力学性质(溶解度、粘度等)、提纯表面处理吸附等性质模拟软件平台及解决方案。

 

数据挖掘

基于Pipeline Pilot提供数据搜集、数据清洗、特征工程、机器学习、流程设计等多种数据挖掘综合解决方案。

 

一体化实验室

• 实验室信息管理

• 电子实验记录本/SOP执行

• 试剂耗材管理

• 仪器管理

• 数据管理

 

部分产品

量化材料类

• Crystal:固体化学和物理性质计算软件

• Diamond:晶体结构数据可视化分析

• Endeavour:强大的求解晶体结构的软件

• Molpro:高精度量化软件

• Molcas:多参考态量软件                   

• Turbomole:快速稳定量化软件

• TeraChem:GPU上运行的量化计算软件

• Spartan:分子计算建模软件

 

数据分析类

• GelComparll:凝胶电泳图谱分析软件

• SimaPro:生命周期评估软件             

• Unscrambler:完整多变量数据分析和实验设计软件      

• CSDS:剑桥晶体结构数据库

• lCDD:国际衍射数据中心数据库                

• ICSD:无机晶体结构数据库

• Pearson’s CD:晶体数据库

 

公司简介

北京泰科博思科技有限公司(Beijing Tech-Box S&T Co. Ltd.)成立于2007年,是国内领先的分子模拟及虚拟仿真综合解决方案提供商。

 

北京泰科博思科技有限公司与国际领先的模拟软件厂商、开发团队深入合作,为高校、科研院所和企业在材料、化工、药物、生命科学、环境、人工智能及数据挖掘、虚拟仿真教学等领域提供专业的整体解决方案。用户根据需要在我们的平台上高效的进行各种模拟实验,指导实际的生产设计。

 

北京泰科博思科技有限公司拥有一支一流的技术服务团队和资深的专家咨询团队,以客户真正需求出发,服务客户,为客户创造价值。我们秉承“职业、敬业、担当、拼搏、合作”的企业精神,致力于用国际领先的软件产品和专业全面的技术支持服务,成为客户可信赖的合作伙伴。 

相关产品