T.E.S.T软件操作与实际应用
目前,我们的日常生活中接触到的工业化学物质大约超过100,000种,其中一些可能对人体健康产生不利影响。化学物质的安全性通常通过动物试验、细胞试验、微生物试验等生物检测来评估。然而,在考虑时间、劳动力、物质成本和动物伦理等多种因素时,以这种方式测试如此大量的化学物质是不现实的。
为了实现可持续发展目标,我们需要一种能够迅速准确识别有害化学物质的有效筛选工具。定量构效关系(Quantitative Structure Activity Relationships,QSAR)是一种计算机模拟方法,主要基于各种分子描述符和模型算法,建立化合物的结构与其理化性质,生物学活性,毒理学效应,环境行为和归趋等的定性/定量关系,即根据目标物质的化学结构特征预测其生理效应或理化性质等,具有快速高效的特点,能够有效节约测试成本。
QSAR是目前国内外一个活跃的研究领域,美国环境保护署(United States Environmental Protection Agency,简称US EPA)就基于QSAR开发了针对化学物质毒性预测的软件——Toxicity Estimation Software Tool (T.E.S.T)。
T.E.S.T软件可根据大量的数据处理和统计识别目标化合物中潜在的有毒基团,还能快速地分析与目标物质结构相似的化合物的毒性,进一步综合预测目标物质的毒性。T.E.S.T界面简洁,操作简单,并且软件内配有指南,易上手,用户可通过CAS号、SMILES码、物质名称、InChi码、DTXSID或是手动绘制载入化学物质结构,然后选定预测终点与方法,更改结果输出路径后即可进行预测,软件预测完毕会自动生成结果报告。
►T.E.S.T软件用户界面与基本操作流程
T.E.S.T的预测终点包括毒性和理化性质两大类别。
► 毒性预测终点:
预测终点 |
介绍 |
LC50(Fathead minnow 96-hr) |
96小时导致50%黑头呆鱼(Fathead minnow)死亡的水中试验化学物质浓度(mg/L)。 |
LC50(D. magna 48-hr) |
48小时导致50%大型蚤(Daphnia magna)死亡的水中试验化学物质浓度(mg/L)。 |
IGC50(T. pyriformis 48-hr) |
48小时对50%梨形四膜虫(Tetrahymena pyriformis)生长产生抑制作用的水中试验化学物质浓度(mg/L)。 |
LD50(Oral rat) |
导致50%的大鼠口服后死亡的化学物质量 (mg/kg bw)。 |
生物富集因子 (Bioaccumulation factor) |
达到平衡状态时,化合物在生物体内浓度与环境介质中浓度的比值。 |
发育毒性 (Developmental toxicity) |
化学物质是否会对人类或动物产生发育毒性效应。 |
鼠伤寒沙门氏杆菌回复突变试验 (Ames mutagenicity) |
如果化学物质在鼠伤寒沙门菌菌株(Salmonella typhimurium)中诱导回复突变菌落生长,则该化合物为致突变物。 |
► 理化性质预测终点:
预测终点 |
介绍 |
标准沸点 (Normal boiling poin) |
化学物质在标准大气压(1个大气压)下沸腾的温度(℃) |
蒸汽压 (Vapor pressure) |
在25℃的密闭条件中,与固体或液体处于相平衡的蒸气所具有的压强(mmHg)。 |
熔点 (Melting point) |
化学物质从固体变为液体的温度(℃)。 |
闪点 (Flash point) |
化学物质与外界空气形成混合气与火焰接触时发生闪火并立刻燃烧的最低温度 |
密度 (Density) |
单位体积质量(g/cm3) |
表面张力 (Surface tension) |
液体表面层由于分子引力不均衡而产生的沿表面作用于任一界线上的张力(dyn/cm)。 |
热导率 (Thermal conductivity) |
物质传导热量能力的量度值 (mW/mK)。 |
黏度 (Viscosity) |
流体对流动所表现的阻力(cP) |
水溶性 (Water solubility) |
化学物质溶于液态水中形成均相溶液的浓度(mg/L)。 |
T.E.S.T内包含了Chi连接指数、Kappa形状指数、2D结构特征等14类,共计797个描述符。同时,T.E.S.T的预测方法有5种,即层次聚类法、单一模型法、基团贡献计算法、最近邻法、一致性评价方法。用户可依据自身需求选择和合适的预测方法来增加预测结果的可信度。
► 预测方法:
方法 |
介绍 |
层次聚类法 (Hierarchical method) |
使用来自几种不同聚类模型的预测加权平均值来预测化学物质的毒性。 |
单一模型法 (Single model method) |
使用适合训练集的多元线性回归模型进行预测(使用分子描述符作为独立变量)。 |
基团贡献计算法 (Group contribution method) |
使用适合训练集的多元线性回归模型进行预测(使用分子片段计数作为独立变量)。 |
最近邻法 (Nearest neighbor method) |
通过取训练集中与测试化学物质最相似的3种化学物质的平均值来预测目标化学物质的毒性。 |
一致性评价方法 (Consensus method) |
通过取上述QSAR方法预测毒性的平均值来预测化学物质的毒性(预测结果在各自方法的适用范围内)。 |
► 模型拟合度:
用户在进行QSAR预测时往往最关心的是预测结果的准确性。T.E.S.T.指南文件指出,如果QSAR模型满足以下条件,则认为该模型具有可接受的预测能力:
R2是真实值与预测值之间的相关系数(即为不过原点回归时相关系数的平方),R02是回归曲线截距为零时真实值和预测值之间的相关系数(即为过原点回归时相关系数的平方),k是回归曲线截距为零时的回归方程系数。公式(1)(2)都是对线性回归模型的拟合度量,满足(1)(2)公式条件,即说明模型拟合度较好,具有良好的预测能力。
指南文件介绍了软件中各个QSAR模型的统计参数,本文以LC50(fathead minnow 96-hr)毒性终点和标准沸点(Normal boiling point)的测试集结果为例介绍T.E.S.T中的模型性能。
► LC50(fathead minnow 96-hr)测试集结果:
LC50(fathead minnow 96-hr)测试集结果显示,五种方法的R2均满足公式(1)的条件,且一致性评价方法的结果最好。单一模型法、基团贡献计算法、一致性评价方法不满足公式(2)的条件。依据T. E. S. T.指南指出不满足这些条件的模型本身并非绝对无效的,其预测结果是相对保守的,应该谨慎使用。
► 标准沸点(Normal boiling poin)测试集结果:
单一模型法不适用于标准沸点的预测,因此没有其测试集结果,其余四种方法的三种指标均符合公式(1)(2)的条件。总的来说,标准沸点的测试集预测统计整体是很好的。
♦ 应用域介绍:
对于一个可靠的QSAR预测结果而言除了关注模型预测能力外,还需确定目标化合物是否在该模型的应用域范围内。
应用域的功能就是界定能够被QSAR模型可靠预测的化合物,也可理解为模型适用化合物的集合,通常可通过可从4方面来表征模型的应用域:
①描述符变化范围;
②结构相似性;
③机理相似性;
④代谢转化途径和产物
若目标化合物的上述特征在QSAR模型的应用域内,则预测结果具有良好的可靠性;反之,则预测结果不具备良好的可靠性。
以3-氯-2-甲基苯胺(CAS:87-60-5)的IGC50(T. pyriformis 48-hr)预测为例,如下图所示,3-氯-2-甲基苯胺均在层次聚类法建立的多个预测模型的应用域范围内,即Applicability Domain的一列结果均为“OK”,因此模型的总体预测结果相对可靠。若目标化合物预测结果此列并非“OK”,而显示为“Rmax constraint not met”、“Model ellipsoid constraint not met”或是某个结构片段超出应用域范围,其预测结果须谨慎使用。
综上所述,T.E.S.T是一款由US EPA官方研究开发的QSAR毒性预测软件,可以根据化合物的结构信息预测其潜在毒性及理化性质,其中包括较为常见的7种毒性预测终点和9种理化性质预测终点,并且具有5种预测方法,预测能力较好,结果可信度较高,但在使用的过程中仍需要对目标物质和预测结果进行专家评估以得出专业准确的结论。在使用方面,软件整体安装简单,操作便捷,用户界面友好,并且配有较为详细的用户指南。随着US EPA地不断更新与完善,目前T. E. S. T. 已经更新至5.1.2版本,适用于Windows和macOS系统。更详细的内容请参考软件指南User’s Guide for T. E. S. T. (Toxicity Estimation Software Tool) Version 5.1。
软件链接:Toxicity Estimation Software Tool (TEST) | US EPA
T.E.S.T使用指南:TEST User's Guide.pdf
参考文献:
[1]Honma M. An assessment of mutagenicity of chemical substances by (quantitative) structure-activity relationship. Genes Environ. 2020;42:23.
[2]De P, Kar S, Ambure P, et al. Prediction reliability of QSAR models: an overview of various validation tools. Arch Toxicol. 2022;96(5):1279-1295.
[3]U.S. EPA (2020). User’s Guide for T.E.S.T (version 5.1) (Toxicity Estimation Software Tool): A Program to Estimate Toxicity from Molecular Structure.
[4]唐睿,张松林,粱云明,等. 毒性评估软件T.E.S.T及其在农业污染化合物QSAR研究中的应用[J]. 安徽农业科学,2010,38(36):20878-20879,20882
[5]US EPA. Environmental Optimization Using the Waste Reduction Algorithm. 2011 4/18/16]; Available from: nepis.epa.gov/Exe/ZyPURL.cgi?Dockey=P100DZKT.TXT.
[6]Martin TM, Harten P, Young DM, et al. Does rational selection of training and test sets improve the outcome of QSAR modeling?. J Chem Inf Model. 2012;52(10):2570-2578.
[7]王中钰,陈景文,傅志强,等.QSAR模型应用域的表征方法[J].科学通报,2022,67(3):255-266.
[8]陈景文,李雪花,于海瀛,王亚南,乔显亮.面向毒害有机物生态风险评价的(Q)SAR技术:进展与展望[J].中国科学(6期):461-474[2024-01-16]