一起学QSAR之软件工具篇:OECD QSAR Toolbox介绍
大家好,全新版本的QSAR交流学习网站已经正式上线啦,今后我们可以实时在这个网站上学习和交流QSAR相关知识了,感兴趣的朋友可以踊跃留言参与!
首先,可能部分小伙伴对QSAR相关软件还不太了解,老话说“工欲善其事,必先利其器”。针对这部分问题,我们专门弄了个QSAR 软件介绍专栏,赶紧了解研究起来吧。
今天我们要介绍的第一个(Q)SAR软件是QSAR Toolbox,即QSAR工具箱。 其由经济合作与发展组织(OECD)、欧洲化学品管理局(ECHA)以及结构化信息标准促进组织(OASIS)数理化学实验室(LMC)合作开发,该软件的推出旨在提高 (Q)SAR 方法在世界各国及各地区的监管接受度,使 (Q)SAR 预测结果更易于获取、透明并降低运行成本。QSAR Toolbox于2008年推出第一个正式版本并投入使用,2017年4月功能更强大且更易于使用的4.0版本正式推出,目前最新的版本是今年刚发布的v.4.5 SP1版本,其可在安装windows10/11系统的个人PC上正常运行。
Toolbox作为一款公益性软件,可供政府组织、化学工业和其他利益相关者免费使用,以填补评估化学品危害所需的(生态)毒性数据的空白。其可用于查找实验数据、查找类似物、建立和评估分类、探索代谢途径或模拟物质转化代谢、填补数据缺口、运行外部 QSAR 模型、构建数据矩阵和生成预测报告等等。
Toolbox功能强大,应用范围广泛,界面美观友好,得到了越来越多的官方管理机构认可。其具有以下特点:
1、有效性,通过统一分类和交叉对照,可使对(生态)毒理学充分了解的用户更加快速准确的使用非测试方法。
2、流线型,将理论知识、实验数据和计算工具整合到一个逻辑工作流程中。
3、数据丰富,大约 60个数据库,包含超过 9 万种化学品和超过 260 万个实验数据点。
4、透明性,大分子共价结合机制知识库。也可用于物质的初步筛选或优先排序。
5、内容详尽,可显示观察到的和/或预测的代谢物和/或降解产物。根据化学物质的生物活化,可进行与代谢相关的预测。
6、多功能,可使用各种工具搜索化学品/数据;导入/导出;类别一致性评估;导出评估报告等等。
说完了Toolbox的功能和特点,我们来看看它的软件界面和基本使用方法。
首先是输入(Input)模块。与其他计算软件类似,“输入”模块也是Toolbox工作流程所有连续步骤的起点。在这里,用户可以:
1、打开一个新的或已经保存的文档。
2、关闭或保存当前文档。
3、加载单个目标化学品——按 CAS、名称、结构、SMILES 或绘图(包括混合物),还可从文件中选择。
4、加载化学品列表——从数据库、清单或者自定义文件。
5、定制搜索——在 Toolbox 数据库中搜索化学品或数据,可以使用逻辑运算符(AND、OR、NOT)组合的一个或多个标准。
6、在 IUCLID 数据库中搜索——在 Toolbox 中导入的 IUCLID 数据库中搜索化学品。可以为可搜索物质的组成(例如杂质、添加剂)定义一个或多个标准。
其次是分类(Profiling)模块。用于确定目标化学品与初步定义的类别(功能组/警报)的从属关系。分类的结果决定了寻找类似物的最合适方法,但它们也可用于物质的初步筛选或优先排序。在该部分,用户可以:
1、检索目标化学品的信息,目标的结构特征(官能团、化学元素等)或与目标结构中特定功能相关的已知作用机制(警报)。提供了已识别警报的机制理由。
2、模拟新陈代谢 ——通过使用可用的代谢模拟器,可以检查是否有任何记录或模拟的代谢物或目标化学物质的水解产物。
3、检索目标化学品的转化产物(代谢物、水解产物)的信息——代谢物的结构表征(官能团、化学元素等)或与特定功能相关的已知作用机制(警报)代谢物结构。
4、使用用户自己的知识创建分析方案——可以基于外部记录或专家知识创建简单或决策树类型的分析方案。
第三步是数据获取(Data)。Toolbox中所有可用的实验数据都位于“数据模块”中。
在该部分,用户能够:
1、检索其目标化学品的试验数据。
2、导入用户自己的数据库/数据清单。
3、搜索类似物以填补数据缺口,搜索特定化学品/数据。
4、在 Toolbox 和 IUCLID 之间传输数据——您可以将预测从 Toolbox 导入到 IUCLID 或将数据从 IUCLID 导出到Toolbox。
第四步是类别定义(Category definition/ Grouping)模块。类别定义模块为用户提供了多种方法,可根据目标分子的具体情况将化学品分组为具有毒理学意义的类别。化学品可以根据“相似性”(结构或机理相似性)的不同度量进行分组,以便在类别数据中,可以通过交叉参照(Read-across)或趋势分析(Trend analysis)来填补空白。这是工作流程中的关键步骤,Toolbox中提供了几个选项来帮助用户更好地定义类别。
在类别定义部分,用户可以:
1、根据目标结构的具体情况搜索类似物——查找目标物质的类似物及其可用的实验数据。
2、根据目标代谢物的具体情况搜索类似物。
3、检查已定义类别的一致性——应用类别元素有助于比较类别成员之间关于已定义端点的相似性(理化、结构和机理等)。
4、计算警报性能——警报性能功能可告知用户特定警报或分析器中结构特征的预测能力,以及它们在构建具有一致实验结果的类似物类别方面的适用性。
5、对定义的类别进行细分/聚类——精炼数据缺口之外的分组。
第五步是填补数据空白(Data Gap Filling)。在数据缺口填充模块中,用户可以使用来自Trend analysis、Read-across或现有 QSAR 模型的类似物的数据来填补其目标物质的数据缺口。在Read-across或Trend analysis时,用户可以通过子分类来进一步降低数据集的不确定性——去除与目标化学品在机理和/或结构上不同的化学品。还可以执行遵循预定义端点(水生毒性、皮肤致敏)的实施逻辑的自动化和半自动化工作流程。
在该部分,用户可以:
1、执行自动化或标准化(半自动化)工作流程。
2、执行手动工作流程 ——通过手动完成所有工具箱阶段(输入、分析、数据、类别定义)来填补目标化学品的数据空白。
3、使用外部 (Q)SAR 模型进行预测——用户还可以使用适用于不同端点的各种 (Q)SAR模型(902 模型),可以将它们用于快速危害评估或收集证据权重。大多数可用的 (Q)SAR 模型都会提供域信息、训练集和测试集。
4、创建一个新的 (Q)SAR 模型——用户可以创建/编辑自己的模型来预测感兴趣的属性。自定义 (Q)SAR 模型可以自行导出或导入。
5、构建自动化工作流程——使用工作流程编辑器自定义开发自动化和/或标准化工作流程,以对目标物质进行预测或分组。
最后一步是报告(Report)部分。在“报告”模块中,可以为使用Toolbox执行的任何预测创建报告或与当前类别的一致性相关的报告。此外,可以生成数据矩阵中化学品的报告文件(数据矩阵报告)和可用的 (Q)SAR 模型(QMRF 报告)。
上述内容是对QSAR Toolbox的一个简单介绍,该软件功能非常强大,一篇文章介绍是远远不够的,感兴趣的可以先从上述基本操作着手练习。以后我们还会针对该软件写一些系列详细文章,敬请期待!