定量构效关系(QSAR)指利用数理统计方法建立特定性质与分子理化性质参数或结构参数之间关系的方法。目前多款商业软件都已集成了该功能,之所以以MOE为例,是因为它的QSAR构建页面是我见过最简洁、最直观的,而且功能分区比较集中,不需要开开关关多个窗口。

1. 打开任意一个sdf文件

这里选择打开MOE内部示例数据(该数据集记录了每个分子血脑屏障通透性数值logBB)最终目标是训练一个可以预测分子血脑屏障通透性的QSAR模型。

如果你想要给分子添加新的属性,比如IC50值等,可以选中某列表头右键,选择new,定义新的一列列名,并手动给每个分子添加各自数值。

2.清洗结构,生成三维坐标

3.计算分子描述符

计算分子描述符或分子指纹,类似于deepchem中的Feature:

这里我随便选了几个Descriptor(分子描述符),如下图:

下图红框内的就是新计算生成的分子描述符

4.构建QSAR模型

本例我们构建的QSAR模型是用来预测logBB的,这中预测值是数值上连续的,所以选择模型时选第一个QSAR即可(如下图);如果预测值是分类型的(如有无毒性,有无活性等),则需要选择第二个分类模型—Classification。

下图如果勾选selected entries only,则只会选用选中的数据进行构建QSAR模型。想象一下,如果你后续对模型验证时发现有影响模型准确性的"坏"数据,则可以在重新构建模型时不选中这些数据,同时勾选selected entries only前的方框,这样就可以排除这些数据的干扰了。

进行这一步之前,最好点一下Validate,看一下模型构建的品质。尤其是需要找出影响模型准确度的数据(XZ-SCORE大于1.5的最好去除)

5.用构建好的QSAR模型预测其他分子的logBB值

这里为了简化操作,就拿上面模型构建的数据进行预测吧

6.绘图查看预测值与实际值间的相关性

上图可以看出预测的结果并没有太好,R2仅有0.58。这多半是因为中间跳过了validate一步,正常情况下模型构建好后需要validate,剔除XZ-SCORE大于1.5的数据,再重新进行模型构建。

MOE定量构效关系(QSAR)相关推荐

  1. 双基因突变患者_双任务干预对携带LRRK2基因突变的帕金森病患者手灵活性的影响...

    双任务干预对携带LRRK2基因突变的帕金森病患者手灵活性的影响 目的:观察执行单.双任务时LRRK2(+)帕金森病(PD)患者手灵活性变化及双任务干预情况.方法:受试者总数为122例,PD患者46例纳 ...

  2. Nature:药物研发里程碑技术

    科研背景 生物医学是综合医学.生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学,特别是医学中的有关问题.机器学习技术能利用复杂的算法在大规模. ...

  3. 最新突破!天然产物首次实现全合成,轰动整个化学界

    01 科研背景 生物医学是综合医学.生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学,特别是医学中的有关问题.机器学习技术能利用复杂的算法在大 ...

  4. 计算机辅助药物筛选教程,药物筛选之计算机辅助药物设计

    欢迎您注册蒲公英 您需要 登录 才可以下载或查看,没有帐号?立即注册 x 计算机辅助药物设计(computer-aided drug design,CADD)是近年来发展起来的研究与开发新药的一种崭新 ...

  5. 蛋白质活性研究结合热门科研技术,生物医学领域迎来全新机遇。

    01 科研背景 生物医学是综合医学.生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学,特别是医学中的有关问题.机器学习技术能利用复杂的算法在大 ...

  6. 结合人工智能、机器学习等热门科研技术的生物医药研发,进入发展新阶段。

    01科研背景 生物医学是综合医学.生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学,特别是医学中的有关问题.机器学习技术能利用复杂的算法在大规 ...

  7. 六大热门科研技术,让生物医学领域迎来崭新的春天

    01 科研背景 生物医学是综合医学.生命科学和生物学的理论和方法而发展起来的前沿交叉学科,基本任务是运用生物学及工程技术手段研究和解决生命科学,特别是医学中的有关问题.机器学习技术能利用复杂的算法在大 ...

  8. Nat. Mach. Intell. | 可解释性人工智能(xAI)遇上药物发现

    今天给大家介绍瑞士苏黎世联邦理工学院化学与应用生物科学系 Gisbert Schneider等人在Nature Machine Intelligence上发表的文章"Drug discove ...

  9. J. Cheminform. | 基于化学基因组学中深度和浅层学习预测药物特异性

    今天给大家介绍由巴黎文理研究大学计算生物研究中心的Veronique Stoven教授课题组发表在J Cheminform上的一篇文章.作者提出一种具有深度学习功能的化学基因组神经网络(CN),以分子 ...

最新文章

  1. 人工智能中对机器学非常简要的介绍
  2. doublevalue_Java Double类doubleValue()方法与示例
  3. 需求分析中对系统的要求
  4. iOS黑魔法 - Method Swizzling
  5. Windows不同压缩软件、压缩算法、压缩率详细对比测试与选择
  6. 虚拟机专用精简版win7系统_新手玩NAS:创建虚拟机,安装WIN10,实现迅雷下载和百度云...
  7. 实现一个圆形进度条(vue)
  8. 泛函分析笔记(七) 连续线性算子和连续多重线性映射
  9. EKMA 曲线及大气 O3 来源解析
  10. BMZ-MISC-损坏的压缩包
  11. 金融科技大数据产品推荐:恒丰银行实时智能决策引擎
  12. kal安装了tim,无法显示图片咋办
  13. 分频电路的实现:奇数分频、偶数分频和小数分频
  14. AWTRIX像素屏时钟搭建
  15. spark dataframe 一列分隔多列,一列分隔多行(scala)
  16. 有4个圆塔、圆心分别为(2,2)、(-2,2)、(-2,-2)、(2,-2),圆半径为1,见图4.5。这4个塔的高度为10m,塔以外无建筑物。今输入任一点的坐标,求该点的建筑高度(塔外的高度为零)
  17. 《软件登记测试报告》可以作为软件第三方检测报告使用吗
  18. HAL库之SYSTICK时钟频率探究-F407
  19. AndroidRecyclerView仿QQ相册功能
  20. hbw-utils - 关于guava和jdk的compare方法

热门文章

  1. 软考--流水线问题吞吐率详解
  2. 虚函数之定义一个基类Shape,在此基础上派生出Rectangle和Circle再使用Rectangle类创建一个派生类Square。
  3. Grade for Android 之一:Groovy概述
  4. 【60000个红包】点赞即得!和谭丽一起坚守时间价值!
  5. cd ..、cd / 和 cd ~ 的区别
  6. 【油猴脚本】忽视页面跳转拦截,自动继续访问页面JustJumpAhead(location;正则)
  7. 发电机计算机控制系统的组成,第一章发动机电控系统概述
  8. 2600评测_10寸真香电纸书 墨案Inkpad X评测
  9. 前端微服务无界实践 | 京东云技术团队
  10. python爬取百度新闻_火车浏览器网络爬虫实践6:以“陕茶”为例爬取百度新闻搜索结果...