一、你有被化学结构命名难倒过吗?

“命名难、难命名、命难名!”是许多医药、化学科研工作者的一块心病,特别是面对一些复杂的化学结构式,如何能够准确、高效地命名是很大的难题。

二、不简单的IUPAC中文命名
对于复杂结构的中文命名,很早就有人想到先用ChemDraw等软件生成化学结构的IUPAC英文名称,然后再利用Google翻译将其转化成中文名称。

这种做法得到的中文命名正确率很低。通过翻译得到的结果经常会中、英文掺杂在一起,需要人工修改。不仅费时费力,而且又极容易出错,导致中文名称不能再还原成正确的结构式,在中文专利知识产权保护上,可能会面临专利无效的风险。

IUPAC英文命名系统和IUPAC中文命名系统有诸多差异。翻译软件只能生搬硬套地对应,无法应付中文命名中很多约定俗成的命名方式。

比如酚类是中文特有的命名方式,在结构式的中文命名中,我们将连接在芳环上的羟基命名为“酚”,以“benzene-1,2,4-triol”为例,对应的中文命名为“苯-1,2,4-三酚”,如果直接将其英文名称用Google翻译,则会得到“苯-1,2,4-三醇”,这显然是错误的。

这样的例子还有很多,IUPAC英文的命名顺序和中文命名也不一样,直接翻译也是不准确的。就拿酯类物质而言,酯命名时,其中英文的顺序是不同的。例如,中文“丙二酸乙基甲基酯”对应于英文“ethyl methyl malonate”,如果拿英文直接翻译成中文,则会得到 “乙基甲基丙二酸”,打乱了顺序。

如果就这样对化合物名称进行草率地翻译,会埋下隐患。如果在做学术过程中,论文结构名称出现错误,会大大影响到你的学术可信度。在申请专利时,如果中文专利的结构式名称不规范,则不利于专利审核与保护。很可能你所保护的分子结构,因为命名问题被别人钻了空子,造成损失。

科学出版社出版的《有机化合物命名原则2017》是目前有机化学结构中文命名的权威参考。中文命名和IUPAC英文名称有着极大差异,比如中文有机化合物名称中组合各结构构成名称时,需要采用各种连缀字来表达它们之间的相互关系,这与英文中以变换字母,尤其是元音即可表达构词的方法是不同的。

InDraw的中文命名系统则是参考了这本书,其最底层的命名逻辑更契合中文的命名方式,所得到的中文名称则更加准确。同时InDraw的英文命名,也参考了权威的IUPAC 1993版、IUPAC 2013版,此外InDraw还参考了无机物1980版的命名原则,命名范围更广。

三、各大命名软件功能对比
市面上的命名软件到底有何异同?由于ChemDraw、ChemDoodle、MarvinSketch只能进行IUPAC英文命名,无法进行中文命名,笔者将其命名结果用Google翻译转化成中文做中文名称的参考。

首先来测试一下很多人在生活工作中必不可少的咖啡因分子,咖啡因是嘌呤类的物质,常被命名为 “1,3,7-三甲基黄嘌呤”,在相关的CAS号查询平台和百科上都可以见到这个命名。这样命名的单体其实就是黄嘌呤了,然后再对三个甲基进行定位,简洁清楚。PubChem平台给出的IUPAC英文命名是“1,3,7-trimethylpurine-2,6-dione”,将单体又细分为嘌呤了。ChemDraw、ChemDoodle、MarvinSketch、InDraw的命名单体也围绕着嘌呤来,前两者的命名结果是完全一样的。

MarvinSketch的命名结果则稍微复杂一点,定位更多,有意思的一点是,将其命名结果导入ChemDraw和ChemDoodle的Name to Structure功能,前者无法显示。说明两者的命名逻辑是不一样的,也未能很好的兼容。

InDraw对于咖啡因的命名方式类似MarvinSketch,只不过氢取代基的定位略有不同,MavrinSketch是“2,3,6,7”,而InDraw的定位是“1,2,3,6”。杂环一般是采用并环法命名,编号顺序是顺时针,而嘌呤是个例外,先逆时针定位完嘧啶环再定位咪唑环,从命名结果上看,InDraw给出的中文命名其更加符合《有机化合物命名原则 2017》的命名顺序。导入InDraw命名的英文名称,另外三款软件均能显示出正确的咖啡因结构式。

如果将结构的复杂度提升,换成健康杀手胆固醇呢?胆固醇是甾体类化合物,甾体结构在自然界中大量存在,是比较典型的四环化合物,从事天然产物化学的研究者可能经常与甾体结构打交道。比较简单的命名方式就是以甾体母核进行命名,比如在胆甾的基础上增加取代基。

可以看到当化学结构复杂度提升时,这几款命名软件给出的英文命名不尽相同。ChemDraw、MarvinSketch的命名逻辑基本相似,所选取的命名单体是一样的,这也与PubChem数据库查询的IUPAC英文命名方式基本相似。

由于MarvinSketch有着两套命名系统,能同时给出结构式的俗名和IUPAC英文名,MarvinSketch也提供了“Cholesterol”,这个命名的选项。ChemDoodle似乎在这方面做的不够好,并没有选取环戊环和菲环作为环的命名单元。而InDraw的命名类似半俗名,直接以胆甾为命名单体,与CAS查询得到的命名逻辑一致。

再观察Google的翻译结果,显然就和中文命名方式有很大的差别,比如环单元命名这块,按照中文的命名逻辑应该为“环戊并菲”,而Google翻译的结果是“环戊二烯菲”,这也说明了直接翻译IUPAC英文名称的方式不可取。

InDraw对甾体化合物的命名做了专门的优化,可以直接以胆甾、雌甾、雄甾、孕甾为命名单元进行命名,能够使天然产物的命名更为简洁。

比如这五种甾体结构,InDraw可以很好地识别其甾体母核,给出的命名类似我们用的半俗名,非常简洁,而ChemDraw未能识别。

倘若再将物质范围扩大、用普通有机物、螺环、桥环、氨基酸、甾体以及无机物来考验这四款软件,它们的命名表现又将如何?






体验下来,在基础有机物这块,ChemDoodle出师不捷,5个结构最终只能命名出2个。这几种结构里面含有Si、Se、Sn等在有机化学结构内不常见的元素,对于处理这些结构的命名,ChemDoodle有待提升。在螺环这块,ChemDoodle更是无法命名。在最后的无机物命名这块,ChemDoodle也难以达到预期。

在无机物这块,InDraw与这三款软件相比,有着一定优势。比如ChemDraw无法识别最基础的二氧化氮,MarvinSketch无法识别离子化合物,只能单个给出离子的命名,不能给出整体命名,推测它只能识别共价化合物。

MarvinSketch支持俗名以及IUPAC英文命名,比如氨基酸“D-alloisoleucine(D-别异亮氨酸)”,MarvinSketch可以给出缩写名“Hile”,同时其也支持甾体的简洁命名。InDraw对氨基酸衍生物的处理也很到位,可以识别其中的氨基酸结构。

以上对比或多或少能反映出这些化学结构软件在中文命名上的优缺点,希望能够有所帮助。

化学结构命名软件对比相关推荐

  1. 可从文献、图片、PDF等提取化学结构的开源软件

    我们经常会遇到需要从文献.图片.专利中提取化学结构的情况,要是自己一个一个去画比较费劲,参考网上资料有几个开源的软件可供大家选择使用. OSRA 这是第一个可识别90多种的图形格式的软件,将其转换为s ...

  2. iMeta | 中国农大杨栋组揭示膳食纤维化学结构对肠道微生物的调控

    点击蓝字 关注我们 膳食纤维化学结构调控下肠道微生物动态变化 https://doi.org/10.1002/imt2.64 REVIEW ARTICLE ● 2022年11月6日,中国农业大学食品科 ...

  3. 19个三维GIS软件对比

    19个三维GIS软件对比麦豆科研技术中心 2 days ago 我国GIS经过三十多年的发展,理论和技术日趋成熟,在传统二维GIS已不能满足应用需求的情况下,三维GIS应运而生,并成为GIS的重要发展 ...

  4. Oracle HRMS,PeopleSoft HR,SAP HR区别 主流HR软件对比分析

    Oracle HRMS,PeopleSoft HR,SAP HR区别(转) 主流HR软件对比分析  首先谢谢写这篇文章的大牛,具体出处也无从考究了.下面是具体内容: Oracle优点: 1. 从整体来 ...

  5. chemdraw怎么连接两个结构_ChemDraw化学结构绘制高级技巧

    <ChemDraw化学结构绘制高级技巧>由会员分享,可在线阅读,更多相关<ChemDraw化学结构绘制高级技巧(36页珍藏版)>请在人人文库网上搜索. 1.2 使用快捷键标记原 ...

  6. ChemDrew如何翻转化学结构

    ChemDraw作为专业的化学结构式绘图编辑软件,能够建立和编辑各类分子式.方程式.结构式.立体图形.对称图形.轨道等,并能对图形进行翻转.旋转.缩放.存储.复制.粘贴等多种操作.为了方便大家的使用, ...

  7. J Cheminform2022 | SwinOCSR+:基于Swin Transformer的end-to-end光学化学结构识别

    原文标题:SwinOCSR: end-to-end optical chemical structure recognition using a Swin Transformer 代码:GitHub ...

  8. 高压缩比 压缩软件 linux,Linux下压缩软件对比

    Linux下压缩软件对比 发布时间:2007-02-15 00:44:03来源:红联作者:seais 最近在做系统备传输时发现压缩时间过常,于是简单做了一下Linux下的压缩软件的测试 源文件3591 ...

  9. [Swift]枚举、类与结构体的对比

    为什么80%的码农都做不了架构师?>>>    ###枚举.类与结构体的对比### ####枚举与其他两者的关系#### 首先说枚举,相对比较好区分,因为我们知道,枚举与其他两者最大 ...

最新文章

  1. 支付领域的未来与生物识别息息相关
  2. linux下网络排错与查看
  3. Flash 检测摄像头是否被占用
  4. 【工具】PC端调试手机端 Html 页面的工具
  5. ORACLE EBS 多账套总结
  6. 【Flink】SASL encryption trust check: localHostTrusted = false, remoteHostT
  7. java ArrayList扩容入门
  8. springBoot笔记2
  9. 超轻薄笔记本电脑软件测试,一口气测了三款轻薄本 这三个核心问题有答案了...
  10. sql统计不为空的字段数_SQL太难?你离完全理解SQL就差这10步!
  11. win10调整计算机字体大小,主编教您win10下怎么调整字体大小
  12. 五个金念什么_5个火读什么???还有5个水 5个木 5个土 5个金
  13. Liang-Barsky算法思想及简单cpp实现
  14. 多伦多大学好吗_多伦多大学留学好不好
  15. 中国知网html如何复制,中国知网如何快速导出参考文献的格式? 来看看吧
  16. 【超详细】SSM框架项目实战|Spring+Mybatis+Springmvc框架项目实战整合-【CRM客户管理系统】——课程笔记
  17. 为什么电脑唯独搜不到自己家wifi?
  18. Java计算机毕业设计甜趣网上蛋糕店订购系统源码+系统+数据库+lw文档
  19. 计算机硬件方面课程,计算机硬件课程教学改革分析
  20. 超级计算机泰坦 amd,再见推土机:搭载AMD皓龙处理器的泰坦超算退役

热门文章

  1. 为何游戏公司青睐工作室制度
  2. 希腊字母的 LaTeX 语言、音标、大小写、以及对应的真实读音
  3. 网络加速原理与方法:静态CDN、动态CDN、全站加速、GAAP、AIA、CLB跨地域部署
  4. Win10任务栏个性化-注册表
  5. OpenLayers介绍
  6. 怎样为“创新”保驾护航?
  7. 分屏视频怎么剪?手把手教你剪辑
  8. C语言实现Linux聊天工具
  9. 亿万级赛道谁主沉浮,国潮品牌直播电商如何破局增长?
  10. 邮件营销七大禁忌介绍