前些日子,收到了来自老师的毕业论文问候,本着学习的态度就在知识的海洋了疯狂遨游,奈何风太大,差点翻车


于是我就萌发出一种可以自动降重的脚本(别说什么网上降重,没钱!!!),众所周知,论文降重其实就是找近义词。正好,我想起了synonyms中文库寻找近义词


首先就是安装

pip install synonyms

想法是这样的:首先输入一条句子,然后进行分词,找出所有分词的近义词(应该是形容词,后续再弄),在拼接到一块,最后进行句子的相识度展示。


在这个过程中需要解决一些问题,因为synonyms打包的display模块里只有显示,没有返回数据,所以将synonyms的模块进行了一些微调,让它返回数据,如下

def display(word, size=10):# print("'%s'近义词:" % word)o = nearby(word, size)# assert len(o) == 2, "should contain 2 list"# if len(o[0]) == 0:#     print(" out of vocabulary")# for k, v in enumerate(o[0]):#     print("%d. %s:%s" % (k + 1, v, o[1][k]))return o

接下来就是我们的主程序了,简单的不行,这里我把synonyms模块改成了newsyn

import newsyn.newsynresult = newsyn.newsyn.seg('随着现代信息化、智能制造的快速发展,工业数据在制造企业中呈日益增长趋势。其中标准件的数量更是占据了全部零件数量的绝大部分,而标准件的管理却依然采用着人工手动统计的方式,这种方式不仅浪费人力还容易出现种种差错,影响了制造企业快速设计、制造的趋势。在航空制造企业中,标准件件数量大、参数多,为了提高产品的设计效率,降低产品的开发成本,提高产品在市面上的竞争力,提出利用现代计算机语言创建飞机标准件库存管理系统,增强了企业对标准件的信息化管理。')print(result[0])symbol = [',','.',',','。','?','‘','’','“','”','!','、']
str = []
for i in range(3):sentence = ''for words in result[0]:print(words)if words not in symbol:word = newsyn.newsyn.display(words)print(word[0])if word[0]==[]:sentence += wordselse:sentence += word[0][i]else:sentence += wordsstr.append(sentence)print(str)
result = newsyn.newsyn.compare(str[0],str[1])
print('近似度:' , result)
result = newsyn.newsyn.compare(str[0],str[2])
print('近似度:' , result)

结果就是

随着现代信息化、智能制造的快速发展,工业数据在制造企业中呈日益增长趋势。其中标准件的数量更是占据了全部零件数量的绝大部分,而标准件的管理却依然采用着人工手动统计的方式,这种方式不仅浪费人力还容易出现种种差错,影响了制造企业快速设计、制造的趋势。在航空制造企业中,标准件件数量大、参数多,为了提高产品的设计效率,降低产品的开发成本,提高产品在市面上的竞争力,提出利用现代计算机语言创建飞机标准件库存管理系统,增强了企业对标准件的信息化管理。

随著当代信息技术、智能化生产的的迅速经济发展,轻工业信息特别是在生产民营企业之中呈圆形不断增长态势。当中特种玻璃的的数目可谓占有了有全数配件数目的的大部分,因而特种玻璃的的管理工作虽然仍然使用著育苗自动统计数据的的形式,此种形式不但节约物力也难发生诸多疏漏,负面影响了有生产民营企业迅速结构设计、生产的的态势。特别是在航空公司生产民营企业之中,特种玻璃多件数目小、变量少,为的是提升商品的的结构设计工作效率,减少商品的的生产成本,提升商品特别是在市面的的竞争优势,明确提出借助当代计算机语言建立直升机特种玻璃库存量信息系统,进一步增强了有民营企业对于特种玻璃的的信息技术管理工作。

由于近代电子政务、智能家居组装和加速产业发展,化学工业统计数据如在组装中小企业当中呈长不断增加格局。另外盒形和量着实占去了为剩余部件量和绝大多数,因此盒形和行政管理终究依旧选用着大滴灌全自动统计资料和方法,这样方法不光消耗劳力就不易再次出现各种纰漏,冲击了为组装中小企业加速外观设计、组装和格局。如在国际航空组装中小企业当中,盒形万件量多、模块频密,借以降低系列产品和外观设计效能,减低系列产品和投资成本,降低系列产品如在市售和竞争能力,制订借由近代计算机语言创立客机盒形产能系统,提升了为中小企业对个人盒形和电子政务行政管理。

第一个为原文,和第二个和第三个的相识度分别为
近似度: 0.947
近似度: 0.919


话说,这个不能说是一摸一样吧,最后一个简直毫不相干


简单算是一个思路吧,后续再把相关词性进行一些操作,让降重更精确点

利用Synonyms库对论文进行降重相关推荐

  1. 大量引用了原文的论文怎么降重啊?

    不知道大家有没有这样的感触:在写论文的时候写着写着就不小心直接照搬了参考文献里面的句子或者词语.又或者在引用原文的时候不小心引用多了,重复率不查都知道会很高.因为有的时候总觉得自己的话术在那些专业的论 ...

  2. 论文快速降重的一点实用性见解(仅供参考)

    本人在写毕业论文查重降重过程中的一点小小的总结,以paperfree为例,现分享给大家,仅供参考! 一.首先摸清楚查重的算法.Paperfree的算法是: 总体相似度 = 相似字数 / 检测字数 被系 ...

  3. 巧用PaperPass自建库免费检测提高降重效率

    在介绍PaperPass自建库之前,先客观的讲解一下使用paperpass的情况,这个系统检测出来的重复率会偏高,有些是同义转换或者概述的句子段落都会被标红,认为是抄袭.(除此之外,该网站后期开发票特 ...

  4. 论文降重脚本思路(根据词性)

    紧跟着上一次的利用Synonyms库对论文进行降重,期间发现了使用上一版本的会出现文章与降重后的意思完全不一样,所以这次我是用了根据词性进行精准降重(例如只针对副词.形容词等等) Synonyms库对 ...

  5. 2篇word文档比较重复率_论文深耕 | 论文重复率太高怎么办?7个降重技巧收好了!...

    Hello! 这是你与「大学生科研竞赛」的第 25 次相遇. 不知道从什么时候开始,我们的网络社区被各种关于论文降重.论文查重.论文改重的知识所包围.相信每个上了大学的朋友或多或少都会接触到这方面的内 ...

  6. 计算机概念性的文字怎么降重,论文降重概念性的文字怎么改

    毕业论文是每名学生都需要面临的挑战,而毕业论文当中的重复率是其重要的一项关卡,重复率不达标准的毕业论文则会被高校视为不合格论文,不给予毕业答辩的资格,甚至会影响后续的毕业,也因此学生都会在论文上交前对 ...

  7. 为什么论文降重没有效果?

    在查重论文时,大家都会遇到这样的问题.在查重一篇论文的重复率后,发现论文中引用的内容也会被检测系统标记为红色.引用的内容也会被检测到吗?为什么每次查重结果都不一样?最让人感到无奈的是,重复的内容被明显 ...

  8. chatgpt可以降重论文吗-chatgpt降重论文软件

    chatgpt可以降重论文吗 ChatGPT是一种自然语言处理技术,可以生成符合指定条件的文本.因此,理论上可以使用ChatGPT来降重论文.但是,需要注意以下几点: 是否符合学术道德要求:学术论文的 ...

  9. 毕业生查重必备!!论文降重小技巧 + 查重网站哪家强

    我们学校有三次查重机会,所以第一次我头一热没有自己降重,就直接上传了.重复率44%,所以在多数人不需要担心是否在30%以内时,我就很惴惴不安,要努力降重!以下就介绍了我写论文的降重方法和查重网站的使用 ...

最新文章

  1. 正确关闭WCF代理对象
  2. LeetCode MySQL 197. 上升的温度
  3. c++如何禁用指定的键盘布局_Karabiner Elements for Mac 键盘键位自定义改键工具
  4. Hadoop(二)搭建Hadoop集群
  5. 一个demo学会js
  6. linux自带perl加密,关于加密:如何在Perl脚本中加密或隐藏密码?
  7. python如何获取鼠标位置_python实时得到鼠标的位置
  8. 游戏王ygocore项目解析
  9. 【ISO9126】软件质量模型的介绍(软件质量管理的六大特征和二十七个子特征)
  10. 中介分析(二): 多重中介分析
  11. 稻盛和夫:人为什么要努力工作?
  12. win10怎样将桌面上回收站快捷键图标隐藏或显示
  13. NetBeans 打开/保存具有指定编码的文件插件
  14. 苹果网页显示无法连接服务器失败怎么办啊,苹果手机自带的浏览器显示无法连接互联网是怎么回事啊...
  15. 时间都去哪了--你统计过你每天花在手机上的时间么?
  16. 面试官:RocketMQ是什么,它有什么特性与使用场景?
  17. 非支配排序遗传算法c语言,非支配排序遗传算法(NSGA)的研究与应用
  18. 软件测试面试官都问些啥?(内附答案)
  19. 想养花,先了解这18种(不收藏是你的损失)
  20. linux乘机模式怎么关闭,坐飞机前 在CentOS Linux中检查电池容量

热门文章

  1. Google 地图 API示例
  2. 【洛谷】P1318 积水面积
  3. 推荐一款Win10桌面分屏软件(PowerToys)
  4. 电子招标采购系统源码 + 二次开发+定制化服务
  5. 使用`NewtonSoft.Json`的序列化与反序列化
  6. 一个完整的线上产品推广方案需要的要素和渠道是什么?
  7. 计算机全国统考深圳考点,2019深圳市公务员考试笔试考点及考场安排表汇总(各考区)-深圳市考试院...
  8. wordpress在LINUX主机和windows主机下如何设定301重定向
  9. 搜索实现 app 本地搜索效果,有历史记录的
  10. 委托开发合同与合作开发合同的区别