基于PyQT5、OCR、文字转语言等实现翻译功能(自动识别语言),实现词频统计,生成词云等,读取txt文件内容


前言

提示:基于PyQT5、OCR、文字转语言等实现翻译功能(自动识别语言)

参考链接:https://blog.csdn.net/m0_46778548/article/details/121042773?ops_request_misc=&request_id=&biz_id=102&utm_term=%E6%9C%89%E9%81%93%E7%BF%BB%E8%AF%91&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-3-121042773.nonecase&spm=1018.2226.3001.4187https://blog.csdn.net/melo_1/article/details/105036899https://blog.csdn.net/melo_1/article/details/105036899https://blog.csdn.net/melo_1/article/details/105036899

用Python破解有道翻译反爬虫机制_南窗客斯黄的博客-CSDN博客_爬虫有道翻译https://blog.csdn.net/m0_46778548/article/details/121042773?ops_request_misc=&request_id=&biz_id=102&utm_term=%E6%9C%89%E9%81%93%E7%BF%BB%E8%AF%91&utm_medium=distribute.pc_search_result.none-task-blog-2~all~sobaiduweb~default-3-121042773.nonecase&spm=1018.2226.3001.4187


一、程序演示

二、核心代码

1.翻译

代码如下:

    def translatefun(self):import urllib.requestimport urllib.parseimport jsona = "123"def translate_action(content):# print(content)url = 'http://fanyi.youdao.com/translate?smartresult=dict&smartresult=rule'# 需要打开网页的链接,这个在Request URL栏head = {}head['User-Agent'] = 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/80.0.3987.122 Safari/537.36'# 模拟浏览器访问,简单的防止反爬机制。这个在Request Headers中的User-Agent栏。data = {}data['i'] = contentdata['from'] = 'AUTO'data['to'] = 'AUTO'data['smartresult'] = 'dict'data['client'] = 'fanyideskweb'data['salt'] = '15847864360501'data['sign'] = 'f762faa6901c6cf473fce719f8238ca8'data['ts'] = '1584786436050'data['bv'] = '0ed2e07b89acaa1301d499442c9fdf79'data['doctype'] = 'json'data['version'] = '2.1'data['keyfrom'] = 'fanyi.web'data['action'] = 'FY_BY_REALTlME'# 将Form Data数据存入data字典中。data = urllib.parse.urlencode(data).encode('utf-8')# 将data以utf-8的形式编码req = urllib.request.Request(url, data, head)# 以代码中的data与head形式访问代码中的url链接response = urllib.request.urlopen(req)# 打开url网页并传送data与headhtml = response.read().decode('utf-8')# 读取打开的网页并进行utf-8解码target = json.loads(html)# 识别jsonprint(target['translateResult'])result = ''for i in target['translateResult']:for j in range(len(i)):print(i[j]['tgt'])result += i[j]['tgt']result += '\n'print(result)return resulttry:lt=translate_action(self.leftT.toPlainText())self.rightT.setText(str(lt))except:print("translatefun 128 err")

2.词频统计

代码如下:

    def analyseText(self):txt = self.rightT.toPlainText()words = jieba.lcut(txt)# print(words)counts = {}# while i<len(words):for word in words:if len(word) == 1:continueelse:rword = wordcounts[rword] = counts.get(rword, 0) + 1  # 返回指定键的值,如果值不在字典中返回default值即0sed = sorted(counts.items(), key=lambda x: x[1], reverse=True)[:20]tk20=[]tv20=[]for (k, v) in sorted(counts.items(), key=lambda x: x[1], reverse=True)[:10]:print("{}\t\t\t\t{}".format(k, v))tk20.append(k)tv20.append(v)plt.rcParams['font.family'] = 'STsong'print(tk20,tv20)plt.bar(tk20, tv20, color='lightskyblue')plt.xlabel('出现词语')plt.ylabel('出现次数')plt.title('词频统计柱状图')plt.show()

3.词云图生成:

 def wordimg(self):import matplotlib.pyplot as pltfrom wordcloud import WordCloudimport jiebagetText=self.rightT.toPlainText()jtext = jieba.cut(getText, cut_all=True)jtextsplit = " ".join(jtext)font = r'C:\Windows\Fonts\simfang.ttf'  # 设置中文字体,否则词云图可能不显示中文my_wordcloud = WordCloud(font_path=font).generate(jtextsplit)plt.imshow(my_wordcloud)plt.axis("off")  # 消除坐标轴plt.show()

4.图片识别文字

 def extractText(self):from cnocr.utils import read_imgfrom cnocr import CnOcr# 图片转文字def exT(imgpath):ocr = CnOcr()img_fp = imgpathimg = read_img(img_fp)res = ocr.ocr(img)text = ''for i in res:# print("".join(i[0]))text += "".join(i[0])text += "\n"return textfname = QFileDialog.getOpenFileName()text=exT(fname[0])self.leftT.setText(text)

如需要整套源码请点击python有道翻译、ocr图片转文字、文字转语音、统计词频、生成词云-Python文档类资源-CSDN下载


总结

由于本人能力有限,以后的学习中将继续完善自己的编码能力

Python基于有道翻译实现翻译功能_课程设计相关推荐

  1. python英汉字典,Python基于有道实现英汉字典功能,python英汉字典

    Python基于有道实现英汉字典功能,python英汉字典 本文实例讲述了Python基于有道实现英汉字典功能的方法.分享给大家供大家参考.具体如下: import re,urllib aa=&quo ...

  2. python绘制3d图形-Python基于matplotlib实现绘制三维图形功能示例

    本文实例讲述了Python基于matplotlib实现绘制三维图形功能.分享给大家供大家参考,具体如下: 代码一: # coding=utf-8 import numpy as np import m ...

  3. python画三维图-Python基于matplotlib实现绘制三维图形功能示例

    本文实例讲述了Python基于matplotlib实现绘制三维图形功能.分享给大家供大家参考,具体如下: 代码一: # coding=utf-8 import numpy as np import m ...

  4. 单片机串口中断控制流水灯c语言,基于单片机AT89C51控制的中断控制流水灯_课程设计报告...

    <基于单片机AT89C51控制的中断控制流水灯_课程设计报告>由会员分享,可在线阅读,更多相关<基于单片机AT89C51控制的中断控制流水灯_课程设计报告(25页珍藏版)>请在 ...

  5. matlab通信系统仿真设计课程设计,基于matlab的FM通信系统仿真设计与实现_课程设计报告...

    基于matlab的FM通信系统仿真设计与实现_课程设计报告 第 0 页 共 20 页第 0 页 共 20 第 0 页 共 20 页课程设计报告题 目 : 基于 matlab 的 FM 通信系统仿真设计 ...

  6. 基于SpringBoot的二手交易平台(自己的课程设计附项目下载)

    基于SpringBoot的二手交易平台(自己的课程设计附项目下载) 整体的目录如下: 整体首页是这样的: 左边是一个快捷的连接分类按钮,右边是分类对应的商品 那下面就详细介绍一下吧!!! 注意:下面的 ...

  7. android媒体播放器设计报告,基于Android的多媒體播放器课程设计报告.doc

    基于Android的多媒體播放器课程设计报告 基于Android的多媒体播放器课程设计报告 (2014-01-02 22:46:52) HYPERLINK "javascript:;&quo ...

  8. 基于U-Net系列算法的医学图像分割(课程设计)

    基于U-Net系列算法的医学图像分割(课程设计) 参考论文:包括U_Net/R2U_Net/AttU_Net/R2AttU_Net,如下图所示: 基于Pytorch的代码和数据集下载地址:下载地址 运 ...

  9. 20165219王彦博《基于Cortex-M4的虚拟机制作与测试》课程设计个人报告

    20165219王彦博<基于Cortex-M4的虚拟机制作与测试>课程设计个人报告 一.个人贡献 参与课设题目讨论及完成全过程: 资料收集: 负责环境搭建,代码运行下载: 撰写小组结题报告 ...

  10. android音乐播放器课程设计报告,基于android平台的音乐播放器的课程设计报告.docx...

    基于android平台的音乐播放器的课程设计报告 - PAGE - PAGE 17 - 吉 首 大 学 JISHOU UNIVERSITY <疯狂Android讲义>课程设计 报 告 书 ...

最新文章

  1. QT学习之经典控件源码(如此强大)
  2. 【设计模式】装饰者模式
  3. 安装完python后、还需要安装什么-初学 Python 需要安装哪些软件?
  4. 程序员Linux学到什么程度,Linux学到什么程度,才可以找到合适的工作?
  5. 深入理解计算机系统9个重点笔记
  6. 给一个正在运行的Docker容器动态添加Volume
  7. 7-2 最大流 加强版 (20 分)
  8. 女方妈妈和男方爸爸这样告诉即将结婚的儿女,写的真好,希望每个人都可以认真的把它看完...
  9. 线程池和定时器——多线程的自动管理(转载)
  10. PowerDesigner生成SQL
  11. 18.1---不用加号的加法(CC150)
  12. 静默安装oracle11,Oracle11g静默安装
  13. 高速公路收费标准c语言,c语言课程设计报告-高速公路收费系统
  14. Idea 中最常用的10款插件(提高开发效率),一定要学会使用!
  15. pdf合并成一个pdf怎么合并
  16. Docker mongo:5.0
  17. Windows 10打开Java控制面板
  18. 盘点那些年 半死不活的国产操作系统们
  19. SpringBoot整合Mybatis演示
  20. maven项目引入Google二维码框架zxing实现二维码(支持logo图)

热门文章

  1. Python编程:xlm文件读写
  2. CISA报考条件是什么?
  3. BPDU GUAR​D的功能
  4. Hadoop大数据技术教程( wukong-1.0v)
  5. 100ASK_全志V853-PRO开发板支持人形检测和人脸识别
  6. 专访埃洛普:为何Asha 501没有搭载Windows Phone系统
  7. 天玥微型计算机售后,航天科工自主可控硬件产品手册(35页)-原创力文档
  8. 办公神器!2024年值得拥有的10款在线画板软件!
  9. python通俗解释_解释下类 对象 属性 方法等等python语言中的各种术语 通俗场景化,对码字有帮助的解释...
  10. 驱动python_驱和两驱有什么区别?