基于Windows安装langconv实现繁体和简体字的转换

在学习自然语言处理的时候,大家可能已经发现有些中文数据集是繁体字,那么当我们的任务需求是输出简体字时就需要对原始中文数据集进行字体转换,达到顺利输出的目的。

一、点击下面的链接打开对应的安装包的网页。注意:为什么要下载zh_wiki文件,原因是langconv文件内的代码需要用到(见下面第三张图)。

  • zh_wiki.py文件:zh_wiki.py文件
  • langconv.py文件:langconv.py文件



二、对应分别都点击“raw”。



三、然后分别都再右击鼠标点击“另存为…”。


四、然后弹出另保存的新弹框后,首先选择文件保存的路径,选择安装到你需要使用这个功能的python项目的路径(建议选择此种方式),当然不听话的你也可以随便保存到自己想放置此文件的路径(比如:博主放到“D:\Anaconda\Scripts”路径,需要时使用sys这个python库即可,见下面代码),然后将文件名去掉默认的后缀“.txt”,然后保存类型选择“所有文件”,最后点击“保存”,然后等待十秒下载完成。

import sys
from sys import path
path.append(r'D:\Anaconda\Scripts') # 项目中添加langconv文件的路径,注意要放在import前




五、复制下面代码在jupyter notebook上运行,若没有安装软件可以参考博主下面两篇文章进行安装,运行结果如下图所示则表示安装langconv实现繁体和简体字的转换成功。注意:字符串不能先进行decode解码,要先encode编码再解码,否则运行程序会报错。

  • 点击打开《Jupyter Notebook安装及使用指南》文章
  • 点击打开《Jupyter Notebook自动补全代码配置》文章
import sys
from sys import path
path.append(r'D:\Anaconda\Scripts')
from langconv import Converterdef simple2tradition(line):#将简体转换成繁体line = line.encode('utf-8')line = Converter('zh-hant').convert(line.decode('utf-8'))return linedef tradition2simple(line):# 将繁体转换成简体line = line.encode('utf-8')line = Converter('zh-hans').convert(line.decode('utf-8'))return line
str = "我是CSDN博主Rothschildlhl,欢迎大家关注我的博客,谢谢!"
str1 = simple2tradition(str)
print(str1)
str2 = tradition2simple(str1)
print(str2)

基于Windows安装langconv实现繁体和简体字的转换相关推荐

  1. 如何安装mysql 8.0.12_基于Windows安装MySQL 8.0.12图文教程

    本教程仅适用Windows系统,如果你原本装了没装上,一定要先删除原本的数据库,执行:mysqld --remove mysql,然后在看我的帖子! 第一步:到MySQL官网下载安装包 第二步:将下载 ...

  2. VirtualBox基于Windows安装

    VirtualBox基于Windows安装 软件安装 选择安装位置 添加快捷方式 网络重置警告 开始安装 安装完成 问题描述 新建虚拟机只显示32位版本 官方网站:点击进入 (需要科学上网) 软件安装 ...

  3. putty上传文件到linux_基于windows安装部署putty小工具及相关功能介绍

    概述 PuTTY是一个Telnet.SSH.rlogin.纯TCP以及串行接口连接软件.较早的版本仅支持Windows平台,在最近的版本中开始支持各类Unix平台,并打算移植至Mac OS X上.除了 ...

  4. 基于Win10安装双系统Ubuntu不能正常进入的问题

    基于Win10安装双系统Ubuntu不能正常进入的问题 1.基于Windows安装Ubuntu,如果需要再次覆盖安装 需要进入Windows,将需要覆盖安装的磁盘,重新分区 2.安装Ubuntu结束, ...

  5. logicaldoc 6.5 结合postgresql 9.x安装部署—基于windows平台

    2019独角兽企业重金招聘Python工程师标准>>> 湘中朱生   2012年9月于深圳 说明:原创内容,请勿转载! <1> 从官网下载部署包 官方网站提供源码包和集成 ...

  6. 基于windows平台的命令行软件安装工具Chocolatey的安装

    本文介绍Chocolatey的安装和使用 Chocolatey 这是基于.NET Framework 4以上的windows安装软件的命令行工具 安装 第一步,打开你的powershell.exe,使 ...

  7. 基于Windows Server 2019域环境体验Veeam ONE 10安装

    基于Windows Server 2019域环境体验Veeam ONE 10安装 https://www.charflower.com/?p=1722 2020-02-20 by BOBtm 安装IS ...

  8. 基于 Windows 7 的计算机可用内存低于安装内存

    基于 Windows 7 的计算机可用内存低于安装内存 症状 在运行 Windows 7 的计算机上,可用内存 (RAM) 大小可能会低于已装内存大小. 例如,32 位版本的 Windows 7 可能 ...

  9. wmi 计算机应用程序,WMI 提供程序宿主程序 (Wmiprvse.exe) 已安装 NLB 功能的基于 Windows Server 2008 的计算机上可能会崩溃...

    修补程序信息 可以从 Microsoft 获得受支持的修复程序.然而,此修补程序仅用于解决本文中描述的问题.此修复程序仅适用于遇到本文中描述的问题的系统.此修补程序可能会接受进一步的测试.因此,如果这 ...

最新文章

  1. trainer setup_Detectron2源码阅读笔记-(一)Configamp;Trainer
  2. JDK安装以及开发环境搭建
  3. php header 重定向 url不变_PHP实现页面跳转功能
  4. 浅析网站备案的三大好处——你的网站备案了吗?
  5. 数据中心操作运营贴士:确保生命安全
  6. python读取文件夹下所有图片_python 读取单文件夹中的图片文件信息保存到csv文件中...
  7. ldap配置系列二:jenkins集成ldap
  8. .NET 6 全新指标 System.Diagnostics.Metrics 介绍
  9. [原创]FineUI秘密花园(二十一) — 表格之动态创建列
  10. mysql5.4升级5.6_如何在CentOS上升级php5.4至5.6?
  11. ID3、C4.5、CART决策树算法解析(关键内容讲解)
  12. 编写高质量代码改善C#程序的157个建议——建议38:小心闭包中的陷阱
  13. html5 播放加密视频,说说Html5视频加密播放原理和优势
  14. 主线剧情0.0-Linux学习资源大综合
  15. 基础练习 Sine之舞(最近FJ为他的奶牛们开设了数学分析课,FJ知道若要学好这门课,必须有一个好的三角函数基本功。所以他准备和奶牛们做一个“Sine之舞”的游戏,寓教于乐,提高奶牛们的计算能力。)
  16. 嵌入式Linux使用TFT屏幕:使用TinyDRM点亮ST7789V屏幕
  17. zte中兴客户端掉线的一种解决办法
  18. 禁止QQ迷你首页运行【转】
  19. 想学习高速ADC/DAC/SDR项目这个项目你不得不理解
  20. 计算机用户怎么配置漫游,Windows下漫游用户配置和强制漫游用户配置详细过程...

热门文章

  1. VHDL程序的基本结构
  2. Linux 15:基于C/S架构——微云盘
  3. ARIMA模型学习心得
  4. SQL数据库不用SQL语句能显示全表的内容_阿里巴巴数据库分库分表的实践
  5. win10开机黑屏,需要重新开机2~3次才能正常启动(如不能解决,上电脑官网重装本机驱动)
  6. SpringCloud微服务安装lombok(小辣椒)插件
  7. 【Python爬虫与数据分析】进程、线程、协程
  8. python创建棋盘矩阵_python使用turtle绘制国际象棋棋盘
  9. 从git中删除文件夹
  10. Docker 部署jenkins最新版本