1.Opencc-python

今天学习文本分析中偶然想到繁体中文要如何分割的问题,于是联想到将繁体中文先转换为简体中文,查过网上的资料后发现比较好用的是opencc-python,以及下载zh_wiki.py 和 langconv.py,将这两个文件放到python代码所在目录即可。

先来说说后者遇到的问题

因为我只安装了anaconda,没有另外装python,所以没有办法跟着网上的教程进行配置环境,如果装了python的话应该会比较容易一点

opencc-python的问题

原以为这个也挺容易的,没想到也弄了一个下午。如果按照网上教程,不管我在anaconda prompt里还是命令行里利用pip install opencc-python安装都会报错(提示我的错误是403,这个错误目前还么有看到有解决的办法),别灰心

我在GitHub上找到了正确的打开方式!!!

原来,开发这个库的作者将安装代码更新了!立马打开anaconda prompt运行,安装成功!!而且opencc-python 能在Python2.7 和Python3.x.运行,感动天地!!安装代码如下:

pip install opencc-python-reimplemented

用法

from opencc import OpenCC
cc = OpenCC('s2t')  # 将简体中文转换为繁体中文
to_convert = '开放中文转换'
converted = cc.convert(to_convert)
converted
#Output:'開放中文轉換'
cc.set_conversion('s2tw')  #将简体中文转换成繁体中文(以台湾标准)
print(cc.convert(to_convert))
#Output: 開放中文轉換

转换代码

hk2s: 繁体中文(香港标准)转简体中文

s2hk: 简体中文转繁体中文(香港标准)

s2t: 简体中文转繁体中文

s2tw: 简体中文转换成繁体中文(台湾标准)

s2twp: 简体中文转繁体中文(带短语)

t2hk: 繁体中文转繁体(香港标准)

t2s: 繁体中文转简体

t2tw: 繁体中文转繁体(台湾标准)

tw2s: 繁体中文(台湾标准)转简体中文

tw2sp:繁体中文(台湾标准)转简体中文(带短语)

详情请看:opencc-python

2. python-pinyin-jyutping-sentence

除了繁体简体转换,还找到了一个将简体中文、粤语转换为拼音的,这个项目是为了制作普通话和粤语的卡片,不过有点奇怪的是作为一个广东人,粤语翻译出来的拼音我不怎么会念。。。不过还是挺有趣的!给大家分享一下~

安装

pip install pinyin_jyutping_sentence

用法

import pinyin_jyutping_sentence
pinyin_jyutping_sentence.pinyin("提高口语")
# Output:'tígāo kǒuyǔ'
pinyin_jyutping_sentence.jyutping("我出去攞野食")
# Output:'ngǒ cēothêoi ló jěsik'

详情请见:简体、粤语转拼音

opencc解决简体中文与繁体中文转换问题【python】相关推荐

  1. java将简体中文_【Java】简体中文、繁体中文转换

    项目中用到繁体中文语言适配,目前已经有开源的框架可以将简体中文转换成繁体中文,在此基础上封装了一个工具类,可以直接将简体中文的strings.xml转换成繁体中文的strings.xml. 引用Jar ...

  2. 【Java】简体中文、繁体中文转换

    个人博客: http://www.milovetingting.cn 项目中用到繁体中文语言适配,目前已经有开源的框架可以将简体中文转换成繁体中文,在此基础上封装了一个工具类,可以直接将简体中文的st ...

  3. python简体中文、繁体中文转换

    使用hanziconv这个库:pip install hanziconv 简体转繁体 from hanziconv import HanziConvprint(HanziConv.toTraditio ...

  4. 简体中文与繁体中文之间的转换

    刚开发玩的一个项目要将简体中文转换为繁体中文并生成txt文档传送到服务器,但是之前一直没接触过,这次算是费尽周折总算搞定! 今天把这个总结一下保存下来方便以后的查询,也方便大家共同进步 首相是将简体中 ...

  5. 简体中文与繁体中文互转

     一. BIG5编码, GB编码(GB2312, GBK, ...), Unicode编码, UTF编码 1.1. BIG5编码 BIG5字集是台湾繁体字集,共包括国标繁体汉字13053个 1.2 ...

  6. java获取系统语言(区分简体中文和繁体中文)

    2019独角兽企业重金招聘Python工程师标准>>> 之前做android应用时遇到过一个问题,就是根据语言的不同而显示不同的内容 网上很多代码都是错误的,起码无法区分简体和繁体, ...

  7. 简体中文转换为繁体中文

    <? /***********************************************************************                       ...

  8. php 简转繁体,PHP_简体中文转换为繁体中文的PHP函数,感谢网友Keyes提供移植用的Delph - phpStudy...

    简体中文转换为繁体中文的PHP函数 感谢网友Keyes提供移植用的Delphi源代码.其调用方式为$txt=gbtobig5($txt). (注:源代码中的include "data_gb. ...

  9. java判断简体和繁体字_java获取系统语言(区分简体中文和繁体中文) | 学步园...

    之前做android应用时遇到过一个问题,就是根据语言的不同而显示不同的内容 网上很多代码都是错误的,起码无法区分简体和繁体,这里给出一种方法 不涉及android任何知识,所以就归类到java这边了 ...

最新文章

  1. CodeForces 375D Tree and Queries
  2. Windows保护模式学习笔记(一)—— 段寄存器GDT表
  3. 读写锁的由奢入俭“易”
  4. context set_parameter all_req_parameters /iwfnd/if_sodata_types=gcs_iwf_context
  5. 设计模式--单例模式--Java实现
  6. 应届生月薪2W,财务人却不涨薪?那是你不会这种财务分析
  7. Android实战——Activity超详细学习笔记
  8. mysql的server_id怎么设置_MySQL Server-id踩到的坑
  9. 谈谈平安京资源的npk解包思路
  10. 使用phpQuery获取数组
  11. IT项目管理流程总结·二十三
  12. 债券指数基金以及债券ETF
  13. 利用python提取企查查企业的工商基本信息
  14. dom4j解析xml错误-version 后面跟随的值必须是用引号括起来的字符串
  15. 一键部署开箱即用的代理服务器,解决 SAP UI5 应用开发过程中访问远端 OData 服务的跨域问题试读版
  16. MATLAB画阶梯图
  17. 基于STM32视频监控系统
  18. PTA 盲盒包装流水线 (25 分)
  19. 《JavaScript AST其实很简单》五、Step4-平坦化控制流
  20. UVM--TLM2.0通信

热门文章

  1. 我国6大超级计算机,崛起的象征!外媒评出中国现代科技的6个奇迹
  2. MATLAB系统仿真其三:Lorenz和Rossler系统混沌同步
  3. 一阶电路中的时间常数_以及一阶电路的时间常数的概念.ppt
  4. RPLIDAR A3开箱实测
  5. vue表单验证时怎么定位到错误的地方
  6. ZOJ 2853 Evolution[ 矩阵快速幂 ]
  7. IDEA 配置热部署
  8. 怎么玩ChatGPT?解锁玩ChatGPT玩法
  9. 实操!看看JNPF是如何快速搭建HRM系统的
  10. Farfetch、阿里巴巴集团和历峰集团结成全球合作伙伴关系,将加速奢侈品行业数字化进程