python 日语转罗马音工具 pykakasi模块使用
翻译文章自:https://qiita.com/komorin0521/items/8cd1eb0cdb4a9ede217e
①下载模块:
pip install pykakasi
pip会自动把依赖库six和semidbm给装上
手动装也可以:
pip install six semidbm pip install pykakasi
模块主页:https://github.com/miurahr/pykakasi
②测试代码:
#!/usr/bin/env python3
# coding: utf-8
from pykakasi import kakasikakasi = kakasi()kakasi.setMode('H', 'a')
kakasi.setMode('K', 'a')
kakasi.setMode('J', 'a')conv = kakasi.getConverter()filename = '本日は晴天なり.jpg'print(type(filename))
print(conv.do(filename))
③最终结果:
honjitsuhaseitennari.jpg
④效果截图:
⑤参数说明
These switch alphabets are derived from original Kakasi. Now it support following options:
Option | Description | Values | Note |
---|---|---|---|
K | Katakana convertion | a,H,None | roman, Hiragana or noconversion |
H | Hiragana convertion | a,K,None | roman, Katakana or noconversion |
J | Kanji conversion | a,H,K,None | roman or Hiragana, Katakana or noconv |
a | Roman conversion | E,None | JIS ROMAN or noconversion |
E | JIS ROMAN conversion | a,None | ascii roman or noconversion |
Each character means character sets as follows:
Character Setsa: ascii j: jisroman g: graphic k: kana(j,k defined in jisx0201)E: kigou K: katakana H: hiragana J: kanji(E,K,H,J defined in jisx0208)
上面的参数说明很详细了,如果看不懂看下面的例子就一目了然:
from pykakasi import kakasi,wakatitext = u"かな漢字交じり文"
kakasi = kakasi()
kakasi.setMode("H","a") # Hiragana to ascii, default: no conversion
kakasi.setMode("K","a") # Katakana to ascii, default: no conversion
kakasi.setMode("J","a") # Japanese to ascii, default: no conversion
kakasi.setMode("r","Hepburn") # default: use Hepburn Roman table
kakasi.setMode("s", True) # add space, default: no separator
kakasi.setMode("C", True) # capitalize, default: no capitalize
conv = kakasi.getConverter()
result = conv.do(text)
print(result)wakati = wakati()
conv = wakati.getConverter()
result = conv.do(text)
print(result)
要说这个模块的作用,除了可以自动转换日文歌词之外,还有python的很多模块不支持非ascii字符串,比如Vapoursynth用于压制的时候,VSFilter或者VSFilterMod就不支持很多字幕文件名的字符了,这个模块可以自动把文件名转换成罗马音解决要手动改名字的麻烦。
python 日语转罗马音工具 pykakasi模块使用相关推荐
- win10日语输入法罗马音与假名不对应
问题 win10中使用日语输入法时,输入罗马音a,打出的却是ち,输入其他罗马音也是这种情况 出现这种情况是因为你无意中输入方式设置成了假名输入,我们需要改成罗马字输入 解决 在win10任务栏中的日语 ...
- Python脚本 抓取/翻译动漫角色名字的罗马音或外文名(用于搜索图片)
在 https://danbooru.donmai.us 搜索色图的时候,因为老美的网站的缘故,不支持中文和日文输入,只能输入平假名对应罗马音来寻找人物.像我虽然日语N1了,但是遇到人名有时依然会念错 ...
- Python中常用的数据分析工具(模块)有哪些?
本期Python培训分享:Python中常用的数据分析工具(模块)有哪些?Python本身的数据分析功能并不强,需要安装一些第三方的扩展库来增强它的能力.我们课程用到的库包括NumPy.Pandas. ...
- 罗马音平假名片假名转换器_零基础日语萌新该如何学习五十音?
在这里跟小伙伴们讲一下如何学习日语50音.五十音就像我们的二十六个字母一样.如果我们不能熟练地写和发音五十种音调,我们就无法很好地继续学习. 日语五十音图 https://sourl.cn/rMFhZ ...
- 罗马音平假名中文可复制_如何快速有效地学习日语五十音?
在日语学习的过程中,五十音图是学习日语朋友的第一步,而在平假名,片假名和罗马字的转换中,让一部分初学之放弃了日语的学习,那么,日语五十音图很难背吗?什么样的方法记忆日语五十音图最高效,日语五十图记忆方 ...
- 罗马音平假名中文可复制_日语零基础入门五十音,日语零基础五十音图表
日语零基础入门五十音,日语入门的最基本要求就是记住五十音图,但是这个记住不仅是你能背下来或是默写下来.而是你需对号入座! 下面是一张五十音图表. 即每个假名单独拿出来你要立马反应出来怎么读.其重要性甚 ...
- 【python小白】抖音无水印视频下载小工具(windows)
无水印视频的方法大家都已经知道了,我很早之前也写了一个脚本.最近学习了一下下pyside2,所以我用python写了一个小工具. 运行图: from PySide2.QtWidgets import ...
- 罗马音平假名中文可复制_想自学日语口语又想唱日语歌但苦于不会读罗马音标?干货都在这...
日文应该算是一门和中文相似度较高的语言了,其中很多字词都来源于中文的繁体字,所以相对于英文来说,我们学习日文更加容易上手. 和我国汉语拼音不同的是,学习日语需要用到罗马音标,相信唱过日语歌的小伙伴都看 ...
- python一键去抖音视频水印工具,请勿用于学习以外的用途!
一.前言 翻了翻爬虫代码存货,决定把抖音APP视频批量下载的代码拿出来做个文章. 二.实战背景 抖音越来越火,越刷越上瘾,总感觉下一个视频一定会更精彩,根本停不下来.想将抖音里喜欢的小哥哥/×××姐的 ...
最新文章
- 模型保存的序列化文件pb 什么是PB文件 pb是protocol(协议) buffer(缓冲)的缩写
- Spring Cloud Netflix Eureka 配置参数说明
- Face Alignment at 3000 FPS via Regressing Local Binary Features(CVPR2014)读后感(first pass)
- Leetcode 226. 翻转二叉树 (每日一题 20210819)
- 机器学习初学者手抄本:数学基础、机器学习经典算法、统计学习方法等
- Generative Adversarial Learning Towards Fast Weakly Supervised Detection(CVPR2018)阅读笔记
- 清除无用工具栏:CommandbarCleaner下载
- 什么是MES?与ERP有什么区别呢?
- MySQL存储过程-循环遍历查询到的结果集
- 关于SQL Server将一列的多行内容拼接成一行的问题讨论
- 浏览器Browser截屏截长图使用记录220813
- linux内核中的以太网phy芯片的驱动介绍:以lan8720和ip101作为对比
- ami码matlab,matlab编程实现ami码的相关问题
- java对大陆身份证号码验证
- 计算机excel中钱的符号,在excel中输入钱的符号 excel货币符号
- 免费4s店汽车保养维修记录查询的方式
- 为什么书上说是 TCP 四次挥手,但是实际会出现 TCP 三次挥手?
- MVC无法打开项目文件 此安装不支持该项目类型
- Unity颜色转换(HtmlString和Color)
- ncbi查找目的基因序列_如何获得基因序列——在NCBI中查找目的基因实例.PDF