java 如何计算两个汉字的相似度?如何获得一个汉字的相似汉字?
计算汉字相似度
情景
有时候我们希望计算两个汉字的相似度,比如文本的 OCR 等场景。用于识别纠正。
实现
引入 maven
<dependency><groupId>com.github.houbb</groupId><artifactId>nlp-hanzi-similar</artifactId><version>1.3.0</version>
</dependency>
java 实现
double rate1 = HanziSimilarHelper.similar('末', '未');
返回对应的相似度:
0.9629629629629629
返回一个汉字的相似列表
情景
找到相似的汉字,有很多有趣的场景。
实现
List<String> list = HanziSimilarHelper.similarList('爱');
Assert.assertEquals("[爰, 爯, 受, 爭, 妥, 憂, 李, 爳, 叐, 雙]", list.toString());
开源地址
为了便于大家学习,上述代码已开源
https://github.com/houbb/nlp-hanzi-similar
在线体验
在线体验
拓展阅读
NLP 中文形近字相似度计算思路
中文形近字相似度算法实现,为汉字 NLP 尽一点绵薄之力
当代中国最贵的汉字是什么?
NLP 开源形近字算法补完计划(完结篇)
NLP 开源形近字算法之形近字列表(番外篇)
开源项目在线化 中文繁简体转换/敏感词/拼音/分词/汉字相似度/markdown 目录
java 如何计算两个汉字的相似度?如何获得一个汉字的相似汉字?相关推荐
- C++/JAVA 计算两篇文章的相似度
C++/JAVA 计算两篇文章的相似度 这位少侠,要不要进店瞧瞧? 实验介绍及思路 问题描述: 编写程序,计算任意两篇文章的相似度. 基本思路: 利用余弦相似度来计算其相似度. 完整代码 C++ 代码 ...
- 如何计算两幅图像的相似度,计算两张图片相似度
怎么对比两张图片的相似度 1.首先打开微信,选择底部"发现".如图所示.2.然后在点击进入"小程序".如图所示.3.然后输入"腾讯AI体验中心&quo ...
- java opencv 相似度_opencv使用 java 对比两个人脸的相似度
1.创建Java工程,并导入如下jar包 opencv-440.jar 2.编写代码 import org.opencv.core.*; import org.opencv.imgcodecs.Img ...
- java计算两个经纬度之间的距离
前一阵项目中,有一个需求:是查找附近的人,其实就是查询某个距离内有多少用户.实现方式还是比较简单的,之前使用GeodeticCalculator计算经纬度误差在高德上与腾讯有点偏差,首先用户在APP上 ...
- java两个数组中不同的数字_java将两个数组中不同的数字去掉一个剩下的保存到一个新的数组中...
展开全部 package co; import java.util.Arrays; import java.util.HashSet; import java.util.Set; /** * java ...
- 如何计算两个字符串之间的文本相似度?
如何计算两个字符串之间的文本相似度? 前言 平时的编码中,我们经常需要判断两个文本的相似性,不管是用来做文本纠错或者去重等等,那么我们应该以什么维度来判断相似性呢?这些算法又怎么实现呢?这篇文章对常见 ...
- 如何计算两个文档的相似度(一)
下面的内容转自我爱自然语言处理博客,感谢博主,学到很多东西. 原文链接:http://www.52nlp.cn/%E5%A6%82%E4%BD%95%E8%AE%A1%E7%AE%97%E4%B8%A ...
- Java黑皮书课后题第4章:*4.2(几何:最大圆距离)最大圆面积是指球面上两个点间的距离。编写一个程序,提示用户以度为单位输入地球上两个点的经纬度,显示其最大圆距离值
*4.2(几何:最大圆距离)最大圆面积是指球面上两个点间的距离.编写一个程序,提示用户以度为单位输入地球上两个点的经纬度,显示其最大圆距离值 题目 题目概述 破题 运行示例 代码 题目 题目概述 *4 ...
- matlab源代码 语义相似度计算,如何计算两个句子之间的相似度(句法和语义)...
我应该每次取两个句子并计算它们是否相似.我的意思是,在语法和语义上都是这样.如何计算两个句子之间的相似度(句法和语义) INPUT1:奥巴马签署法律.奥巴马签署了一项新法律. INPUT2: 总线停在 ...
最新文章
- 独家 | 成功开发者必备的5项软技能
- 【原创】如何使用Jmockit进行单元测试
- DirectUI介绍
- 探索 .NET Core 依赖注入的 IServiceProvider
- 文件指针创建失败!File *fp失败
- linux 敏感标记 权限,闲话Linux系统安全(二)——强制访问控制(MAC)
- 全奖博士招生,伦敦大学学院盖茨比计算神经科学研究组
- tomcat7 IP限制配置
- 双系统win+ubuntu14.04使用360随身wifi 3代
- 电脑软件从通过运行开启(耍帅必会)
- 进入bios看了,vt 已经开了,为什么打开模拟器还显示未开启?
- NoSQLBooster for MongoDB软件使用
- android中按两次返回键返回桌面或退出程序
- Opencv4.5.1 微信二维码识别功能 QRCode 编译与使用 C++
- iTerm2终端集成git缩写意思
- 新加坡IT薪酬总结,
- 数学方面的一些思维训练
- 多尺度计算机模拟方法,多尺度问题的数值模拟.pdf
- 没有插件的sublime编辑器是没有灵魂的
- Android6.0源码解读之ViewGroup点击事件分发机制
热门文章
- 第三方服务:腾讯云短信服务 Handler dispatch failed; nested exception is java.lang.NoSuchMethodError: org.json.JSO
- 设备像素、css 像素、设备独立像素、dpr、ppi 之间的区别?
- opc读取ab的plc数据_ABPLC通过OPC方式通讯的连接方法
- uni-app 【JS Framework】报错当前运行的基座不包含原生插件【xxxx】,请在manifest.json中配置该插件---uniapp原生开发006
- 怎么将ppt转换成pdf格式
- 汉语是世界上最优秀的语言
- mysql中判断NULL和空字符串
- elementUi中的el-input去掉border边框
- 5分钟搭建SpringCloud Eureka服务注册中心
- P7909 [CSP-J 2021] 分糖果(详细讲解)