计算汉字相似度

情景

有时候我们希望计算两个汉字的相似度,比如文本的 OCR 等场景。用于识别纠正。

实现

引入 maven

<dependency><groupId>com.github.houbb</groupId><artifactId>nlp-hanzi-similar</artifactId><version>1.3.0</version>
</dependency>

java 实现

double rate1 = HanziSimilarHelper.similar('末', '未');

返回对应的相似度:

0.9629629629629629

返回一个汉字的相似列表

情景

找到相似的汉字,有很多有趣的场景。

实现

List<String> list = HanziSimilarHelper.similarList('爱');
Assert.assertEquals("[爰, 爯, 受, 爭, 妥, 憂, 李, 爳, 叐, 雙]", list.toString());

开源地址

为了便于大家学习,上述代码已开源

https://github.com/houbb/nlp-hanzi-similar

在线体验

在线体验

拓展阅读

NLP 中文形近字相似度计算思路

中文形近字相似度算法实现,为汉字 NLP 尽一点绵薄之力

当代中国最贵的汉字是什么?

NLP 开源形近字算法补完计划(完结篇)

NLP 开源形近字算法之形近字列表(番外篇)

开源项目在线化 中文繁简体转换/敏感词/拼音/分词/汉字相似度/markdown 目录

java 如何计算两个汉字的相似度?如何获得一个汉字的相似汉字?相关推荐

  1. C++/JAVA 计算两篇文章的相似度

    C++/JAVA 计算两篇文章的相似度 这位少侠,要不要进店瞧瞧? 实验介绍及思路 问题描述: 编写程序,计算任意两篇文章的相似度. 基本思路: 利用余弦相似度来计算其相似度. 完整代码 C++ 代码 ...

  2. 如何计算两幅图像的相似度,计算两张图片相似度

    怎么对比两张图片的相似度 1.首先打开微信,选择底部"发现".如图所示.2.然后在点击进入"小程序".如图所示.3.然后输入"腾讯AI体验中心&quo ...

  3. java opencv 相似度_opencv使用 java 对比两个人脸的相似度

    1.创建Java工程,并导入如下jar包 opencv-440.jar 2.编写代码 import org.opencv.core.*; import org.opencv.imgcodecs.Img ...

  4. java计算两个经纬度之间的距离

    前一阵项目中,有一个需求:是查找附近的人,其实就是查询某个距离内有多少用户.实现方式还是比较简单的,之前使用GeodeticCalculator计算经纬度误差在高德上与腾讯有点偏差,首先用户在APP上 ...

  5. java两个数组中不同的数字_java将两个数组中不同的数字去掉一个剩下的保存到一个新的数组中...

    展开全部 package co; import java.util.Arrays; import java.util.HashSet; import java.util.Set; /** * java ...

  6. 如何计算两个字符串之间的文本相似度?

    如何计算两个字符串之间的文本相似度? 前言 平时的编码中,我们经常需要判断两个文本的相似性,不管是用来做文本纠错或者去重等等,那么我们应该以什么维度来判断相似性呢?这些算法又怎么实现呢?这篇文章对常见 ...

  7. 如何计算两个文档的相似度(一)

    下面的内容转自我爱自然语言处理博客,感谢博主,学到很多东西. 原文链接:http://www.52nlp.cn/%E5%A6%82%E4%BD%95%E8%AE%A1%E7%AE%97%E4%B8%A ...

  8. Java黑皮书课后题第4章:*4.2(几何:最大圆距离)最大圆面积是指球面上两个点间的距离。编写一个程序,提示用户以度为单位输入地球上两个点的经纬度,显示其最大圆距离值

    *4.2(几何:最大圆距离)最大圆面积是指球面上两个点间的距离.编写一个程序,提示用户以度为单位输入地球上两个点的经纬度,显示其最大圆距离值 题目 题目概述 破题 运行示例 代码 题目 题目概述 *4 ...

  9. matlab源代码 语义相似度计算,如何计算两个句子之间的相似度(句法和语义)...

    我应该每次取两个句子并计算它们是否相似.我的意思是,在语法和语义上都是这样.如何计算两个句子之间的相似度(句法和语义) INPUT1:奥巴马签署法律.奥巴马签署了一项新法律. INPUT2: 总线停在 ...

最新文章

  1. 独家 | 成功开发者必备的5项软技能
  2. 【原创】如何使用Jmockit进行单元测试
  3. DirectUI介绍
  4. 探索 .NET Core 依赖注入的 IServiceProvider
  5. 文件指针创建失败!File *fp失败
  6. linux 敏感标记 权限,闲话Linux系统安全(二)——强制访问控制(MAC)
  7. 全奖博士招生,伦敦大学学院盖茨比计算神经科学研究组
  8. tomcat7 IP限制配置
  9. 双系统win+ubuntu14.04使用360随身wifi 3代
  10. 电脑软件从通过运行开启(耍帅必会)
  11. 进入bios看了,vt 已经开了,为什么打开模拟器还显示未开启?
  12. NoSQLBooster for MongoDB软件使用
  13. android中按两次返回键返回桌面或退出程序
  14. Opencv4.5.1 微信二维码识别功能 QRCode 编译与使用 C++
  15. iTerm2终端集成git缩写意思
  16. 新加坡IT薪酬总结,
  17. 数学方面的一些思维训练
  18. 多尺度计算机模拟方法,多尺度问题的数值模拟.pdf
  19. 没有插件的sublime编辑器是没有灵魂的
  20. Android6.0源码解读之ViewGroup点击事件分发机制

热门文章

  1. 第三方服务:腾讯云短信服务 Handler dispatch failed; nested exception is java.lang.NoSuchMethodError: org.json.JSO
  2. 设备像素、css 像素、设备独立像素、dpr、ppi 之间的区别?
  3. opc读取ab的plc数据_ABPLC通过OPC方式通讯的连接方法
  4. uni-app 【JS Framework】报错当前运行的基座不包含原生插件【xxxx】,请在manifest.json中配置该插件---uniapp原生开发006
  5. 怎么将ppt转换成pdf格式
  6. 汉语是世界上最优秀的语言
  7. mysql中判断NULL和空字符串
  8. elementUi中的el-input去掉border边框
  9. 5分钟搭建SpringCloud Eureka服务注册中心
  10. P7909 [CSP-J 2021] 分糖果(详细讲解)