首先我们将对代码进行基础构思:

一、 创建TrieNode 类

Trie 树的节点类,用于构建 Trie 树。TrieNode 类有以下成员变量:
children:一个 Map,用于存储当前节点的子节点,key 是字符,value 是对应的子节点 TrieNode。
isEndOfWord:布尔值,表示当前节点是否是一个关键词的结尾。
fail:失败指针,指向其他节点,用于构建 Trie 树的失败指针。
matchedKeywords:一个 Set,用于存储匹配到的关键词。

/*** Trie树节点类*/
class TrieNode {Map<Character, TrieNode> children; // 子节点映射表boolean isEndOfWord; // 是否是关键词结尾TrieNode fail; // 失败指针,指向其他节点Set<String> matchedKeywords; // 匹配到的关键词集合public TrieNode() {children = new HashMap<>();isEndOfWord = false;fail = null;matchedKeywords = new HashSet<>();}
}

二 、创建Trie 类

Trie 类用于构建 Trie 树,并实现相关功能。Trie 类有以下成员变量:
root:Trie 树的根节点。
Trie 类有以下成员方法:
insert(String word): 将一个关键词插入到 Trie 树中。在插入过程中,逐个字符遍历,如果当前字符不存在对应的子节点,则创建一个新的节点并插入;如果当前字符已存在对应的子节点,则直接获取子节点继续遍历。最后标记当前节点为关键词结尾,并将该关键词添加到节点的 matchedKeywords 集合中。
buildFailPointers():构建 Trie 树的失败指针。通过 BFS 遍历 Trie 树,为每个节点设置失败指针,使得在搜索过程中可以快速回溯失败节点,从而实现 KMP 算法的功能。同时,也将匹配到的关键词集合合并到当前节点的 matchedKeywords 中。
search(String text):在文本中搜索关键词。根据 Trie 树,逐个字符遍历文本,并根据失败指针快速回溯,找到匹配的关键词。

/*** Trie树类*/
class Trie {private TrieNode root;public Trie() {root = new TrieNode();}/*** 插入关键词到Trie树* @param word*/public void insert(String word) {TrieNode current = root;for (char ch : word.toCharArray()) {current.children.putIfAbsent(ch, new TrieNode());current = current.children.get(ch);}current.isEndOfWord = true;current.matchedKeywords.add(word);}/*** 构建Trie树的失败指针,用于KMP算法*/public void buildFailPointers() {Queue<TrieNode> queue = new LinkedList<>();for (TrieNode child : root.children.values()) {child.fail = root;queue.add(child);}while (!queue.isEmpty()) {TrieNode current = queue.poll();for (Map.Entry<Character, TrieNode> entry : current.children.entrySet()) {char ch = entry.getKey();TrieNode child = entry.getValue();TrieNode failNode = current.fail;while (failNode != null && !failNode.children.containsKey(ch)) {failNode = failNode.fail;}if (failNode == null) {child.fail = root;} else {child.fail = failNode.children.get(ch);child.matchedKeywords.addAll(child.fail.matchedKeywords); // 合并匹配关键词集合}queue.add(child);}}}

三. 创建ChineseKeywordMatcher 类

ChineseKeywordMatcher 类是程序的入口点,负责读取用户输入的文本,并进行匹配。
ChineseKeywordMatcher 类有以下成员方法:
在主方法main中,我们定义了多组关键词,构建 Trie 树并插入关键词,然后构建失败指针,接着获取用户输入的文本,最后通过并行计算搜索组合关键词,并输出匹配的结果。
searchCombinationsParallel(String text, List<List> keywordGroups):并行计算搜索组合关键词,并返回匹配的组合关键词集合。在这个方法中,我们使用线程池来同时搜索多组关键词,从而提高搜索效率。
generateCombinations(String text, List keywords, StringBuilder currentCombination, Set matchedKeywords):生成所有组合关键词,并在文本中查找匹配。这是一个辅助方法,在主方法中调用,并通过非递归方式生成组合关键词,然后根据 Trie 树在文本中查找匹配。

    public static void main(String[] args) throws InterruptedException, ExecutionException {// 定义多组关键词List<List<String>> keywordGroups = new ArrayList<>();keywordGroups.add(Arrays.asList("人工智能", "AI"));keywordGroups.add(Arrays.asList("隐私计算", "联邦学习", "可信执行环境"));// 创建Trie树并插入关键词Trie trie = new Trie();for (List<String> keywords : keywordGroups) {for (String keyword : keywords) {trie.insert(keyword);}}// 构建Trie树的失败指针,用于KMP算法trie.buildFailPointers();// 获取用户输入的文本Scanner scanner = new Scanner(System.in);System.out.print("请输入中文文本:");String userInput = scanner.nextLine();scanner.close();// 并行计算搜索组合关键词,并返回匹配的组合关键词集合Set<String> matchedCombinationKeywords = searchCombinationsParallel(userInput, keywordGroups);if (!matchedCombinationKeywords.isEmpty()) {System.out.println("匹配的组合关键词:");for (String keyword : matchedCombinationKeywords) {System.out.println(keyword);}} else {System.out.println("没有匹配到组合关键词。");}}

四、 输入文本

在代码的 main 方法中,通过 Scanner 读取用户输入的中文文本。

  // 获取用户输入的文本Scanner scanner = new Scanner(System.in);System.out.print("请输入中文文本:");String userInput = scanner.nextLine();scanner.close();

注意:这里有部分长字符串需要剔除空格才可以精准匹配

五、 匹配组合关键词

在 searchCombinationsParallel 方法中,我们使用线程池和并行计算来搜索多组关键词的组合关键词。在 generateCombinations 方法中,我们通过非递归方式生成组合关键词,并利用 Trie 树在文本中查找匹配。最终输出匹配到的组合关键词。

  /*** 并行计算:在文本中搜索组合关键词,并返回匹配的组合关键词集合* @param text* @param keywordGroups* @return* @throws InterruptedException* @throws ExecutionException*/public static Set<String> searchCombinationsParallel(String text, List<List<String>> keywordGroups) throws InterruptedException, ExecutionException {// 获取可用处理器核心数,并创建对应数量的线程池int numThreads = Runtime.getRuntime().availableProcessors();ExecutorService executorService = Executors.newFixedThreadPool(numThreads);// 使用线程安全的集合来保存匹配结果Set<String> matchedCombinationKeywords = new ConcurrentSkipListSet<>();// 创建并行任务列表List<Callable<Set<String>>> tasks = new ArrayList<>();for (List<String> keywords : keywordGroups) {tasks.add(() -> {Set<String> matchedKeywords = new HashSet<>();generateCombinations(text, keywords, new StringBuilder(), matchedKeywords);return matchedKeywords;});}// 并行执行任务,获取结果并合并到结果集合List<Future<Set<String>>> futures = executorService.invokeAll(tasks);for (Future<Set<String>> future : futures) {matchedCombinationKeywords.addAll(future.get());}// 关闭线程池executorService.shutdown();return matchedCombinationKeywords;}/*** 生成所有组合关键词,并在文本中查找匹配* @param text* @param keywords* @param currentCombination* @param matchedKeywords*/private static void generateCombinations(String text, List<String> keywords, StringBuilder currentCombination, Set<String> matchedKeywords) {int[] indices = new int[keywords.size()]; // 记录每组关键词的索引while (true) {StringBuilder currentCombinationKeyword = new StringBuilder();// 生成当前的组合关键词for (int i = 0; i < keywords.size(); i++) {String keyword = keywords.get(i);// int index = indices[i];if (currentCombinationKeyword.length() > 0) {currentCombinationKeyword.append(",");}currentCombinationKeyword.append(keyword);indices[i]++;}Trie trie = new Trie();for (String keyword : currentCombinationKeyword.toString().split(",")) {trie.insert(keyword);}trie.buildFailPointers();Set<String> matched = trie.search(text);if (!matched.isEmpty()) {matchedKeywords.addAll(matched);}// 移动索引,类似组合数学中的组合生成算法int j = keywords.size() - 1;while (j >= 0 && indices[j] == keywords.size()) {indices[j] = 0;j--;}if (j < 0) {break;}}}

根据以上步骤思路我们编写完整代码,具体完整代码如下所示:

package cn.konne.konneim.download;
import java.util.*;
import java.util.concurrent.*;/*** Trie树节点类*/
class TrieNode {Map<Character, TrieNode> children; // 子节点映射表boolean isEndOfWord; // 是否是关键词结尾TrieNode fail; // 失败指针,指向其他节点Set<String> matchedKeywords; // 匹配到的关键词集合public TrieNode() {children = new HashMap<>();isEndOfWord = false;fail = null;matchedKeywords = new HashSet<>();}
}/*** Trie树类*/
class Trie {private TrieNode root;public Trie() {root = new TrieNode();}/*** 插入关键词到Trie树* @param word*/public void insert(String word) {TrieNode current = root;for (char ch : word.toCharArray()) {current.children.putIfAbsent(ch, new TrieNode());current = current.children.get(ch);}current.isEndOfWord = true;current.matchedKeywords.add(word);}/*** 构建Trie树的失败指针,用于KMP算法*/public void buildFailPointers() {Queue<TrieNode> queue = new LinkedList<>();for (TrieNode child : root.children.values()) {child.fail = root;queue.add(child);}while (!queue.isEmpty()) {TrieNode current = queue.poll();for (Map.Entry<Character, TrieNode> entry : current.children.entrySet()) {char ch = entry.getKey();TrieNode child = entry.getValue();TrieNode failNode = current.fail;while (failNode != null && !failNode.children.containsKey(ch)) {failNode = failNode.fail;}if (failNode == null) {child.fail = root;} else {child.fail = failNode.children.get(ch);child.matchedKeywords.addAll(child.fail.matchedKeywords); // 合并匹配关键词集合}queue.add(child);}}}/*** 在文本中搜索关键词,并返回匹配的关键词集合* @param text 要匹配得文本串* @return*/public Set<String> search(String text) {TrieNode current = root;Set<String> matchedKeywords = new HashSet<>();StringBuilder matchedKeyword = new StringBuilder();for (char ch : text.toCharArray()) {while (current != root && !current.children.containsKey(ch)) {current = current.fail;}if (current.children.containsKey(ch)) {current = current.children.get(ch);matchedKeyword.append(ch);if (current.isEndOfWord) {matchedKeywords.addAll(current.matchedKeywords);}} else {current = root;matchedKeyword.setLength(0);}}return matchedKeywords;}
}public class ChineseKeywordMatcher {public static void main(String[] args) throws InterruptedException, ExecutionException {// 定义多组关键词List<List<String>> keywordGroups = new ArrayList<>();keywordGroups.add(Arrays.asList("人工智能", "AI"));keywordGroups.add(Arrays.asList("隐私计算", "联邦学习", "可信执行环境"));// 创建Trie树并插入关键词Trie trie = new Trie();for (List<String> keywords : keywordGroups) {for (String keyword : keywords) {trie.insert(keyword);}}// 构建Trie树的失败指针,用于KMP算法trie.buildFailPointers();// 获取用户输入的文本Scanner scanner = new Scanner(System.in);System.out.print("请输入中文文本:");String userInput = scanner.nextLine();scanner.close();// 并行计算搜索组合关键词,并返回匹配的组合关键词集合Set<String> matchedCombinationKeywords = searchCombinationsParallel(userInput, keywordGroups);if (!matchedCombinationKeywords.isEmpty()) {System.out.println("匹配的组合关键词:");for (String keyword : matchedCombinationKeywords) {System.out.println(keyword);}} else {System.out.println("没有匹配到组合关键词。");}}/*** 并行计算:在文本中搜索组合关键词,并返回匹配的组合关键词集合* @param text* @param keywordGroups* @return* @throws InterruptedException* @throws ExecutionException*/public static Set<String> searchCombinationsParallel(String text, List<List<String>> keywordGroups) throws InterruptedException, ExecutionException {// 获取可用处理器核心数,并创建对应数量的线程池int numThreads = Runtime.getRuntime().availableProcessors();ExecutorService executorService = Executors.newFixedThreadPool(numThreads);// 使用线程安全的集合来保存匹配结果Set<String> matchedCombinationKeywords = new ConcurrentSkipListSet<>();// 创建并行任务列表List<Callable<Set<String>>> tasks = new ArrayList<>();for (List<String> keywords : keywordGroups) {tasks.add(() -> {Set<String> matchedKeywords = new HashSet<>();generateCombinations(text, keywords, new StringBuilder(), matchedKeywords);return matchedKeywords;});}// 并行执行任务,获取结果并合并到结果集合List<Future<Set<String>>> futures = executorService.invokeAll(tasks);for (Future<Set<String>> future : futures) {matchedCombinationKeywords.addAll(future.get());}// 关闭线程池executorService.shutdown();return matchedCombinationKeywords;}/*** 生成所有组合关键词,并在文本中查找匹配 * @param text* @param keywords* @param currentCombination* @param matchedKeywords*/private static void generateCombinations(String text, List<String> keywords, StringBuilder currentCombination, Set<String> matchedKeywords) {int[] indices = new int[keywords.size()]; // 记录每组关键词的索引while (true) {StringBuilder currentCombinationKeyword = new StringBuilder();// 生成当前的组合关键词for (int i = 0; i < keywords.size(); i++) {String keyword = keywords.get(i);// int index = indices[i];if (currentCombinationKeyword.length() > 0) {currentCombinationKeyword.append(",");}currentCombinationKeyword.append(keyword);indices[i]++;}Trie trie = new Trie();for (String keyword : currentCombinationKeyword.toString().split(",")) {trie.insert(keyword);}trie.buildFailPointers();Set<String> matched = trie.search(text);if (!matched.isEmpty()) {matchedKeywords.addAll(matched);}// 移动索引,类似组合数学中的组合生成算法int j = keywords.size() - 1;while (j >= 0 && indices[j] == keywords.size()) {indices[j] = 0;j--;}if (j < 0) {break;}}}
}

以上为java关键词组匹配程序,如果有啥不足欢迎支持

java关键词组匹配算法相关推荐

  1. java正向最大匹配算法_java中文分词之正向最大匹配法实例代码

    前言 基于词典的正向最大匹配算法(最长词优先匹配),算法会根据词典文件自动调整最大长度,分词的好坏完全取决于词典. 所谓词典正向最大匹配就是将一段字符串进行分隔,其中分隔 的长度有限制,然后将分隔的子 ...

  2. RobotFramework-自定义远程java关键字库能否返回Map类型

    自定义的远程关键字库能使用哪些数据类型来和robotframework交互?先引用官网上的一段话 4.2.3   Supported argument and return value types B ...

  3. java 相似度匹配算法

    相似度匹配算法实际是计算字符串之间的编辑距离. 经常刷算法的同学,就应该知道这个是一个可迭代可递归实现的中难度的leetcode算法. 详细思路可以在[思路分析指引]看看,我就直接给出对应的的代码! ...

  4. java opencv 模板匹配算法_OpenCV探索之路(九):模板匹配

    模板匹配的作用在图像识别领域作用可大了.那什么是模板匹配? 模板匹配,就是在一幅图像中寻找另一幅模板图像最匹配(也就是最相似)的部分的技术. 说的有点抽象,下面给个例子说明就很明白了. 在上面这幅全明 ...

  5. java 字符正则匹配算法_算法之字符串——正则表达式匹配

    难度 困难 请实现一个函数用来匹配包含'. '和'*'的正则表达式.模式中的字符'.'表示任意一个字符,而'*'表示它前面的字符可以出现任意次(含0次).在本题中,匹配是指字符串的所有字符匹配整个模式 ...

  6. java 字符正则匹配算法_java把任意字符串删减成符合一个给定的正则表达式(已知)的方法该怎么写?...

    展开全部 ^String str = "q123wwwe.dd434rrd"; String result = null; if(str==null||str.equals(&qu ...

  7. 微信小程序珊瑚文本检测分享(Java案例)

    [辰兮要努力]:hello你好我是辰兮,很高兴你能来阅读,昵称是希望自己能不断精进,向着优秀程序员前行! 博客来源于项目以及编程中遇到的问题总结,偶尔会有读书分享,我会陆续更新Java前端.后台.数据 ...

  8. java转换成class文件_浅谈JVM编译原理-.java文件转变为.class文件的过程

    为什么需要编译? 我们平常写代码,有规范的命名方式,都能够看得懂,但是我们写的代码计算机是看不懂的,所以需要编译,也就是一个转换的过程,如下: 1.这个是咱们平时写的代码,就比较好理解,对人友好 2. ...

  9. 编译原理代码生成器java_浅谈JVM编译原理-.java文件转变为.class文件的过程

    为什么需要编译? 我们平常写代码,有规范的命名方式,都能够看得懂,但是我们写的代码计算机是看不懂的,所以需要编译,也就是一个转换的过程,如下: 1.这个是咱们平时写的代码,就比较好理解,对人友好 2. ...

  10. Java 代码编译和执行的整个过程

    一.简述 Java代码编译和执行的整个过程包含了三个重要的机制: ①Java 源码编译机制: ②类加载机制: ③类执行机制 二.Java 源码编译机制 Java 代码编译是由 Javac 编译器来完成 ...

最新文章

  1. ORM读取web.config中的数据库连接字符串
  2. 文件加载顺序_Springboot配置文件存放位置及读取顺序
  3. cmd的rd命令简单解析
  4. Aizu - 1407 Parentheses Editor(对顶栈+模拟)
  5. 拼车日滴滴派单的那些事
  6. 【最优解法】1054 求平均值 (20分)_31行代码AC
  7. Gartner:2020年全球IaaS公有云服务市场增长40.7%
  8. base64是哪个jar包的_涨知识 | 用maven轻松管理jar包
  9. sessionStorage localStorage cookie
  10. 在Blazor中构建数据库应用程序——第2部分——服务——构建CRUD数据层
  11. Java教程:Java JDK下载与安装教程
  12. eclipse sdk 无法更新
  13. Brute-Force 算法与KMP算法
  14. 怎么做才能使校园网让多台电脑使用?
  15. 有一分数序列: 2/1 3/2 5/3 8/5 13/8 21/13...... 求出这个数列的前N项之和,保留两位小数。
  16. android 高德地图移动卡顿_Xamarin.Forms Android使用高德地图SDK
  17. 勿以自己的经历来审视他人
  18. 一个23届蔡鸡渣硕找实习的经历(附部分记录了还想得起来的面经)
  19. 区块链到底是不是骗局
  20. 数据化运营chapter4_code--分析模型和方法

热门文章

  1. WHMCS用户分组会员等级折扣插件
  2. 便携式水污染检测设备可以分析多少项污水指标
  3. 美国查斯卡市大力促进数据中心设施建设
  4. 九轴姿态解算(梯度下降法)
  5. .net爬虫使用HtmlAgilityPack爬取网络数据
  6. linux修改/etc/sudoers报错“没有找到有效的 sudoers 资源,退出”
  7. 那么多的悲伤,只有自己能承担:冷小兮情感日志分享
  8. DDoS攻击:网络安全的威胁与防御
  9. 考研还是江苏三新供电?有选择困难症的你赶快点进来!
  10. 更改IE浏览器网页 myeclipse的背景颜色为淡绿色可以有效保护视力