php mysql敏感词_php查找/过滤一段文字中的违禁词敏感词
//定义编码
header( 'Content-Type:text/html;charset=utf-8 ');
$words=array('我','你','他');
$content="测一测我是不是违禁词";
$banned=generateRegularExpression($words);
//检查违禁词
$res_banned=check_words($banned,$content);
write_html($content,$res_banned);
/**
* @describe 数组生成正则表达式
* @param array $words
* @return string
*/
function generateRegularExpression($words)
{
$regular = implode('|', array_map('preg_quote', $words));
return "/$regular/i";
}
/**
* @describe 字符串 生成正则表达式
* @param array $words
* @return string
*/
function generateRegularExpressionString($string){
$str_arr[0]=$string;
$str_new_arr= array_map('preg_quote', $str_arr);
return $str_new_arr[0];
}
/**
* 检查敏感词
* @param $banned
* @param $string
* @return bool|string
*/
function check_words($banned,$string)
{ $match_banned=array();
//循环查出所有敏感词
$new_banned=strtolower($banned);
$i=0;
do{
$matches=null;
if (!empty($new_banned) && preg_match($new_banned, $string, $matches)) {
$isempyt=empty($matches[0]);
if(!$isempyt){
$match_banned = array_merge($match_banned, $matches);
$matches_str=strtolower(generateRegularExpressionString($matches[0]));
$new_banned=str_replace("|".$matches_str."|","|",$new_banned);
$new_banned=str_replace("/".$matches_str."|","/",$new_banned);
$new_banned=str_replace("|".$matches_str."/","/",$new_banned);
}
}
$i++;
if($i>20){
$isempyt=true;
break;
}
}while(count($matches)>0 && !$isempyt);
//查出敏感词
if($match_banned){
return $match_banned;
}
//没有查出敏感词
return array();
}
/**
* 打印到页面上
* @param $filepath
* @param $res_mingan
* @param $res_banned
*/
function write_html($content,$res_banned){
print_r($content);
if($res_banned){
print_r(" 违禁词(".count($res_banned)."):".implode('|',$res_banned));
}
echo "
";
}
php mysql敏感词_php查找/过滤一段文字中的违禁词敏感词相关推荐
- php查找/过滤一段文字中的违禁词敏感词
<?php//定义编码 header( 'Content-Type:text/html;charset=utf-8 '); $words=array('我','你','他');$content= ...
- 查找一段文字中最长的重复字串 – 编程珠玑(排过序的后缀数组的应用)
转自:https://www.cse.msu.edu/~liyang5/?p=53 <编程珠玑>在第15章"珍珠字符串"一节,给出了一个非常漂亮的实现 – 基于目标字符 ...
- python 词库 匹配_python从一段文本中找出存在于词库的词语
python从一段文本中找出存在于词库的词语 有现成的库吗? 可能不是最佳答案,只是提供一个思路. 个人觉得这个问题并不需要什么库,先把词库载入,弄成列表什么的.然后再把你需要匹配的文本读入,反过来想 ...
- mysql 过滤微信昵称表情_PHP正则过滤处理微信昵称中emoji字符的方法
本文实例讲述了PHP正则过滤处理微信昵称中emoji字符的方法.分享给大家供大家参考,具体如下: 今天刚做了一个微信应用,在获取微信昵称的过程中报错了,经查原因是微信昵称中包含emoji字符,在写入数 ...
- vue实现对一段文字中违禁词的校验
<template><div><ks-dialogref="categoryDialog"title="不建议使用词排查入口"cl ...
- 基于布隆过滤器实现敏感词识别和过滤
在当前的网络环境下,敏感词过滤已经是各大网站的"标准配置",如果不想被大量的垃圾信息充斥,除了使用机器人识别.验证码等验证工具,还需要阻止含有敏感词内容的发布,否则可能面临关站等风 ...
- mysql 敏感词_PHP实现的敏感词过滤方法示例
本文实例讲述了PHP实现的敏感词过滤方法.分享给大家供大家参考,具体如下: 1.敏感词过滤方法 /** * @todo 敏感词过滤,返回结果 * @param array $list 定义敏感词一维数 ...
- php mysql敏感词_PHP违禁词敏感词 全站文件扫描
全站违禁词扫描下载地址 https://files.cnblogs.com/files/kingchou/%E8%BF%9D%E7%A6%81%E8%AF%8D%E7%B1%BB%E6%96%87%E ...
- python敏感词过滤replace_Serverless 实战:3 分钟实现文本敏感词过滤
敏感词过滤是随着互联网社区一起发展起来的一种阻止网络犯罪和网络暴力的技术手段,通过对可能存在犯罪或网络暴力的关键词进行有针对性的筛查和屏蔽,能够防患于未然,将后果严重的犯罪行为扼杀于萌芽之中. 随着各 ...
最新文章
- ETL 工具下载全集 包括 Informatica Datastage Cognos( 持续更新)
- 聊聊EIGRP的自动汇总与手工汇总
- GNU make 工具
- Hadoop通过路径和和链接访问HDFS
- Python-time标准库知识小结
- 机器学习与统计学的本质差异
- 在阿里干了五年,面试个小公司挂了…
- 担忧医生因AI技术而失业?杞人忧天
- 用 lastIndexOf()、substr()、split()方法截取一段字符串
- idea license 20200104
- 薄荷Toolbar(ActionBar)的适配方案
- 现在有些公众号我真的看不惯
- 使用Pytorch实现NLP深度学习
- 深度学习——手写数字识别
- Java EE的几个常用框架简介
- 防止你的WP7手机偷跑流量——系统设置篇
- 著名专家托马斯·拉姆什评孙宇晨出任格林纳达常驻WTO代表
- 四川高考30000多名学计算机哪个学校好,恭喜!四川省有32名学霸被保送到清北,分别来自四所重点中学...
- ROS2教程 04 话题Topic
- 来酷新生态 抢滩元宇宙:首发数码类数字藏品