处理句子中的脏话

pip install better_profanity -i http://pypi.douban.com/simple/ --trusted-host pypi.douban.com
from better_profanity import profanity  # profanity means dirty words
# 审查元素时忽视大小写情况# profanity.censor function
"""
替换脏话1. profanity.censor可以审查文本中的脏话,默认会将每个脏话替代成四个星号字符(****)被审查后的文本 censored_text_1 中:- 脏话Fuck和jerk都会被替换为****
2. profanity.censor不担心单词(脏话)之间的分隔符,无论是(,/./_),但是除了(@/*/'/"/$/)被审查后的文本 censored_text_2 中:- 脏话Fuck与其它字符以逗号隔开了,脏话jerk与其它字符以点和下划线隔开了,但是它们仍然能被此方法审查到
3. profanity.censor的自定义审查可以改变替换字符(将星号替换为其它的字符)观察函数 profanity.censor(self, text, censor_char="*") 可以得知关键字参数censor_char可以替换默认样式被审查后的文本 censored_text_3 中:- 脏话Fuck和jerk都将被替换为----
"""
censored_text_1 = profanity.censor('Fuck You’re a jerk!')
print(censored_text_1)  # ****,You’re a ****!
censored_text_2 = profanity.censor('Fuck,You’re a_jerk.!')
print(censored_text_2)  # ****,You’re a_****.!
censored_text_3 = profanity.censor('Fuck,You’re a jerk!', '-')
print(censored_text_3)  # ----,You’re a ----!# profanity.contains_profanity() function
"""
判断字符串是否含有脏话可以检查字符串中是否含有脏话,含有则返回True,否则返回False- Fuck You’re a jerk! return True- You are a good boy. return False
"""
print(profanity.contains_profanity('Fuck You’re a jerk!'))  # True
print(profanity.contains_profanity('You are a good boy.'))  # False# profanity.load_censor_words() function
# profanity.load_censor_words_from_file() function
"""
加载单组审查单词(不管通过下列哪种方法都只能加载一次)load_censor_words(custom_bad_words_list) 可以将当前列表的单词加载到审查库中- You are a good boy.很明显不会被审查出脏话,但是当我们将boy和good添加到脏话库中,那么就会被审查为脏话了profanity.load_censor_words_from_file(my_bad_words_file)- You are a good boy.很明显不会被审查出脏话,但是当我们将You和are添加到脏话库中,那么就会被审查为脏话了取消加载审查单词- 直接调用 profanity.load_censor_words()
"""
custom_bad_words_list = ['good', 'boy']  # custom_bad_words_list(自定义的脏话列表)
profanity.load_censor_words(custom_bad_words_list)
print(profanity.contains_profanity('You are a good boy.'))  # True
censored_text_4 = profanity.censor('You are a good boy.')
print(censored_text_4)  # You are a **** ****.profanity.load_censor_words_from_file('my_bad_words.txt')
censored_text_5 = profanity.censor('You are a good boy.')
print(censored_text_5)  # **** **** a good boy.# profanity.load_censor_words() function
# profanity.load_censor_words_from_file() function
"""
白名单单词(使其暂时不成为脏话) --- 关键字 whitelist_words
"""
custom_bad_words_list = ['good', 'boy']
profanity.load_censor_words(custom_bad_words_list, whitelist_words=['good'])
censored_text_6 = profanity.censor('You are a good boy.')
print(censored_text_6)  # You are a good ****.profanity.load_censor_words_from_file('my_bad_words.txt', whitelist_words=['are'])
censored_text_7 = profanity.censor('You are a good boy.')
print(censored_text_7)  # **** are a good boy.# profanity.add_censor_words() function
"""
添加更多审查单词(可以增加多次)
"""
profanity.load_censor_words_from_file('my_bad_words.txt', whitelist_words=['are'])
profanity.add_censor_words(custom_bad_words_list)
censored_text_8 = profanity.censor('You are a good boy.')
print(censored_text_8)  # **** are a **** ****.# Limitations
"""
审查单词是按照单个字符来进行的,那么就很容易通过添加单个字符来绕过审查
"""
profanity.load_censor_words()
censored_text_9 = profanity.censor('Fuck,You’re a jerk!')
print(censored_text_9)  # ****,You’re a ****!censored_text_10 = profanity.censor('Fuckk,You’re a jerkk!')
print(censored_text_10)  # Fuckk,You’re a jerkk!

利用 Python处理句子中的脏话 —— 2022/2/12相关推荐

  1. 如何利用python提取字符串中的数字

    目录 一.isdigit() 函数 二.filter() 函数 三.提取一段字符串中的数字 四.匹配指定字符串开头的数字 参考资料 一.isdigit() 函数 isdigit() 函数是检测输入字符 ...

  2. python 物理学中的应用_利用python求解物理学中的双弹簧质能系统详解

    前言 本文主要给大家介绍了关于利用python求解物理学中双弹簧质能系统的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. 物理的模型如下: 在这个系统里有两个物体,它们的质 ...

  3. python 表格格式输出_利用python对excel中一列的时间数据更改格式操作

    问题场景:需要将下列的交期一列的数据格式更改成2019/05/10 存货编码 尺寸 数量 交期 0 K10Y0190000X B140 200 2019-05-10 00:00:00 1 K10Y01 ...

  4. python代码物理_利用python求解物理学中的双弹簧质能系统详解

    前言 本文主要给大家介绍了关于利用python求解物理学中双弹簧质能系统的相关内容,分享出来供大家参考学习,下面话不多说了,来一起看看详细的介绍吧. 物理的模型如下: 在这个系统里有两个物体,它们的质 ...

  5. python 替换array中的值_利用Python提取视频中的字幕(文字识别)

    我的CSDN博客id:qq_39783601,昵称是糖潮丽子~辣丽 从今天开始我会陆续将数据分析师相关的知识点分享在这里,包括Python.机器学习.数据库等等. 今天来分享一个Python小项目! ...

  6. python对excel数据更改_利用python对excel中一列的时间数据更改格式代码示例

    本篇文章小编给大家分享一下利用python对excel中一列的时间数据更改格式代码示例,文章代码介绍的很详细,小编觉得挺不错的,现在分享给大家供大家参考,有需要的小伙伴们可以来看看. 问题场景:需要将 ...

  7. python把汉字变成拼音英文_利用python将表格中的汉字转化为拼音

    GB18030的字符集标准 http://zbgb5.com/2/StandardDetail479488.htm 缺少包时用pip install 进行安装,例如: pip install xlsx ...

  8. 利用python提取视频中的字幕

    利用python提取视频中的字幕 `` 一.导包 import base64 import os import cv2 import requests import aip from aip impo ...

  9. 如何利用Python实现工作中的自动化

    如何利用Python实现工作中的自动化 "偷懒还能干完活,才是本事" 帅张发了一篇<工作要学会偷懒>,深感赞同. 有些事情既然定期都要处理,就没有更好的处理方式?能自动 ...

最新文章

  1. 数据结构 - 平衡二叉树
  2. Linux系统高并发kernel参数优化
  3. POJ 1185 炮兵阵地 状压dp
  4. 前端防xss攻击(去掉空格等能影响和攻击数据库的字段)
  5. 贝叶斯统计 传统统计_统计贝叶斯如何补充常客
  6. 行货好还是水货好?详解苹果iPhone5版本选购 --国行、港行、水货、合约机
  7. gulp与webpack的对比
  8. java的Apollo的功能_Apollo配置中心
  9. [渝粤教育] 中国地质大学 大学英语(4) 复习题
  10. 硬核干货 | 人脸识别的原理是什么?
  11. 【逗老师的无线电】Motorola DMR设备如何经由BM中心网络上报APRS位置信息
  12. 网易16年研发实习生笔试题 - 寻找第K大
  13. 硬件:宽带猫(光猫)的基础知识
  14. 700多页A4纸打印要多少钱?
  15. 模板模式详解、模板模式怎么用、模板模式模板代码
  16. L-LSP和E-LSP介绍
  17. backupexec mysql_MySQL使用mysqldump备份及还原
  18. MODBUS通讯协议和RS232以及RS485通讯协议有什么区别
  19. Spring MVC上传图片,Java二…
  20. OpenMV 机器视觉模块 简介

热门文章

  1. P1209 [USACO1.3]修理牛棚
  2. 面试问题:2018年全国大学生数学建模竞赛项目(RGV动态调度模型、贪婪算法)
  3. SSH原理与运用:远程登录
  4. 终于找到海底的丢失的大铁锚
  5. 中国联通今年5G投资350亿元!附2019业绩PPT全文
  6. Photoshop如何使用滤镜之实例演示?
  7. Web搜索引擎工作原理和体系结构
  8. 如何在excel单词后面批量加固定文字?
  9. Why T - 为什么玩微博?
  10. Github每日精选:将近4万Star的Java、Python面试指南献给大家!