java特殊符号处理
特殊符号空格ASCII码值160
被前端转义为 ,对于中文来说没有什么影响,但是对于英文就会影响断句换行
final char c1 = ' '; //db里的空格
final char c2 = ' '; //手动输入的空格
System.out.println((int)c1); //160
System.out.println((int)c2); //32
replace("\u00A0", "")
replaceAll("\\u00A0+", "") //这是正则表达式的写法String str = "aacsdfe "; //包含了不间断空格的字符串
str = str.replace("\u00A0", "");
str = str.replaceAll("\\u00A0+", "");
java去掉特殊符号文章有很多,这里汇总一下
1.利用guaua去掉所有不可见字符
com.google.common.base.CharMatcher.INVISIBLE.removeFrom(str);
2.需要对字符串做情感分析,只保留中文英文数字和常见符号即可
String reg = "[^\\u4e00-\\u9fa5a-zA-Z0-9 .,\"?!:'。,!“‘]";
str.replaceAll(reg, "").trim()
3.用unicode编码正则去除不可见字符
private String replaceWrongUnicode(String source, String replace) {if (StringUtils.isBlank(source)) {return source;}if (StringUtils.isBlank(replace)) {replace = "";}Pattern CRLF = Pattern.compile("([\\u007f-\\u009f]|\\u00ad|[\\u0483-\\u0489]|[\\u0559-\\u055a]|\\u058a|[\\u0591-\\u05bd]|\\u05bf|[\\u05c1-\\u05c2]|[\\u05c4-\\u05c7]|[\\u0606-\\u060a]|[\\u063b-\\u063f]|\\u0674|[\\u06e5-\\u06e6]|\\u070f|[\\u076e-\\u077f]|\\u0a51|\\u0a75|\\u0b44|[\\u0b62-\\u0b63]|[\\u0c62-\\u0c63]|[\\u0ce2-\\u0ce3]|[\\u0d62-\\u0d63]|\\u135f|[\\u200b-\\u200f]|[\\u2028-\\u202e]|\\u2044|\\u2071|[\\uf701-\\uf70e]|[\\uf710-\\uf71a]|\\ufb1e|[\\ufc5e-\\ufc62]|\\ufeff|\\ufffc)");Matcher m = CRLF.matcher(source);if (m.find()) {return m.replaceAll(replace);}return source;}转载于:https://my.oschina.net/luanwu/blog/1798285
4.去掉特殊符号
String regEx="[`~!@#$%^&*()+=|{}':;',//[//].<>/?~!@#¥%……&*()——+|{}【】‘;:”“’。,、?]"; Pattern p = Pattern.compile(regEx); Matcher m = p.matcher(str); return m.replaceAll("").trim();
————————————————
版权声明:本文为CSDN博主「quyanli123_126_com」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/quyanli123_126_com/article/details/5444100
5.去除非ascii码字符、不可打印字符
/*** 去除非ascii码字符** @param str* @return*/public static String removeNonAscii(String str) {return str.replaceAll("[^\\x00-\\x7F]", "");}/*** 去除不可打印字符** @param str* @return*/public static String removeNonPrintable(String str) {return str.replaceAll("[\\p{C}]", "");}/*** 去除一些控制字符 Control Char** @param str* @return*/public static String removeSomeControlChar(String str) {return str.replaceAll("[\\p{Cntrl}\\p{Cc}\\p{Cf}\\p{Co}\\p{Cn}]", ""); // Some Control Char}/*** 去除一些换行制表符** @param str* @return*/public static String removeFullControlChar(String str) {return removeNonPrintable(str).replaceAll("[\\r\\n\\t]", "");}————————————————
版权声明:本文为CSDN博主「小伟童鞋」的原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/lai1170137052/article/details/100018471
java特殊符号处理相关推荐
- java各种符号用法_java“与”符号写法与用法
java"与"符号写法与用法 java"与"符号怎么打出来的 java中"与"符号使用键盘上的 Shift + 数字7 即可打出来.(不是小 ...
- java 注册商标符号乱码_java 注册商标符号乱码
注册商标符号乱码: 智能仓库: 探秘阿里巴巴智能仓库,全自动化超震撼!感觉要失业,缺失:java注册商标符号乱码151228/1 以下是的一些我们精选的智能仓库: 探秘阿里巴巴智能仓库,全自动化超震撼 ...
- java 无符号转有符号_java有符号无符号的转换
数据处理中常常遇到基本数据类型的操作,java都是有符号的数据,而与下位机通信中常常遇到无符号的比如uint8, uint16,uint32等等 1.为了完成这个功能还专门采用ByteBuffer的方 ...
- java 无符号 类型_java中符号类型和无符号类型的问题分析
一 参考博文 二 java中的无符号数和有符号数 在计算机中,可以区分正负的类型,称为有符号类型,无正负的类型,称为无符号类型. 使用二进制中的最高位表示正负 计算机中用补码表示数值:另外,用二进制的 ...
- java 特殊符号正则_java利用正则表达式处理特殊字符的方法实例
前言 一串字符串中有特殊符号,可能会影响到相关接口业务,所以需要把字符串中的特殊字符都过滤掉 百度上面搜索大部分处理方法是通过正则表达式, 他需要处理的特殊符号都写进正则表达式中去校验, 这种方式一眼 ...
- java 偏移符号_java中的移位运算符总结
java中的移位运算符:<>,>>>总结 java中有三种移位运算符 << : 左移运算符,num << 1,相当于num乘以2 >> ...
- java 无符号右移_java中的无符号移位运算
1. 无符号右移 >>> 或 >>> = 无符号右移(>>>)跟右移(>>)运算符不一样. 右移不改变数的正负. 对于一个正数, ...
- Java美元符号取值_java:我如何使用printf打印美元符号和带2位小数的双精度值?...
我对printf非常不满.如何添加%$ 2F到我的字符串格式,这样我可以得到的东西干净这样的: (我忘了添加"$"更早)java:我如何使用printf打印美元符号和带2位小数的双 ...
- java有符号和无符号右移
Java中提供了两种右移操作符:有符号右移操作符>>和无符号右移操作符>>>.它们的区别在于,有符号右移操作符会将高位填充为符号位(即正数填充0,负数填充1),而无符号右 ...
- Java无符号数据类型
Java不支持无符号数据类型.byte,short,int和long都是有符号数据类型.对于有符号数据类型,值范围的一半存储正数,一半用于负数,因为一个位用于存储有符号值的符号. 例如,一个字节需要8 ...
最新文章
- 爬虫python书籍-Python爬虫案例:抓取豆瓣编程类高评分书籍
- WinForm编程细节
- 文科学业水平测试题软件,学业水平测试:文科备战理科篇
- java手动输入函数_Java程序如何添加一个函数,如果玩家输入错误,它将返回代码。...
- Windows 命名管道 + 异步I/O模型
- 十一、Powerbi函数篇
- 深入理解操作系统内核架构(送书)!
- Linux 安装 配置 Maven
- 中科院自动化所与华为联合提出!视觉目标检测大模型GAIA
- 【opencv】图像处理之伽马变换
- Ubuntu 8.04 告白登岸德国柏林的地铁零碎
- 作为日千万订单级别的业务,美团外卖的后端服务是怎么支撑的
- wms地图绘制工具_【工具】奇幻风世界地图绘制工具Inkarnate
- Vue 中的 v-cloak 作用及用法
- lievent源码分析:evbuffer
- 互联网大佬的枕边美女
- css竖向箭头符号_「右箭头符号」html实现右箭头 - seo实验室
- IDEA常用插件、设置、注释
- 不用CorelDraw怎么编辑CDR文件
- jane street market prediction 冠军方案 奇巧淫技与topline链接整理(3/3)
热门文章
- 【众说区块链】从阿里区块链医疗聊起,落地应用要突破中心机构数据壁垒
- 野菜并不是“绿色蔬菜”
- PHP开发_入门基础
- 那群因为上班摸鱼而被罚的打工人...
- 论文阅读——STD-Net:Retinal Image Segmentation with a Structure-Texture Demixing Network
- Python模拟ARCH过程
- 计算机vf知识题库,计算机二级VF上机题库及答案
- 玩转云端 | 天翼云电脑的百变玩法
- 复盘2021鲜花电商:行业波动过后迎新一轮混战和增长
- HDU 3220 Alice’s Cube (09年上海区域赛水题(位压缩、逆向搜索、打表))