学会python正则表达式就是这么简单
一前言
本篇文章带大家快速入门正则表达式的使用,正则表达式的规则不仅适用python语言,基本大多数编程语言都适用,在日常使用中极为广泛,读者们有必要学好正则表达式。看完这篇文章,读者们要理解什么是正则表达式,正则表达式的规则,常见的正则表达式示例,如何在python中使用函数进行正则表达式操作;
二 正则表达式的概念
正则表达式是指在一串字符串中使用特殊的模式匹配获得子串,我们可以对获得的子串进行提取,替换等操作;
举个例子zszxz666
这个字符串,现在知识追寻者想要获得子串zszxz
, 则需要经过一个模式匹配后获得子串,在正则表达式中这个模式可以很多种格式,知识追寻者在这边使用最简单的模式 [a-z]*
,然后经过python正则表达式匹配函数就可以获得子串zszxz
;这种方式比平时的字符串函数操作更加简便,适用范围广泛;
三 常用的正则匹配模式
常用的正则表达式模式如下,如果对这些模式有疑惑的可以参照 正则表达式手册 ;手册中还有日常使用的正则示例,比如用户名,密码,邮箱,URL 的匹配模式等;
模式 | 含义 |
---|---|
^ | 匹配字符串的开头 |
$ | 匹配字符串的末尾 |
. | 匹配任意字符,除了换行符 |
+ | 匹配前面的子表达式一次或多次 |
? | 匹配前面的子表达式零次或一次,或表示一个非贪婪限定符 |
* | 匹配前面的子表达式零次或多次 |
\ | 转义特殊字符 |
\d | 匹配任意数字,等价于 [0-9]。 |
\D | 匹配任意非数字 |
\s |
匹配任意空白字符(制表,换行,回车,换页,垂直制表),等价于[^\f\n\r\t\v]
|
\S |
匹配任何非空白字符。等价[^\f\n\r\t\v]
|
\w | 匹配数字字母下划线 |
\W | 匹配非数字字母下划线 |
[…] | 用来表示一组字符;[amk] 匹配 ‘a’,‘m’或’k’ |
[^…] |
不匹配在[]中的字符;[^amk] 不匹配 ‘a’,‘m’或’k’
|
{n} | 匹配前面的子表达式n 次 |
{n,} | 匹配前面的子表达式至少n 次 |
{n,m} | 匹配前面的子表达式最少匹配 n 次且最多匹配 m 次 |
| | 表示或;a| b,表示匹配a或者b |
\b | 匹配一个单词边界,即字与空格间的位置 |
\B | 非单词边界匹配 |
四 python正则常用修斯符
re.I | 使匹配对大小写不敏感 |
---|---|
re.L | 做本地化识别(locale-aware)匹配 |
re.M | 多行匹配,影响 ^ 和 $ |
re.S | 使 . 匹配包括换行在内的所有字符 |
re.U | 根据Unicode字符集解析字符。这个标志影响 \w, \W, \b, \B. |
re.X | 该标志通过给予你更灵活的格式以便你将正则表达式写得更易于理解 |
五 python常用正则行数说明
- pattern 表示正则表达式模式
- string 表示传入待匹配字符串
- flags 标志位,可以用第四节的修饰符限定
- count 表示限定匹配的次数
- repl 表示替换的字符串,也可为一个函数
- pos 起始位置
- endpos 结束位置
- maxsplit 最大分割次数
函数名称 | 函数含义 |
---|---|
re.findall(string, pos, endpos) | 匹配所有子串,并返回一个列表,未匹配,则返回空列表 |
re.match(pattern, string, flags=0) | 从字符串的起始位置匹配一个模式,如果匹配失败返回None |
re.search(pattern, string, flags=0) | 扫描整个字符串并返回第一个成功的匹配;匹配失败返回None |
re.compile(pattern, flags=0) | 编译正则表达式,生成一个正则表达式( Pattern )对象 |
re.sub(pattern, repl, string, count=0, flags=0) | 查找和替换 |
re.finditer(pattern, string, flags=0) | 与findall类似,返回的是迭代器 |
re.split(pattern, string, maxsplit=0, flags=0]) | 将匹配的子串分割后返回列表 |
六 常用函数示例
6.1 match函数
group(num=0) 函数表示提取匹配的表达式,可以使用组号提取对应的匹配结果;知识追寻者想要获得字符串中第一个出现的数字串;
import re
# 指定模式 至少匹配一个数字
pattern = re.compile(r'\d+')
# 输入的字符串
mat = pattern.match("451zszxz666")
# 获得第一个匹配到的值
g = mat.group();
# 451
print(g)
6.2search函数
知识追寻者想要获得指定的字符串,第一个匹配的就好;
import re
# 想匹配nhzszxz 或者 nh666 或者 nhnh
pattern = re.compile(r'nh(zszxz|666|nh)')
ser = pattern.search('nhzszxzkkk nh666 llll nhnh')
g_0 = ser.group()
# zszxz
print(g_0)
g_1 = ser.group(1)
# nhzszxz
print(g_1)
6.3 findall函数
知识追寻者想要在字符串中获得所有的数字;
import re
pattern = re.compile(r'\d+')
# 输入的字符串
mat = pattern.fidall("451zszxz666")
# ['451', '666']
print(mat)
# 666
print(mat[1])
6.6 sub函数
知识追寻者想要获得所有非数字的子串;
import re
str = '8556gfggs5555dfg'
# 替换所有数字
result = re.sub(r'\d', '', str)
# gfggsdfg
print(result)
6.7 split函数
知识追寻者想要获得以,
分割的字符串;
import re
str = '123,456,zszxz,666'
result = re.split(',',str)
# ['123', '456', 'zszxz', '666']
print(result)
6.8 finditer 函数
知识追寻者想要获得数字451,和666;
import re
pattern = re.compile(r'\d+')
# 输入的字符串
mat = pattern.finditer("451zszxz666")
for it in mat:print(it.group())
七 初学者使用正则表达式正确的姿势
初学者在使用正则表达式的时候难免会得到的匹配的结果与自己预期的不符合,可以借助一些在线工具匹配完成后再进行代码编写,常用的在线正则匹配测试如下;
- 在线工具
- 站长工具
学会python正则表达式就是这么简单相关推荐
- 十个小项目带你学会python编程,很简单,识字就行
前言 Python不是一门很难的编程语言,但对于从未有过编程经验的人来说,学习它也需要讲究一定的技巧. 下面,用十个小项目,带你学会python编程. 项目1:自动添加标签项目2:绘制图表项目3:万能 ...
- 学会Python正则表达式,就看这20个例子~
import re 1 查找第一个匹配串 s = 'i love python very much' pat = 'python' r = re.search(pat,s) print(r.span( ...
- 一篇文章学会 Python 正则表达式!
菜鸡自学 Python 笔记:正则表达式 一.简单理解 二. re.findall函数 三.普通字符与元字符 1.普通字符 2.元字符 四.修饰符(可选标志) 五.re.sub函数 六.re.matc ...
- 一张图学会python高清图-一张图带你学会Python,学习Python的非常简单,附教程
原标题:一张图带你学会Python,学习Python的非常简单,附教程 网上有这样一张图片,信息量很大,通常会被配上标题"一张图让你学会Python" 这张图流传甚广,但我没有找到 ...
- python正则表达式需要模块_使用Python正则表达式模块,让操作更加简单
处理文本数据的一个主要任务就是创建许多以文本为基础的特性. 人们可能想要在文本中找出特定格式的内容,比如找出存在于文本中的电子邮件,或者大型文本中的电话号码. 虽然想要实现上述功能听起来很繁琐,但是如 ...
- pythonturtle简单绘图_10分钟轻松学会 Python turtle 绘图
10分钟轻松学会 Python turtle 绘图 python2.6版本中后引入的一个简单的绘图工具,叫做海龟绘图(Turtle Graphics),turtle库是python的内部库,使用导入即 ...
- 学会python爬虫怎么赚钱-转行学Python有前途吗?Python爬虫怎么赚钱?
Python是一种面向对象的解释型计算机程序设计语言,具有丰富和强大的库,Python 已经成为继JAVA,C++之后的第三大语言.下面就跟着千锋一起来看看吧! Python的特点:简单易学.免费开源 ...
- 逻辑性不好可以学python吗_如果本文若未能让你学会“Python”,可能真的不适合学习Python...
很多小伙伴们会问学习Python难学吗? python就是以他简单易学出名的.几乎是现在最简单,却可塑性最高的语言了.一般有其它编程语言基础的,自学,三小时左右就能学会.现在Python都有给小朋友的 ...
- python入门应该学什么专业好_真的能半个月学会Python吗?(文末附python入门进阶教程)...
这里为什么用 Python 举例呢? 因为在很多人看来,Python 比较"简单". 写这篇文章主要是因为我在知乎上看到了一条有趣的动态: 该条动态的作者认为一个高考600分以上的 ...
最新文章
- ng-repeat根据多个字段排序
- Selenium3自动化测试——12.上传文件功能
- 指尖时刻:百度移动营销生态体系
- HDU 4505 小Q系列故事——电梯里的爱情
- oracle数据库连接时报12514_Oracle 数据库 SQLPlus连接正常、PLSQL连接报错 ORA-12514、TNSPING正常...
- Asp.NET Core一个接口的多个实现如何基于当前HTTP请求注册
- 数据结构之基于Java的二叉树实现
- jstl标签库基础教程及其使用代码
- “包”治百病,BOS丰富的预付费资源包来了
- 3D模型欣赏:白发小恶魔女 次世代角色设计 毛发细腻
- <caption>表格标题标签
- mysql温度报警器源码_基于51单片机的温度报警器设计源码
- FM,FFM,DeepFM
- OPPO R9微信分身设置
- 下一代搜索技术霸主之争!百度重磅推出“Lens”
- OpenJudge计算概论-最大奇数与最小偶数之差的绝对值
- 知乎爬虫(scrapy默认配置下单机1小时可爬取60多万条数据)
- [VB]获得RecordSet的记录总数
- Mysql 简易入门
- 软考信息系统监理师备考攻略
热门文章
- The user specified as a definer (‘root‘@‘%‘) does not exist
- 数产融合已成全球性经济趋势,广州如何打造领跑地位?
- 【web前端】JavaScript DOM元素(节点的创建appendChild(),删除removeChild(),修改replaceChild())
- spring学习笔记05(狂神学习笔记)-IOC小结
- 合阳中学2021高考成绩查询,合阳县2018年合阳中学、路井中学、黑池中学高考战况...
- df 和 du 两者区别
- 调色进阶的一些工具认识——可选颜色
- DevOps实施方法论
- 中医对伤风感冒的看法
- 04-CSS选择器:伪类