Python 正则表达式

正则表达式是搜索模式形成的字符序列。它可用于检查字符串是否与某种字符匹配的搜索模式。

RegEx模块

Python有一个内置的包re，可以用来处理正则表达式。导入re模块：

import re

Python中的RegEx

导入re模块后，可以开始使用正则表达式：

实例

搜索字符串以查看它是否以“The”开头并以“Spain”结尾：

import re

txt = "The rain in Spain"
x = re.search("^The.*Spain$", txt)

运行实例 »

RegEx函数

re模块提供了一组函数，允许我们搜索字符串以进行匹配：

函数	描述
findall	返回包含所有匹配项的列表
search	匹配整个字符串中的任意位置，返回第一个成功的匹配对象
split	返回一个能够匹配的子串将字符串分割的列表
sub	用字符串替换一个或多个匹配项

元字符

元字符是具有特殊含义的字符：

字符	描述	例子	试一试
[]	一个字符集	"[a-m]"	试一试 »
\	发出特殊序列信号（也可用于转义特殊字符）	"\d"	试一试 »
.	匹配任意字符，除了换行符	"he..o"	试一试 »
^	匹配字符串的开头	"^hello"	试一试 »
$	匹配字符串的末尾。	"world$"	试一试 »
*	匹配0个或多个的表达式。	"aix*"	试一试 »
+	匹配1个或多个的表达式。	"aix+"	试一试 »
{}	匹配出现的次数	"al{2}"	试一试 »
\|	或关系	"falls\|stays"	试一试 »
()	匹配括号内的表达式，也表示一个组

特殊序列

一个特殊的序列\后跟下面列表中的一个字符，具有特殊含义：

字符	描述	例子	试一试
\A	匹配以字符串开始。	"\AThe"	试一试 »
\b	匹配一个词的边界。	r"\bain" r"ain\b"	试一试 » 试一试 »
\B	匹配一个非单词边界。	r"\Bain" r"ain\B"	试一试 » 试一试 »
\d	匹配一个数字,等价于[0-9]	"\d"	试一试 »
\D	匹配一个非数字字符,等价于[^0-9]	"\D"	试一试 »
\s	匹配一个空白字符，包括空格、制表符、换页符和换行符。	"\s"	试一试 »
\S	匹配一个非空白字符。	"\S"	试一试 »
\w	匹配一个单字字符（字母、数字或者下划线）等价于[A-Za-z0-9_]。	"\w"	试一试 »
\W	匹配一个非单字字符。等价于[^A-Za-z0-9_]	"\W"	试一试 »
\Z	匹配指定的字符串结尾	"Spain\Z"	试一试 »

集

集合是一对方括号内的一组字符 []，具有特殊含义：

集	描述	试一试
[arn]	返回匹配到 (`a`, `r`, or `n`) 中的任何字符	试一试 »
[a-n]	返回匹配 `a` ~ `n` 之间的所有字符	试一试 »
[^arn]	返回匹配除 `a`, `r`, `n` 之外的任何字符	试一试 »
[0123]	返回匹配到 (`0`, `1`, `2`, `3`) 中的任何字符	试一试 »
[0-9]	返回匹配任何 `0` ~ `9` 之间的数字	试一试 »
[0-5][0-9]	返回配置到 `00`~ `59` 之间的两位数字	试一试 »
[a-zA-Z]	返回匹配到的小写a-z字符，大写 A-Z字符	试一试 »
[+]	在集合中, `+`, `*`, `.`, `\|`, `()`, `$`,`{}` 这些字符没有特别的意义, 因此 `[+]`的意思：返回`+`任何字符	试一试 »

findall()函数

findall()函数返回包含所有匹配项的列表。

实例

打印所有匹配的列表：


import re

str = "The rain in Spain"
x = re.findall("ai", str)
print(x)

运行示例»

该列表按照找到的顺序包含匹配项。如果未找到匹配项，则返回空列表：

实例

如果未找到匹配项，则返回空列表：


import re

str = "The rain in Spain"
x = re.findall("Portugal", str)
print(x)

运行示例»

search（）函数

search()函数在字符串中搜索匹配项，如果匹配则返回Match对象。如果有多个匹配，则仅返回匹配的第一个匹配项：

实例

在字符串中搜索第一个空格字符：


import re

str = "The rain in Spain"
x = re.search("\s", str)

print("The first white-space character is located in position:", x.start())

运行示例»

如果未找到匹配项，则返回None值：

实例

不返回匹配的搜索：


import re

str = "The rain in Spain"
x = re.search("Portugal", str)
print(x)

运行示例»

split()函数

split()函数返回一个列表，其字符串在每次匹配时被拆分：

实例

在每个空格字符处拆分：


import re

str = "The rain in Spain"
x = re.split("\s", str)
print(x)

运行示例»

您可以通过指定maxsplit 参数来控制出现次数：

实例

仅在第一次出现时分割字符串：


import re

str = "The rain in Spain"
x = re.split("\s", str, 1)
print(x)

运行示例»

sub()函数

sub()函数将匹配替换为您选择的文本：

实例

用数字9替换每个空格字符：


import re

str = "The rain in Spain"
x = re.sub("\s", "9", str)
print(x)

运行示例»

可以通过指定count 参数来控制替换次数：

实例

替换前两次出现：


import re

str = "The rain in Spain"
x = re.sub("\s", "9", str, 2)
print(x)

运行示例»

匹配对象

匹配对象是包含有关搜索和结果的信息的对象。

注意：如果没有匹配项，将返回None值，而不是匹配对象。

实例

执行将返回匹配对象的搜索：


import re

str = "The rain in Spain"
x = re.search("ai", str)
print(x) #this will print an object

运行示例»

匹配对象具有用于检索有关搜索的信息的属性和方法，结果如下： .span()返回包含匹配的开始和结束位置的元组。 .string返回传递给函数的字符串 .group()返回匹配的字符串部分

实例

打印第一个匹配事件的位置（开始和结束位置）。正则表达式查找以大写“S”开头的任何单词：


import re

str = "The rain in Spain"
x = re.search(r"\bS\w+", str)
print(x.span())

运行示例»

实例

打印传递给函数的字符串：


import re

str = "The rain in Spain"
x = re.search(r"\bS\w+", str)
print(x.string)

运行示例»

实例

打印匹配的字符串部分。正则表达式查找以大写“S”开头的任何单词：


import re

str = "The rain in Spain"
x = re.search(r"\bS\w+", str)
print(x.group())

运行示例»

注意：如果没有匹配项，将返回None值，而不是匹配对象。

HTML and CSS

后端

数据库

其它

HTML

Exercises

Python 教程

文件处理

Python MySQL

Python MongoDB

Python 参考

Python 模块参考

Python 技巧

Python 实例

Python 正则表达式

RegEx模块

Python中的RegEx

实例

RegEx函数

元字符

特殊序列

集

findall()函数

实例

实例

search（）函数

实例

实例

split()函数

实例

实例

sub()函数

实例

实例

匹配对象

实例

实例

实例

实例

颜色选择器

常用工具

教程TOP

参考TOP

实例TOP

站点信息