python中re模块功能详解

文章由Byrx.net分享于2019-03-22 12:03:27评论（330）

python中re模块功能详解

python中的re模块实现了正则表达式的功能。
        首先产生正则表达式模式，然后python将其转化为字节码，通过c语言的匹配引擎进行配操作，匹配的基本原理类似于先深搜索。

正则表达式的元字符有. ^ $ * ? { [ ] | ( )
．表示任意字符
［］用来匹配一个指定的字符类别，所谓的字符类别就是你想匹配的一个字符集，对于字符集中的字符可以理解成或的关系。
^ 如果放在字符串的开头，则表示取非的意思。[^5]表示除了5之外的其他字符。而如果^不在字符串的开头，则表示它本身。

具有重复功能的元字符：
* 对于前一个字符重复0到无穷次
对于前一个字符重复1到无穷次
？对于前一个字符重复0到1次
{m,n} 对于前一个字符重复次数在为m到n次，其中，{0,} = *,{1,} = , {0,1} = ?
{m} 对于前一个字符重复m次

\d 匹配任何十进制数；它相当于类 [0-9]。
\D 匹配任何非数字字符；它相当于类 [^0-9]。
\s 匹配任何空白字符；它相当于类 [ fv]。
\S 匹配任何非空白字符；它相当于类 [^ fv]。
\w 匹配任何字母数字字符；它相当于类 [a-zA-Z0-9_]。
\W 匹配任何非字母数字字符；它相当于类 [^a-zA-Z0-9_]。

使用正则表达式
        现在我们已经看了一些简单的正则表达式，那么我们实际在 Python 中是如何使用它们的呢？ re 模块提供了一个正则表达式引擎的接口，可以让你将 REs 编译成对象并用它们来进行匹配。
编译正则表达式

        正则表达式被编译成 `RegexObject` 实例，可以为不同的操作提供方法，如模式匹配搜索或字符串替换。
#!python
>>> import re
>>> p = re.compile(ab*)
>>> print p
<re.RegexObject instance at 80b4150>
        re.compile() 也接受可选的标志参数，常用来实现不同的特殊功能和语法变更。我们稍後将查看所有可用的设置，但现在只举一个例子：
#!python
>>> p = re.compile(ab*, re.IGNORECASE)
        RE 被做为一个字符串发送给 re.compile()。REs 被处理成字符串是因为正则表达式不是 Python语言的核心部分，也没有为它创建特定的语法。（应用程序根本就不需要 REs，因此没必要包含它们去使语言说明变得臃肿不堪。）而 re 模块则只是以一个 C 扩展模块的形式来被 Python 包含，就象 socket 或 zlib 模块一样。
执行匹配

        一旦你有了已经编译了的正则表达式的对象，你要用它做什么呢？`RegexObject` 实例有一些方法和属性。这里只显示了最重要的几个，如果要看完整的列表请查阅 Python Library Reference。希望本文能对你有所收获。

热门文章：

python中re模块功能详解

python中re模块功能详解

相关内容

最新python教程

python~HOT