python正则表达式如何整理的相关方案介绍(1)


下面的文章就是对python正则表达式如何整理的实际操作方案的具体介绍,如果你在相关的资料中没有找到相关的文献可以参考的,你就可以点击以下的文章对python正则表达式的实际相关应用有所了解。

python正则表达式专题

  1. <!--[if !supportLists]-->一、<!--[endif]--> 

整理其应用于python的用到的正则表达式

  1. <!--[if !supportLists]-->1.1 <!--[endif]--> 

字符匹配元字符列表:

  1. . ^ $ * + ? { [ ] \ | ( ) 

字符可以单个列出,也可以用“-”号分隔的两个给定字符来表示一个字符区间。例如,[abc] 将匹配"a", "b", 或 "c"中的任意一个字符;也可以用区间[a-c]来表示同一字符集,和前者效果一致。如果你只想匹配小写字母。那么 RE 应写成 [a-z].

你可以用补集来匹配不在区间范围内的字符。其做法是把"^"作为类别的首个字符;其它地方的"^"只会简单匹配 "^"字符本身。例如,[^5] 将匹配除 "5" 之外的任意字符。也许最重要的元字符是反斜杠"\"。 做为 Python 中的字符串字母,反斜杠后面可以加不同的字符以表示不同特殊意义。它也可以用于取消所有的元字符,这样你就可以在模式中匹配它们了。举个例子,如果你需要 匹配字符 "[" 或 "\",你可以在它们之前用反斜杠来取消它们的特殊意义: \[ 或 \\。

PS:其中的\ 表示转义处理常用的字符:

\d 匹配任何十进制数;它相当于类 [0-9]。\D 匹配任何非数字字符;它相当于类 [^0-9]。\s 匹配任何空白字符;它相当于类 [ \t\n\r\f\v]。\S 匹配任何非空白字符;它相当于类 [^ \t\n\r\f\v]。\w 匹配任何字母数字字符;它相当于类 [a-zA-Z0-9_]。\W 匹配任何非字母数字字符;python正则表达相当于类 [^a-zA-Z0-9_]。这两种写法是等价的!

  1. <!--[if !supportLists]-->1.2 <!--[endif]--> 

重复

第一个重复功能的元字符是 *。* 并不匹配字母字符 "*";相反,它指定前一个字符可以被匹配零次或更多次,而不是只有一次。另一个重复元字符是 +,表示匹配一或更多次。请注意 * 和 + 之间的不同;* 匹配零或更多次,所以根本就可以不出现,而 + 则要求至少出现一次。


评论关闭