Python re正则可以匹配中文词组吗，pythonre中文词组,情景如下，网页中有一段：

文章由Byrx.net分享于2019-03-23 06:03:46评论（456）

Python re正则可以匹配中文词组吗，pythonre中文词组,情景如下，网页中有一段：

情景如下，网页中有一段：

<tr>    <td class="whitetext">此书刊没有复本</td></tr><tr>     <td bgcolor="#FFFFFF" class="whitetext"><font color="red"> 此书刊可能正在订购中或者处理中 </font></td></tr>

用 BeautifulSoup4 和 Requests 抓取一段网页内容，如果匹配到有“没有复本” 字样，就抛出异常。

如何实现用正则匹配特定的中文词组呢？
（PS 问：如何在 BeautifulSoup4 中搜索特定的文本内容？不限中文 ~ ）

代码
#! /usr/bin/env python# -*- coding: utf-8 -*-content = """<tr> <td class="whitetext">此书刊没有复本</td></tr><tr> <td bgcolor="#FFFFFF" class="whitetext"><font color="red"> 此书刊可能正在订购中或者处理中 </font></td></tr"""from bs4 import BeautifulSoupimport retag_soup = BeautifulSoup(content)tag_content = tag_soup.get_text().encode("utf-8")print re.search(r"没有复本", tag_content)
get_text()从标签中获取所有文字内容，不过是unicode编码，将其用utf-8编码之后，就可以直接用正则表达式搜索。

编橙之家文章，

热门文章：

Python re正则可以匹配中文词组吗，pythonre中文词组,情景如下，网页中有一段：

Python re正则可以匹配中文词组吗，pythonre中文词组,情景如下，网页中有一段：

相关内容

最新python问答

python~HOT