Python正则表达式怎样进行Java中的使用


Python正则表达式在使用的时候需要注意很多问题,相关的Python正则表达式问题如只有不断的学习才能更好的进行解决。下面我们就看看如何才能更好的学习。希望大家有所收获。

Java代码

  1. #encoding=utf-8   
  2. '''   
  3. python learn regular express   
  4. url : http://docs.python.org/library/re.html   
  5. parse html url : http://www.boddie.org.uk/python/HTML.html   
  6. author : liuzheng   
  7. '''   
  8. import re   
  9. import urllib   
  10. #分析javaeye blog 频道   
  11. class ParseHTML:   
  12. '''   
  13. parse html for infomation   
  14. parse javeeye page   
  15. '''   
  16. def __init__(self,url):   
  17. self.url = url   
  18. pass   
  19. #analyses html   
  20. def parse(self):   
  21. sock = urllib.urlopen(self.url)   
  22. html = sock.read()   
  23. self.__puts(html)   
  24. pass   
  25. #打印html 匹配数据   
  26. def __puts(self,html):   
  27. b = re.compile(r"<a href='([\w./:\\]+?)'[\s]*title=([^<>]+?)
    [\s]*
    target=([^<>]+?)>([^<>]+?)</a>",re.I)   
  28. m = re.findall(b,html)   
  29. #这里有encode 问题?,不知道,大家是否可以帮忙解答   
  30. print m   
  31. if __name__ == '__main__':   
  32. url = "http://www.javaeye.com/blogs"   
  33. p = ParseHTML(url)   
  34. p.parse()   
  35. if __debug__:   
  36. print "debuging is %s" % __debug__   
  37. print "regular" + "* " * 30   
  38. #math   
  39. str = "800-820-8800"   
  40. m = re.match(r"(\d{3})-(\d{3})-(\d{4})", str)   
  41. print "result : " ,m.groups()   
  42. #split   
  43. print "split : %s" % re.split('\W', 'Words, words, words.')   
  44. #findall   
  45. text = "He was carefully disguised but captured quickly 
    by police."
       
  46. print "findall :%s" % re.findall(r"\w+ly",text)   
  47. #sub   
  48. text = "hello world!"   
  49. print "sub:%s" % re.sub(r"\s+","--",text)  

以上就是对Python正则表达式的详细介绍。

评论关闭