python 正则表达式贪婪模式与非贪婪模式原理、用法实例分析

站长资源 2024/11/25 佚名

2 0 1

本文实例讲述了python 正则表达式贪婪模式与非贪婪模式原理、用法。分享给大家供大家参考，具体如下：

之前未接触过正则表达式，今日看python网络爬虫的源码，里面一行正则表达式匹配的代码初看之下，不是很理解，代码如下：

myItems = re.findall('<div.*"content".*"(.*">(.*"htmlcode">

import re
patern = re.compile('www\..*')
match1 = patern.match("www.baidu.com")
if match1:
  print(match1.group())
else:
  print("match1 don't match")
#output
> ==================RESTART =============================
> 
www.baidu.com




这个结果，应该说是意料之中，加个“？”呢？


import re
patern = re.compile('www\..*"www.baidu.com")
if match1:
  print(match1.group())
else:
  print("match1 don't match")
#output
> ==================RESTART =============================
> 
www.




竟然是这个结果。。。“."htmlcode">

import re
patern = re.compile('www\.."www.baidu.com")
if match1:
  print(match1.group())
else:
  print("match1 don't match")
#output
> ==================RESTART =============================
> 
www.b




此次匹配结果，显然是贪婪模式。奇怪了，也就是“？”的特殊组合才是非贪婪模式。
网上搜索得如下说明：

标准量词修饰的子表达式，在可匹配可不匹配的情况下，总会先尝试进行匹配，称这种方式为匹配优先，或者贪婪模式。此前介绍的一些量词，“{m}”、“{m,n}”、“{m,}”、“"color: #800000">PS：这里再为大家提供2款非常方便的正则表达式工具供大家参考使用：
JavaScript正则表达式在线测试工具：

http://tools.jb51.net/regex/javascript
正则表达式在线生成工具：

http://tools.jb51.net/regex/create_reg
更多关于Python相关内容可查看本站专题：《Python正则表达式用法总结》、《Python数据结构与算法教程》、《Python函数使用技巧总结》、《Python字符串操作技巧汇总》、《Python入门与进阶经典教程》及《Python文件与目录操作技巧汇总》
希望本文所述对大家Python程序设计有所帮助。