最新公告
  • 欢迎您光临波比源码,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • python 贪婪 非贪婪 匹配

    python re模块还是需要重新学习。
    python readline 和 readlines(), readline() , read() 3者之间的区分,之前1直都不清楚,现在弄清楚是怎样回事了。
    readlines() 可以1起显示出全部文件,这个也是迭代显示的,需要追行显示,迭代器的指针会被消耗的。

    python 中的正则是匹配换行之外的所有的字符。.* 是匹配不了所有的字符的。在某些情况下,我的结论是正确的,但是在某些情况下,我的结论又是毛病的。刚才遇到的问题,现在终究知道是怎样回事了,原来是贪婪匹配和非贪婪匹配的问题,对这类情况,我也是相对迟钝了。
    save.html 是我随意抓来的1个html,我要从这个html中抓出所有的 javascript代码段。

    def getcss():

    fh = open('save.html')
    html =fh.read()

    #js_pattern = re.compile(r'<script .*?">');
    ans = re.findall(r'<script .*?>.*?</script>',html,re.S)

    src_pattern = re.compile(r'^"http.*"');
    for i in ans:
    #ret = re.findall(src_pattern,i)
    print i

    通过上面的程序,我得到了下面的结果。源文件是1个html,格式1般,这些代码段是分行的,我的目的是找出所有的代码段。下面做1个简单的解释。在尝试的进程中,我试了好几种正则表达式,下面讲1下我遇到的问题。
    这里写图片描述
    实现是跨行匹配的问题,.*是没法匹配
    的,所以如果标签散布在不同的行,那末如何匹配中间的内容呢。为了解决跨行匹配的问题,找到了这个解决方案,可以用([dD]*)或([wW]*) 或([sS]*) 来代替。
    然后又遇到了问题,我的正则总是会匹配太多的内容,最后发现,我的匹配模式是依照最多内容匹配的。默许的匹配模式是贪婪匹配,所以如果用了.*的话,总会匹配更多的内容。所以找到了这个参考。python贪婪匹配看到了贪婪匹配和非贪婪匹配的核心在1个?上,re.S标记是多行匹配的关键,类似的标记还有re.M标记,这个是1行的标记。re.M:^$标志将会匹配每行,默许^和$只会匹配第1行,文章里有几个例子还是很不错的,值得仔细研究1下,建议自己履行1下这些代码,看下结果,如果这些都很清楚,那末正则掌握的还算不错。

    re.findall(r"a(d+?)", "a23b")
    re.findall(r"a(d+)", "a23b")
    re.findall(r"a(d+)b.+a(d+)b", "a23b
    a34b"
    )
    re.findall(r"a(d+)b.+a(d+)b", "a23b
    a34b"
    , re.S)

    最后,实现了上面我提出的需求,主要利用了跨行匹配和非贪婪匹配。

    波比源码 – 精品源码模版分享 | www.bobi11.com
    1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
    2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
    3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
    4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
    5. 如有链接无法下载、失效或广告,请联系管理员处理!
    6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
    7. 如遇到加密压缩包,请使用WINRAR解压,如遇到无法解压的请联系管理员!

    波比源码 » python 贪婪 非贪婪 匹配

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    波比源码
    一个高级程序员模板开发平台
    升级波友尊享更多特权立即升级