最新公告
  • 欢迎您光临波比源码,本站秉承服务宗旨 履行“站长”责任,销售只是起点 服务永无止境!立即加入我们
  • Java正则表达中Greedy Reluctant Possessive 的区别


    上1篇文章《编程思想之正则表达式 》中讲了正则表达式的原理、使用方法和常见的正则表达式总结,本文将进1步探讨Java正则表达中GreedyReluctantPossessive3种策略的区分。

    从Java的官方文档http://docs.oracle.com/javase/7/docs/api/java/util/regex/Pattern.html中我们可以看到,正则表达式表示数量词的符号有3套,分别是Greedy(贪婪的)Reluctant(委曲的)Possessive(独占的)。其含义以下:

    Greedy 数量词

    X?

    X,1次或1次也没有

    X*

    X,零次或屡次

    X+

    X,1次或屡次

    X{n}

    X,恰好 n 次

    X{n,}

    X,最少 n 次

    X{n,m}

    X,最少 n 次,但是不超过 m 次

     

     

    Reluctant 数量词

    X??

    X,1次或1次也没有

    X*?

    X,零次或屡次

    X+?

    X,1次或屡次

    X{n}?

    X,恰好 n 次

    X{n,}?

    X,最少 n 次

    X{n,m}?

    X,最少 n 次,但是不超过 m 次

     

     

    Possessive 数量词

    X?+

    X,1次或1次也没有

    X*+

    X,零次或屡次

    X++

    X,1次或屡次

    X{n}+

    X,恰好 n 次

    X{n,}+

    X,最少 n 次

    X{n,m}+

    X,最少 n 次,但是不超过 m 次

     

    GreedyReluctantPossessive的区分

    实例说话

    看上面的表格我们发现这3种数量词的含义都相同(X?X??X?+都表示1次或1次也没有),但他们之间还是有1些细微的区分的。我们先来看1个例子:

    1.Greedy

    public static void testGreedy() {
    Pattern p = Pattern.compile(".*foo");
    String strText = "xfooxxxxxxfoo";
    Matcher m = p.matcher(strText);
    while (m.find()) {
    System.out.println("matched form " + m.start() + " to " + m.end());
    }
    }

    结果:

    matched form 0 to 13

     

    2.Reluctant

    public static void testReluctant() {
    Pattern p = Pattern.compile(".*?foo");
    String strText = "xfooxxxxxxfoo";
    Matcher m = p.matcher(strText);
    while (m.find()) {
    System.out.println("matched form " + m.start() + " to " + m.end());
    }
    }

    结果:

    matched form 0 to 4

    matched form 4 to 13

     

     

    3.Possessive

    public static void testPossessive() {
    Pattern p = Pattern.compile(".*+foo");
    String strText = "xfooxxxxxxfoo";
    Matcher m = p.matcher(strText);
    while (m.find()) {
    System.out.println("matched form " + m.start() + " to " + m.end());
    }
    }

    结果:

     

    //未匹配成功

     

    原理讲授

    Greedy数量词被称为“贪婪的”是由于匹配器被强迫要求第1次尝试匹配时读入全部输入串,如果第1次尝试匹配失败,则从后往前逐一字符地回退并尝试再次匹配,直到匹配成功或没有字符可回退。

    模式串:.*foo

    查找串:xfooxxxxxxfoo

    结果:matched form 0 to 13

     

    其比较进程以下

     


    Reluctant采取与Greedy相反的方法,它从输入串的首(字符)位置开始,在1次尝试匹配查找中只委曲地读1个字符,直到尝试完全个字符串。

    模式串:.*foo

    查找串:xfooxxxxxxfoo

    结果:matched form 0 to 4

          matched form 4 to 13

     

    其比较进程以下

     

     

    Possessive数量词总是读入全部输入串,尝试1次(仅且1次)匹配成功,不像GreedyPossessive从不回退,即使这样做也可能使整体匹配成功。

    模式串:.*foo

    查找串:xfooxxxxxxfoo

    结果:

          //未匹配成功

     

    其比较进程以下

     

     

    参考文章:http://docs.oracle.com/javase/tutorial/essential/regex/quant.html

     

    再来看看几个例子:

    模式串:.+[0⑼]

    查找串:abcd5aabb6

    结果:matched form 0 to 10

     

     

    模式串:.+?[0⑼]

    查找串:abcd5aabb6

    结果:matched form 0 to 4

     

     

    模式串:.{1,9}+[0⑼]

    查找串:abcd5aabb6

    结果:matched form 0 to 10

     

    模式串:.{1,10}+[0⑼]

    查找串:abcd5aabb6

    结果:匹配失败

     

     

    如果您有甚么疑惑和想法,请在评论处给予反馈,您的反馈就是最好的测评师!由于本人技术和能力有限,如果本博文有毛病或不足的地方,敬请体谅并给出您宝贵的建议!

     

     

    ========================欢迎关注编程思想系列文章========================

    编程思想之正则表达式

    编程思想之迭代器

    编程思想之递归

    编程思想之回调

     

     

    波比源码 – 精品源码模版分享 | www.bobi11.com
    1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
    2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
    3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
    4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
    5. 如有链接无法下载、失效或广告,请联系管理员处理!
    6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
    7. 如遇到加密压缩包,请使用WINRAR解压,如遇到无法解压的请联系管理员!

    波比源码 » Java正则表达中Greedy Reluctant Possessive 的区别

    常见问题FAQ

    免费下载或者VIP会员专享资源能否直接商用?
    本站所有资源版权均属于原作者所有,这里所提供资源均只能用于参考学习用,请勿直接商用。若由于商用引起版权纠纷,一切责任均由使用者承担。更多说明请参考 VIP介绍。
    提示下载完但解压或打开不了?
    最常见的情况是下载不完整: 可对比下载完压缩包的与网盘上的容量,若小于网盘提示的容量则是这个原因。这是浏览器下载的bug,建议用百度网盘软件或迅雷下载。若排除这种情况,可在对应资源底部留言,或 联络我们.。
    找不到素材资源介绍文章里的示例图片?
    对于PPT,KEY,Mockups,APP,网页模版等类型的素材,文章内用于介绍的图片通常并不包含在对应可供下载素材包内。这些相关商业图片需另外购买,且本站不负责(也没有办法)找到出处。 同样地一些字体文件也是这种情况,但部分素材会在素材包内有一份字体下载链接清单。
    波比源码
    一个高级程序员模板开发平台
    升级波友尊享更多特权立即升级