win2003使用preg_match_all导致apache崩溃解决办法

Apache/2.2.9 (Win32) + PHP/5.2.17,在使用正则表达式 preg_match_all (如 preg_match_all("/ni(.*?)wo/", $html, $matches);)进行分析匹配比较长的字符串 $html 时(大于10万字节,一般用于分析采集回来的网页源码),Apache服务器会崩溃自动重启。

在Apache错误日志里有这样的提示:

  1. [Thu Apr 11 18:31:31 2013] [notice] Parent: child process exited with status 128 — Restarting. 
  2. [Thu Apr 11 18:31:31 2013] [notice] Apache/2.2.9 (Win32) PHP/5.2.17 configured — resuming normal operations 
  3. [Thu Apr 11 18:31:31 2013] [notice] Server built: Jun 13 2008 04:04:59 
  4. [Thu Apr 11 18:31:31 2013] [notice] Parent: Created child process 2964 
  5. [Thu Apr 11 18:31:31 2013] [notice] Disabled use of AcceptEx() WinSock2 API 
  6. [Thu Apr 11 18:31:31 2013] [notice] Child 2964: Child process is running 
  7. [Thu Apr 11 18:31:31 2013] [notice] Child 2964: Acquired the start mutex. 
  8. [Thu Apr 11 18:31:31 2013] [notice] Child 2964: Starting 350 worker threads. 
  9. [Thu Apr 11 18:31:31 2013] [notice] Child 2964: Listening on port 80. 

经过查阅Apache官方以及论坛资料后,发现win平台下用正则 preg_match_all 或preg_match 分析比较长的字符串时,导致apache崩溃重启的原因是windows平台下默认分配的线程堆栈空间 ThreadStackSize 太小导致的。 win32默认只有256KB,而在 linux下默认值是 8M,这就是为什么同样的程序在 linux平台下正常,而在 win平台下不正常的原因。

根据PCRE library的官方说明:256 KB 的堆栈空间对应的pcre.recursion_limit大小应该不超过524。

下面就是一张Stacksize和pcre.recursion_limit对应的建议安全值,超过这个数值就极有可能发生堆栈溢出,apache crash:

  1. Stacksize   pcre.recursion_limit 
  2.  64 MB      134217 
  3.  32 MB      67108 
  4.  16 MB      33554 
  5.   8 MB      16777 
  6.   4 MB      8388 
  7.   2 MB      4194 
  8.   1 MB      2097 
  9. 512 KB      1048 
  10. 256 KB      524 

如果你没有调整堆栈大小,就必须在使用正则的PHP页面最开头加入:

  1. <?php 
  2. ini_set("pcre.recursion_limit""524"); // PHP default is 100,000. 
  3. ?> 

查看具体的错误可以使用下面的代码:

  1. $resultsArray = preg_match_all("/table.*?<a>/isU"$html$contents); 
  2. if ($resultsArray === 0){ 
  3. echo get_pcre_err(); 
  4. function get_pcre_err(){ 
  5.         $pcre_err = preg_last_error();  // PHP 5.2 and above. 
  6.         if ($pcre_err === PREG_NO_ERROR) { 
  7.             $msg = 'Successful non-match.'
  8.         } else { 
  9.             // preg_match error! 
  10.             switch ($pcre_err) { 
  11.                 case PREG_INTERNAL_ERROR: 
  12.                     $msg = 'PREG_INTERNAL_ERROR'
  13.                     break
  14.                 case PREG_BACKTRACK_LIMIT_ERROR: 
  15.                     $msg = 'PREG_BACKTRACK_LIMIT_ERROR'
  16.                     break
  17.                 case PREG_RECURSION_LIMIT_ERROR: 
  18.                     $msg = 'PREG_RECURSION_LIMIT_ERROR'
  19.                     break
  20.                 case PREG_BAD_UTF8_ERROR: 
  21.                     $msg = 'PREG_BAD_UTF8_ERROR'
  22.                     break
  23.                 case PREG_BAD_UTF8_OFFSET_ERROR: 
  24.                     $msg = 'PREG_BAD_UTF8_OFFSET_ERROR'
  25.                     break
  26.                 default
  27.                     $msg = 'Unrecognized PREG error'
  28.                     break
  29.             } 
  30.         } 
  31.     return($msg); 

对于正则的修饰符 isU 说明:

i: 表示in-casesensitive,即大小写不敏感

s: PCRE_DOTALL,表示点号可以匹配换行符。

U: 表示PCRE_UNGREEDY,表示非贪婪,相当于perl/python语言的.*?,在匹配过程中,对于.*正则,一有匹配立即执行,而不是等.*搜索了所有字符再一一返回,在使用正则表达式时,我们应该尽量避免递归调用,递归容易导致堆栈溢出。比如:

/<table((?!<table).)*?</a>/isU 就会发生错误,而使用 /<table.*?</a>/i 就正常。

那么如何增加win平台下 ThreadStackSize 的大小呢? 在apache的配置文件 httpd.conf 里启用 “Include conf/extra/httpd-mpm.conf”(删除前面的注释#),然后在 httpd-mpm.conf 文件里的 mpm_winnt_module 配置模块里设置 “ThreadStackSize 8400000”即可(大约8M),代码如下:

  1. <IfModule mpm_winnt_module> 
  2.     ThreadStackSize 8400000 
  3.     ThreadsPerChild      200 
  4.     MaxRequestsPerChild    10000 
  5.     Win32DisableAcceptEx 
  6. </IfModule> 

这里需要注意的是,32位的Apache程序只能最多使用大约2GB内存空间! 因此,ThreadStackSize 和ThreadsPerChild 的值相乘后(8M * 200)不应该超过2G,否则无法启动apache,出现的错误日志如下:

  1. [Thu Apr 11 20:02:45 2013] [crit] (OS 8)存储空间不足,无法处理此命令。  : Child 4832: _beginthreadex failed. Unable to create all worker threads. Created 212 of the 220 threads requested with the ThreadsPerChild configuration directive. 

通过上面的提示,飘易可以告诉大家的是在我的这台服务器上,当线程堆栈大小设为8M时,我可以设置的线程数最多是212个。

波比源码 – 精品源码模版分享 | www.bobi11.com
1. 本站所有资源来源于用户上传和网络,如有侵权请邮件联系站长!
2. 分享目的仅供大家学习和交流,您必须在下载后24小时内删除!
3. 不得使用于非法商业用途,不得违反国家法律。否则后果自负!
4. 本站提供的源码、模板、插件等等其他资源,都不包含技术服务请大家谅解!
5. 如有链接无法下载、失效或广告,请联系管理员处理!
6. 本站资源售价只是赞助,收取费用仅维持本站的日常运营所需!
7. 本站源码并不保证全部能正常使用,仅供有技术基础的人学习研究,请谨慎下载
8. 如遇到加密压缩包,请使用WINRAR解压,如遇到无法解压的请联系管理员!

波比源码 » win2003使用preg_match_all导致apache崩溃解决办法

1 评论

发表评论

Hi, 如果你对这款模板有疑问,可以跟我联系哦!

联系站长
赞助VIP 享更多特权,建议使用 QQ 登录
喜欢我嘛?喜欢就按“ctrl+D”收藏我吧!♡