首页 / HTML / php – preg_match_all html标记,但双引号或单引号中的标记除外

php – preg_match_all html标记,但双引号或单引号中的标记除外

内容导读

互联网集市收集整理的这篇技术教程文章主要介绍了php – preg_match_all html标记,但双引号或单引号中的标记除外，小编现在分享给大家，供广大互联网技能从业者学习和参考。文章包含3021字，纯文字阅读大概需要5分钟。

内容图文

php – preg_match_all html标记,但双引号或单引号中的标记除外

鉴于这个DOM

$html=<<<'EOD'
<div class='container clickable' data-param='{"footer":"<div>Bye</div>","info":"We win"}'>
 <img src='a.jpg' />
</div>
<a href='a.html'>The A</a>
<span></span>
<span data-span-param='{"detailTag":"<span class=\"link\">Anything here</span>"}'>
 <a></a>
</span>  
EOD;

我正在尝试使用此表达式preg_match_all html标记：

$tags = array();
if(preg_match_all('~<\s*[\w]+[^>]*>|<\s*/\s*[\w]+\s*>~im',$html,$matchall,PREG_SET_ORDER)){
   foreach($matchall as $m){
       $tags[] = $m[0];
   }
}  
print_r($tags);

该表达式的输出是：

Array
(
[0] => < div class=’container clickable’ data-param='{“footer”:”< div>
[1] => < /div>
[2] => < img src=’a.jpg’ />
[3] => < /div>
[4] => < a href=’a.html’>
[5] => < /a>
[6] => < span>
[7] => < /span>
[8] => < span data-span-param='{“detailTag”:”< span class=\”link\”>
[9] => < /span>
[10] => < a>
[11] => < /a>
[12] => < /span>
)

我的预期输出是这样的：

Array
(
[0] => < div class=’container clickable’ data-param='{“footer”:”< div>Bye< /div>”,”info”:”We win”}’>
[1] => < img src=’a.jpg’ />
[2] => < /div>
[3] => < a href=’a.html’>
[4] => < /a>
[5] => < span>
[6] => < /span>
[7] => < span data-span-param='{“detailTag”:”< span class=\”link\”>Anything here< /span>”}’>
[8] => < a>
[9] => < /a>
[10] => < /span>
)

我需要一个表达式的帮助来解决这个问题.

解决方法:

这将匹配所有html标记,并且不会捕获用双引号或单引号括起来的标记

<?php
$html=<<<EOD
<div class='container clickable' data-param='{"footer"<div>Bye</div>","info":"We win"}'>
<img src='a.jpg' />
</div>
<a href='a.html'>The A</a>
<span></span>
<span data-span-param='{"detailTag":"<span class=\"link\">Anything here</span>"}'>
<a></a>
</span>
EOD;

$html = preg_replace('~\&lt\;~is','<',$html);
$html = preg_replace('~\&gt\;~is','>',$html);
//$html = preg_replace('~\&quot\;~is','"',$html);
$html = preg_replace('~=\s*\'\s*\'~is','=\'.\'',$html);
$html = preg_replace('~=\s*"\s*"~is','="."',$html);

if(preg_match_all('~((?<==\')(?:.(?!\'))*.)\'|((?<==")(?:.(?!"))*.)"~im',$html,$matchall,PREG_SET_ORDER)){
  foreach($matchall as $m){
    if(preg_match('~\<~is',$m[0],$mtch1)||preg_match('~\>~is',$m[0],$mtch2)){
        $end = $m[0][(strlen($m[0])-1)];
        $replace1 = substr($m[0],0,(strlen($m[0])-1));
        $replace = preg_replace('~"~is','&quot;',$replace1);
        $replace = preg_replace('~<~is','&lt;',$replace);
        $replace = preg_replace('~>~is','&gt;',$replace);
        $html = preg_replace("~".preg_quote(($end.$replace1.$end),'~')."~is",$end.$replace.$end,$html);
    }
  }
}

$tags = array();
if(preg_match_all('~<\s*[\w]+[^>]*>|<\s*/\s*[\w]+\s*>~im',$html,$matchall,PREG_SET_ORDER)){
  foreach($matchall as $m){ 
    $tags[] = $m[0];
  }
}

print_r($tags);
?>

输出：

Array  
(  
[0] => <div class='container clickable' data-param='{&quot;footer&quot;:&quot;&lt;div&gt;Bye&lt;/div&gt;&quot;,&quot;info&quot;:&quot;We win&quot;}'>  
[1] => <img src='a.jpg' />  
[2] => </div>  
[3] => <a href='a.html'>  
[4] => </a>  
[5] => <span>  
[6] => </span>  
[7] => <span data-span-param='{&quot;detailTag&quot;:&quot;&lt;span class=\&quot;link\&quot;&gt;Anything here&lt;/span&gt;&quot;}'>  
[8] => <a>
[9] => </a>  
[10] => </span>  
)

内容总结

以上是互联网集市为您收集整理的php – preg_match_all html标记,但双引号或单引号中的标记除外全部内容，希望文章能够帮你解决php – preg_match_all html标记,但双引号或单引号中的标记除外所遇到的程序开发问题。如果觉得互联网集市技术教程内容还不错，欢迎将互联网集市网站推荐给程序员好友。

内容备注

版权声明：本文内容由互联网用户自发贡献，该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容，请发送邮件至 gblab@vip.qq.com 举报，一经查实，本站将立刻删除。

内容手机端

扫描二维码推送至手机访问。

本文链接：https://qyyshop.com/info/779650.html

来源：【匿名】

【上一篇】python – 不能对html2text使用read()吗？【下一篇】PHP 和 HTML

更多 ►

【php – preg_match_all html标记,但双引号或单引号中的标记除外】教程文章相关的互联网学习教程文章

php-来自某些html代码的preg_match【代码】

我将如何在php中编写php preg_match()来挑选250值.我有一个很大的html代码字符串,我想从中选出250个,而我似乎无法正确获取正则表达式. 这是我要匹配的html模式-请注意,我要提取250处的整数： < span class =“ price-ld”> H $250< / span> 我已经尝试了几个小时才能做到这一点,但我无法使其正常工作解决方法:这是您要查找的正则表达式：(?<=<span class="price-ld">H\$)\d+(?=</span>)您可以看到结果here. 这是解释：Options: cas...

HTML - 技术教程分类

HTML 教程 HTML 简介 HTML 编辑器 HTML 基础 HTML 元素 HTML 属性 HTML 标题 HTML 段落 HTML 文本格式化 HTML 链接 HTML 头部 HTML CSS HTML 图像 HTML 表格 HTML 列表 HTML 区块 HTML 布局 HTML 表单 HTML 框架 HTML 颜色 HTML 颜色名 HTML 颜色值 HTML 脚本 HTML 字符实体 HTML URL HTML 速查列表 HTML 总结 XHTML 简介 HTML 媒体(Media) HTML 插件 HTML 实例 HTML 标签列表（功能排序） HTML 属性 HTML 事件 HTML 画布 HTML 音频/视频 HTML 颜色名 HTML 字符集 HTML ASCII HTML ISO-8859-1 HTML 符号 HTML 语言代码 html 全部

HTML - 最热教程

html5代码如何实现进度条功能？（示例）javascript中html字符串转化为jquerydo...HTML5实战与剖析之CSS选择器——getEle...html5中设置或返回音频/视频是否应该被...HTML5获取设备信息 jQuery打印指定区域Html页面并自动分页...jQuery+HTML5+CSS3制作支持响应式布局时...JS+HTML5实现上传图片预览效果完整实例...php删除html标签和标签内的内容的方法总...XMLHttpRequest中responseText如何获取...

首页 / HTML / php – preg_match_all html标记,但双引号或单引号中的标记除外

php – preg_match_all html标记,但双引号或单引号中的标记除外

内容导读

内容图文

内容总结

内容备注

内容手机端

【php – preg_match_all html标记,但双引号或单引号中的标记除外】教程文章相关的互联网学习教程文章

php-来自某些html代码的preg_match【代码】

HTML - 相关标签

PHP - 相关标签

HTML - 技术教程分类

HTML - 最新教程

HTML - 最热教程