我有这个HTML字符串(已验证):
<div><img src="images/stories/2014/AAA.gif" alt="AAA" width="24" height="24" /> THE PRODUCTION OF: PLASTIC BOTTLES <br /></div>
我必须提取<img>
标记附近唯一的标题,以修剪之前和之后的所有空格,而不是将其包装在<h1>
标记中。加速结果应为:
<div><h1>THE PRODUCTION OF: PLASTIC BOTTLES</h1></div>
我已经完成了一个有效的正则表达式,但最终结果中还包含空格:
/<img\s*src="[^"]+"\s*alt="AAA"\s*width="24"\s*height="24"\s*\/>\s*([^<]+)\s*<br\s*\/>/
对于alt,width和height属性的这些特征值,可以识别图像。谢谢。
使您的比赛变得不贪婪应该可以解决这个问题:(请<img\s*src="[^"]+"\s*alt="AAA"\s*width="24"\s*height="24"\s*\/>\s*([^<]+?)\s*<br\s*\/>
注意?
旁边的额外内容[^<]+
)。可在此处获得更多信息。
话虽如此,您实际上应该使用PHP DOM Parser之类的东西来处理HTML。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句