我有这个标签:
<span class="text_obisnuit2">* Notă:</span>John Wells - <em>My Dreams</em>, Albatros Books, 1986.</p>
还有这个:
<span class="text_obisnuit1">* Notă:</span>Mariah Carey - <em>Lovers on the road</em>, BackStreet Books, 1965.</p>
因此,我想找到<span class="text_obisnuit2">
包含这些单词(字符串)的那些特定的html标签:Albatros
和<em>
和</em>
(第一行)
这是一个简单明了的示例,但是它要求在<em>
标签(demo)之后加上'Albatros' :
(<span class="text_obisnuit2">).*<em>.*<\/em>.*Albatros.*
以下代码不在乎它们的顺序(demo):
(<span class="text_obisnuit2">).*(<em>.*<\/em>.*Albatros.*|Albatros.*<em>.*<\/em>.*)
这是另一个变体,后面的数字text_obisnuit
无关紧要,整个span
标签被捕获为第一组(demo):
(<span class="text_obisnuit\d+">.*<\/span>).*(<em>.*<\/em>.*Albatros.*|Albatros.*<em>.*<\/em>.*)
所有正则表达式均假定条目分别位于文件中的各自行上。检测边界<p>
并</p>
作为边界可能更有意义,但是为此,我们需要从输入文件中摘录更大的摘录。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句