我可以使用某种RegEx模式在HTML文件中的两个脚本标签(包括脚本标签本身)之间提取所有内容吗?例如:
<html>
<head>
<title></title>
</head>
<body>
<!-- A bunch of HTML here -->
<script>
// A bunch of javascript here
</script>
<script type="type/javascript">
// Another block of javascript here
</script>
</body>
</html>
我希望能够做到的是捕获<script>
标签之间的所有内容。我希望每个javascript块都是新的匹配项。RegEx有可能吗?我正在使用C#作为我的语言。如果RegEx无法做到这一点,我希望有一些可以做到这一点的解析器库的想法。
我几乎可以保证不会有一个包含结束脚本标签的javascript字符串文字。
如果是这种情况,您可以尝试使用以下正则表达式:
<script[^>]*>(.*?)</script>
标签中的组不是贪婪的,因此正则表达式将匹配它找到的第一个。
但我强烈建议使用HTML解析器。
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句