如何删除 HTML 文件中不属于 HTML 标签的字符串

debugcn 发表于 Dev

埃姆雷阿科克

我有一个 HTML 文件，其中包含；

<html>
<head></head>
<body><p>thanks god its Friday</p></body>
</html>a&amp; ca-79069608498"
<div class="cont" id="aka"></div>
<footer>
<div class="tent"><div class="cont"></div>
<h2><img alt="dscdsc" height="18" src="dsc.png" srcset="" width="116"/></h2>


</div>
</footer>

 ipt> (window.NORLQ=window.NORLQ||[]).push(function(){var 
ns,i,p,img;ns=document.getElementsByTagName('noscript');for(i=0;i<ns.len)>-1){img=document.createEleight'));img.setAttribute('alt',p.getAttribute('data-alt'));p.parentNode.replaceChild(img,p);}}});/*]]>*/</script><script>(window.RLQ=window.RLQ||[]).push(function(

文件名是a.html

我想删除</html>HTML 文件中的Python 2.7所有内容，但 HTML 标签后的所有字符串都不属于标签，其中一些只是嘈杂，所以我无法使用 Beautifulsoup 来完成，我不知道使用正则表达式是否明智用于 HTML 文件。

如何在之后删除字符串</html>并写入 HTML 文件？

尤文克

使用正则表达式

import re
...
newhtml = re.sub('</html>[\s\S.]+', '</html>', oldhtml)

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-07-13

我来说两句

0条评论

登录后参与评论

来自分类Dev

从字符串中删除html标签

来自分类Dev

如何通过REGEX从字符串中删除HTML标签？

来自分类Dev

如何从字符串中删除html标签？

来自分类Dev

如何从python字符串中删除HTML标签？

来自分类Dev

如何检查和删除字符串中的html标签

来自分类Dev

是否可以在不属于您的 HTML 页面中创建指向标签的链接？

来自分类Dev

从AngularJS中的字符串中删除HTML标签

来自分类Dev

Python，从字符串中删除所有html标签

来自分类Dev

从字符串中删除斜体和粗体html标签？

来自分类Dev

从html字符串中删除多余的“ a href”标签

来自分类Dev

使用jQquery从字符串中删除html标签

来自分类Dev

从字符串中删除html标签，但恢复\ n

来自分类Dev

Powershell删除字符串内容中的HTML标签

来自分类Dev

从laravel刀片上的字符串中删除HTML标签

来自分类Dev

从字符串中删除无效的html标签

来自分类Dev

从字符串中删除html标签，但恢复\ n

来自分类Dev

使用Jquery从html字符串中删除标签

来自分类Dev

如何从不属于pojo的html传递字段？

来自分类Dev

如何从字符串中剥离所有HTML标签？

来自分类Dev

从字符串Python删除HTML标签

来自分类Dev

如何使用BeautifulSoup从Python中的字符串中删除html标签

来自分类Dev

如何使用BeautifulSoup从Python中的字符串中删除html标签

来自分类Dev

如何使用asp.net从字符串中删除HTML标签（粗体，强壮，字体名称等）

来自分类Dev

如何从字符串中删除具有属性的HTML标签？

来自分类Dev

如何从字符串中删除具有属性的HTML标签？

来自分类Dev

从C＃字符串中删除不属于特定代码页的字符

来自分类Dev

从C＃字符串中删除不属于特定代码页的字符

来自分类Dev

如何从包含相同 HTML 标签的字符串列表中删除 HTML 标签？

来自分类Dev

如何快速删除字符串中的所有html

Related 相关文章

文章