我有一个看起来像这样的文字:
“ \ xee \ x80 \ x80nike \ xee \ x80 \ x81:\ xee \ x80 \ x80 \ x46ind \ xee \ x80 \ x81您的\ xee \ x80 \ x80greatness \ xee \ x80 \ x81。(英国)-YouTubeis \ xee \ x80 \ x80nike \ xee \ x80 \ x81故意取笑一个男孩试图\ xee \ x80 \ x80 \ x66ind \ xee \ x80 \ x81 ...
我需要删除\ xee \ x80 \ x81或\ xee \ x80 \ x82等标记
我正在使用以下正则表达式\\xee\\x[0-9][0-9]\\x[0-9][0-9]
。它不起作用,但是如果我使用\\xee\\x80\\x81
它,它会起作用。我想要一个笼统的表达,因为数字可以是任何数字。
有人可以告诉我问题是什么吗?
显然问题出在这里\xee\x80\x80\x46
-字符\x80
重复两次,然后重复\x46
,所以它与您的模式不匹配。
您可以尝试使用\\xee(\\x[0-9][0-9])+
pattern-它会删除所有\xee
出现的内容,然后再删除一个或多个\x[0-9][0-9]
。
或者,您可以使用\\xee(\\x\d{2})+
-基本上相同,但从我的角度来看,它看起来更优雅。这里d
代表“任何数字”和{2}
“恰好两次”,并且()+
是“组出现一次或多次”
var result = Regex.Replace(your_text, @"\\xee(\\x\d{2})+", "");
您的样本结果将是:
耐克:您的伟大。(英国)-youtubeis nike故意取笑一个试图自杀的男孩...
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句