如何在xml c#中删除非ASCII字符,例如倒置的“ T”,“ L”等
我已经尝试过Sanitize Xml String这样的
(character >= 0x20 && character <= 0xD7FF) ||
(character >= 0xE000 && character <= 0xFFFD) ||
(character >= 0x10000 && character <= 0x10FFFF)
并使用正则表达式如下:
Regex.Replace(inputText, @"[^><#\w\.@-]", "");
(or)
string str = str.replace(/[^A-Za-z 0-9 \.,\?""!@#\$%\^&\*\(\)-_=\+;:<>\/\\\|\}\{\[\]`~]*/g, '')
然后将Pattern替换为以下内容:
string pattern = @"#x((10?|[2-F])FFF[EF]|FDD[0-9A-F]|7F|8[0-46-9A-F]9[0-9A-F])";
最后是
XmlConvert.VerifyXmlChars(text);
但是没有用,字符如下所示:'┌''├''⌐''┐''┴'
请查看此链接https://en.wikipedia.org/wiki/Western_Latin_character_sets_%28computing%29
└U + 2514 C0
C0┘U + 2518 D9 D9
请帮帮我。提前致谢
Try This
string s = "søme string";
s = Regex.Replace(s, @"[^\u0000-\u007F]", string.Empty);
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句