我想编码然后解码一个包含多语言字符的字符串,其中的语言、长度和字符定位(例如索引 8-10 上的汉字)是未知的。
甚至有可能拥有一个“通用”编码器吗?或者一些知道如何解码的算法?
在网上搜索只能找到涉及知道特殊字符在哪里以及使用什么语言的解决方案,而我什至不知道语言本身。
有任何想法吗?
编辑:示例:由多种语言组成的字符串,例如:
“你好 {CHINESE},我的 {LATIN} 生锈了”
由英文、中文和拉丁文组成。
但是当我这样做时
var test = ASCIIEncoding.ASCII.GetBytes(someStr);
然后
ASCIIEncoding.ASCII.GetString(test)
“特殊字符”(IE,不是英文字符)被转换为问号
不要使用 ASCII 编码,因为它不应该在同一个字符串中处理多种语言字符。
改用 Unicode:
var test = UnicodeEncoding.Unicode.GetBytes(someStr);
var test1 = UnicodeEncoding.Unicode.GetString(test);
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句