我有一个应用程序,接受最多255个字符的UTF-8字符串。
如果字符是ASCII,(字符数==大小,以字节为单位)。
如果字符不是全部为ASCII且包含日语字母(例如,给定字节大小),如何获取字符串中的字符数?
输入:char *data, int bytes_no
输出:int char_no
您可以mblen
用来计算长度或使用mbstowcs
来源:
http://www.cplusplus.com/reference/cstdlib/mblen/
http://www.cl.cam.ac.uk/~mgk25/unicode.html#mod
可以使用mbstowcs(NULL,s,0)以可移植的方式在C语言中计算字符数。只要已选择适当的语言环境,它就可以像UTF-8一样适用于任何其他受支持的编码。计算UTF-8字符串中字符数的一种硬连接技术是对除0x80 – 0xBF范围内的字节以外的所有字节进行计数,因为这些字节只是连续字节,而不是它们自己的字符。但是,在应用程序中很少出现计数字符的需求。
您可以将Unicode字符保存为宽字符 wchar_t
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句