我有一个带有字符串 '\u96e8' 的变量,我想将其转换为 unicode,因为函数 kanji_to_romaji() 只接受 unicode。我该怎么做?我在 python 2.7
# -*- coding: UTF-8 -*-
from kanji_to_romaji import kanji_to_romaji
message = '\u96e8'
message = unicode(message)
x = kanji_to_romaji(message)
print(x)
使用ast.literal_eval
:
>>> message = '\u96e8'
>>> ast.literal_eval('u"{}"'.format(message))
u'\u96e8'
诀窍是构造一个包含unicode
字符串文字的字符串作为参数传递给literal_eval
. 也就是说,u"\u96e8"
而不仅仅是\u96e8
.
(不过,这只是部分正确。如果它message
本身的值包含双引号,它就会失败。可能还有其他情况也会失败。)
本文收集自互联网,转载请注明来源。
如有侵权,请联系[email protected] 删除。
我来说两句