在python 2.7中打印阿拉伯语/波斯语字母

debugcn 发表于 Dev

奥米德

在下面的代码中，Python似乎无法使用阿拉伯字母。有任何想法吗？

#!/usr/bin/python
# -*- coding: utf-8 -*-

import nltk
sentence = "ورود ممنوع"

tokens = nltk.word_tokenize(sentence)

print tokens

结果是：

>>> 
['\xd9\x88\xd8\xb1\xd9\x88\xd8\xaf', '\xd9\x85\xd9\x85\xd9\x86\xd9\x88\xd8\xb9']
>>>

我也尝试u在字符串前添加a ，但无济于事：

>>> u"ورود ممنوع">>>
['\xd9\x88\xd8\xb1\xd9\x88\xd8\xaf', '\xd9\x85\xd9\x85\xd9\x86\xd9\x88\xd8\xb9']

恩普

您在具有字节字符串的列表中有正确的结果：

>>> lst = ['\xd9\x88\xd8\xb1\xd9\x88\xd8\xaf',
           '\xd9\x85\xd9\x85\xd9\x86\xd9\x88\xd8\xb9']
>>> for l in lst:
...  print l
... 
ورود
ممنوع

要将其转换为unicode，可以使用列表推导：

>>> lst = [e.decode('utf-8') for e in lst]
>>> lst
[u'\u0648\u0631\u0648\u062f', u'\u0645\u0645\u0646\u0648\u0639']

在列表中打印Unicode字符

本文收集自互联网，转载请注明来源。

如有侵权，请联系[email protected] 删除。

编辑于2021-06-5

我来说两句

0条评论

登录后参与评论

来自分类Dev

在python 2.7中打印阿拉伯语/波斯语字母

来自分类Dev

python3中波斯语或阿拉伯语的unicode和编码

来自分类Dev

在python中导入阿拉伯语Wordnet

来自分类Dev

Python 分类阿拉伯语数据集中的 UnicodeDecodeError

来自分类Dev

symfony 2如何使数字出现在西方阿拉伯语中

来自分类Dev

RTL（波斯语-阿拉伯语）字母被android studio编辑器弄乱了

来自分类Dev

Python中的阿拉伯语Word Net同义词？

来自分类Dev

Python将阿拉伯语存储在数组中吗？

来自分类Dev

python 2.7中阿拉伯语单词的正则表达式

来自分类Dev

在php中重命名文件名（波斯语/波斯语/阿拉伯语）

来自分类Dev

Stimulsoft报告richText错误中的Unicode字符（阿拉伯语或波斯语）

来自分类Dev

如何找到阿拉伯语和波斯语中的mist漏？

来自分类Dev

在MySQL数据库中存储波斯语\阿拉伯语文本

来自分类Dev

如何在Java控制台中打印波斯语和阿拉伯语（utf-8）字符？

来自分类Dev

jinja 2将阿拉伯语传递给rander模板

来自分类Dev

如何使用libraqm使用FreeType2渲染正确的字形（阿拉伯语）？

来自分类Dev

jinja 2将阿拉伯语传递给rander模板

来自分类Dev

无法使用Python将阿拉伯语解码的Unicode保存到CSV文件

来自分类Dev

如何使用 Python 读取包含阿拉伯语行的 CSV 文件

来自分类Dev

通过 Python tcp 套接字传输以阿拉伯语命名的文件时出现 ValueError

来自分类Dev

仅将指定的div的英语数字转换为波斯语/阿拉伯语

来自分类Dev

如何使lubuntu（LXDE）终端支持阿拉伯语或波斯语？

来自分类Dev

在GD中显示从右到左连接的语言（如波斯语和阿拉伯语）-可能的PHP错误

来自分类Dev

php从字符串中删除阿拉伯语/波斯语字符串

来自分类Dev

在GD中显示从右到左连接的语言（如波斯语和阿拉伯语）-可能的PHP错误

来自分类Dev

如何在Office Word 365中将页码的数字更改为波斯语或阿拉伯语

来自分类Dev

从对象填充的下拉列表中未正确显示波斯语/阿拉伯语文本

来自分类Dev

为什么我无法使用twitterizer2用阿拉伯语发布推文？

来自分类Dev

避免用RTL语言（波斯语，阿拉伯语）错误地包装某些单词

Related 相关文章

文章